Note2- 评价指标

单值概括

先来点比较简单和比较常见的:

NDCG(归一化折损累计增益)

考虑针对一个查询,很少有文档完全相关或完全不相关,需要引进相关性分数

先一点点来理解 NDCG(Normalized Discounted Cumulative Gain)

举例:

一致性检验 -Kappa

基于混淆矩阵的 Kappa 系数:

k=pope1pe

举例:

所以 Kappa 统计量为:κ=0.9250.66510.665=0.776