Note2- 评价指标
单值概括
先来点比较简单和比较常见的:
-
MAP(Mean Average Precision):对不同召回率点上的准确率进行平均得到 AP,在对所有查询的 AP 求平均得到 MAP
-
R-Precision:给定一个查询,排序结果列表中前 R 个位置的准确率
-
Pricision@N:前 N 个位置上的准确率
-
RR:第一个相关文档出现位置的倒数
NDCG(归一化折损累计增益)
考虑针对一个查询,很少有文档完全相关或完全不相关,需要引进相关性分数
先一点点来理解 NDCG(Normalized Discounted Cumulative Gain)
- Gain:所有项的相关性分数
- Cumulative Grain:表示对前 k 个项的 Gain 进行累加
- Discounted Cumulative Gain:考虑排序因素,使得排名靠前的项增益更高,对靠后的项进行折损,
- Ideal DCG:理想化的 DCG,按
降序排列时算出来的 DCG - Normalized DCG:
举例:
一致性检验 -Kappa
基于混淆矩阵的 Kappa 系数:
:对角线元素之和 / 总数。也就是两者分类相同的数目的比率 : (第 行元素之和 + 第 列元素之和) / 矩阵总数
举例:
所以 Kappa 统计量为: