0%

Average Precision

Average Precision (AP)

本文翻译自Average Precision,如有侵权请联系博主删除。
计算机中的信息检索系统(如搜索引擎)性能评估一般包含两部分:

  1. 检索出来的结果和我们的查询有多么相关?(precision,即精确率)
  2. 该系统从数据库中检索出来的相关的结果有多少,即检索出来的正确结果在整个数据库中正确结果的比例是多少?(recall,即召回率)

对于不熟悉的读者,我们将解释什么是精确率(precision)和召回率(recall)。对于哪些熟悉的读者,我们将解释该领域中在比较精确率-召回率曲线时候的一些困惑。

天鹅和飞机

假定我们拥有一堆包含飞机和天鹅的照片集合。

我们希望我们的系统可以检索出所有的飞机图片,但是不要检索出任何天鹅的图片。
给定一个系统检索成果,我们可以定义四个指标:

True Positives:系统正确检索出来的飞机图片集合

True Negatives:系统正确地没有检索出来的天鹅图片集合

False Positives:系统错误地将天鹅图片检索出来而认为是飞机的天鹅图片集合

False Negatives:系统错误地将飞机图片没有检索出来而认为是天鹅的飞机图片结合

使用上述定义的指标,在上面的图例中,这里拥有三个True Positives和一个False Positive。两个False Negatives(系统没有返回的飞机图片)和四个True Negatives(系统没有检索返回的天鹅图片)。