Average Precision (AP)

本文翻译自Average Precision，如有侵权请联系博主删除。
计算机中的信息检索系统（如搜索引擎）性能评估一般包含两部分：

对于不熟悉的读者，我们将解释什么是精确率（precision）和召回率（recall）。对于哪些熟悉的读者，我们将解释该领域中在比较精确率-召回率曲线时候的一些困惑。

天鹅和飞机

假定我们拥有一堆包含飞机和天鹅的照片集合。

我们希望我们的系统可以检索出所有的飞机图片，但是不要检索出任何天鹅的图片。
给定一个系统检索成果，我们可以定义四个指标：

True Positives：系统正确检索出来的飞机图片集合

True Negatives：系统正确地没有检索出来的天鹅图片集合

False Positives：系统错误地将天鹅图片检索出来而认为是飞机的天鹅图片集合

False Negatives：系统错误地将飞机图片没有检索出来而认为是天鹅的飞机图片结合

使用上述定义的指标，在上面的图例中，这里拥有三个True Positives和一个False Positive。两个False Negatives（系统没有返回的飞机图片）和四个True Negatives（系统没有检索返回的天鹅图片）。