他们发现,大约3.4%的数据是不准确或错误标记的,这可能会导致使用这些数据集的人工智能系统出现问题 ... 错误源于亚马逊产品评论被错误地标记为正面,而实际上是负面的,反之亦然 ... 他们使用Mechanical Turk验证了可能的错误,发现算法标记的数据中有54%的标签不正确。