自由贴: 免费、免注册、免审查匿名海报板,过期彻底删除,最高64K字节(约1.6万汉字)。图片请用 路过图床, Youimg 等图床
Page up Page up 发布新内容 Previous Page Next Page

计算机视觉是当前 AI 发展最好的一个方向,而 ImageNet 是这个领域里经典的数据集,不夸张地说,如果没有它,现在的面部识别都会是一种奢望。但它产生的更重大的意义,是让人们意识到构建优良数据集的工作是 AI 研究的核心,数据和算法一样至关重要。

最早期,ImageNet 需要有人手动查找、标记图像并将其添加到数据集中。李飞飞想雇用本科生,每小时付 10 美元,但经过计算,想到达到她预想的规模,本科生们不吃不喝得做数十年。最终,事情有了转机,她注意到了亚马逊众包平台 Mechanical Turk。在这个平台上,一些科研人员会发布一些琐碎任务,比如给图像加标签、鉴定色情照片等。每个能坐在电脑前的人都可以接活,完成后就能获得金钱回报。

就这样,来自 167 个国家的 49000 人次,花费两年半的时间完成了这项伟大的工程。可以说,ImageNet 因为众包才得以出生,但却鲜少人会关注那群同样参与创造的数据标注员。他们是真人,只不过平台把服务背后的人「抽象化」了,让人感觉这些任务是由计算机自动执行的。他们是真人,点击了无数次「图片里是否有皮艇」和「图片里是否有暹罗猫」。

PID: 2098@2021-03-26 07:21:29 ~