人工智能的成功,不只归功于金字塔尖的天才。

AI 不会识别物体,需要大量数据学会分辨五官和交通灯。

AI 对信息来者不拒,仰仗人工帮它剔除数据库有害的那部分。

当 AI 最终出现在镁光灯下,数据标注员们完成了单调而重要的职责,然后又隐入黑暗。

火爆全球的 ChatGPT,大概也是一个「一将功成万骨枯」的故事。

ChatGPT 的「幕后英雄」
ChatGPT 有多厉害不必多言,它和你用自然语言交谈,编写代码、撰写论文、通过考试、创作诗歌都不在话下。

比起之前的「人工智障」,ChatGPT 的前身 GPT-3 也是一大进步,但它存在一个问题,容易脱口而出暴力、性别歧视和种族主义言论,所以无法真正普及开来。

有了前车之鉴,为了保证 ChatGPT 的温和无害,OpenAI 建立了一个额外的安全机制。
它基于涉及暴力、仇恨和性虐等内容的例子,训练出能够检测有害内容的 AI,再把这个 AI 作为检测器,内置到 ChatGPT 之中,在内容到达用户之前,起到检测和过滤的作用。

以上例子需要经过数据标注(Data labelling),这是一项浩如烟海的人力劳动,由肯尼亚的工人们负责,为有害内容打上标签。

从 2021 年 11 月起,OpenAI 向外包公司 Sama 发送了数万个文本片段,其中大部分体现着互联网最黑暗的角落,涉及性虐、自杀、酷刑等内容。
那些越来越边缘的人
自 ChatGPT 横空出世,不少人担心起了自己的饭碗,这可能是一种非常具体的危机感。

与此同时,AI 和人类的关系,也在另一个维度发生了微妙的变化——它改变了人类的工作方式,以及存在的工作类型,让海量的劳动力隐居幕后。

比如数据标注员,他们的工作门槛并不高,往往没有硬性的学历要求,经过几天培训就能上岗。知道要标注的是什么、标在哪里,基本就算入门了,剩下的时间留给熟能生巧。
他们往往也不是正式员工,而是外包形式,就像为 OpenAI 服务的肯尼亚工人。

这意味着,他们身处一个更加不稳定的世界,待遇更低,地位更加边缘,职场发言权也更少,只是亦步亦趋而已。AI 的进展究竟如何,他们或许并不知道。

2018 年,GQ 报道在《那些给人工智能打工的人》提到:「我们没有研发能力,纯粹也就是一个(代工的)富士康。」
卢德运动.

相似的情形曾在历史上演。在 19 世纪初的英国,自动化纺织机普及开来,工厂更希望雇佣廉价的无技术劳动力操作机器,导致许多技术娴熟的手工工人失业。

时代的车轮在继续前行,为 AI 服务的数据标注员,也在被 AI 慢慢替代。

2022 年 6 月,特斯拉计划解雇 200 名美国员工,他们负责标注视频,帮助改进驾驶员辅助系统。原因可能在于,近年来特斯拉的自动化数据标注有了进展,可以代替人力完成部分工作。

最后修改:2023 年 02 月 16 日
如果觉得我的文章对你有用,请随意赞赏