ChatGPT 爆火背后，那些帮它「洗白」的人

2023 年 02 月 16 日

5031 次浏览

1229字数

人工智能的成功，不只归功于金字塔尖的天才。

AI 不会识别物体，需要大量数据学会分辨五官和交通灯。

AI 对信息来者不拒，仰仗人工帮它剔除数据库有害的那部分。

当 AI 最终出现在镁光灯下，数据标注员们完成了单调而重要的职责，然后又隐入黑暗。

火爆全球的 ChatGPT，大概也是一个「一将功成万骨枯」的故事。

ChatGPT 的「幕后英雄」
ChatGPT 有多厉害不必多言，它和你用自然语言交谈，编写代码、撰写论文、通过考试、创作诗歌都不在话下。

比起之前的「人工智障」，ChatGPT 的前身 GPT-3 也是一大进步，但它存在一个问题，容易脱口而出暴力、性别歧视和种族主义言论，所以无法真正普及开来。

有了前车之鉴，为了保证 ChatGPT 的温和无害，OpenAI 建立了一个额外的安全机制。
它基于涉及暴力、仇恨和性虐等内容的例子，训练出能够检测有害内容的 AI，再把这个 AI 作为检测器，内置到 ChatGPT 之中，在内容到达用户之前，起到检测和过滤的作用。

以上例子需要经过数据标注（Data labelling），这是一项浩如烟海的人力劳动，由肯尼亚的工人们负责，为有害内容打上标签。

从 2021 年 11 月起，OpenAI 向外包公司 Sama 发送了数万个文本片段，其中大部分体现着互联网最黑暗的角落，涉及性虐、自杀、酷刑等内容。
那些越来越边缘的人
自 ChatGPT 横空出世，不少人担心起了自己的饭碗，这可能是一种非常具体的危机感。

与此同时，AI 和人类的关系，也在另一个维度发生了微妙的变化——它改变了人类的工作方式，以及存在的工作类型，让海量的劳动力隐居幕后。

比如数据标注员，他们的工作门槛并不高，往往没有硬性的学历要求，经过几天培训就能上岗。知道要标注的是什么、标在哪里，基本就算入门了，剩下的时间留给熟能生巧。
他们往往也不是正式员工，而是外包形式，就像为 OpenAI 服务的肯尼亚工人。

这意味着，他们身处一个更加不稳定的世界，待遇更低，地位更加边缘，职场发言权也更少，只是亦步亦趋而已。AI 的进展究竟如何，他们或许并不知道。

2018 年，GQ 报道在《那些给人工智能打工的人》提到：「我们没有研发能力，纯粹也就是一个（代工的）富士康。」
卢德运动.

相似的情形曾在历史上演。在 19 世纪初的英国，自动化纺织机普及开来，工厂更希望雇佣廉价的无技术劳动力操作机器，导致许多技术娴熟的手工工人失业。

时代的车轮在继续前行，为 AI 服务的数据标注员，也在被 AI 慢慢替代。

2022 年 6 月，特斯拉计划解雇 200 名美国员工，他们负责标注视频，帮助改进驾驶员辅助系统。原因可能在于，近年来特斯拉的自动化数据标注有了进展，可以代替人力完成部分工作。

ChatGPT 爆火背后，那些帮它「洗白」的人

蜗牛 • 2023 年 02 月 16 日