直达期货｜香港直达国际期货-官网

您的位置：主页 > 公司动态 > 公司新闻 > 公司新闻

肯尼亚「喂养」GPT-4-外盘期货

2023-03-31 08:00 来源：直达期货作者：直达期货点击：次

积灰的吊扇慵懒地转着，十几个肯尼亚人盯着粗笨的台式电脑屏幕，不停露出惊讶的神情。

思量到这里是肯尼亚内罗毕的基贝拉穷人窟，一个过半住民没有事情，连自来水和清洁的茅厕都忧伤一见的地方，可能有人会误以为，他们一定是“村里刚通上网”，才会露出这种没见过世面的反映吧？

与想象的差异，现实上，他们在为全球*进、最热门的AI产物ChatGPT事情。这些人被称作数据标注师，正是他们保障了ChatGPT“康健生长”，使其成为一个彬彬有礼、夸夸其谈的谈天AI。

近半个月以来，随着ChatGPT最新版本GPT-4的公布，全球科技公司纷纷跟进，例如英伟达宣布在芯片硬件和云服务领域上周全支持AI的开发，百度公布文心一言，而AI也再次成为全球焦点。

但在鲜明亮丽的社会转变和投资热潮背后，却是一群时薪不到两美元的肯尼亚人来教会AI，作甚善恶。

而且这份事情，并不鲜明。

一、“精神污染”

互联网上的言论总是充满着“戾气”，几条恶毒的言论就可以影响一小我私人的心情。若是有这样一份事情，要求员工天天高强度阅读9个小时的恶意内容，时薪若干能让人接受？

为OpenAI阅读和符号这些内容的肯尼亚人，实得人为约为每小时1.32美元至2美元（约合9~13.7元人民币）。

这些肯尼亚数据标注师的事情内容类似于鉴黄师，但更重口。

为了教会ChatGPT什么内容不应学，数据标注公司Sama从暗网上找来了种种由人性最漆黑面发生的文本和图片，包罗但不限于无码的血腥酷刑、反人类的犯罪现场、儿童性荼毒和恼恨言论。

一位卖力为OpenAI阅读和符号恶意文本的肯尼亚数据标注师示意，他在阅读了一则跨物种猎奇性行为的图片后，频频泛起幻觉。“那是一种折磨，即即是在一周后，我照样有时会想起那张图片，止不住地犯恶心。”

用中文互联网的盛行语来形容，就是“我的脑子不清洁了”，或“辣眼睛”。

一张图片的影响已云云之大，但除了图片之外，肯尼亚的数据标注师们天天还需要阅读150至250段文本，长度从约莫100个单词到1000多个单词不等。

这些让人心理和心理上不适的内容，不停撕裂着数据标注师的三观，每小我私人都积攒了大量的精神压力。最终，没人能坚持跨越3个月。

因此，雇佣他们的Sama公司在2022年2月终止了为OpenAI提供服务的条约，比设计提前了八个月。

Sama是一家总部位于美国旧金山的公司，耐久在肯尼亚、乌干达和印度招聘员工，为谷歌、Meta和微软等硅谷公司提供类似的数据标注营业。Sama将自己定位为一家“有道德的AI公司”，声称已辅助50000多人脱节贫困。

自称是改善社会生产方式的转变，但AI的源头却从这样令人痛苦的事情最先。克扣贫困国家的廉价劳动力去做最基础的事情，是否会成为AI降生的“原罪”？

二、离不开人的AI

即即是*进的AI，也仍然离不开人，哪怕这小我私人来自相对贫困落伍的国家。因此，肯尼亚数据标注师们的事情对OpenAI而言至关主要。

事实上，ChatGPT的前身GPT-3，就已经具备了令人印象深刻的语言表达能力和逻辑认知能力。但由于缺乏对于互联网信息的筛选机制，GPT-3也会被充满恶意的信息诱导，输出一些恼恨、暴力、歧视的内容。

在周全推广后，一旦发生类似“AI支持纳粹”这样的公关危急，整个行业都有可能被私见推优势口浪尖，导致手艺提高阻滞。

辛巴曝出头部主播流量内讧，快手「CEO工程」失速

现在，大多数的互联网平台都有着运用AI手艺的信息审核机制，从最基础的要害词初筛，到高级的识图和从语言逻辑中判断恶意内容，都离不开AI手艺的身影。

想要构建这样能够自我学习和进化的信息审核机制，OpenAI借鉴了Facebook等社交媒体的做法。那即是先网络那些带有血腥、暴力、恼恨言论和性荼毒标签的素材，由远在肯尼亚的数据标注师举行人工评级打分，再教给ChatGPT。

履历多轮人工校对后，ChatGPT将确立自己的“善恶观”，在发生恶意言论之前，就将其过滤掉。

现在出现在天下眼前的，这个礼貌、成熟，甚至显示出一定共情能力的GPT-4，可以说是AI见惯了人世百态之后的样子。

OpenAI“诞下”了GPT-4，但雇了一批肯尼亚“保姆”，干着最脏最累的活来“养育”GPT-4。

“ChatGPT和其他语言模子AI令人印象深刻，但他们并不神奇。”人工智能伦理学家安德鲁·斯特雷特示意，由于这些AI仍然依赖于大量人力和数据，其中大部门是未经授权和未经赞成使用的，连这个领域最明星的企业OpenAI也没能解决这些严重的基础性问题。

三、为什么是肯尼亚？

对于外界而言，崎岖的山脉、茂密的森林和野生动物厚实的大草原，组成了他们眼中的肯尼亚。

然而在这片不到60万平方公里的河山上，生涯着5300万肯尼亚人，其中不少人选择了从事与盘算机相关的数字事情。

据2021年肯尼亚媒体《肯尼亚华尔街》的一份讲述，肯尼亚成年人口中有跨越120万数字事情者。相比于2019年的63.8万人，这一数据有了显著增进。

肯尼亚的数字事情者数目逐年增进。（图源：肯尼亚华尔街）

他们从事线上营销、线上助理、学术写作、软件开发和数据科学等事情。

凭证市场剖析机构埃森哲的展望，到2025年，数字经济预计将占肯尼亚GDP的9.24%。但这一数字仍远低于天下银行统计的全球平均水平15%。

只管肯尼亚的互联网普及率不高，贫富差距极大，但照样有一部门人率先享受到了线上事情的便利。

政府对数字经济的推动，极低的人为尺度，以及劳动法执行的纰漏，促使肯尼亚成为蓬勃国家的数字外包“工厂”。

就拿数据标注师的人为而言，雇佣美国人的平均月薪约为4374美元（约合3万元人民币），雇佣印度人的平均月薪要1.67万卢比（约合1400元人民币），而雇佣肯尼亚人仅需每月2万肯尼亚先令（折合约1044元人民币）。

美国《时代周刊》曾采访多名肩负ChatGPT外包数据标注师的肯尼亚Sama员工，他们都示意并没有收到公司准许的“全身心保障”福利，好比心理咨询、冥想、照顾护士和游戏等。

但对于人为，他们并未表达出明确的不满，Sama准许的每月21000~40000肯尼亚先令的人为水平，已经远远高于当地*月薪尺度15000先令。为了生计，他们也都不愿透露姓名。

遭受“精神污染”的数据符号师终究照样少数，大多数肯尼亚数据符号师处置着相对正常的内容。对于讨生涯的肯尼亚人而言，与其思量自己是否“被克扣”，还不如接受这份高薪的外包事情。

这也促使科技巨头们打着“辅助当地生长人工智能”的口号，变本加厉地在这些国家攫取廉价劳动力资源。

或许在他们看来，一个工业结构不完整，政局不稳固的贫困非洲国家，仅凭一群学历都不高的员工辅助国际科技巨头们做点外包事情，怎么可能实现所谓“人工智能领域的弯道超车”呢？

上一篇：「新阿里」哪个营业能先上市-商品期货

下一篇：大厂下沉：一个北方小城折射出的南北差距与电