这些囚犯正在训练AI

   日期:2025-01-27     来源:本站    作者:admin    浏览:92    
核心提示:      在一间没有窗户的房间里,隔着一张无菌的白色桌子,我被介绍给一位40多岁的女士。她的下巴方方正正,一头金色的头发

  

  

  在一间没有窗户的房间里,隔着一张无菌的白色桌子,我被介绍给一位40多岁的女士。她的下巴方方正正,一头金色的头发用浅蓝色的发圈从脸上梳了起来。“女孩们叫我橘子酱,”她说,邀请我用她在监狱里的昵称。周三清晨,Marmalade来到芬兰的一所监狱,展示一种新型监狱劳工。

  桌子上除了一个小塑料瓶和一台惠普笔记本电脑外,什么也没有。她的工资是每小时1.54欧元(合1.67美元),在三小时轮班期间,这台笔记本电脑被编程为向她显示有关房地产的短文本,然后就她刚刚阅读的内容询问是或否的问题。其中一个问题是:“前一段是指房地产决策,还是指申请?”

  “有点无聊,”Marmalade耸耸肩。她也不完全确定这个练习的目的。她若有所思地说,也许她正在帮助创建一个客户服务聊天机器人。

  事实上,她正在训练芬兰初创公司Metroc旗下的一个大型语言模型,该公司创建了一个搜索引擎,旨在帮助建筑公司找到新批准的建筑项目。为此,Metroc需要数据标签器来帮助其模型理解新闻文章和市政文件中有关即将到来的建筑项目的线索。例如,人工智能必须能够区分已经聘请建筑师或窗户安装工的医院项目与可能仍在招聘的项目之间的区别。

  在世界各地,数以百万计的所谓“点击工作者”(clickworkers)训练人工智能模型,教机器区分行人和棕榈树,或者用什么词语组合来描述暴力或性虐待。这些工人通常驻扎在工资低廉的南半球。例如,OpenAI使用一家外包公司,该公司在肯尼亚、乌干达和印度雇佣点击工作者。这种安排适用于使用世界上使用最广泛的语言——英语开展业务的美国公司。但在南半球讲芬兰语的人并不多。

  所以地铁公司才找监狱劳工。该公司获得廉价的芬兰语工人,而监狱系统可以为囚犯提供就业机会,该公司表示,这为他们获释后进入数字世界的工作做好了准备。利用囚犯来训练人工智能,与技术下游经常存在的那种低薪、有时甚至是剥削性的劳动力形成了令人不安的对比。但在芬兰,这个项目得到了广泛的支持。

  “关于什么是数据劳动,有一个全球性的概念。赫尔辛基大学(University of Helsinki)研究芬兰监狱数据劳动的研究员图卡·莱赫蒂涅米(Tuukka Lehtiniemi)说:“如果你仔细观察,就会发现芬兰的情况非常不同。”

  四个月来,Marmalade一直住在H?meenlinna监狱里。这座建筑很现代,有大窗户。色彩缤纷的艺术品试图在空荡荡的走廊上营造一种欢快的感觉。如果不是厚重的灰色安全门挡住了所有的出入口,这些房间很容易属于一个特别没有灵魂的学校或大学建筑群。

  芬兰可能以其开放式监狱而闻名,囚犯可以在附近的城镇工作或学习,但这不是其中之一。相反,H?meenlinna是该国安全级别最高的机构,专门关押女性囚犯。Marmalade被判处六年监禁。根据监狱制定的隐私规则,《连线》杂志不能公布Marmalade的真实姓名、确切年龄或任何其他可用于识别她身份的信息。但在一个终身监禁的囚犯可以在12年后申请释放的国家,6年的刑期很重。和住在这里的其他100名囚犯一样,她也不能离开。

  H?meenlinna prison exteriorH?meenlinna Priso由RISE提供

  当Marmalade刚来的时候,她每天早上都会看着其他女人起床去上班:她们可以自愿打扫卫生,洗衣服,或者缝自己的衣服。每班6小时,他们可以得到大约6欧元(6.5美元)。但是Marmalade不忍心参与进来。“我会觉得很累,”她说。相反,她在牢房里待了很长时间。当一名监狱顾问建议她尝试“人工智能工作”时,这种三小时的短轮班对她很有吸引力,而且有钱总比没有钱好。“虽然不多,但总比待在牢房里好,”她说,“到目前为止,她只上了三班,但她已经有了成就感。

  这是芬兰三所监狱之一,囚犯可以自愿通过数据劳动赚钱。每个囚室里都有三台笔记本电脑,供犯人参与这项人工智能工作。没有目标。囚犯是按小时计酬,而不是按工作速度或质量计酬。Minna Inkinen是一名监狱工作指导员,留着一头红色短发,我们谈话时她就坐在Marmalade旁边。她说,在H?meenlinna,大约有20名囚犯尝试过这种做法。“有些人肯定比其他人更喜欢它。”当我在星期三早上到达监狱时,缝纫室已经很忙了。囚犯们在缝纫机前挤成一团,或者成对地在成堆的织物上交谈。但在Marmalade到来之前,人工智能工作的小房间完全是空的。Inkinen说,总共只有三名囚犯定期自愿为人工智能轮班,并解释说其他两人目前正在法庭上。Marmalade说:“我更喜欢和一群人一起做。”她还说,她一直开着门,这样她就可以在回答问题的间隙和隔壁缝纫的人聊天。

  这些问题是在监狱以南100公里的一间办公室里手工写的,那是赫尔辛基一个光滑的联合办公空间。在这里,我见到了麦德龙的创始人兼首席执行官尤西·维纳拉(Jussi Virnala)。他把我领到一个闷热的电话亭,经过一排室内秋千、一张台球桌和一群穿着西装的男人。这是令人兴奋的一周,他笑着解释道。该公司刚刚宣布获得200万欧元(合210万美元)的融资,他计划用这笔资金在北欧扩张。他说,与他交谈的投资者对该公司与芬兰监狱的联系很感兴趣。维尔纳拉说:“每个人都对这种创新的方式感兴趣,也很兴奋。”“我认为这在产品方面非常有价值。”

  去监狱当劳工是维尔纳拉的主意。该公司需要以芬兰语为母语的人来帮助提高其大型语言模型对特定于结构的语言的理解。但在芬兰这样的高工资经济体,很难找到这些数据劳动者。芬兰福利体系慷慨的失业救济金使得芬兰人几乎没有动力去注册像亚马逊(Amazon)的Mechanical Turk这样的低工资点击工作平台。“机械土耳其人没有很多会说芬兰语的工人,”维纳拉说。与此同时,他补充说,自动翻译工具仍然不擅长芬兰语,这门语言的母语只有500万人。

  维纳拉说,当他向芬兰监狱和缓刑机构的智能监狱项目负责人皮娅·普奥拉卡(Pia Puolakka)推销自己的想法时,她立刻产生了兴趣。在疫情爆发之前,另一家名为Vainu的芬兰科技公司一直在使用囚犯进行数据劳动。但在联合创始人之间的分歧导致负责该项目的托马斯·拉西拉(Tuomas Rasila)离开公司后,Vainu突然退出了公司。

  2022年,当维尔纳拉向她求婚时,普奥拉卡渴望恢复人工智能的工作。她的工作是试图使芬兰监狱和互联网之间的关系更接近日益数字化的外部世界。到目前为止,她一直在单独的牢房里安装笔记本电脑,这样囚犯就可以浏览一些受限制的网站,并申请进行视频通话的许可。她认为数据劳动只是这一使命的另一部分。

  其目的不是取代传统的监狱劳动,比如制作路标或园艺。这是为了给囚犯更多的选择。数据标注只能在三小时轮班中完成。她说:“一天做八小时这样的工作可能会很累。”她补充说,如果囚犯和其他类型的监狱劳工一起做数据标签就好了。她说:“这类工作是未来的趋势,如果我们想让囚犯为出狱后的生活做好准备,过上没有犯罪的生活,这些技能可能至少与监狱提供的传统工作类型一样重要。”

  但数据标签能在多大程度上为囚犯提供出狱后可用于工作的技能,目前尚不清楚。Vainu的联合创始人托马斯·拉西拉(Tuomas Rasila)现已分居,他曾在那里管理监狱项目一年,他承认自己没有证据证明这一点;他说,这个项目没有运行足够长的时间来收集数据。“我认为,让那些可能觉得自己置身于社会之外的人来培养现代社会中最高科技的方面,是一个赋权的想法。”

  然而,其他人认为这种新形式的监狱劳动是对廉价劳动力的有问题的抢购的一部分,而廉价劳动力正是人工智能革命的基础。人权观察(human Rights Watch)专注于人工智能的高级研究员阿莫斯·托(Amos Toh)表示:“我们正在走向一个更方便、更高效的全自动化社会的说法,往往掩盖了这样一个事实,即许多这些系统都是由真人驱动的。”

  对于Toh来说,对所谓点击工人的加速搜索创造了一种趋势,即公司越来越多地转向那些几乎没有其他选择的群体:难民,受经济危机影响的国家的人口-现在是囚犯。

  Toh说:“这种动态是非常熟悉的。“我们在这里看到的是一个更广泛现象的一部分,即建筑技术背后的劳动力正被外包给那些在潜在的剥削性工作条件下辛苦工作的工人。”

  Toh也对数据劳动能否帮助囚犯培养数字技能持怀疑态度。他说:“监狱里的人有很多提升自己的方式,比如获得证书和参加高等教育。”“但我对以每小时1欧元的价格为一家公司做数据标签是否会带来有意义的进步持怀疑态度。”H?meenlinna监狱确实为囚犯提供人工智能在线课程,但当工作人员试图解释其好处时,Marmalade面无表情。

  当我见到赫尔辛基大学的研究员莱赫蒂涅米时,我对监狱项目的优点感到很纠结。监狱里的女工每小时工资为1.54欧元,从那里直接走到metro的办公室,公司在那里庆祝获得了2000万欧元的融资,这让人感觉很不舒服。在赫尔辛基宏伟的圆顶大教堂对面的一家咖啡馆里,莱赫蒂涅米耐心地听我描述那种感觉。

  但Lehtiniemi自己对囚犯的采访给了他一个不同的看法——他对这个项目总体上是积极的。关于我关于薪酬差距的观点,他认为这不是主流社会的普通劳动力。这些人在监狱里。他说:“把我作为研究人员得到的钱和囚犯在监狱劳动得到的钱相比,这是没有意义的。”“我听到的唯一负面的事情是,这项工作做得不够。他指的是每所监狱只能配备三台笔记本电脑的限制。

  他说:“当我们想到数据劳动力时,我们往往会想到土耳其人,也就是全球南部或美国农村的人。”但对他来说,这是一种独特的本地版本的数据劳动,它带来了一个有利于社会的转折。与其他监狱劳动选择相比,它为囚犯提供了认知刺激的工作,同时也代表了人工智能革命中的芬兰语。

  如果没有这种主动性,Lehtiniemi担心非英语语言将被排除在下一代技术之外。智能音箱仍然很难听懂芬兰方言。“并非所有芬兰人都能说一口流利的英语,所以也需要这些本地形式的数据标签,”Lehtiniemi说。Metroc并不是唯一一家在寻找芬兰数据劳动力方面被迫创新的公司。2011年,国家图书馆创建了一个游戏,以激励志愿者帮助将其档案数字化。2020年,芬兰广播公司YLE与赫尔辛基大学和国有开发公司VAKE合作,要求志愿者捐赠他们说芬兰语的录音。

  在芬兰有一种感觉,监狱项目仅仅是个开始。一些人担心,这可能会开创一个先例,为监狱引入更多有争议的数据标签类型,比如缓和暴力内容。Toh说:“即使在芬兰被贴上标签的数据现在没有争议,我们也必须考虑它所开创的先例。”“是什么阻止了公司将创伤性和令人讨厌的内容的数据标签外包给监狱里的人,尤其是如果他们认为这是一个未开发的劳动力资源?”

  同样不清楚的是,芬兰监狱的劳动条件——以改造囚犯而闻名——是否可以在其他司法手段不那么进步的国家复制。根据民权组织美国公民自由联盟(ACLU)的数据,在美国,76%的囚犯报告称监狱劳动是强制性的。“美国的监狱系统与芬兰或北欧国家非常不同。这是一个完全不同的想法,”拉西拉说。“在芬兰,人们对这个项目的感觉非常积极,因为每个人都知道这是非常自愿的。”

  人工智能公司只会需要更多的数据劳动力,迫使他们不断寻找越来越不寻常的劳动力来跟上步伐。随着Metroc计划将业务扩展到北欧,并扩展到芬兰语以外的其他语言,维纳拉正在考虑是否将监狱劳工项目扩展到其他国家。“这是我们需要探索的东西,”他说。

 
打赏
 
更多>同类文章

推荐图文
推荐文章
点击排行