人工智能讲述的书来了人类失业了吗?这家初创公司有一个解决方案

   日期:2024-11-28     来源:本站    作者:admin    浏览:93    
核心提示:      如果你在过去一年左右的时间里听过一本有声书或一篇叙述新闻文章,那么它很有可能不是由人类创作的,而是由模仿人类

  

  

  如果你在过去一年左右的时间里听过一本有声书或一篇叙述新闻文章,那么它很有可能不是由人类创作的,而是由模仿人类声音的人工智能软件创作的。

  在不久或更遥远的某一天,人工合成的旁白和演员可能会变得司空见惯,被人们毫不犹豫地接受,但目前还有争论的余地:当机器代替人类表演者的工作时,我们会失去什么,又会得到什么?当有声书旁白等工作外包给人工智能时,谁应该获得收入?

  圣地亚哥一家名为Yembo的软件公司的联合创始人正涉入这一泥潭,为前所未有的情况提供前所未有的答案。圣地亚哥及其他地区的配音演员们正饶有兴趣地关注着这种为人工智能增强劳动付费的方式。

  场景:Yembo的联合创始人撰写并自行出版了一本关于人工智能的书,一位演员去年录制了这本英文有声书,并获得了录音时间的报酬。现在,她的人工智能克隆声音被用来讲述这本有声书的15个翻译。

  叙述者不会说瑞典语、乌克兰语和土耳其语,但她的声音会。

  这本书的作者兼出版商、Yembo的联合创始人扎克·拉特纳(Zach Rattner)在一封电子邮件中写道:“美式英语由有血有肉的海莉来讲述,其余的都是与她相似的人工智能。”

  海莉指的是配音被克隆的演员海莉·汉萨德。根据她的合同,汉萨德将获得用她的声音写的有声读物的版税,尽管她没有用这些语言中的任何一种来叙述这本书。

  虽然有声书和文章的人工智能叙述越来越普遍,但这可能是有声书领域人工智能克隆翻译支付版税的第一个例子——根据市场研究公司market.us的数据,到2033年,这是一个蓬勃发展的行业,预计全球将达到390亿美元。

  拉特纳说:“据我所知,这个有声书项目是第一个让叙述者从使用他们的人工智能形象的产品中获得版税的项目,但这并不是他们自己创造的。”“这是我所知道的第一个,当我试图弄清楚的时候,我什么也找不到。我们必须从头开始搞清楚。我们找不到任何模板。”

  圣地亚哥演员桑德拉·康德(Sandra Conde)的肖像已被扫描到一个生成式人工智能游戏项目中,她审查了合同的细节,并表示,在一个未知的、快速变化的领域,它解决了发行商和配音演员的利益。

  康德说:“这是一个新领域,我们不知道它会是什么样子,甚至不知道两年后或一年后会是什么样子。”

  来自康涅狄格州的配音演员兼娱乐律师罗伯特·西格林帕利亚表示,这份合同值得关注,因为它具有开创性,涉及有声读物旁白、翻译和人工智能。

  “这是狂野的西部,”他说。“据我所知,(演员)工会没有任何关于(人工智能)翻译的东西。”

  这份合同之所以重要,是因为其中的利害关系:“这是目前有声书世界的一个大问题:你是使用人类的声音,还是使用克隆的声音。因为有一些有声书是用人工智能完成的,叙述者试图保护现场叙事,试图保护他们的生计,”他说。

  他补充说,毫无疑问,人工智能将取代人类解说员。

  “我脑子里的问题是,它会走多远?会占用50%的股份吗?25% ?75% ?100% ?这是我们应该问的问题,”西格里帕利亚说。

  全国配音演员协会主席兼联合创始人蒂姆·弗里德兰德(Tim Friedlander)表示,这份合同意义重大,即使它只是一个例子,因为它允许人工智能生成的材料取代或补充人类的叙述。

  弗里德兰德在洛杉矶表示:“任何一种情况下,只要你有标准化的合成内容,(合同条款)就会很重要。”

  他补充说,人类演员比人工智能工具更有优势:他们的人性——这让他们能够根据生活经验、文化和背景做出细致入微的解读。他说,机器可能会尝试模仿,但它们无法以真实的方式解释故事或文章中的单词。

  有点像罗伯特·弗罗斯特所说的诗歌在翻译中迷失。

  Rattner表示同意。毕竟,他雇佣了一个人来录制英语有声书,而不是一开始就使用克隆的声音。只有翻译是克隆的。

  “我的意思是,有一些变化。在有声书中,她偷笑了几次。比如,作为人工智能,你确实会失去一些东西,”他说。但他说,在某些情况下,人工智能是有意义的。

  听众会在意一个声音是人的还是合成的吗?

  这可能取决于是什么书。或者声音。

  几十年来,演员们一直在为录制和重组他们的声音而付费——Siri于2011年首次亮相,其背景故事围绕着同意和补偿——使用生成式人工智能来克隆声音是一种新技术,而且效率要高得多,只需要一个小样本就能创造出新的材料。

  作为SAG-AFTRA的成员,西格里帕利亚说,十年前“你做不到这一点——你必须找一个配音演员,付他一个月的钱”来录下一大堆声音和文字。“现在你可以取一个三分钟的样本,你可以用它做任何你想做的事情。你可以做有声书,电影,电视节目,你可以用三种不同的语言。它只需要非常少的数据。”

  《大西洋月刊》和圣地亚哥调查新闻媒体inewsource都使用了人工智能旁白插件。人工智能文本到语音叙述服务的家庭手工业已经激增:ElevenLabs、Podcastle、Speechify、Murf AI、Revoicer、Audiobook。艾和其他人。

  在这一飞跃之前,表演和有声读物叙事很难外包。马来西亚和斯里兰卡的劳动力价格可能很便宜,但加州的节奏是他们无法制造的。人工智能是一种变通方法:使用机器而不是人工。

  这就是演员和其他创意专业人士将生成式人工智能视为生存威胁的原因。

  这就是为什么演员和作家在去年的罢工中与电影公司发生冲突,西格里帕利亚说。

  电影公司是否应该被允许扫描演员的脸,并利用这些扫描产生新的素材,或者他们是否应该继续雇佣人类,即使合成演员——不需要上厕所或支付薪水——可以取代他们?如果电影公司确实扫描了演员的面部特征,他们是只为扫描付费,还是应该为未来或潜在的用途付费——那些本来可以由人类演员完成的用途?

  演员罢工的解决方案允许人工智能克隆,但对未来的使用进行了限制,并增加了有关补偿的规则,以更好地保护演员,西格里帕利亚说。

  弗里德兰德说,保守估计,美国约有10万名在职配音演员,其中约80%的配音工作是非工会成员。

  去年夏天,曾在高通(Qualcomm)从事软件创新工作的拉特纳(Rattner)自行出版了一本名为《快速成长:一家人工智能初创公司的经验教训》的书。这是一本创业回忆录,讲述了他如何帮助创建了Yembo公司,这家公司利用人工智能的一个子集——计算机视觉,为移动和保险行业制造工具。

  这本书的西班牙语译本将于本月发布,其次是乌克兰语和其他10多种语言。拉特纳说,所有这些都可以在几个月内完成,并有时间进行调整和修改。

  他说,人工智能旁白“无疑为那些无法传达信息的人降低了进入的门槛。”

  他分解了人力和机器的时间和金钱成本。英语有声书花了大约四周的时间来录制。(汉萨德只能在周末录音,她的声带需要休息。)他写道:“考虑到母带、编辑、QA听音和重录,我估计这部美国英语有声书的制作需要各方大约65个工时的努力。”

  接下来,他们用她三小时的书籍录音来训练一个名为语音合成模型的人工智能工具,并使用该模型来创建翻译中的其他书籍。

  不算人类的翻译(Rattner雇佣了人来写翻译,因为“人工智能翻译会以不可预测的方式出现奇怪的错误”),每本人工智能有声读物的叙述需要5个小时,其中大部分时间花在质量保证上——消除错误,比如把第二篇读成“第二篇”而不是“第二篇”,而是“第二篇”。

  他估计,价格上的差异更惊人:一个人类解说员每次录音的收费可能是几百美元,一本有声书的收费可能是2500美元。语音合成软件每月花费22美元。

  叙述者不需要做额外的工作来创作15本翻译书籍,但出版商也不需要出去雇佣另外15名叙述者。当有声书的部分制作外包给人工智能时,对创作者和出版商来说,多少报酬是公平的?

  拉特纳与《联合论坛报》分享了这份合同,该合同试图最大限度地减少一名工人的损失,同时最大限度地提高人工智能的好处,对于有声读物翻译来说,人工智能的好处包括扩大信息获取渠道。每卖出一本《快速成长》的译本,旁白就会赚到钱——尽管她从未用其他语言录制过唱片。出版商也是如此,他们使用人工智能来解说翻译,而使用人工演员的成本只是人类演员的一小部分。

  汉萨德每天在录音室录音4小时,可获得500美元的报酬,使用她的语言的翻译作品可获得10%的版税ned的声音。付款按季度进行,期限为10年。

  她的克罗Ned的声音可以。仅用于本书的翻译。其他用途需要新的许可证。

  解说员有30天的时间来审查产品,包括翻译,并在产品发布前要求进行编辑。

  出版商可以以任何价格出售这本书,并提供赠品。

  其中一节涉及标签。“人工智能的使用必须在产品标识中披露,”Rattner说。这样,读者或听众就会知道这本有声书是“由海莉·汉萨德叙述”还是“用海莉·汉萨德的声音”。

  其他审查了合同要点的演员称其“令人鼓舞”,并表示这对双方来说总体上是公平的,尽管有些人持保留意见。

  大家都同意叙述者应该得到版税。希格里帕格里亚表示:“使用人工智能代替人类演员,使出版社获得了更大的利润,未来的叙述者因为人工智能而失去了潜在的收入。”

  他说:“他们只需要一个人用一种语言阅读,然后他们可以用机器把它转换成一种语言,不需要任何费用。”

  弗里德兰德喜欢这份合同涉及到同意、控制、补偿和透明度。但他表示,即使是公平的合同也会引发对先例的质疑。

  他说:“一个配音演员可以用所有不同的语言配音。”他提到了“这对所有其他叙述者造成的伤害,他们可能会用不同的语言来做这件事。”

  他说,有一天可能会出现“一小撮四五个叙述者,他们会成为一切的代言人”。有声读物是“许多人开始配音的地方之一”。他问道,如果规范变成了合成的声音,这些新人将如何开始呢?

  康德想知道为什么版税在10年后就停止了。“合同解除了吗?她的声音可以在任何地方使用吗?”她问。“我会担心10年条款之后会发生什么。”

  圣地亚哥配音演员温迪·霍夫兰(Wendy Hovland)说,时间限制可以帮助叙述者重新谈判。她还表示,出版商“似乎正在公开与她合作,告诉她将如何使用它,并提出一种对双方都有效的补偿方式。”她说,配音演员并不总是能做到这一点。

  “这是一个大问题:声音——我不知道用‘偷来’这个词是否恰当,但它的使用方式并非本意。配音演员以为他们在为一件事配音,却发现他们的声音被用来做别的事情。”

  汉萨德觉得这份合同“很有保护”,因为未经她同意,合同禁止其他人使用她克隆的声音。

  “像其他演员和创作者一样,我确实担心被人工智能利用。但这个特殊的协议是双赢的。扎克非常愿意照顾我所有的担忧,”汉萨德说。

  要理解为什么拉特纳优先考虑与叙述者签订一份公平的合同——这对Yembo有什么好处——就有助于理解Yembo卖的是什么。Yembo的软件扫描房屋内部,创建库存和3D模型,用于移动、存储和保险重建估算。

  拉特纳说,签约新客户的最大挑战不是竞争对手,而是抵制变革。在一个使用打字机仍然可行的行业——就像他遇到的一家搬家公司那样——他们将如何信任新技术,不管它是不是人工智能?如果几十年来一切都很好,为什么要冒险呢?

  他的解决方案是:证明人工智能的用途不仅仅是盈利。

  “我发现商业安排和这本书本身一样有趣。我认为这是一个有趣的故事,讲述了人工智能如何被用于做好事,尤其是在人们对人工智能演员感到焦虑的情况下。”

  他补充说:“人工智能允许经济价值与创造的产出挂钩,而不是与付出的努力(例如,用时间换美元)挂钩。”

  拉特纳表示,如果没有人工智能,他不会从事外语叙事,因为他的工作是经营一家科技初创公司,而不是一家出版社。他从Yembo的队伍中找到了叙述者:汉萨德是Yembo雇佣的产品经理,以前是一名专业演员。她有sag资格,但不是工会成员。

  他说:“(人工智能的)替代品什么都没有。”他解释说,他说的“什么都不做”是指没有翻译,也没有聘请各种语言的解说员。

  在洛杉矶的一次采访中,Hansard谈到了听到她的声音克隆的不可思议之处。这是她的第一本有声书,有英文版,也有翻译版。

  她说:“听到我的声音说着我以前从未说过的语言,这几乎是不和谐的,但这种可能性的存在也令人惊讶。”

  她对这个项目很满意,因为她确信它不会占用别人的工作。

  “我认为最好的结果是人工智能不会取代人类演员或人类声音,”汉萨德说。“如果没有它就不可能,它只是一种补充。”

  她继续说道:“我认为这是每个人都必须触及人性的地方,以确保人工智能不会取代人类。它只会增强——如果有些事情不可能实现,那么它就会填补空白。”

 
打赏
 
更多>同类文章

推荐图文
推荐文章
点击排行