ChatGPT改变了公司nversation一人工智能。
但支持它的技术有局限性,可能很难制造出和人类一样聪明的人工智能。
研究人员现在正在寻找替代方案。
NEW LOOK注册获取今日市场、科技和商业领域最重要新闻的内幕消息——每日提供。阅读预览广告
2017年,一群谷歌人的开创性工作向世界介绍了变压器——为当今流行的人工智能产品提供动力的神经网络。
它们为OpenAI的聊天机器人ChatGPT下的大语言模型(LLM)提供了动力。去年,聊天机器人ChatGPT的爆炸式发展促使比尔·盖茨宣布“人工智能时代已经开始”。
现在,一些人工智能企业家的任务是实现科幻小说中的愿景,创造出通用人工智能(AGI):看起来和人类一样聪明的人工智能。
但是,虽然变形金刚可以为ChatGPT提供动力,但谷歌研究人员上个月发表的一篇预印本论文表明,他们可能无法做出像人类一样的抽象、推断和预测,这意味着我们已经达到了AGI。
广告
ChatGPT只是使用人类训练过的数据,用文本回应用户的提示。在其最早的公开形式中,聊天机器人对2021年9月之后的事件一无所知,每次有人询问最近的话题时,它都必须承认。
在测试变压器超越数据的能力时,谷歌的研究人员描述了它们“即使是简单的外推任务的泛化”的“退化”。
这就提出了类似人类的人工智能是否可能的问题。另一个问题是,不同的技术是否能让我们实现这一目标。
一些研究人员正在测试替代方案来解决这个问题,另一篇新论文表明,可能有一个更好的模型在等待。
广告
卡内基梅隆大学机器学习系助理教授Albert Gu和Together AI首席科学家Tri Dao于12月1日向开放存取库ArXiv提交了一份研究报告,介绍了一种名为Mamba的模型。
Mamba是一种状态空间模型,或SSM,根据Gu和Dao的说法,它似乎能够在一系列任务中的性能上击败变压器。
警告:提交给ArXiv的研究是有节制的,但不一定是同行评审的。这意味着公众可以更快地看到研究成果,但这并不一定可靠。
与llm一样,ssm也能够进行语言建模,这是ChatGPT等聊天机器人运行的过程。但是ssm是通过用户提示可能采取的不同“状态”的数学模型来做到这一点的。
广告
Gu和Dao的研究表明:“曼巴在语言、音频和基因组学等多种方式上实现了最先进的表现。”
Gu和Dao指出,在语言建模方面,Mamba“在预训练和下游评估方面优于同等大小的变压器,并与两倍大小的变压器相匹配。”
Dao还在X上写道,ssm特有的一个特性意味着Mamba能够以比转换器快五倍的速度生成语言响应。
作为回应,英伟达软件公司的研究科学家吉姆·范博士在X上写道,他“总是对推翻变形金刚的新尝试感到兴奋”。我们需要更多这样的人。”
广告
他对Dao和Gu“多年来推动可选序列架构”表示“赞赏”。
ChatGPT是一个具有里程碑意义的文化事件,引发了人工智能热潮。但该公司的技术似乎不太可能引领该行业走向拥有类人智能的应许之地。
但是,如果反复测试证实曼巴的性能始终优于变压器,它可能会使整个行业更近一步。