旧金山:谷歌分享了关于通用语音模型(USM)的更多信息,该公司将该系统描述为实现其目标的“关键的第一步”,现在正朝着构建支持1000种不同语言的人工智能语言模型的目标迈进,以击败ChatGPT。
去年11月,该公司宣布计划创建一个支持世界上1000种最常用语言的语言模型,同时还公布了其USM模型。
这家科技巨头将USM描述为一个最先进的语音模型家族,拥有20亿个参数,经过1200万小时的语音和280亿句文本训练,涵盖300多种语言。
谷歌在一篇博客文章中说:“USM用于YouTube(例如,封闭字幕),不仅可以对英语和普通话等广泛使用的语言进行自动语音识别,还可以对阿姆哈拉语、塞布亚诺语、阿萨姆语和阿塞拜疆语等资源不足的语言进行自动语音识别。”
谷歌目前声称USM支持超过100种语言,并将作为一个更大系统的“基础”。
与此同时,谷歌预计将在不久的将来为其产品引入一系列人工智能功能,其中,针对Android的Gboard正在努力集成Imagen文本到图像生成器。