扎克伯格吹嘘他将成为人工智能之王,因为我们已经把我们所有的数据都给了他

   日期:2024-10-25     来源:本站    作者:admin    浏览:145    

  

  

  过去的几个月对马克·扎克伯格(Mark Zuckerberg)的meta来说是好事,该公司周四透露,由于削减成本和广告收入反弹,其利润同比增长了两倍,达到140亿美元。

  meta计划大力投资其虚拟现实和人工智能产品,对于后者,扎克伯格在财报电话会议上表示,公司正在“为赢而战”。人工智能已经迅速成为一个拥挤的领域,meta面临着来自OpenAI、微软和谷歌的激烈竞争。扎克伯格为meta的人工智能“剧本”列出了几个组成部分,其中最重要的是,全球数十亿人已经在meta的平台(包括Facebook和Instagram)上以帖子、评论、图片和视频的形式放弃了他们的数据。

  扎克伯格说:“当人们想到数据时,他们通常会想到你可能用来预先训练模型的语料库。“在Facebook和Instagram上,有数千亿张公开分享的图片和数百亿个公开视频,我们估计这比Common Crawl数据集还要多,人们也在我们的服务上分享了大量的公共文本帖子。”

  Common Crawl是一个共享数据集,多年来一直在不断地抓取网络数据,这可能是专门针对OpenAI的,因为该公司的GPT-3人工智能模型是在Common Crawl上训练的,此外还有维基百科、两个包含书籍的数据集和一个由Reddit链接组成的内部数据集。OpenAI还没有公开其最新模型GPT-4的训练资源。meta也在它的人工智能项目中使用Common Crawl,谷歌也有自己版本的数据集。

  虽然meta还没有真正在GPT的规模上与竞争对手展开竞争,但该公司利用用户数据开发其人工智能产品已经不是什么秘密了。该公司去年已经承认,它使用了公开帖子——但它声称,不是私人信息——来训练它的元人工智能助手。近几个月来,未经授权抓取网络数据以训练人工智能模型的行为引发了极大的愤怒;OpenAI甚至在描述该模型的论文中感谢了为训练GPT-3提供数据的无名“数百万人”。但当涉及到自愿与Facebook和meta分享的数据时,这种浮士德式的交易很久以前就达成了。

  现在,再加上共享开源模型和产品开发的长远眼光等所谓的优势,meta押注其庞大的储备将使其超越榜首。

 
打赏
 
更多>同类文章

推荐图文
推荐文章
点击排行