苹果公司的一个工程师团队开发了一款名为Depth Pro的基于人工智能的模型,可以绘制2D图像的深度。该团队撰写了一篇论文,描述了该应用程序及其功能,并将其发布在arXiv预印本服务器上。他们还在公司的机器学习研究页面上发布了关于这款应用的公告。
人类和其他动物之所以能够感知深度,是因为大脑能够从每只眼睛获取两幅图像,并利用它们之间的差异来找出图像的哪些部分近一些,哪些部分远一些。一些摄像机也做了类似的事情来制作3D视频。
智能手机,因为他们只依靠一个摄像头拍照和视频制作,有各种硬件和软件的补充,允许增加一定程度的深度。在这一新的努力中,苹果的工程师们利用原始图像中的数据创建了一个完整的深度图,而不需要使用元数据,比如相机的内在特性。
深度图是使用原始图像中的所有像素创建的地图。地图上的每个数据点代表一个像素,对应于像素所代表的图像部分与被成像物体对应部分之间的距离。
这样的地图允许在平面图片上添加另一个维度,使其具有3D效果。该团队表示,创建深度图可以产生比使用标准智能手机技术更清晰的3D效果。
在他们的声明中,苹果团队声称使用该模型的应用程序能够在0.3秒内生成深度图,当在带有标准gpu的计算机上运行时,它可以在没有生成3D效果通常需要的相机数据的情况下完成。
通过创建一个运行如此迅速的模型,苹果打开了用单镜头相机实时创建3D图像的大门。该团队指出,这可能会对机器人和其他实时地图应用产生重大影响,比如自动驾驶汽车上使用的应用。
更多信息:Aleksei Bochkovskii等人,深度专业:不到一秒钟的锐利单目度量深度,arXiv(2024)。DOI: 10.48550 / arxiv.2410.02073
深度专业版:github.com/apple/ml-depth-pro
machinelearning.apple.com/research/depth-pro
期刊信息:
arXiv
?2024 Science X Network
引用苹果推出深度Pro,这是一款人工智能应用程序,可以映射2024年10月10日从https://techxplore.com/news/2024-10-apple-unveils-depth-pro-ai.html检索的2D图像的深度
作品受版权保护。除为私人学习或研究目的而进行的任何公平交易外,未经书面许可,不得转载任何部分。的有限公司
内容仅供参考之用。