查看原文
其他

一句话生成3D模型来了!动动嘴就完成建模不再是梦想!

穿行者2049 今说新语 2024-04-14

本周,开源人工智能研究机构 OpenAI 发布了一项新技术Point-E,可以直接从文本生成 3D 模型。这一技术的出现,为计算机视觉领域带来了新的突破,也为人工智能在视觉领域的发展提供了更多可能性。

在过去的几十年里,计算机视觉技术一直是人工智能领域的重要研究方向。计算机视觉技术的发展,有助于人工智能在自动驾驶、图像识别、机器人等领域的应用。而随着深度学习技术的发展,计算机视觉技术也取得了长足的进步。
然而,在计算机视觉领域,从文本生成 3D 模型的技术一直是一个挑战。这一技术的难点在于,需要计算机能够理解文本中描述的物体的形状、尺寸、颜色等信息,并将这些信息转化为 3D 模型。这需要计算机具备自然语言理解、图像生成和 3D 建模等多项技术。
而 OpenAI 在最近发布的 3D 模型生成技术中,成功地解决了这一挑战。通过训练大量数据,让计算机能够理解文本中的物体信息,并将其转化为 3D 模型。在测试中,这一技术的生成速度提升了600倍,能够生成出精细的 3D 模型。
Point-E 不输出传统意义上的 3D 图像,它会生成点云,或空间中代表 3D 形状的离散数据点集。随后一个额外的人工智能系统来将 Point-E 的点云转换为网格。
Point-E 由两个步骤组成:文本到图像模型和图像到 3D 模型。文本到图像模型类似于 DALL-E 2 和 Stable Diffusion 等text2Img系统,在图像生成之后,再执行图像到 3D 模型生成。
程序目前已开源,并已经有了演示版可以体验。
文本生成3D
图像生成3D
文本生成图像再生成3D
点状云图
3D模型
可下载的模型文件
这一技术的出现,不仅为计算机视觉领域带来了新的突破,也为人工智能在视觉领域的发展提供了更多可能性。例如,在未来,这一技术可以用于自动生成 3D 建筑模型、游戏角色模型等,为计算机视觉领域的应用带来新的想象空间。
此外,这一技术的出现,也为人工智能在自然语言理解、图像生成和 3D 建模等领域的发展提供了新的思路。在未来,随着计算机视觉技术的不断发展,人工智能可能会在更多领域得到应用。
总的来说,OpenAI 发布的 3D 模型生成技术,为人工智能在视觉领域的发展带来了新的机会,也为计算机视觉领域的应用提供了新的想象空间。希望在未来,这一技术能够得到更多的发展,为人类带来更多的便利。
感兴趣的朋友可以去体验一下。
项目地址:https://github.com/openai/point-e
演示版地址:https://huggingface.co/spaces/anzorq/point-e_demo


根据你的喜好,推荐阅读以下AI绘画内容:




对写作者最好的支持就是

转发、点赞、关注、打赏

继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存