查看原文
其他

Sora背后团队原来是他们!居然还有00后?外网又传出一波令人震惊的OpenAI sora视频!

wuhu小精灵 wuhu动画人空间 2024-04-20

wuhu专题

文| sora


就在前几天OpenAI发布了最新文本生成视频应用sora,一时间轰动世界,成为全球焦点。


据悉,受益于Sora的大火,OpenAI的估值狂飙275%,在最新一轮融资中有望超过800亿美元(约合5755亿元),跃升为仅次于字节跳动(2250亿美元)和SpaceX(1500亿美元)的全球第三大独角兽。


在 Sora 之前,已经涌现出其他几种文本到视频生成模型,包括 Meta 的 Make-A-Video、Runway 的 Gen-2 以及 Google 的 Lumiere。截至 2024 年 2 月,其中最后一个模型仍处于研究阶段。Sora 背后的公司 OpenAI 在 2023 年 9 月发布了 DALL·E 3,这是其第三个 DALL-E 文本到图像模型。

Sora 的开发团队以日语中 "天空" 的意义命名它,象征着它的 "无限创造潜力"。于 2024 年 2 月 15 日,OpenAI 首次预览了 Sora,并发布了多个由其生成的高清视频片段,包括一辆 SUV 在山路上行驶、蜡烛旁边的 "短毛怪" 动画、两个人们在雪地里走过东京,以及加州淘金热的虚假历史场景。

OpenAI表示 Sora 能够生成长达一分钟的视频。随后,该公司分享了一份技术报告,重点介绍了用于训练模型的方法。OpenAI 首席执行官 Sam Altman 还通过一系列推文回应了 Twitter 用户使用 Sora 生成的提示视频。

OpenAI 表示,它计划向公众开放 Sora,但时间表尚未明确。该公司向一个小型 "红队" 提供了有限的访问权限,其中包括错误信息和偏见方面的专家,以对模型进行对抗性测试。同时,公司还与一小群创意专业人士(包括视频制作者和艺术家)分享了 Sora,以获取有关其在创意领域实用性的反馈。

目前,外网又传出一波令人震惊的OpenAI sora视频!

连一年前被整活吃面条的威尔斯密斯在sora时代也迎来了完全进化:

不过还好,震惊之余,仔细看看,原来是官方整活,真人出镜搞笑。

这让很多网友们在一开始看到视频的时候看了无数遍为了寻找瑕疵,结果是真人。。。闹了不少笑话。

就在今天,Sora团队开启招聘,同时放出了最新sora作品,寻找“对系统效率充满热情、相信可扩展性并拥有解决这些问题的专业知识”的人才。

从sora的出现到背后,大家都开始好奇这背后的团队到底是谁?

Sora的主要负责人一共有三名:

Tim Brooks
蒂姆·布鲁克斯

“我是OpenAI的研究科学家,共同领导我们的视频生成模型Sora。我的研究主要涉及模拟物理世界的大规模生成模型。

我在伯克利人工智能研究中心获得了博士学位,导师是Alyosha Efros,我在那里发明了InstructPix2Pix。之前,我曾在谷歌负责Pixel手机相机的人工智能技术,并在NVIDIA研究视频生成模型。

我的摄影作品曾获得国家地理、自然最佳摄影和国家野生动物联合会颁发的奖项。我曾在纽约百老汇的比肯剧院表演,并因无伴奏节拍击鼓获得国际奖项。

我对人工智能充满热情,很幸运它与我对摄影、电影和音乐的热爱相结合。欢迎您对我的工作提出评论和问题。”

与同为 Tim 师出同门、比他晚毕业 4 个月的 William (Bill) Peebles 一样,他也是 Sora 的另一位负责人。

William (Bill) Peebles

威廉(比尔)皮布尔斯

“我是OpenAI的研究科学家,共同领导我们的视频生成和世界模拟项目Sora。

此前,我在伯克利人工智能研究中心完成了我的博士学位,导师是Alyosha Efros。在那之前,我在麻省理工学院本科阶段,得到了Antonio Torralba的指导。我曾在Facebook人工智能研究院(FAIR)、Adobe Research和NVIDIA实习过。在攻读博士学位期间,我得到了美国国家科学基金会的研究生研究奖学金的支持。”


Aditya Ramesh
阿迪提亚·拉梅什

“我创建了 DALL·E,并与他人共同创造了 DALL·E 2,这是OpenAI开发的一种文本到图像生成系统。我对利用人工智能来增强人类创造力充满兴趣,在2024 年冬季季度加入华盛顿大学历史系担任助理教授”

他希望更多人了解 DALL-E 2 技术的工作原理,以减少对其的误解。他谈到DALL-E 和生成式人工智能的未来,“有人认为这个模型的运作方式是它在某个地方有一个图像数据库,然后通过剪切和粘贴这些图像的片段来创建新的图像,”他解释道。“但实际上,它的运作方式更接近人类。当模型通过图像进行训练时,它会学习到所有这些概念的抽象表示。”

他进一步解释:“当我们开始从零生成图像时,就不再使用训练数据。”“生成模型从试图生成的模糊近似开始,然后通过多个步骤逐渐添加细节,就像艺术家如何从一个粗略的草图开始,然后随着时间推移逐渐丰富它。”

2021年 DALL-E 生成的“穿着短裙遛狗的小萝卜”插图 

结果到昨天

sora已经将它直接变成动画!

他强调,一直以来 DALL-E 的目标就是帮助艺术家。

Sora团队的00后登场!


will depue
威尔·德普

“我热爱构建。我的重点是构建从根本上质疑一切的事物。今年1月我才刚刚加入Sora项目组” 

2022年从密西根大学计算机系本科毕业,我进行过前端开发,简单的人工智能/机器学习工作,但我更愿意将自己看作是一个设计和产品的人。

我领导过团队,规模从10人到200人以上,取得了成功。我的领导风格很独特,正如有人所说:“威尔是我曾经遇到过的最自然的领导之一 - 以一种非常悠闲随和的方式,他将周围的人视为平等。”

Sora的幕后团队还包括三位华人

Li Jing、Ricky Wang、Yufei Guo

Li Jing是DALL-E 3的共同项目组成员,2014年本科毕业于北京大学物理系,2019年获得MIT物理学博士学位。在Meta做了2年多博士后之后,Li Jing于2022年加入OpenAI。

另一位华人作者是Ricky Wang,他在今年一月从Meta/Instagram跳槽到OpenAI。同时,新加入的还有Conner Holmes,他在微软工作时以外援形式参与了DALL·E 3的推理优化工作,后来干脆加入了OpenAI。

最后,我们来看一下完整的作者名单:


OpenAI创始人奥特曼7万亿芯片计划

OpenAI宣布了一项筹资7万亿美元的计划,旨在建立一个“芯片帝国”。这一庞大的投资相当于美国国内生产总值(GDP)的25%,中国GDP的40%,全球GDP的10%。

OpenAI的首席执行官奥特曼透露,目前该公司每天生成约1000亿个单词,这需要大量的GPU(图形处理器)芯片进行训练计算。这也许是OpenAI决定“造芯”的一个重要原因。此前,奥特曼曾多次抱怨AI芯片短缺问题,指出目前英伟达的芯片产能已不足以满足未来的需求。

据业内估算,ChatGPT的一次训练大约需要2.5万块英伟达A100芯片。如果训练GPT-5,则可能需要5万张英伟达H100芯片。市场分析认为,随着GPT模型的不断迭代升级,未来GPT-5可能会面临无法满足芯片需求的情况。因此,对于OpenAI而言,投身芯片制造似乎是一个顺理成章的举措,也是必然的选择。

NVIDIA CEO黄仁勋笑了:有必要吗?

黄仁勋则认为更高效、更低成本的芯片将不断涌现,奥特曼所谓的“7万亿美元”大规模投资的没有这么必要。

不过话说回来,黄仁勋也没有绝对否定。他强调,对于AI领域的投资增长不会在短期内停止,并预测AI数据中心的规模将在五年内翻番。实际上,自从奥特曼的7万亿美元的消息曝光以来,网友们也没少进行各种猜测。

根据Gartner的预测,2023年全球半导体行业的总收入为5330亿美元,而7万亿美元是这个数字的14倍。

一些网友计算认为,这笔资金不仅足以一口气吞并英伟达、台积电、英特尔、三星、高通、博通、AMD、ASML等一系列半导体行业的龙头公司,而且剩下的钱还能轻松购买Meta。


AI快速发展,监管将面临哪些挑战?

中国互联网协会副理事长、伏羲智库创始人李晓东表示,“数据获取+应用方式”是AI监管的两大问题。合理合法获取数据对人工智能至关重要,人工智能的应用方式也要充分遵守伦理规则。这两个核心问题如果处理不当,将会严重影响人工智能的发展和利用。
从数据获取方面看,采集和获取不仅涉及到数据的产权问题,还涉及到国家安全和个人隐私。如何合理合法获取数据,对于人工智能至关重要。
此外,如何有效联通数据故障,促进数据交换共享,提升数据之间的互操作能力也是人工智能的治理重点。否则,没有持续数据支撑的人工智能发展将会严重受损。
从人工智能的应用方式来看,人工智能以前所未有的方式展现其强大的信息处理能力,其本质是提升人类对信息的利用效率和效果。而人类社会有其基于特定国家和文化的法律法规和道德约束,人工智能发展也要充分遵从法律法规和道德伦理。
目前,部分人工智能技术确实对传统道德伦理及既定法律法规产生冲击,并产生全球性新的伦理规范和规则。而在规则规范形成过程中,要保持积极互动跟踪,推动伦理规范和全球规则朝着向上的轨道前行。

参考:OpenAI官网 央视新闻


END


公众号改版,如果没有星标✨可能之后会看不到我们的文章


添加wuhu小精灵5号微信(wuhudonghua5)发送“动画新势力”即可在不久后被邀请进群。



你一定还感兴趣:


脑机接口原来长这样?!元宇宙离我们到底还有多远?


蝉联动画界最高奖项!《蜘蛛侠:纵横宇宙》横扫安妮奖7大奖项!!


 行业震动!OpenAI首个视频生成模型震惊世界后还有这些问题...


《寄生兽》由Netflix联手《釜山行》导演翻拍韩版,质疑声却比噱头大?

2024年全球最赚钱的124个IP,米哈游原神首度上榜!




继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存