查看原文
其他

文本生成视频领域的王者:Runway的崛起之路!

穿行者2049 今说新语 2024-04-14
扫除AI绘画的迷雾,全面解读AIGC的秘密!
加入《AI绘画与AIGC实践之路》专栏,一睹究竟!

如果问你目前AI发展最快的领域是什么? 可能很多人还没意识到:文本生成视频。

如果你看过我视频号最近发布的大量AI视频,例如上面这种,你应该已经知道这些都是使用Runway公司Gen-2制作的精彩视频。显然目前媒体和AI用户群体对Gen-2的关注远远不够,虽然Gen-2仍在内测中,但在国外社交媒体上已经出现了大量Gen-2制作的精美视频,如同AI绘画在去年爆发一样,AI视频即将带来更大的一波生成式AI浪潮。

Runway 是目前人工智能领域最引人注目的公司,如果你一直关注AI领域的新闻,很容易注意到他们目前拥有最领先的AI视频技术。当然,Nvidia、Meta和Google等很多大公司也已经展示了一些研究演示。但Runway已经有了一款真正意义上的产品,大量艺术家们正在用它制作令人着迷的视频。

那么,他们背后的团队是谁?他们是如何做到的?

@agermanidis在左边,@matamalaortiz在中间,@c_valenzuelab在右边。

Runway的故事始于21世纪初。故事发生在纽约大学,三名技术艺术项目的研究生相遇。他们各自为设计师制作一些设计工具,Gene Kogan展示了他用风格迁移做的几个实验,将第一个生成式AI病毒式GIF送给了世界。Mr. Div的迪斯科舞球经由Gustav Klimt的“吻”重新设计。在半个地球之外,智利的克里斯托瓦尔·瓦伦苏埃拉被这个作品深深吸引。因此,他申请了纽约大学,在那里科根Kogan是兼职教师。
克里斯托瓦尔成功入学。就像之前的许多人一样,他搬到了这个充满梦想的地方。
2016年

在纽约大学,克里斯托瓦尔遇到了一个充满创意的社群,他们正在用技术突破边界,从机器学习(ML)到虚拟现实(VR)。他积极从事各种技术开发,甚至合作开发了ml5js,它利用用户的网络浏览器和GPU执行ML任务。他还与其他移民阿雷贾德罗·马塔马拉-奥尔蒂斯和阿纳斯塔西斯·格尔马尼迪斯建立了联系,他们正在为设计师构建工具。

当时,他们没有梦想建立下一个AI独角兽,他们只是在学术环境中进行探讨和研究,三人开始探讨如何将神经网络应用在自动驾驶汽车等常规应用之外,特别是为艺术家和电影制片人提供的工具。

2017年

克里斯托瓦尔开始研究他的论文,专注于一个名为Runway的工具,为设计师提供ImageNet和Char-rnn等开源模型的访问权限。当他评估了来自VFX、电影、艺术和设计等行业的人们的反馈时,他意识到这是不容忽视的。

嘿,我对这个感兴趣。

我想用这个。

我能得到这个吗?

每天,他都能听到大量类似的请求。他与阿雷贾德罗和阿纳斯塔西斯分享了他的经历,他们也遇到了对他们的工具感兴趣的类似需求。

这三人决定创办一家公司。

但Runway几乎差点没能开始。

像许多伟大公司的起源故事一样,Runway的创立是由潜在客户的强烈需求驱动的。然而,一个障碍几乎使他们错过了独角兽的机会。毕业后,他们收到了来自大型、知名公司的工作邀请。例如,克里斯托瓦尔被Adobe的AI团队提供了一个职位。克里斯托瓦尔的母亲敦促他接受这份工作。但他的直觉和支持他的其他创始人让他选择了Runway。

这三人在Twitter上发布了一条推文寻找测试用户,以评估对他们软件的测试版访问的兴趣,数百人热情地回应。结果反响热烈:570个赞👇


这次用户热烈的反响让他们有信心拒绝那些大公司。他们意识到这个机会太重要,不能再接受稳定的工作,他们选择了学校提供的研究驻地职位。

冒险正式开始。这三人接受了纽约大学每月2000美元的研究员职位。在纽约,这点钱微不足道。所以,他们加快了开发速度,他们推出了团队自己的软件,当时它还处于内测阶段。设计师们非常喜欢这个软件,称之为“新的Photoshop”。


很快风险投资家就注意到了他们,仅仅在三人全职投入几个月后,Runway就筹集到200万美元的种子轮融资。这使得团队能够搬出他们的小公寓。然后他们将Runway完全建立在网络上,并在其上构建了易于使用的各种应用程序,他们开始思考如何利用其技术让电影制作更加普及。

在2018年开始创建生成式AI公司Runway时,投资者、电影制片人和广告商告诉几位联合创始人,他们是疯了。投资人说:”你们为什么要为视频和电影制作构建AI工具?“但现在,五年后,这家提供AI驱动的图像和视频编辑工具的初创公司已吸引了投资者和公众的关注。根据福布斯报道,Runway已经从风投公司如Amplify Partners,Lux Capital,Coatue和Felicis Ventures获得了近1亿美元的融资,最新一轮融资使其估值达到5亿美元,同时还在获奖影片《Everything, Everywhere, All at Once》中担任关键制作角色。

在2020年底筹集到850万美元的A轮融资后,团队全力投入模型方面:

2021年的Latent Diffusion

2022年的Stable Diffusion

这帮助团队筹集到B轮和C轮融资,为他们下一次精彩的发布做好准备...

#Gen-1

公司在2月6日发布了Gen-1,并在Twitter上获得了巨大的关注。轻松上手!Runway GEN-1详细使用教程,让你成为AI视频大师!

做为第一款产品化的AI视频工具,用户的接受程度非常高,由于公司将其开放给人类强化学习,Gen-1在第一周到第六周的进步速度惊人。

#Gen2

这使他们在短短六周后就推出了Gen-2!炸了!GEN-2正式公测!Runway带领我们进入AI视频新时代!

未来已来:Gen-2 AI视频生成工具领先时代,引领影视创作进入新纪元!

目前Gen-2每天都在社交媒体上产生令人惊叹的各种视频。

甚至在Gen-2还没有公开时,Runway就已经精心地将访问权限推广给很多活跃在Twitter的艺术家。显然,Runway是文本到视频AI领域的明显领导者。

这是一个天才策略的天才执行。

Runwayml如何取得如此成功?

1. 精准定位受众:Runway确定了技术创意人群的关键人物

2. 利用强大的市场推广:Runway巧妙地设计了Twitter友好的功能

3. 构建自我持续发展的模式:Runway的增长依赖于自身

作为“全栈应用AI研究公司”,Runway包括三个组件。

首先,公司构建了自己的基础模型,如Gen-1和Gen-2,这些模型可以根据用户提供的文本、图像或视频剪辑创建视频。Runway的模型训练实际上起源于图像生成——初创公司最初与慕尼黑大学的研究人员合作,建立了Stable Diffusion的第一个版本,随后Stability AI介入,对模型进行了额外数据的训练。

然后,Runway的基础设施团队将这些模型以可靠、安全的方式部署给客户,这对于创建好莱坞规模的电影来说是重要的要求。

最后一个组件是Runway的应用层,包括从个人创作者到大型电影制片厂可以使用的编辑图像和视频的工具。

Runway的全栈战略吸引了许多硅谷风投公司,因为它具有灵活性、控制性和可防御性。然而,这家初创公司最初采用这种方法并不是为了迎合投资者,而是出于绝对的必要。在Runway成立之初,AI“模型并不是很好,应用仍在被理解”,这意味着创业公司的创始团队需要对产品进行充分的控制以便于实验。

构建整个技术栈所需的时间——对于Runway来说是四年多——这使得与Runway规模相当的直接竞争对手难以涌现,尽管面向企业用例的AI生成视频初创公司如Synthesia也受到了投资者的关注。

如今,这家初创公司采用基于消费的定价模式,根据用户计划生成的视频长度或图像数量提供不同的套餐,其中包括一个免费套餐。

艺术面向所有人,很多客户在头脑风暴、分镜头绘制和原型制作过程中使用Runway的工具,以便了解不同方法可能的基本外观。一旦他们确定了最终方案,制片人和创作者可以结合Runway公司的工具来加速拍摄和制作过程,例如自动删除和替换视频背景,许多这些功能都是与客户共同开发的,客户经常向Runway描述他们在创建视频时遇到的问题和障碍。

由于他们过去在艺术和设计方面的经验,Runway的联合创始人更容易理解电影制作的难题。

对于未来,Runway最期待建立可以适用于任何形式的“创意增强工具”,从文本到音频到视频,很多方面都与人们如今接收内容的方式相似——同时观看视频片段、阅读字幕和消化音频。Runway的创始人表示:“每一代艺术家都有责任利用现有的最大技术手段去创作艺术。艺术是一种观点,不需要技术含量高或复杂,只要能表达出有意义的东西。”

如果你对Runway公司的Gen-2产品感兴趣,可以关注我的视频号,目前已经发布大量使用Gen-2技术制作的视频。如果你想紧跟AI技术的最新进展,欢迎加入我的公众号专栏《2023 AIGC从入门到精通专栏》,及时获取最新技术动态!

根据你的喜好,推荐阅读以下AI绘画内容:




公众号内容导航

基础入门 | 建筑室内 | 模型训练 | ChatGPT

StableDiffusion  |  Midjourney  |  进阶专栏 

2023.4  2023.3 | 2023.2 | 2022


☞三连击支持 点赞 + 在看 + 分享👇

继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存