查看原文
其他

VR内容的重点在操控感?音乐的角色?VR会议功能的价值?| Oculus前CTO、技术咨询顾问 访谈实录

东西文娱 2023-10-16

The following article is from 共同虚拟 Author 共同虚拟

为VR领域的技术大牛,Oculus前CTO、技术咨询顾问 John Carmack 近期接受了Lex Fridman的访谈。
Lex Fridman是出生于俄罗斯的美国计算机科学家,人工智能研究员,并且是麻省理工学院的播客主持人。在学术界之外,弗里德曼(Fridman)因其播客和油管视频系列而广为人知。
在Lex Fridman今年8月5日的播客中,John carmack与其探讨了一系列话题,其中包括VR、AGI、编程、视频游戏和火箭等,因为John carmack的游戏背景,所以也聊到了游戏《毁灭战士(DOOM)》、游戏《雷神之锤(QUAKE)》。
John Carmack是知名游戏公司ID Software的创始人之一。ID是一家成立于1991年,专门开发电子游戏、电视游戏的公司,而他更备受关注的身份之一是Oculus公司前CTO。
John carmack从2013年开始加入Oculus公司,并担任CTO一职,也是该公司的关键人物之一。2019年11月,John Carmack宣布将从Facebook离职,此后将在人工智能领域继续展开研究,但John Carmack仍然将继续担任Oculus“技术咨询顾问”的职位。
共同虚拟对Lex Fridman与John carmack的部分对话进行了编译,版权属于原作者(见文末链接)。本文旨在用于学术分享,不用于商业用途。


John  Carmack 主要观点(以下简称JC)

1. 虚拟现实最大的特点在于它的沉浸感。在虚拟现实中,用户将会拥有比现实生活更好的体验。在未来,世界将会像进入互联网时代一样渐渐进入虚拟现实的时代,由各个技术与产品量变的积累产生最后质变的飞跃。

2. VR目前最大的问题是:设备的易用性和普及性。要想让更多人使用VR,就要让在硬件方面让VR的设备更便宜和便携,因此,Carmack本人更倾向于在移动端打造VR。
3. AGI的研发在近些年已经得到了飞速的发展,预计在2030 年会有可能创造出真正的AGI,如果成功面世,将改变人类历史的进程。Carmack认为,AGI研发的突破口或许隐藏在前人的跨学科文献内。
4. 元宇宙的打造是自下而上的,先通过创造高价值的娱乐产业来吸引用户,在此基础上再不断加入其他功能逐渐扩张成一个通用的平台。

《节奏光剑》几乎完美地发挥了VR真正的优势
几个世纪后,你回想到这些体验,这标志着变革的发生,即我们世界的大部分都开始进入虚拟现实,你认为这些体验会是什么样的?
J C :我认为这些体验会有点像互联网。如同网络一样,慢慢地接管了你所在的地方的方方面面,温水煮青蛙一般。人们就如同锅中的青蛙,在经历了所有这些之后,水慢慢加热。我还记得,第一次在广告牌上看到网站地址时,感到十分震惊。当然你现在可能认为,电脑世界正在感染现实世界,是很明显的。但当你回顾过去,确认是什么让网络时代起飞,你会发现是一堆小事情,很多微不足道的事情导致了这一变革的发生。
也许有历史学家,可以真正确定是在哪一刻标志着这个变革的发生。比如,数据驱动出现,就像Myspace之类产品的出现。
J C :我认为这是历史学家的谬论,他们一直想找到所谓的主要原因,主导性因素等。其中很多事情就像我们看到的指数曲线,但现实这并不是单件事呈指数增长,而是有数百条小sigmoid曲线重叠在一起,它们只是碰巧不断累加,所以你在任何给定的点都有某种指数增长,但没有任何一条曲线是发挥着决定性作用。我的意思是,任何事物都会像博客一样,让位于社交媒体,但最终以其他形式复活。

你所谈的一切现在我们都能够看到,早期的技术和产品的变化也使得互联网发生了改变,我相信历史学家也会记录这一切,从而让人类在打造基础设施建设时 ,能够在网站上读到这些记录。
J C :人们会回顾过去,会为这些关键时刻命名,但这可能是对实际发生的事情的一个粗略地计算。但我们已经在VR领域发现,这些过去的记录并没有发挥作用。现代VR,基本上是从我的E3 Doom演示开始的,没有人预测到最流行的虚拟现实应用程序竟然是VR音游《Beat Saber(节奏光剑)》。
当时没有人预测到它会成为最流行的游戏?为什么在你眼里,元宇宙会像游戏一样?
J C :当你事后从我的角度分析它时,它实际上非常有意义,并且也很清晰。从工程角度出发,看起来这是一个古怪想法,但这几乎完美地发挥了真正的优势。在VR中,我真正低估了VR重要性的一件事是控制器的重要性。你知道,我那时认为我们可以用GamePad 做更多的事情,只是让任何现有的游戏都能移动你的头并环顾四周。那真的很神奇。但尽管我如此重视控制器,当用户用控制器做的很多事情时,他们的感受都很糟糕,比如控制器拿起眼镜,感觉就很差。
比如,你用手摁住VR控制的按钮。但你靠近的时候却出现了卡顿,这导致VR的体验不够好。
但在《Beat Saber(节奏光剑)》游戏中,我只发挥VR控制器的优势,完全隐藏了它的所有弱点,因为你手里拿着东西,你牢牢地抓住它。一直以来,它都在切开东西,而不会碰到不应该碰到的东西。比如,我在敲这张桌子。但在VR中,我的手直接穿过它,所以你有东西。那是切开的,所以你的大脑永远不会告诉你,我应该打什么东西,你这里有一把轻型军刀,你希望能用它能穿透一切。音乐也是一个非常强大的助力。
虚拟现实中,我们常里面构建世界,在很多低功耗的硬件上,我们也能够实现高效的运转,在很小的范围内就实现一个价值的循环。
很多现代游戏需要的时间太长了,用户需要坐下来玩一个小时才能到达游戏中的某个地方,有时新游戏需要一个小时才能通过新手的教程关卡,这种过长的游戏时间对VR是不利的,原因有几个。如果你四处走动,你仍然会感觉头戴式设备戴着不舒服,还要手机版本耳机电池寿命较短。
因此,从游戏的角度来看,将游戏分为3分钟或4分钟的版本,是非常有价值的。这是最好的选择。不会有任何其他舒适度问题。用户无需四处寻找,站着就行。在游戏《Beat Saber(节奏光剑)》,所有的东西都飞向你,并且还加上了音乐效果。通过这种做法,增加了VR中的整体适应性。一开始没有人考虑这个问题,事实证明,如果你去玩,这是一件非常好的日常健身事情,是实实在在的锻炼,比任何其他方式的锻炼都有趣。

  
VR硬件依然面临很多问题,但在切实进步
如果我用我的虚拟现实经验来说,这就是街机舞台。我认为VR强大的点在于它的沉浸感,可能目前还没有实现。但是有例子的。当你不在那个游戏世界中,你玩游戏的欲望会愈发强烈,然后你就想永远呆在那里,因为想要逃避糟糕的生活。
J C :曾经有一段时间,有人问我对虚拟现实VR的看法,我的观点是,VR应该比现实世界更好,因为这是用户心里面所梦想的世界。
每个人都认为这是反乌托邦的,会认为使用VR的人会忘记外面的世界。我不理解他们的看法,我认为如果你能在VR里让世界变得更好,你在现实世界就能够帮助他人。在现实世界中,我们不能为每个人面面俱到地考虑到。不是每个人都能拥有理查德布兰森的私人岛屿,但每个人都可以拥有私人VR岛屿,从而可以做他们想做的事情。
VR可以做得更好,我们可以做很多这样的事情,可以非常非常丰富,所以我认为这将是一件积极的事情。在这个世界里,人们想回到他们的VR中,因为VR的环境比那些小公寓更好。人们在虚拟现实中拥有富丽堂皇的庄园,他们可以邀请来自世界各地的朋友过来。每个人无需搭乘飞机才能抵达,这些都是我们需要整理的小事情。VR会议比起远程会议效果更好。
但不是每个人都有VR设备,且目前VR的互操作性很差。这些问题都需要解决,但这是你可以清楚地看到VR正在发展,因为我们知道VR的价值。我们只需要真正努力,解决所有的问题,使之成为可能。
你说我们是有可能通过VR进行面对面的互动,达到一种沉浸的体验,我们是不是很快能实现这项技术的突破了?
J C :是的,我不是说现在就能实现这一点,但你可以看到它正在朝着这个方向前景。我们是知道需要修复和改进的点在哪,面对面访谈和远程会议还是有区别的。
面对面有一种即时的存在感,超低延迟响应能力能够看到所有微妙的事情,只是占据了同样的视野。所有这些都是我们绝对可以做的事情。在使用VR的情况下,举办几个人的小型会议,这比Ready player me的创建容易多了,毕竟他们是一个多元宇宙,你知道一座通向神奇地方的巨大桥梁。当我们开始在VR上进行眼睛和面部跟踪以及其他一些事情时,你会得到微妙的暗示,这有助于交流。
我想知道面对面的会议是否有价值梯度,因为如果你做对了,这会改变世界。你可以选择继续沿着这个方向前进,但这就会带来一定的改变。人们的线上会议,会从zoom转移到VR中,我想知道,VR的瓶颈是什么?是硬件还是软件?
J C :在内部会议时,我们战略方向的争论很激烈,就比如针对即将推出的下一款头显,我们已经发布了各种公告,将会有价格高的头显设备、更贵的更多功能,这几个元素之间我们是要作出权衡的。
我会看看市场对此有什么看法。我们在这里做了精确的权衡。但是如果你想替换zoom,这就要求你的设备是每个人都拥有的。我喜欢更便宜的东西,因为更轻更便宜,从而更多人能够拥有,这能带来一个良性循环。而更多的功能往往也会导致更重,且更昂贵,从而购买的人就少了。如果我们添加更多功能,而人们并不熟悉这些功能,但这些功能导致耳机更重,并消耗更多的电量。这就是我一直喜欢低端的设备的原因,他们更便宜也更快捷。这就是为什么我总是支持VR的移动端,而不是更高端的PC头显。但我们不能止步于此,我们现在的瓶颈是硬件方面。现在,在VR中,你可以玩,可以搭建工作室,这种体验是很好的。
你知道VR的会议效果是比zoom好的,因此您在那里有更好的即时感。你从当前硬件中得到的表达式,是非常真实的感觉。
Meta已经推出了4K分辨率头显,可以插入电脑进行高端渲染,这是很棒的成就,但就经验而言,我感觉meta还没有真正的取得成功。
J C :一方面,我们确实取得了部分成就。但还是不够。Mark确实宣布过,meta宣布每年花100亿美元在Reality lab上,这涵盖了很多方面。除了VR以外还有很多研究项目,比如Portal,spark和其他大型的研究工作,并且一直在扩展到包括人工智能。
但100亿美元对我来说,数字大到难以想象。只是一想到花了那么多钱,我就觉得痛心。但他们展示了对此的承诺,致力于这些开发。Meta和谷歌不同,谷歌取消了所有这些项目,而meta确实坚持研究VR和AR还有其他项目。所以,如果项目能够进行下去的话,我希望所有这些资源都能得到更高效的利用。
                 

Meta正在自上而下创建元宇宙
先做娱乐再扩张
从原理上和技术上来说,打造一个元宇宙有多难?在你看来,元宇宙,为什么会吸引这么多用户,为什么会有这么大的价值?创造这种引人注目的元宇宙从而改变世界,是一件多难的事情?
J C : 元宇宙这个概念来自于Neil stephenson的书Snowcrash,我们中的许多人在90年代都读过,这本书很有影响力。这本书告诉我们,元宇宙具有自由,无限可能和无限的能力的特征,在这个虚拟世界,你可以做任何想做的事情且无论你对它提出什么要求,它都能满足。这些特征对一代又一代的游戏开发人员产生了强大的吸引力。
人们正在考虑更通用的应用程序,所以我们在开发游戏《毁灭战士(DOOM)》和《雷神之锤(QUAKE)》的时候,就讨论了这个问题,关于如何打造一个互联互通的世界,用户可以轻松地从一个世界访问到另一个世界,访问不同的世界就像浏览不同的网页一样简单。
为此,我们应该发展什么样的能力来实现这一点。初始版本往往都不够完美。另一方面,我们有一些成功的游戏,比如《毁灭战士(DOOM)》和《雷神之锤(QUAKE)》,以及相关的游戏社区,然后是完全不同数量级的游戏,例如Minecraft和Fortnite,它们拥有1亿多用户。我仍然认为建造元宇宙的正确方法是建造一些人们喜欢,且会感到惊奇的东西,因为喜欢,人们最终会把所有的时间都花在里面,之后再扩展相关的能力。
所以即使这是一个非常基本的体验。

J C :我很喜欢Minecraft,在很多事情上,他们都是经典的案例,值得研究。能够做到这一点真的很有启发性,还有其他类似的平台,比如,Roblox基本上是一个游戏创建平台,这是针对青少年的一个平台,它的规模也在不断的扩大。这些公司或平台的发展顺序是类似的。因此,我相信,如果你要建立一个平台或世界,你要让人们喜欢你的产品,你需要在过程中不断升级这个产品,这就是我说的沿用过去的方法来发展。
在早期,如果你只是玩同样的游戏,比如你每年都推出《使命召唤》(call of duty)这款游戏,这种做法是对的且是可以盈利的,很多人都会喜欢。你可以创办一个好的游戏,每年发布一个新版本,让这个游戏的能力得到增长和进一步扩展。这个游戏的种类可以是跑步类,也可以是射击类。但现在你可以把媒体带入其中,你可以在这个游戏中添加社会意识,生命迹象其他任何东西。我认为这是一个很好的发展机会。
在我看来,Meta正在进行自下而上的创建,目的是打造一个通用的平台。因此,创造者可以用他们想要的东西建造任何东西。而现在,meta其实很难与像Fortnite这样也有巨大创造力的公司进行比较和竞争。因为fortnite最初的设计目的并不是未来打造成一个通用的平台。在我看来,先做娱乐产业,打造价值,然后扩张,是正确的方法。

VR之后的关注点是AGI
听说您现在在研究AGI,您是否认为AGI将改变人类历史的进程?
J C :在VR之后,我一直在思考要把关注点放在哪里。虽然我仍在研究VR,我每周会花一天的时间向Meta的首席技术官就一些具体的棘手问题进行咨询,我仍然对所有这些充满热情,但我一直在想要如何合理地分配精力以处理一些其他的事情。
在我看来,现在就是人类历史上最能发挥优势的时刻,我们对大脑的了解程度决定了我们可以用人工智能做什么。通用智能将由数万行代码,而无需数百万行代码就能进行编写。与编写Web浏览器或操作系统不同,这些代码将构造出一个真正的人。
基于人工智能在近十年中机器学习取得的进展,很多我们曾经无法实现的事情在今天可能会变得意想不到的简单。通过数据与GPU的协同,我们可以创造出和人类行为一致的人工智能,并能以任何我们想要的方式去教育它。在这样的情形下,我们可以无需物理交互就能让计算机远程控制通用人工智能去做任何事情。我相信一定可以做到,当我们在专注一件事时就会有超人般的能力。
虽然有些事情我们暂时还没有头绪,但我不认为它们没有可能。就像我几年前说的那样,在2030年,世界上有50%的可能会出现AGI的生命迹象,到了现在,我认为这个几率可能是55%-60%。
所以您是否觉得AGI的所有剩余关键步骤的突破口已经埋藏在今天大量文献中的某个地方?
J C :是的,正是因为相信这一点,AGI领域才吸引了包括了我在内的许多研究者。比起外部世界庞大的信息,我们汲取到的只是其中的一根稻草。就像你无法读尽所有的论文,你看不到聪明的人们在90年代或更早的时候做的事情。我认为在旧文献中一定埋藏着宝石,它与此时此刻我们在做的事情存在一些奇妙的关联性。
当我们事后回头去看的时候,或许会发现某一篇早期的论文已经精准地预测到了从神经科学的动物训练中可以得到这个结果。科学是贯通的,当各个学科在一起碰撞时,它们可以相互学习。
现在已经没有太多的人觉得这不可能或者需要几百年的时间才能实现。
在10年前,你或许要么说不可能,要么说会在200年后甚至是几个世纪才能实现,但这个预测的数值正在不断下降。虽然人们会因为人工智能将接管世界这类安全问题而产生顾虑,但我不认为这是一个可信的立场,我认为我们将从一个点开始,慢慢连接到它们。比如给猪的神经连接上人类的语言系统,让它开始学习人类语言,我认为动物智能与人类智能是非常接近的。
发展人工智能就像在教育一个有学习障碍的蹒跚学步的孩子,我们可以像教育真人一样让它们进行训练和学习。甚至可以部署一支集工程师、认知科学家、发展教育人员的团队来教导它,通过不同的课程找到发展人工智能最正确的方式。
在您看来传统的人工智能和AGI有什么区别,区别是在于AGI有神经网络吗?
J C :从根本上说大脑是一个循环神经网络,它是在生物意义上实现的。我认为意识和人工智能从根本上是一种无关的机制,人工智能不必像大脑一样去实施,任何可以用人工智能完成的事情,都可以被量化为奖励机制的损失函数。
但是,在雅达利游戏模型中,人工智能会参与里面的所有游戏,却并没有完全学会被强化学习者指示去做的事情,甚至它仍然带有特定的手动编码奖励功能,这是它最有趣的事情,人工智能并没有学会人类学习的方式。
我们无法为每一个程序都建立损失函数,因此,我们要把人们做的所有事情都切掉,这确实需要全面的人工通用智能。
您认为AGI是否需要如机器人一般的实体?
J C :对于应该考虑机器人的形态还是可以在纯数字中实现,我有明确的看法,我认为AGI不需要躯体,甚至不需要体现在物理世界中。在游戏或虚拟现实中,我相信可以创造一个模拟环境来提供大部分价值,真实环境反而是一种限制。这也是我在航空航天工作中的教训之一。
我承认,有真实躯体的机器人更容易让人们接受。但我认为现阶段没有必要去做这件事。
企业完全可以在客观的利润损失基础上保持运营,在这个不断进化的世界里,当你有了自由市场,有了企业家,当它被证明是有利的时候,很快就能吸引大量的追随者。
AGI其实也不需要一个具象化的实体。如果你需要网课学习,比起看屏幕上的二维投影,我更倾向于直接投射到你的视网膜上让你直接拥有屏幕。
对于人工智能来说,学习是有帮助的,未来也许是一个不同人工智能相互交互的世界。除了相互交互以外,人工智能还可以与真实的人互动,你可以扮演一种角色,当他们经历和探索不同的事情时与其交互。在某种情况下,你甚至是在与他们交谈,与他们一起解决问题或探索情况。这是一件有价值的事情,人工智能或许会成为你的朋友 。
【参考链接】https://www.youtube.com/watch?v=I845O57ZSy4

全球XR智库|

全球XR智库为天风全球前瞻产业研究院、东西文娱联合发起,持续全面跟踪XR产业发展,点击下图了解峰会现场


前期峰会实录|

Unity大中华区总监张黎明-Unity在XR方向的积累与技术布局,点击下图了解详情



影核总经理曹安洁—VR游戏与VR硬件生态处于上升期,看好VR游戏三个类型,点击下图了解详情



境腾CEO张力-XR重构未来,成为面向企业元宇宙的Office生产力工具,点击下图了解详情



七鑫易维路伟成-眼球追踪技术会成为AR/VR的标准配置,数字人等应用会很广泛,点击下图了解详情



中国移动咪咕朱佳伟-数字经济视角的VR/AR实践,运营驱动“内容+场景+技术”的布局矩阵,点击下图了解详情



下期峰会实录预告|
具有全球竞争力的全自主研发VR/AR系统及三维交互数字引擎开发工具供应商。Nibiru XR 系统支持国内各类XR品牌,Nibiru Studio 和 Nibiru Creator 两大引擎工具服务数千家行业应用公司,业务覆盖教育、医疗、工业、零售、水利、 交通、职业培训等近百个行业。「Nibiru睿悦」





您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存