查看原文
其他

实测Pika1.0,砸了3.9亿元,真实效果不及宣传|产品观察

武静静 智能涌现 2024-04-01

文|武静静

编辑|苏建勋

封面来源|IC photo

12月26日,Pika 1.0开启免费公测,普通用户可以直接上手体验。

ChatGPT、Midjourney等AI工具爆火以来,给创作、广告、游戏制作领域带来了十倍甚至几十倍的效率提升已经不是新鲜事。但在视频领域,受制于技术难度和数据集等难题,一直未出现类似文生图以及文本生成的大规模的应用。

一个月前Pika1.0发布,从宣传片上来看,相比此前的AI生成视频产品,Pika1.0在流畅性、画质和风格准确性表现堪称完美,让很多人眼前一亮。

Pika1.0体验起来手感究竟如何,此次,我们直接上手体验了一番。

亮点功能:一键编辑、图生视频、画布延展

进入Pika官网(官网地址:https://pika.art),首页是Pika生成的作品广场,右侧则是用户的个人作品列表。


△图源:Pika官网首页

官网最下侧栏目就是提示词入口,可以直接输入提示词和风格类型,也可以上传照片。

在输入提示词之后,还需要选择点击提示词窗口右下侧三个符号,通过调整画面比例,运动强度,输入反向提示词等来功能,让Pika生成的视频更贴合需求。

画面比例上可以根据需求选择想要的尺寸,每秒帧数可以选择默认的24,也可以结合自己需求调整。

Strength of motion指的是运动强度,数字越大,视频中动作变化越快。

反向提示词是Pika1.0一个独特的功能,输入类似“变形、噪点、质量差、失真、绘制不佳、模糊、颗粒感、分辨率低、饱和度过高、缺乏细节、照明不一致”等提示词,可以优化生成的视频效果。

这些设置完成后,就可以在自己的作品列表等待视频。等待过程一般在几十秒或1分钟以上,期间,也可以继续输入提示词创作新视频。

比如,输入提示词“A little girl wearing a red hat is crying in the snowy field,anime style”后,等待了大约10秒钟,Pika制作出了这段视频。

效果不好,也可以选择Retry键,多生成几个视频,再筛选。

Pika最惊艳的是一键编辑功能,用户可以直接选定要调整的区域,输入提示词,编辑视频。

选中编辑前文中生成的视频,输入提示词”戴上墨镜”,就有了下面的效果。

除了戴墨镜这种有趣的尝试,Pika的一键编辑和图生视频功能在商业层面将发挥巨大的价值,尤其会给营销广告视频制作领域带来极大的效率提升。

以这张模特图片为例,上传照片给Pika。


△图源:IC photo

静态的图片就转化成一段活灵活现的动态视频,整体效果不错,但视频中的人脸比照片显示更虚一点。

选中视频中模特衣服,输入提示词“给模特穿上牛仔背心”。

一个换装成功的模特立马出现。

如果你觉得只有上半身效果不够,也可以编辑中选择一键扩图。输入提示词“穿着牛仔裤”,选择4:5画布,就可以生成新的模特视频。也可以点击延长4s这个功能,增加视频时长。

也有测试失败的作品。同样是上面这张模特图片,我们试图把模特视频转换成3d风格,但效果不如人意。


可见,虽然目前Pika1.0宣称支持3D动画、动漫或电影等各种类型内容生成,但在测试中发现,在视频风格转化功能上,Pika产品尚需改进。

Pika的杀手锏:无门槛上手

产品体验上,和各类AI生成视频的工具产品相比,Pika最大的特征就是易用性,可以无门槛上手

此前,视频类工具都需要掌握一些专业的工具技能才能不断调试,过程复杂,比如Runway提供的Photoshop笔刷和图层等功能对普通用户而言很难上手,更适合专业用户。

但使用Pika的过程中,各类功能简单直接,且二次编辑、画布延展等功能都在产品界面直观看到,对小白用户的上手体验非常友好。

在一次采访中,Pika创始人郭文景曾提到,创立Pika的契机正是发现了AI视频工具的专业门槛过高,对普通人不友好。

2023年年初,郭文景和几位朋友参加了Runway 举办了第一届AI movie Festival,但在实际制作过程中,他们发现视频工具非常复杂,且使用门槛很高,普通人很难学,即便专业人士,也需要花大量时间用工具反复调试。“比如换个背景,几秒钟的内容要制作几小时,软件还经常crash。”

也是这次经历,郭文景决定创立Pika这个项目。郭文景曾说,AI的出现,应该让视频制作变得更简单。

同时为了让更多普通人能更高效创作视频,Pika也是试图创作更简单的二次编辑体验,过程中,用户只需要输入具体的动作提示词,就能通过简单的标准化动作调试视频。

“一键编辑+图转视频+扩图”,有了这三项能力,视频制作门槛大大降低,甚至未来只需要一张简单的平面照片就成了完成视频的全流程制作,不需要模特去现场。

此前,Pika曾发布一款用Pika Beta 2.0制作的广告短片,该短片翻拍自一支旧广告,原片由30个人耗时一月完成,使用Pika Beta 2.0,仅由一个人,用了不到一天时间,效率提升了几十倍。可见未来,广告制作以及各类营销创意视频使用Pika也将迎来几十倍的效率提升。

随着Pika的爆火,更多普通人开始上手体验新的视频工具,整个文生视频市场也将进一步被打开。

当然,整个AI生成视频领域也还在爬坡阶段,且屡被吐槽宣传片和实际效果不符,虽然Pika 1.0在一些体验上已经有了新的亮点,但在整体的逻辑连贯性、流畅性、画质和风格准确性上,以及复杂逻辑动作尝试上,效果也有限。

比如输入提示词“一个带着红色帽子的小女孩和一只狐狸在雪地里跳舞,anime style”,会发现,Pika并没有生成一只狐狸,而是生成了一个带着狐狸帽子的人。

这也是Runway、Genmo、Imagen Video等AI视频产品一直面临的一个难点。相比文生图,文生视频本身的技术难度比较复杂,前者考验的是“作图能力”,后者考验的则是作图、理解、逻辑等多重能力。

所以,AI生成视频工具不仅需要掌握基础的自然语言理解能力,还需要在画面流畅度、风格准确性、稳定性、一致性、动作连贯性等方面有较好的表现。

眼下,这个领域还没有一款产品能够像ChatGPT和Midjourney一样,能产出高于用户预期的作品。

谁会是下一个真正在体验上惊艳用户的产品?让我们拭目以待。

👇🏻 扫码加入「智涌AI交流群」👇🏻

36氪旗下AI公众号

👇🏻 真诚推荐你关注 👇🏻


继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存