查看原文
其他

急性子友好!盘点7款免费实时生成AI工具,在线就能玩

阿虎 头号AI玩家 2024-01-13

作者 | 阿虎
编辑 | 张洁

每次出图都等疯了?

为了减少等待时间,创造更具个性的内容,“量子速出”“秒级生图”等技术成为近期AI领域的热点。甚至有的产品都未上线,就先来博关注。

12月初,谷歌的一篇论文《MobileDiffusion: Subsecond Text-to-Image Generation on Mobile Devices》,提出了手机端文生图的方法。

研究表示,该模型采用Diffusion Gan的技术,在iPhone 15 pro上的测试时间达到了0.2秒。但事实上,这款模型目前仅停留在研究阶段,压根还没开始运行。


图源:上述论文;用户暂时无法在手机端上进行运行
为了帮助各位玩家丝滑体验,近期,“头号AI玩家”实测了当下热门的一些实时生成式AI工具。


如果各位需要借助各种AI工具进行内容可视化演示,或是增加一定的创作互动体验,那么想必会对你有所帮助。



Krea AI


Krea AI是一款制图工具,支持修复增强、AI图案、图片扩展、屏幕生图等,近期因为实时生成功能而备受关注。

用户只需简单勾勒草图或输入文字,Krea AI就能即时渲染,生成图像。

文本生成图像

在左侧边栏选择“Text To Image”,就可以看到Krea AI的实时生成的效果了。

我们尝试使用这样的提示词:“可爱小狗,微笑,穿着红色毛衣,戴着红色帽子,背景是烟花”,让Krea AI生成相应的图片:

提示词:a cute dog,smile,wearing a red sweater and a red hat,fireworks in the background

提醒一下,Krea AI的提示词还是需要使用英语。感受过了Krea AI的实时效果,我们还可以通过绘画来生成图像。

图形生成图像

可以先选择形状、草图作为基础样式。比如画个霍格沃茨学校,我使用了圆形、三角形和正方形进行基础构图。

如果担心AI不理解我们的意图,在文本框里可以输入“Hogwarts”,以获得更好的生成效果。


当然,还可以移动、添加图形实时改变生成的画面。


这里推荐使用提示词+图形的方式,整体的生成效果就会无限趋近于我们想表达的画面。

另外,Krea AI还支持画笔工具,我试图借助幼儿园水平的绘画技巧,生成一副大作:


这算不算分分钟生成想要的画面?

我们再来试试Krea的控制和微调能力,比如给这只猫添加一副眼镜:


经过测试,我们发现提示词在其中的占比远远超过手绘功能。即便你画工不佳,也能靠文字获得相应的画面。

比起Midjourney需要不断调整提示词,重新等待3至5分钟,Krea AI对于绘画新手而言,在实时的生成速度和使用上还是相当友好。

屏幕生成图像

除了上述功能,Krea还可以捕获电脑前的用户活动,实时生成人物形象。


当然,这些功能都可以借助提示词改变画面的细节。不过,大概由于Krea AI数据库的原因,生成的人物整体外貌还是偏向欧美风。

接入其他应用

Krea的最后一个功能是将草图变成3D模型,苦于渲染的设计师们有救了。

简单来说,你可以将电脑中的C4D、Photoshop、建模软件等接入Krea,或将整个屏幕和Krea进行联动:


这样说可能不够直观,Youtube上有位设计师将建模软件接入了Krea:


目前Krea AI的实时功能还停留在图片上,但它的后台已经出现了Animatediff(AI动画生成工具),相信在不久的将来,还能实时制作动画。

体验地址:https://www.krea.ai


SDXL Turbo


SDXL Turbo应该是最早爆火的一款实时AI模型。据官方介绍,该模型只需要1秒甚至更少的时间就能生成高精准图片。

SDXL Turbo模型可以在网站上在线体验,也可以直接在Stable Diffusion WebUI上使用该模型。

我们先用小白友好的版本进行一下效果测试,同一组提示词的情况下,SDXL Turbo生成的速度和效果如下:


生成的速度上,SDXL Turbo确实远远超过Stable Diffusion的其他系列,对提示词的还原也相对精准。

可以看到,AI在构图上会虚化背景,呈现主次之分,画面的清晰程度也超过了Krea AI。

但需要说明的是SDXL Turbo在线体验目前有生成额度的限制,如果需要长期使用的玩家推荐安装模型代码。

体验地址:https://clipdrop.co/stable-diffusion-turbo


实时草图生成器Pikaso


最近,知名图库平台Freepik发布了实时绘图工具Pikaso。借助Freepik背后庞大的图库,Pikaso的实时生成功能成为可能。

同样进入Pikaso后,我们在右侧画布中绘制图案,就可以生成相应的图像。


Pikaso上方的“Imagination值”代表AI发挥的想象力,即设定值越高,AI介入的比例就越高。

比如,下图在没有AI参与的情况下,生成的图片与原图相差不大。如果我们持续调整Imagination值,画面就会产生如下变化:


实测下来发现,如果将Imagination值设定在70至80之间,生成的画面不容易崩坏,而且能够很好地还原草图的设定。

Pikaso还支持图生图功能,用户可以上传图像,将其转绘成漫画、电影、插画等不同风格。

不过,在漫画风格中,Pikaso会将线条、细节做模糊化处理,整体效果不如原图精致。


总体来看,Pikaso的草图生成功能相比其他几个工具更出彩。调整“Imagination值”后会有意想不到的结果,更适合那些需要将手绘图转成实际效果图的用户。

体验地址:https://www.freepik.com/pikaso


Dynamic AI


Dynamic AI是基于Fal.ai网站的实时AI服务。用户输入文本、图像提示即可创建,后续还能调整AI Seed值,改变相应的图像参数。

不过,从官方示例可以看到,虽然生成的月亮与实物有七八分像,但月亮的阴影等细节就有些差强人意了。


无论风景、动物或是人物,Dynamic AI都可以完成,但它的实际效果还是依赖用户所写的提示词。

如果提示词描述精准,AI生成的效果图就会更好。


另外,Dynamic只能给出大致的轮廓内容,无法处理画面的内容细节,比如女孩的外貌和形象,远处的星星等,适合追求“朦胧美”的玩家。

体验地址:https://www.fal.ai/dynamic


Leonardo AI


12月初,Leonardo AI上线了实时绘画功能,并向所有用户开放。在Leonardo AI网页登陆后,选择“Realtime Canvas”即可进入实时绘画功能。

整个Leonardo的界面和Krea AI有点相似,我们可以使用画笔、图形工具进行创作,还能根据提示词的修改,调整画面内容。


值得一提的是,Leonardo AI会优先生成近景图像,上图的猫咪是不是细节拉满?

同样可以点击“Environment”等选择不同的画面风格,“Creativity Strength”则可以调整画笔工具的强度:


Leonardo AI和其他工具不同的是,它还具备文本引导功能。

如果我们想要生成吃竹子的熊猫,但不知道如何描述时,可以使用“Prompt Generation”生成提示词,再投喂给AI进行生成。


这对于从未尝试过AI绘画的用户来说,提供了较大的帮助。

除了实时生成功能外,用户还可以用Leonardo AI修复照片中的瑕疵,生成新3D、动漫、朋克等多种风格的图像。

体验地址:https://app.leonardo.ai/


换脸工具Fal.ai Camera


除了AI绘画步入了实时生成时代,视频领域同样诞生了不少实时AI工具。

此前风靡一时的AI换脸工具Fal.ai Camera,可以允许用户实时换脸成各路明星,比如扎克伯格、马斯克、肯豆等等。

只需输入想要变脸的名人名字,就能实时换脸,并且免费在线即可使用。

先来几张X平台上用户上传的效果图:


从网友分享的视频和动图来看,Fal.ai Camera的效果还是非常逼真的。无论是面部还是表情动作都可以做到和本人一致,可以说是“神同步”。

但有时Fal.ai在人物动作的变化上,会出现滞后的情况。比如在我摘下眼镜的十几秒后,换脸后的“我”才刚刚开始行动。


另外,这款软件目前只能实时替换面部,衣服、环境等都不会发生改变。Fal.ai Camera更适合用来娱乐,想要花式整活的玩家可以尝鲜试试。

体验地址: http://fal.ai/camera


视频生成工具Decohere AI 


Decohere AI是一款基于Stable Video技术的在线视频生成平台。进入后台后,用户可以输入相应的提示词,上方就会出现视频的实时预览效果。

在同一组提示词下,Decohere AI会给出七至八个备选画面,用户可以选择最心仪的一个主画面后,再生成视频。


AI视频生成的动态效果依赖于图片的效果,有些画面只是发生了小幅度的轻微变化,但胜在画面的流畅度和逼真性上。


目前,Decohere AI只允许免费下载3个短视频,如果要生成更多的动态效果,需要额外订阅付费。

体验地址:https://app.decohere.ai/turbo



综上来看,无论是2D还是3D领域的秒级出图,背后的技术大多是LCM(潜在一致性模型),LCM系列模型在Hugging Face平台上下载次数超过55万次。

LCM的主要特点是可以根据输入的提示词,实时生成高分辨率的图像、视频等。

依赖LCM技术,用户能够根据提示词和画笔实时改变图像,有更多的调整和控制画面细节的可能。

相比此前Stable Diffusion、Dall·E等基于扩散模型的文生图工具,潜在一致性模型能够快速采样,生成效率提高了5-10倍,因此能达到“实时生成”的可能。

这种创新性的AI图像技术不仅提高了创造效率,更能处理图像生成过程中的不确定性,提升用户的创作体验。

不过,由于LCM技术带来的实时生成式AI工具,生成内容仍然存在细节不严谨、画面容易崩坏等问题,依然还需要稳定扩散模型和创作者把控好整体的画面走向。



「内容好生意」2024新榜大会来了,就在1月23-24日北京望京凯悦


作为由新榜主办的一年一度的内容行业盛会,我们将邀请这个行业最具代表性的创作红人、明星机构、品牌操盘手等前沿玩家,复盘AIGC、短剧、出海、品牌直播等行业热点背后的内容生意。


目前大会报名已正式开启,想了解更多信息或报名,请点击文末“阅读原文”,期待与你相见。



「头号AI玩家交流群」进群方式:添加微信“banggebangmei”并备注姓名+职业/公司+进群,欢迎玩家们来群里交流,一起探索见证AI的进化。


也欢迎围观小红书@头号AI玩家,我们在这里日常练习AI绘画。


欢迎分享、点赞、在看

 一起研究AI

继续滑动看下一个

急性子友好!盘点7款免费实时生成AI工具,在线就能玩

阿虎 头号AI玩家
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存