查看原文
其他

20秒生成一张画!90后小哥辍学研发AI艺术,火爆全球前曾被200多家风投拒绝?

wuhu小精灵 wuhu动画人空间 2022-07-10

wuhu专题

文 | 莫达


AI做梦的时候会不会梦见电子羊?



如果你真的这样问


那它还真能给出答案



这款名为“Dream(梦)”的软件中


用户直接输入关键词


20秒即可生成一幅画!


而且你还有十几种风格可以选择!



来看看全球网友们是怎么玩的!


《诅咒之城》,关键词:地狱、肠子、火、尸体、城市、城堡、教堂

关键词:草莓螺旋

关键词:撒旦的梦中房屋、佛兰芒巴洛克

关键词:秋天的新英格兰

关键词:T welldell PEEK 迷幻面孔

关键词:最后的教堂

关键词:梵高《星月夜》

关键词:最终幻想14战士

关键词:怪物和人

关键词:Xanathar

关键词:绯红女巫的火焰

关键词:混沌黄金天使

关键词:宇宙空间,龙

关键词:复仇者联盟


只要你有脑洞


马上就可以输出成画作!


十几种风格信手拈来


而你只需要稍等20秒!


这是多少美术人梦寐以求的操作?



那么这到底是啥黑科技软件?


在哪儿可以玩?


别急!wuhu这就告诉你!


Dream 是一款由加拿大初创公司 Wombo 于去年 11 月发布的应用。



截至去年年底,「Wombo Dream」用户已经生成了超过1000万张图片,在普通用户和艺术家群体中都获得了不错的口碑!


我们来沉浸式体验一下!


首先选择系统自带提示词:永生花


点击黑暗幻想风格


期间我们可以全程观看AI创作的过程


每一步的细化和调整是不是很神奇?



那么接下来我们玩点不一样的!


我们集齐了编辑部所有的脑洞


让大家随机说出N个关键词


看看最后能生成什么样的作品!



(你能猜到关键词都是什么嘛?)


有了这款应用


你还可以实现任意混搭!


比如迷幻风格的《蒙娜丽莎的微笑》!



比如蒸汽朋克版《呐喊》!



大家还有什么脑洞?


可以在文末处获取网页链接哦~


这款黑科技为啥这么厉害?


它是如何实现自动生成的?


幕后团队又是谁?


接下来wuhu就带大家来揭晓它的幕后吧~


AI生成艺术原理


这种由人工智能生成的艺术品并不新鲜,wuhu之前就有介绍过不少哦!


拓展链接:又是啥黑科技?!国产“老婆生成器”轻松画出漂亮小姐姐?!

当你掌握了「一键变身迪士尼动画角色」的技能之后...


Dream的工程师 Salman Shahid曾在采访中介绍:Dream 算法基于 CLIP 引导。

* CLIP是由研究实验室 OpenAI 开发的开源神经网络(一种可免费获得的学习数据模式的算法)。该网络接受了互联网上的图像字幕配对训练,并且可以评估用户提供的字幕与图像的关联程度。


为了生成相应艺术作品,Dream 模型从一个随机生成的向量开始。向量中的每个条目对应于图像的一个微小细节。有些可能对应于颜色,有些对应于形状,有些对应于更抽象的含义。


通常,随机向量首先对应于一个灰色的像素块。然后,该算法使用 CLIP 来确定当前矢量图像与用户关键词的对应程度,并在多次迭代中改进对应关系。也就是说该应用程序会在最终产品出现之前创建多个图像,而这个过程的随机性意味着 Dream 永远不会两次制作相同的艺术品。


抽象?局限?


啊这!


难道画师们都要失业了么?!


别急!


AI作画终究是有其局限性的



一位推特用户使用马里奥中的经典角色制作了图片,我们在图中可以看到四位角色的代表色——红色、绿色、黄色和紫色。看上去每个角色都有一个类似帽子的部分,但仔细看却没有一个真正类似于脸的地方。

 


下面是一张关键词为“林克的觉醒”的图片。根据你所认为的脸部的位置,你可以看到他标志性的绿色外衣或者林克在“旷野之息”中穿的蓝色衣服。



由此可见,AI 生成的插图虽然抓住了关键词,但通常看起来很抽象,尤其对角色的细化还有待加强。而且它并不能像真正的人类一样,给用户一个经过思考的答案。


不过很多人似乎很喜欢它们的模糊性,因为某种角度上这会让画面更具“艺术效果”和想象空间。


图源自deviantart用户Dartasia


比如这位画师先在Dream上得到了一张“动漫角色浮在空中”的图片,然后在其上进行再创作,于是得到了左侧这张图。

 

3D动画梦境?


最近,Dream团队正在扩展更多的语言支持,目前已经可以支持中文、日语、印地语、印度尼西亚语等多种语言。除此之外,Dream还在筹备社交功能的上线,例如用户可以查看、点赞、分享自己或者其他用户的“梦境”。


最令人期待的可能就是团队正在实验的3D动画梦境以及输入图片关键词功能。他们希望用户可以穿越到他们在虚拟现实中创造的梦境中。工程师Shahid对此感到非常激动:“希望随着AI艺术的出现,艺术家可以创造出更酷的东西!”


幕后团队


神仙软件的背后是怎样一批人?


也许你早就和他们熟悉了


如果你热衷于tiktok等软件的使用


那一定会知道前些日子掀起的对口型唱歌热潮



没错!这款功能的开发商就是Wombo


但你或许不知道的是


Wombo在爆火之前曾被拒绝200多次!

 

2020年4月份,由于疫情爆发,人们待在家里急需更多样的娱乐方式,当时还在上学的Ben-Zion Benkhin抓住灵感、很快构思出了对口型唱歌的想法,然后毅然辍学投入创业。


Ben-Zion Benkhin照片


曾有人提醒他辍学创业的风险,但Benkhin回答道:“时间不等人,如果我不做,马上就会有其他人做。”


就这样Benkhin信心满满地投入了4万加元的积蓄,然而这对于项目开发需要的资金来说还是远远不够的,于是他开始向各位投资者们寻求合作。


但结果是Benkhin创业路上的第一重打击来得尖锐又沉重——他被200多家风险投资商拒绝了。


年纪轻轻、没有任何开发经验、全凭一支大学生团队的他在投资者眼中完全不合格,可Benkhin没有放弃。


也许是功夫不负有心人,Launch House创始人之一的Jacob Peters在一次推介会上被Benkhin的想法惊艳,于是短短一个月后Benkhin就带领团队其他11位创始人一起搬进了Launch House。


Benkhin与部分团队成员


不到一年后,Wombo正式上线并迅速火爆全网,第一周下载量50万,第二周900万,第三周则达到惊人的1000多万。


口碑和下载量的直升让这个年轻人迅速进入了资本世界的眼中,此时处境直接反转,大量投资公司通过各种渠道找上门来。


一个多月后,Wombo就在种子轮融资中筹集了600万美金的资金。截至今年年初,依靠 WOMBO 和 WOMBO Dream两款应用,Wombo拥有超过 1000 万的月活跃用户,其中更是囊括了从 Z 世代的青少年到 90 多岁的创作者


  版权


Wombo的工作原理是使用预定义的编排来变形面孔。团队为每首配乐拍摄了基本视频,然后使用将这些预设好的面部动作映射到用户图像上。但这里的重点不是原理,而是配乐。

 

虽然目前音乐的版权所有者并没有提出质疑,但Wombo中一些经典的曲目,比如从 Rick Astley 的 “Never Gonna Give You Up ”到“Numa Numa”很明显受到版权保护。


Benkhin回应道团队仍在处理版权问题,但已经和几位艺术家达成协议。他提到希望Wombo能为他们提供一种与观众互动的全新方式——以一种病毒式传播的、有趣的方式。


受到版权因素影响的并不只有Wombo,事实上Dream因为版权导致的问题更加复杂。


首先有用户质疑平台是否保留了用户作品的版权,因为AI作品转化成的NFT 艺术品无疑是个巨额资金获取来源。

 

比如去年三月,全球超过 2000 万访客围观了一场由佳士得举办的线上数字艺术品竞拍。而拍卖品《Everydays:The First 5000 Days》最终以近 7000 万美元成交落锤,高出了莫奈《睡莲》约 1600 万美元。

 

《Everydays:The First 5000 Days》和作者Beeple


目前Wombo对于Dream产生的版权争议并没有清晰的说明,就法律领域而言这也是一个未定义的问题。不过团队想要进军NFT的第一难关可能还是来自美国版权局,因为他们认为AI作品并不符合版权保护条件,人类身份才是先决要求。


  结语


虽然有明显的局限性,但Wombo向我们展示了AI艺术的可能性。也许在未来,游戏、动画、漫画、电影等多个领域都可以应用上类似的技术,我们的任何一个突发奇想都能够迅速落地并且产生价值。尽管距离那样的愿景还有很长的路要走,但又或许先驱者会比你想象的更快出现。


目前市面上已经出现了更多文字生成图片的“神奇AI工具”,比如由艺术家兼程序开发员 @Somnai_dreams 制作的Disco Diffusion。它目前是 GitHub上 的一个开源项目,拥有非常强大的图像转换能力。相比Dream,可自设置的参数更多,也可以实现更复杂的关键词以及风格化表达。但缺点是成图时间长,并且由于目前只以代码形式呈现,所以操作起来比较复杂。

(链接:https://colab.research.google.com/github/alembics/disco-diffusion/blob/main/Disco_Diffusion.ipynb)


(BY B站@弈湘君)


类似的AI绘画工具还有NightCafe Creator,用户可以通过上传图片或文字描述,来生成风格化作品。不过每次创作都需要支付积分,用户可以通过完成分享、发布、资料填写等任务或者直接购买获取。

(链接:https://creator.nightcafe.studio/)


以梵高《星月夜》为参照生成的西湖夜景


去年由OpenAI推出的DALL·E已经于几个月前完成了更新迭代,新一代的DALL·E2可以实现更高分辨率、更快地转化图像,并且允许对图像进行编辑。

(链接:https://openai.com/dall-e-2/)


左:DALL·E 右:DALL·E2

左:原图 右:DALL·E2编辑后


随着科技的发展,也许艺术行业也将日新月异。总之,在激烈的竞争和口碑维护面前,Wombo还需要更加重视他们的每一项决策。毕竟在如今的社交媒体时代,一款APP可能一夜火爆全网,也可能只是昙花一现。


Dream目前Dream支持安卓、ios系统以及网页端,感兴趣的大家可以前往:https://app.wombo.art/




—END—


想了解更多动画资讯与有趣内容?添加wuhu小精灵5号微信(wuhudonghua5) 发送“动画新势力”即可在不久后被邀请进群。


你一定还感兴趣:


休闲小游戏如何引发魔性传播风潮?!瞄准碎片时间发现惊人盈利模式!


《爱死机3》 终于来啦!众多国人艺术家参与!《证人》导演强势回归!幕后制作团队原来是他们…


两人,六年,一部动画电影!获满屏“自来水”助力!!专访《美人鱼的夏天》神仙眷侣主创


梦境还原?!国外CG艺术家做到了!这比好莱坞大片还要刺激的视觉冲击力!!


皮克斯又出最新电影《Elemental》!《新奥特曼》票房拿下TOP1


2022毕业季 | RUBIKA:一个被地理位置埋没的法国动画游戏设计明星学校!


一条短视频因「过于真实」爆火网络!小岛秀夫疯狂点赞!虚幻5火车站惊呆一众网友!


《大护法》导演最新力作《大雨》来了!2022年即将上映!


被花拥簇的白发少女!!!是谁心动了?!我不说!欢迎来到流光溢彩的白色世界!!


国际大奖拿到手软!旗下180多位导演!这个团队还用虚幻引擎做了一支实时动画短片?!


想了解更多后续的介绍要锁定wuhu哦,微博的小伙伴可以关注我们的新浪微博:wuhu动画人空间,对了!如果你想看更多动画作品,去b站搜索wuhu动画人空间看看?
新加入的小伙伴们请注意!往期精彩内容在平台里的wuhu主页上,可别错过哦!欢迎小伙伴们的投稿!
如果你喜欢,请分享给更多人看到:)欢迎留言和wuhu三侠互动

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存