查看原文
其他

人工智能辅助设计工具 Disco Diffusion初探

穿行者2049 今说新语 2024-04-14
一、介绍
近些年AI(人工智能)技术的发展在各个领域都有了很大的突破,相信常上网的人多多少少都听说过一些AI的新闻和趣闻,例如谷歌的阿尔法狗击败人类的围棋顶尖高手,全面碾压了人类的围棋水平。这应该是在大众中最知名的AI新闻了,但其实人工智能在很多个领域都已经有了让人惊艳的表现,比如音乐、舞蹈、绘画、游戏、基因工程、AI看病等等,但普通人却对人工智能在这些领域的表现很难有直观的感受,近期接触了一个人工智能辅助绘画的程序,他的作品应该能让普罗大众有最直观的感受。
这就是谷歌平台上的Disco Diffusion程序,Disco Diffusion 是发布于 Google Colab 平台的一款利用人工智能深度学习技术,进行数字艺术创作的工具,它是一款开源工具,可以通过浏览器在 Google Drive 上直接运行,当然也可以部署到本地运行。简单说Disco Diffusion的工作流程就是把你给出的 文字提示或文字描述转变成图像信息,把你用文字描述的画面或关键词「画」出来。实际操作并不复杂,被很多人称呼为“用嘴画画的工具”。

二、作品展示
先给大家看几张人工智能完成的作品。
海浪中的灯塔
林中迷雾和暗影光芒
中国风水墨山水
未来世界赛博城市
宫崎骏风格的画面
湖中城堡
相信看了上面的作品,你会非常震惊于AI的表现。也许会困惑于AI是如何绘制这些作品的?简单说这套程序依托于程序后面的海量数据,通过检索文字和对应的画面,经过一系列的智能计算,将各个素材组合到一起。例如你输入的画面描述是:清晨草地上开满鲜花,蝴蝶在天空中飞舞。AI程序即可从他的数据库中拣选合适的素材进行组合计算。当然要想得到一张精美的绘画作品,你还需要非常精准的描述你期望的画面效果,并可以指定一些补充的信息,例如色调、雨雪天气、云雾效果、画家风格、写实还是科幻、2D还是3D效果等等。
三、如何使用这个程序
Disco Diffusion 是一个直接在谷歌云端电脑(Google Colab)运行的程序,它对你的电脑配置没有任何要求,有Chrome浏览器就可以运行。但是前提是你已经有一个谷歌账号,并且知道Google Drive等等基础知识。
然后复制下面这个网址:https://colab.research.google.com/github/alembics/disco-diffusion/blob/main/Disco_Diffusion.ipynb
打开Chrome浏览器,将刚才的网址粘贴到浏览器中,即可立刻开始你的 AI 绘画之路了。
程序运行的界面如下图所示:
看到上面满屏的英文和代码别慌,真正需要你调整的东西并不多。当然如果你的电脑知识比较丰富,那看这些代码参数会更亲切熟悉一些,否则不要随意改动里面的参数。
通常第一次进来的用户,只需要调整以下两个参数即可尽快见识到程序的运行效果。
display_rate:20 
程序在绘制过程中,会在下方显示预览的运行效果,这个参数就是控制程序渲染到第20帧显示一幅,他对最终的生成效果没影响,主要方便你能在漫长的渲染过程中预览中间效果。
n_batcher:1
这个参数是控制AI最终渲染出几张图,通常第一次玩,把这里改成1张即可,因为渲染时间实在太长。
好了,第一次玩就改这两个参数即可开始运行程序,大约运行1小时40分钟左右,即可完成第一张AI作品,也就是前面展示过的灯塔这张作品。
后面有时间我会介绍更多的参数以及玩法,最后再欣赏几幅我用这个程序生成的作品。
飞船漂浮在赛博城市上空

水面的城堡

鸟巢变形后的城堡

空中飞艇

未来城市的早晨

迷雾中的森林
水边的建筑
赛博城市街景

也许有些朋友看了上面这些画面会觉得效果也一般,不够惊艳,但请你相信,这是我初次玩还不够熟练的原因,随着对参数了解的逐步深入,和对程序的逐步了解,我能明显看出生成的效果越来越好,这也是人们常说的要对人工智能程序进行调教的过程,不断的修改、不断的思考、不断的创新,才会有更好的作品,AI终归是一个辅助人的工具。
继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存