查看原文
其他

2022年AI绘画的回顾与展望:见证技术与艺术的新时代!

穿行者2049 今说新语 2024-04-14


2022年就要结束了,本年度对我个人来说最重要的事情,就是亲眼见证了AI绘画崛起的全过程。本文就简单总结和回顾一下今年AI技术的进展,以及本公众号今年的主要内容。(全文共5000字,感谢您的阅读)

我认为AIGC是自2000年以来IT技术行业最重要的一个进展,远比2010年的移动互联网爆发要更重要。

先简单回顾一下AI绘画的发展简史。

在2021年,VQGAN(视觉生成模型)+CLIP(算法)的结合使用让AI绘画踏入新阶段,真正实现了较高质量的“输入文字生成图像”。这两种机器学习算法彼此独立,前者擅长根据原有图像生成相似的图像,而后者能够给图像与文字的匹配程度打分。两个算法互相配合,多次迭代后,便能生成一张符合使用者输入文字的最佳图像。

2022年,扩散生成模型(Diffusion Model)凭借更出色的生成结果取代了对抗生成网络(GAN),成为图像生成领域更偏爱的算法。由此衍生出了Clip + Guided Diffusion、Dall E2、Stable Diffusion等新的算法,以及基于这些算法搭建的AI画作生成平台Disco Diffusion、Dall·E2、Midjourney和Stable Diffusion。

3月Disco Diffusion开始出圈

Disco Diffusion的初始作品是一张灯塔,象征着给行业照亮了前行之路。并且普及或者说定义了后来AI绘图的很多概念,例如提示语Prompts、迭代步数、作品风格、参考艺术家、动画、他让很多没有美术基础的人第一次看到自己也能创作出优美的作品。但Disco Diffusion的缺点也是显而易见的,速度慢、需要在浏览器中的Colab上面对代码操作。

4月Midjourney开始内测

Midjourney的出现以作品的生成速度震惊了使用者,同时直观的操作界面、可迭代的进化功能,全公开的作品展示库、艺术家风格库,如同一个个宝藏库让每一个AI爱好者的学习热情都被点燃。人们也意识到AI创作的第一个门槛好的Prompts被迈过,而对艺术家、艺术风格的理解变得更为重要。

4月Dall-E2开始内测,DALL-E为艺术家萨尔瓦多·达利(Salvador Dali)和机器人瓦力(WALL-E)的合成词。DALL-E 2实现了更高分辨率和更低延迟,可以生成更真实和更准确的画像,分辨率更是提高了4倍!语义理解能力和最终的绘画效果更是超出了当时人们想象的最高度,以至由于对各种风险的担忧,迟迟不愿完全开放。

8月Stable Diffusion内测

2022年7月底8月初,功能强大的AI绘画平台Stable Diffusion开始分4波邀请内测。每天产生上千万张图片,并迅速升级迭代,最终于8月20日完全开放网页版服务,随后8月22日开源代码,整个AI届被引爆,各类在线绘图网站纷纷引入,很多网站在其基础上二次开发,任何人都可以在本地计算机部署,单独训练独有的模型。向量图形编辑器、原型设计工具Figma以及图像处理软件Photoshop等等都引入了AI绘图插件。

全行业爆发。

2022年6月11日,《经济学人》杂志选择用Midjourney生成的AI绘图作为当期杂志的封面,AI绘画由此进入主流媒体视野。2022年8月底,由AI生成的画作《空间歌剧院(Théâtre D'opéra Spatial)》在美国一个数字艺术类美术比赛中获得第一名。AI绘画进入社交媒体热议、版权争论渐起。各行各业都卷入进来,不仅仅是纯绘画,包括平面设计、建筑设计、服装设计、鞋类设计、室内设计师、影视动漫等等一切与图像创作相关的行业都开始进入这个领域。

11月ChatGPT横空出世

这是OpenAI训练的一个名为ChatGPT的超级对话模型,以对话方式进行交互,持续性的回答用户提出的各种问题。不论是日常聊天,解决技术问题,还是修改代码,编写提示语,只要你想到的都可以试试,而他不会的问题会直接告诉你,或者提示你如何修改问题才能获得正确的答案。你可以把它当做一个超级智能的搜索引擎助手,随时帮你解决各种困难。

完全可以类比一下2000年互联网爆发时对整个社会的全方位影响,2022年的AI技术爆发也一定会带来对社会全方位的影响。

站在2022年初,没有多少人能预料到这一年会有这么大的进展,但站在2022年末,我想更多的人已经毫不怀疑Ai技术的爆发已经或即将改变整个互联网行业。

从内容的生产、信息的传播、商业社会的渗透、各行业生产流程的重塑,不论是质量和效率都将有巨大的飞跃。

文生文、文生图、文生音乐、文生视频、文生3D,都已取得了长足的进步,技术层面当然还会有巨大的进展,但在产品层面无疑才刚刚开始。

回想我们站在2000年时根本想象不到后来会产生如此多的丰富产品,同样现在也无法想象AI技术会从产品层面带来哪些新鲜的体验。更重要的是目前AI行业处于一个非常好的发展环境中,与2000年相比,用户的接受程度要更快,付费意愿也更强烈,成熟的付费环境也有助于各个创业公司将精力投入在产品研发上,市场也会更快的给好产品定价和奖赏。现在也已经不是画大饼的时代,以往很多公司习惯于产品先画个大饼,技术跟在应用后面追,现在是技术跑在了应用前面,快速迭代的技术进步推着产品加速跟上。

目前国内流行的二次元头像生成、各个创业公司二次开发的AI绘画应用,都还属于产品的初级形态,暂时都还停留在内容生产、用户个人娱乐阶段。国外的应用稍微靠前一些,在室内设计、游戏角色设计、游戏动画设计、视频创作方面都有了一些很好的行业应用方向。当然国外近期的热点应用和国内类似,也是拥挤在微调模型,为用户生成自训练模型、生成个性化头像这一个应用点。毕竟Lensa软件的火爆吸引了大量圈外人的注意力,可以算AI技术的第一次破圈。但头像生成是一个太小的方向,这么多公司都拥挤在微调模型生成头像这个狭窄的领域,好奇心过后,潮水必然退却。用户需求必然还会往更广的方向探索,明年也更希望看到文本生成图像方面有更多的产品形态,行业应用。

此外今年AI技术在3D模型和视频方面都已经开始有了进展,明年在这两个方面无疑将是热点。而这两个方向更偏向于行业用户,专业性更高,但可应用的方向也更广。毕竟我们目前本身就处在一个视频时代,一切有利于提升视频生产力的技术,都会更快的匹配到产品中。在微调模型领域,国外在游戏场景生成、角色生成方面的微调应用发展非常快,已经可以直接接入游戏设计行业的工作流。而在3D人物生成方面,一些公司推出的演示视频也已经相当成熟。但可以肯定地说,我相信明年所有火爆的AI应用在目前这个时点都还没有出现,这件事儿想想就很兴奋,明年快来吧。
2000年互联网的普及带来的是内容生产效率的提高,人人都可上网,人人都可生产内容。AI技术的普及将把这种效率提升百倍,在AI的帮助下,文字、图片、音视频、3D、VR等内容的生产都将爆发性的产出,5G、6G解决了VR内容的传输,而AI将解决内容的生产。

随着AI技术的普及,内容生产可能会发生以下变化:

  1. 生产效率提高:AI可以帮助人类完成大量繁琐的工作,如数据处理、文本生成、图像生成等,提高内容生产的效率。

  2. 内容种类更多:AI可以帮助人类快速生成各种类型的内容,包括文字、图片、音视频、3D、VR等,使得内容种类更加丰富。

  3. 内容质量提高:AI可以帮助人类快速生成高质量的内容,例如文本生成技术可以生成流畅的逻辑性更强的文字,图像生成技术可以生成逼真的图片等,使得内容质量更加优秀。

  4. 内容生产门槛降低:AI可以帮助人类快速生成内容,使得内容生产的门槛降低,让更多的人可以参与内容生产。

  5. 实时内容生产:AI可以帮助人类快速生成内容,使得实时内容生产成为可能。例如,在新闻事件发生后,AI可以帮助快速生成新闻报道、图片、视频等内容,使得实时获取信息更加方便。

  6. 在游戏实时画面生产方面,AI可以帮助快速生成流畅的画面,提高游戏体验。例如,可以使用AI文本生成图像技术来生成游戏场景,使得游戏场景更加逼真。此外,AI还可以帮助快速生成游戏角色、道具、动画等内容,使得游戏更加丰富。

  7. 在VR交互式内容生产方面,AI可以帮助快速生成交互式内容,使得VR体验更加逼真。例如,可以使用AI文本生成图像技术来生成VR场景,使得VR场景更加逼真。此外,AI还可以帮助快速生成VR角色、道具、动画等内容,使得VR体验更加丰富。

  8. 这里提到的实时内容生产不是预先生成内容,而是根据玩家的指令,实时产生对应的场景、装备、交互效果。头号玩家中的场景将离我们更近,那不是幻想,而是可预见的未来。

  9. 一个简单的类别,CAD技术催生了各种行业辅助设计软件,产生了一个巨大的市场,各种行业CAD软件层出不穷。AI技术也会催生各种行业辅助设计生产程序,重塑目前的各行业内容生产方式。

  10. 如果再考虑AI生产文本、音乐等等技术,几乎没有一个行业不受影响。


这个公众号从4月开始全过程记录了个人学习AI绘画的每一步,包括三大主流AI绘画程序的全方位应用技巧,以及后期自训练模型、ChatGPT的一些进展。我想每一个对AI绘画感兴趣的朋友都可以翻翻看,这些文章的绝大多数内容都没有过时,仍旧可以解决很多朋友学习中遇到的问题。

今年也有幸和巴比特、无界公司合作完成了《人人都可以使用AI绘画,你还在等什么?》视频课程的录制,有兴趣从头开始学习AI绘画的朋友可以去系统学习一下这门视频课程。
2023年,我们一起继续学习,继续记录。注意到有些新来的朋友不知如何查看历史文章,还有些朋友没有注意到公众号下方的菜单功能,因此把本年度的主要文章罗列在下方,方便读者朋友收藏查阅,也欢迎转发分享到朋友圈。

【Disco Diffusion相关】

人工智能辅助设计工具 Disco Diffusion初探

AI设计工具 Disco Diffusion基础参数介绍

AI设计工具 Disco Diffusion图形创作

AI设计工具 Disco Diffusion动画创作

Disco Diffusion语法和权重设置

Disco Diffusion推新版,绘制人像技能大跃进!

Disco Diffusion水彩模型参数设置


【Midjourney相关】

AI设计软件Midjourney初体验

AI程序Midjourney常用命令和参数详解

AI程序Midjourney在建筑设计中的应用

写书自己配插图?看AI程序Midjourney如何解放作者!

AI设计的思考和展望:设计者如何使用 AI 来参与你的产品设计?

AI程序Midjourney新版模型发布,语义理解能力惊人!

Midjourney新玩法,img2img超强效果

Midjourney发布二次元模型niji · journey(送邀请码)

Midjourney新模型niji · journey表现怎么样?

在Midjourney创作中,如何保持人物形象的一致性?


【Stable Diffusion相关】

AI绘图程序Stable Diffusion开测,作品欣赏和简单参数介绍

AI绘画程序Stable Diffusion测试期结束,网站开放使用!

AI绘画程序Stable Diffusion开源,打开浏览器即可使用!

在Google Colab中搭建免费使用的Stable Diffusion程序!

开源后新功能:使用Stable Diffusion进行动画创作!

如何取消Stable Diffusion的NSFW图像自审查功能?

AI国画进阶:如何训练Stable Diffusion画出高质量的国画!

【动画】Stable Diffusion如何使用输入的视频生成动画?

【动画】Deforum Stable Diffusion制作插值动画:居住的历史!

【动画】Deforum Stable Diffusion的Inpating/Outpainting功能制作动画


【Stable Diffusion经验技巧】

上不了国外网站,小白如何上手使用Stable Diffusion学习AI绘图?

Stable Diffusion的功能这么多,该如何应用到实际创作中?

AI程序Stable Diffusion都可以画全景图了?!

AI爱好者不容错过的14个Stable Diffusion开源Colab!

AI只能随机绘制图像?如何控制Stable Diffusion程序创作的方向?

提高Stable Diffusion生成图片质量和速度的技巧

使用Stable Diffusion快速绘制图标样式一:卡哇伊风格

使用Stable Diffusion快速绘制图标样式二:3D立体风

使用Stable Diffusion快速绘制图标:动物图标

使用Stable Diffusion快速绘制图标:3D玩偶

免费体验Midjourney模型!还能快捷体验更多不同模型!

这个Stable Diffusion的众包服务,可以免费使用40多个模型!

使用AI技术快速替换图像中的部分内容,基于文本的图像修复!

AI绘画:Stable Diffusion绘制逼真人像的技巧

Stable Diffusion官方发布最新2.0版本

AI绘画:新版Stable Diffusion 2.0生成真实人像技巧!

Stable Diffusion 2免费期开启!官方Bot使用大全!

Stable Diffusion推出2.1版本,AI终于会画手了?!

Stable Diffusion新功能:新版Depth2img深度图像有什么用处?

AI绘画:提高Stable Diffusion构图能力的技巧

AI绘画:释放相机镜头的力量,创造令人惊叹的图像

AI绘画技巧和应用:使用雾气增强画面的表现力


【自训练模型】

艺术工作者们,可以训练Stable Diffusion绘制自己风格的作品了!

Stable Diffusion实现“以假乱真”!你的梦想他帮你完成!

教程:如何用你的图片训练Stable Diffusion学习新概念

Stable Diffusion如何叠加使用其他用户训练的模型?

用户训练的Stable Diffusion模型到底能做出什么效果的图?

Stable Diffusion版的Dreambooth,只需三张自拍照,AI就能记住你!

Stable Diffusion学习丰子恺的画风能画出什么?

新版Dreambooth训练AI模型教程,效率和效果大幅提升!

如何提高Dreambooth训练AI人像模型的质量?

AI进化的速度有多快,再看AI学习徐悲鸿画马

建筑设计师的新助手:利用AI自训练模型绘制建筑效果图

让你的AI绘画技艺达到新高度: 自训练模型!


【建筑室内设计相关】

AI画师一键出图,室内设计师下岗?

Ai取代室内设计师?背后的技术是什么样的?

AI室内设计:白色经典不败,光影永远迷人

如何使用Stable Diffusion生成全景图?

AI绘画:AI跟建筑大师学习建筑设计!

AI绘画:如何设计复杂造型的建筑外观? 

当AI绘画遇上建筑设计,量变到质变


【ChatGPT相关】

AI绘画写提示语如此麻烦,我决定让AI程序ChatGPT来写!

使用ChatGPT生成提示语:为AI绘画带来全新灵感!

没有国外手机号,如何注册使用聊天机器人ChatGPT?

ChatGPT参与AI绘画工作流介绍:山脚下的别墅!


【其他】

人人都可以使用AI绘画,你还在等什么?

Img2Music也来了,AI要彻底解放双手!

一句话生成3D模型来了!动动嘴就完成建模不再是梦想!



对写作者最好的支持就是

转发、点赞、关注、打赏

继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存