种种离谱图画或荒诞、或魔幻,对当事人,无疑是一场生活意外。
初次上手 AI 的萌新们满怀期待,本以为搭上了前沿技术快船,只是没想到技术直接越过人类常识,给刚见面的网友们一通电子毒打。
AI 绘画是怎么变离谱的?
为什么 AI 绘画会产生如此离谱的案例?这要从 AI 生成步骤展开一二。
图片生成模型一般由两部分组成,一部分用于文本到图像理解,将文本与图像做关联,另一部分为图像生成。
以近年最火的 Stable Diffusion 为例,该模型就包括 CLIP 文本 - 图像的多模态部分、生成图像的 Diffusion 部分。
△ 图源:Paul Mooney
AI 生成图片离谱,一方面,问题出在文本 - 图像部分。
即:训练过程中,模型内将一些本来无关的特征做了不当地、单一化地关联。
有网友反映意间的 AI 画 red bodysuit,AI 只会一个劲画 EVA 中的明日香,就可能是将「red bodysuit」关键词与明日香进行了直接关联。
另一种可能性是训练后的模型也可能忽略一些关键特征,导致对人像识别有误。很多人像最终变成动物甚至建筑物,可能与此有关。
但上面解释还不是全部,问题也可能与生成部分有关。
由于动漫风格绘图模型的训练集本身有倾向性,也可能导致生成过程中,最终结果带着「男男向腐文化」、「身材性感化肌肉化」、「人像萌化娘化物化」、「物体拟人化」等等特征。
上述问题一直存在。
前段时间大火的 NovelAI,就因生成的二次元妹子常有三条腿而遭吐槽,甚至有网友靠此种细节来分辨是否 AI 生成的作品。
与之类似,动漫风 AI 长时间都处理不好「吃面条」问题,生成图中,筷子、头发、面条、手指常被混淆:
△这还不算最离谱的 图源:@ShiShizUta
此类问题,即便头部 AI 模型也无法完全解决。
就在今年 10 月,科技博主 Andy Baio 就在社交媒体上 po 出一系列 Stable Diffusion 生成的奇葩图片。
这当中,有手指乱套的:
One More Thing
最后,介绍一下最近带火 AI 绘画的各家工具。
前文案例大部分来自抖音 AI 绘画特效以及一个名为意间 AI 绘画的微信小程序,这俩也是此番引发海量关注的爆破手。
意间 AI 绘画通过微信小程序即可进入,免费注册可用。
使用方法上,支持上传图片,输入关键字,配合引导力度及几个简单设置即可生成作品。
据其官方宣称,上线刚 2 个月,用户增长达 100 万。但如上面所见,对其吐槽声音也不少,也有网友在线分享关键词技巧。
△ 来源:小柔 SeeU
除前面两个工具,美图秀秀和 QQ 也在上周末前后脚推出旗下 AI 绘画工具。
美图秀秀通过首页菜单进入 AI 绘画,同样无需关键词,导入照片即可生成。
至于生成效果,所得图片同本人面部特征关联不算高,相比其他动漫风格滤镜差异不大。
△ 图源:美图秀秀 官方微博
相比前者,QQ 的 AI 绘画进入更复杂。
需要先进入其社交产品「小世界」,再在创作素材库中,通过「异次元的我」栏目进入。
同抖音、美图一样,QQ 所提供的 AI 也无需输入关键词和任何参数,上传照片即可生成一段「变身」短视频。其最终效果也跟美图差不多。
总的来说,此番几个 AI 工具中,意间的 AI 绘画可玩性更高,产生的离谱结果也更五花八门,其他几家大厂平台,抖音更为出圈,生成结果同样更多样。
可以预见的是,伴随 AIGC 大火,AI 绘图飞入寻常百姓家,当中离谱段子笑料涌现还会更多。
最后问问: 你认为 AI 生成离谱图片这件事,有哪些办法能避免?