AI取代插画师?别开玩笑了!

人工智能上色也曾爆发恐慌

作为对二次元并不感冒的少年,在看到《AI可能真的要代替插画师了……》一文时,还是十分震惊的。文中指出有研究者正在使用cGAN生成各种属性的二次元人物头像,甚至《Create Anime Characters with A.I. !》(用AI创造动画形象)的论文作者还搭建了一个网站MakeGirls.moe,允许任何人去尝试生成各种二次元的人物头像。作为一个普通吃瓜群众,当然马不停蹄地赶往了后宫集中地。可是,没想到……

泪崩篇

本以为打开会是这样的。

但实际是这样的。

使用者需要在有限的选项内进行选择。包括发色、发型、眼睛颜色、脸红、微笑、张嘴、帽子、缎带、眼镜、噪音(向量)等。

基于本人嗜好,当然是黑长直的国产小姐姐。至于其他的,都随机吧。

看上去似乎还不错。那其他的不变,再试试男孩子日思夜想的马尾吧。

Excuse me,小姐姐是不是年龄太小,鼻子、嘴巴是不是还没有长开?

不知是不是运气不太好,越试越失望。本着不给糖就捣蛋原则,小鬼我保存了下面这张图。

不得不说,效果很棒。嗯,当然指的是那些被我私藏的美图啦。

憨笑篇

体验了崩坏的效果之后,再回过头来看这篇《AI可能真的要代替插画师了……》。可能不得不对这个观念产生质疑。

首先,即便是对二次元不感兴趣的人士,也能立刻意识到这里产生的图像仅能用于QQ或者微信头像。对,它就像一个掘取无限二次元头像的网页应用。(拿走,不谢)

其次,我们再来看看作者的第一反应“事先声明,这篇文章的标题绝不是在耸人听闻。”但是很多读者可能都在文末“嘘”声不断了。再看看作者文末的结语是如何说的“这项工作确实令人印象深刻,生成的图片质量非常之高,个人认为如果加以完善,完全可以在某种程度上替代掉插画师的一部分工作。”

作者认为AI生成的图像“再进行完善”,“完全可以”在“某种程度”上“替代掉”“插画师”的“一部分”工作。整个句子都在模棱两可之中,甚至可以将这个句子替换为如果吹的牛皮“再进行完善”,“完全可以”在“某种程度”上“替代掉”“真实”的“一部分”。(事先声明,并不针对作者本人)。

我并不知道作者对插画师有多少了解,可以断定“AI可能真的要代替插画师了”。网友的吐槽却大多集中于此。

位于争议中心的插画师的工作到底是怎样的?先不提及插画师工作领域不局限于人物绘画领域,就算实在人物绘画领域中的二次元领域,文中所说的替代目前也做不到,因为它忽视了人物绘画不只是人物,往往还会有繁杂的背景。目前生成的人物没有背景存在,即便技术完善,拥有背景,依旧会出现一个问题:背景与人物如何适配?

即便在目前没有背景的图像中,都存在这样的问题:由于训练数据中各个属性分布不均匀,通过某些罕见的属性组合生成出的图片会发生模式崩坏。比如属性帽子(hat)、眼镜(glasses),不仅比较复杂,而且在训练样本中比较少见,如果把这些属性组合到一起,生成的图片的质量就比较差。在一个更复杂的环境中,这样的问题发生的几率会更大。

此外,尤其是游戏、影视插画设计师,往往需要进行大量分镜制作、场景设计等。目前谈论AI的取代,看起来有点像天方夜谭。

网友不满地直斥其为标题党。关键的核心可能就在于对目前技术过度夸张性的想象。而过度炒作AI的进展往往是十分危险的。

奋进篇

文章作者可能是标题党,但是我们不能否认新的研究取得的成就。目前研究者将其论文放在了github上供查询技术细节。以往的研究者往往采用生成式对抗网络GAN用于生成动画人物人脸形象,但是生成效果很不理想。

研究者们却问了自己一个问题。生成的图像不理想,会不会是数据集和训练结构不理想?那么采用一个更为干净的、更为合适的数据集会不会更好一些?采用一个更为适当更具经验主义的DRAGAN训练框架呢?

论文作者显然在这两个方面尝试突围。

首先,他们认识到了网络爬虫抓取的来自Danbooru或Safebooru这类网站的图片存在大量不可控因素,数据集之间的图像存在较大的噪音与方差,而且由用户上传的图像在风格、领域、质量之间也有不同,但这些数据却将在产生真正人脸面孔或者动漫人物角色中扮演重要的角色。
如何缩小这种差距?研究者从专门提供资讯并销售日本游戏,有着突出图片作为人物形象介绍的专业网站getchu进行数据收集。这些由不同插画画家创造的不同系列主题的不同形象,足够满足数据多样化的需求。最终他们从42000张图片中,手动筛除出了4%的假阳性和不受欢迎的图片。

为了进行训练,还需要给数据打上标记,包括图像的属性,如头发颜色、眼睛的颜色等。研究者采用了Illustration2Vec,一个预训练的CNN模型来产生这些标签。

其次,在知晓GAN的劣势后,为了收敛更快并且能产生更稳定的结果,研究者采用了DRAGAN训练框架。

虽然得到的效果相比以前取得了巨大进步,但研究者也意识到,生成的图像可能产生崩坏。此外,由于训练图像分辨率并不高,导致要生成高分辨率图像时困难的。他们也尝试输出额外的高分辨率图像来克服这种限制。

此前网友开的玩笑无疑再次适用:用来做头像已经足够了。

零镜观点

回到问题的出发点,AI真的要取代插画师了?别逗了。至少,目前该项技术并没有达到我们想要的效果。文章的作者更是有着标题党的嫌疑。无论从实际呈现效果(可能崩坏的二次元人物图像),还是生成的图像分辨率(当然可以从更高分辨率的图像入手),目前都无法取代插画师的角色。AI可能发生进化,但如果那一天真的到来了,能够实现如此复杂操作的AI都出现了,我们真的还需要插画师吗?