真人照片画成二次元人物的方法有很多种。一种方法是使用绘画软件或者图像处理软件,将真人照片导入软件中,然后通过绘制和调整各种图像参数来使其看起来像二次元人物。另一种方法是利用插画软件,使用绘图工具将真人照片以二次元风格重新绘制。
“翻车”将猫狗画成人可能是由于对比度不足,比例不准确或者绘画技巧不到位所引起的。在绘画过程中,要仔细观察宠物的特征和表情,细心地绘制人物的面部特征和身体姿势。如果技巧不熟练或者缺乏对人体结构的理解,就可能导致无法准确地表现出猫狗特有的形态和表情,从而使绘画结果看起来怪异或不自然。
随着AI的发展,每个人都有机会成为艺术家。AI绘画的出现就如同瑞士艺术家保罗·克利所说的:“艺术不是再现可见,而是使不可见成为可见。”经过大约20年的发展,基于不同类型或模态元素的AI绘画各自展现出不同的发展情况。最早得到发展的是“以图生成图”,而最近很火热的则是“文+图”生成图。当然,一些团队也已经研发出了利用语音生成图像的技术。
上传一张图片,或者输入一些简单的关键词,系统就能自动生成一张卡通图像……最近一段时间,通过AI进行绘画的技术在互联网社交平台上开始变得越来越流行。
利用人工智能进行绘画,即AI绘画,是目前人工智能技术的典型应用之一。其基本原理是通过收集大量已有的艺术作品,运用算法对其内容和风格进行分析,并最终生成新的作品。因此,算法是AI绘画的关键所在。
由于当前AI生成图像的技术并不完美,有时候结果可能出乎意料。例如,AI可能会以你的照片为基础,绘制出一张充满艺术感的二次元画像,但也可能会将你的宠物猫或狗画成可爱的少女或肌肉男。
AI绘画在全球范围内已经变得非常流行。2018年,由人工智能创作的首张公开展出的绘画作品《埃德蒙·贝拉米的肖像》在佳士得拍卖行以43.25万美元成交。这幅肖像画是通过机器学习从14世纪到20世纪的1.5万张肖像画作品中生成的。
“AI绘画是凭借先进的算法和大量的数据训练来实现‘凭空’创作的。通过深度学习和生成对抗网络等技术,AI可以从艺术家的作品中学习风格和技巧,然后以自己的方式进行创作。”
除了娱乐,AI绘画还有许多潜在的应用前景。首先,AI绘画可以帮助艺术家和设计师快速生成创意草图和概念设计,节省时间和提高效率。其次,AI绘画还可以用于自动化图像生成,例如在电影特效、游戏开发和虚拟现实等领域。此外,AI绘画还可以应用于文学创作,通过生成文字描述的方式来创作插画和艺术作品。总的来说,AI绘画在视觉艺术、设计和创意产业中有着广阔的应用前景。
将图像转换为图像,通常是指利用计算机程序和人工智能技术将一幅图像转换成另一种风格或者另一幅类似的图像。而“语音生图”则是指使用语音信号和人工智能技术生成图像。通过语音输入,计算机程序可以将语音信息转换成图像,例如根据语音描述生成图像或者通过语音情感分析生成对应的表情图。
2022年,《太空歌剧院》这部由人工智能创作的作品在美国科罗拉多州举办的新兴数字艺术家竞赛中大放异彩。它斩获了“数字艺术/数字修饰照片”类别的一等奖,其构图、配色以及画面细节之精致,令人赞叹不已。然而,值得一提的是,这个作品的创作者并非一位艺术家,而是一位来自美国科罗拉多州的游戏设计师。
一位游戏设计师利用一款名为“Midjourney”的 AI 创作工具,通过输入一些关键词,比如光源、构图、氛围等,获得了 100 幅创作。之后,经过大约 80 小时的修图和修饰,她最终挑选出了3幅作品,并将它们打印到画布上。
“艺术品”的生成方式引起了艺术家们的关注,让他们开始争论“AI绘画作品是否应该参加绘画比赛”。这场激烈的辩论也让人们更清晰地认识到目前AI绘画水平的发展程度。
中国科学院自动化研究所多模态人工智能系统全国重点实验室研究员董未名指出,人工智能在艺术方面的创作最早可以追溯到上个世纪末。当时的人工智能绘画技术被称为“图像的风格化滤镜”。最初的AI绘画方法相对简单,通过图像处理算法对普通照片的像素进行几何或色彩方面的变换,然后再调节不同参数便可模拟出类似油画或水彩画的风格。
经过20年左右的发展,不同类型或模态元素的AI绘画发展情况各有不同。最早发展的是“以图生图”,近期更受瞩目的是“文+图”生图。同时,一些团队已成功研发出了能够由语音生成图像的技术。
AI绘画主要依靠三种技术模式实现,分别是生成对抗网络(GAN)、卷积神经网络(CNN)和递归神经网络(RNN)。这些技术模式使得人工智能能够模仿不同艺术风格、创作绘画作品,并且不断提高自身的绘画水平。
目前,AI绘画主要利用图像风格迁移技术、图文预训练模型和扩散模型来实现。其中,图像风格迁移技术能够将一个图像的风格应用到另一个图像上,而图文预训练模型则通过对大量文本数据的学习,使得AI能够生成更加富有表现力的图像。扩散模型则能够模拟物质扩散的行为,从而产生出令人惊叹的艺术效果。
图像风格迁移技术是指利用图像处理算法,将输入的真实图像内容特征和参考的艺术图像风格特征进行融合,生成新的艺术图像。以美国旧金山艺术宫的外景照片和印象派创始人莫奈绘制的作品为例,通过图像风格迁移技术的融合,可以得到一张看起来像是莫奈绘制的美国旧金山艺术宫的绘画作品。最初的AI绘画就是基于这一技术实现的。
然而,董未名认为,图像风格迁移技术目前主要依赖于生成对抗网络(GAN)算法。然而,他认为该算法存在的问题是生成的绘画作品艺术性不足,笔触和构图与真实绘画有明显差距,因此长期以来,人工智能绘画一直没有引起太多关注。
随着图像风格迁移技术在输出作品的审美上遇到困难,图文预训练模型的涌现加速了AI绘画技术的发展。
基于图文预训练模型的算法能够通过输入一句话或上传一幅风格明显的图片,将图像特征和文字特征相匹配。生成的绘画作品在内容特征上与上传的图片相似,而且在艺术性上比图像风格迁移技术生成的图片更加出色。比如,CLIP算法是一种支持图文预训练模型的算法,它利用图文特征相互匹配的能力,结合已有的生成模型,实现了“以图生图”或者“图+文”生成图片的功能。
然而,董未名坦率地指出,图文预训练模型的推广也引发了一些争议。一些人认为,在训练初期,这些模型需要耗费大量图形处理器(GPU)进行数据训练,消耗大量电能,成本高昂,而且该模型的应用场景并不十分清晰。然而,也有人持有不同观点,认为这种模型有可能成为未来通用的人工智能模型,能够完成更多的算法任务,只是这一点需要时间来验证。
毫无疑问,没有一种技术是完美无缺的,这也激励着人类不断探索更先进的技术。目前最受欢迎的扩散模型就是其中之一。
“目前最新的AI绘画技术采用的就是扩散模型,这种模型可以通过输入随机采样的噪声来尝试生成图像。”董未名表示,扩散模型虽然在图像生成方面取得了进展,但仍然存在一些弱点。例如,由于模型对图片内容识别的能力不足,或者难以完全理解识别文字的意义,以及训练数据的偏差,有时可能会生成出“四不像”的作品。此外,扩散模型生成图片的速度也相对较慢,目前还不能实现实时生成图片的要求。
互联网治理、元宇宙和潜在的应用前景在当今科技发展中正变得越发重要。互联网治理涉及全球范围内关于互联网的规则、标准和运营方式的讨论与决策,这对于确保互联网的公平、安全和可持续发展至关重要。同时,元宇宙作为虚拟现实和增强现实的结合,提供了沉浸式的数字体验,为各种领域的创新和发展提供了新的机遇和可能性。潜在的应用前景包括医疗保健、教育、娱乐和商业等领域,将为人们带来巨大的便利和创新。因此,对互联网治理、元宇宙和潜在的应用前景进行非常重要的研究和探讨。
AI绘画目前的应用场景已经越来越多地集中在社交软件上。近期国内社交网络上流行的AI绘画软件主要集中在小程序和App中。随着AI绘画小程序的兴起,短视频平台抖音也迅速推出了AI绘画特效功能。同时,腾讯上线了“QQ小世界AI画匠”活动,百度也推出了首款AI艺术和创意辅助平台“文心一格”。
AI绘画的出现使艺术创作变得更加普及。正如瑞士艺术家保罗·克利所说:“艺术并非再现可见,而是使不可见成为可见。”AI如今已经实现了这一目标,通过机器计算,人们可以绘制很多现实中难以见到的场景。董未名对未来充满期待,认为AI绘画可能会展现更加丰富的应用场景。
董未名建议,网络上存在大量不良内容,这些内容经常以绘画的形式出现,难以被监管发现。尽管当前的内容识别模型对真实图片识别得很准确,但由于缺乏对不良内容艺术作品的相关训练数据,对不良内容的识别却不准确。为了提升网络内容的安全监管能力和识别准确率,董未名提议可以利用AI绘画技术来积累不良内容艺术作品的数据,并将其用于训练识别模型。
董未名认为,AI绘画作为一种艺术呈现形式,将对元宇宙、设计、文旅等行业产生新的商业模式。举例来说,AI绘画目前已经在AI辅助创作、短视频、影视制作和元宇宙等领域展现出潜力,因为这些领域都离不开创意。AI绘画可以帮助创作者通过简单的特征输入来预览创意,甚至直接进行创作。
董未名指出,尽管AI绘画的发展迅速,但其仍面临版权争议问题。AI绘画的核心在于模型训练,而训练模型需要使用大量图像和文本数据。在未经授权的情况下,生成的图像版权归属尚难确定。董未名所提出的问题,正是多数AI绘画作品所面临的现实问题。
AI绘画正引发资本市场的热情,人们希望它有朝一日能摆脱“照猫画虎”的窘境,真正为艺术创作服务,并创造更多的价值。
来源:科技日报
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 sumchina520@foxmail.com 举报,一经查实,本站将立刻删除。