1.1 AI绘画进入公众视野,AIGC获得指数级发展增速
AIGC全称为AI-Generated Content,即利用人工智能技术来生产内容,在创意、表现力、创作速度、迭代、传播等方面都具有显著的技术优势,已经成为继PGC(专业生产内容)和UGC(用户生产内容)之后新型的内容创作方式。其中,AI绘画是AIGC的重要分支。
2022年8月,AI绘画作品《太空歌剧院》在美国科罗拉多州举办的新兴数字艺术家竞赛中获得了“数字艺术”类别的一等奖,该作品通过AI绘画应用Midjourney生成,获奖者仅是在生成绘画的基础上用Photoshop对作品进行调整。此事引发了热议,AIGC进入大众视野,受到广泛关注。
21年以前,AIGC还是以文字生成为主,22年开始AIGC发展迅速,年初还处于技艺生疏阶段,几个月之后就达到专业级别,可以处理的格式也从最初的文字内容到现在囊括文字、图像、视频、语音、代码、机器人动作等多种内容形式,包罗万象。而AIGC能够呈现指数级的发展增速,得益于深度学习模型的不断完善、开源模式的推动以及数字内容供给需求的不断增长。
1.2 AIGC的发展历程
结合人工智能的演进沿革,AIGC的发展历程大致可以分为三个阶段:早期萌芽阶段(1950s-1990s)、沉淀积累阶段(1990s-2010s)、快速发展阶段(2010s至今)。
1.3 AIGC可生成的内容形式不断扩展,包罗万象
AIGC最初可生成的内容形式以文字为主,经过2022年指数级的发展增速,目前可生成的内容形式已经得到了扩展,囊括文字、图像、视频、语音、代码、机器人动作等多种内容形式,包罗万象。
图:AIGC技术场景中的内容分支及代表应用
1.4 新模型Diffusion的出现推动AIGC突破性发展
最早出现的深度学习模型是“对抗生成网络”GAN,它有明显的不足,即对输出结果的控制力较弱、容易产生随即图像、生成图像分辨率较低及生成的图像是对现有作品的模仿,难以创作出新图像;2021年出现的CLIP模型能够同时进行自然语言理解和计算机视觉分析,实现图像和文本匹配,并且利用互联网图片进行了巨量的文本-图像匹配训练,为后续AIGC应用的落地打下了基础。
2022年深度学习模型Diffusion扩散化模型的出现,直接推动了AIGC技术的突破性发展。Diffusion模型有两大突破,首先,通过增加噪声破坏训练数据来学习,使得模型可以从随机输入中合成新的数据;其次将模型的计算空间降维到一个可能的低维空间里,大幅降低计算量和计算时间,提升模型的训练效率。
图:AIGC相关深度学习模型对比
1.5 较为成熟的海外AIGC应用带动行业发展
作为AIGC以及全球人工智能领域的领头羊,Me
ta和Google在AIGC最能体现算力实力的视频应用场景上也早早进行了布局。Meta于2022年九月发布了新款AIGC系统Make-A-Video,而谷歌则是推出了Imagen Video来完善其AI产品线。Meta推出的Make-A-Video是一款直接文字输入即可生成短视频的AIGC系统,系统生成视频画面准确率高,仅需一段简单的文字描述即可生成一段生动的视频。背后的AI系统更是通过日积月累的用户指令来丰富系统创作的想象力。而谷歌的Imagen Video则是在作品的清晰度,真实性,创作视频所需时间上都略胜一筹,谷歌背后强大的算力数据支持以及较为庞大的AI智能用户数量成为了关键因素。
相较海外,我国AIGC相关应用还处于早期阶段。并主要以输入文字描述,计算机生成图像作品为主。相较于PGC与UGC,AIGC能更好的满足人类对生产效率,生产质量甚至生产创意的需求。但是其在硬件端例如计算机算力的高门槛以及在软件端例如AI智能算法模型,自然语言处理技术等方面都有着较高的要求。使得行业技术壁垒较高,国际科技巨头企业带动全球AIGC行业发展成为大势所趋。
图:Meta-Make-A-Video
详细内容如下:
智玩元宇宙官网http://www.pmeta.fun(复制到浏览器打开)
更多推荐
【东方财富】传媒互联网行业专题研究:Web3.0前瞻系列之一:AIGC技术提速,场景商业化可期-26页
【安信证券】传媒行业元宇宙与Web 3:2023,硬件的“大”年-36页
【国盛证券】Web3时代的生产力工具:AIGC-23页
文章转发自智玩元宇宙微信公众号,版权归其所有。文章内容不代表本站立场和任何投资暗示。