艾瑞咨询:2023年中国AIGC产业全景报告
古人有云:日就月将,学有缉熙于光明。人类对人工智能学的潜心钻研终于再度获得重大突破,大模型的涌现能力与AIGC的应用普及为那不一定是AGI但一定更AI的未来提供了确定性的加速度。AI2.0时代的加速到来,不仅是把AI能力融入到现有应用中,更是未来产业范式的再塑造。AI正跳跃式地加速渗透进各行各业,推动一场新的生产力与创造力革命。AI产业链各环节参与者的角色功能、产品服务和应用生态可能将发生变化。
对此,艾瑞发布《AIGC系列报告——中国AIGC产业全景报告》,作为AIGC系列首发,报告将展开对AIGC产业的全景洞察、探究生成式AI技术对数字产业的影响变化、绘制“中国AIGC产业全景图谱”、分析主流参与厂商类型与格局策略、各类型厂商发展路径和能力要求变化等,为市场辨析产业发展价值与空间。
预训练大模型分类与介绍
基于两大类基础架构衍生出各类大模型;多模态已成趋势
预训练大模型按照模态可以分为文本、图像、视频、代码、音乐生成等多种,但从底层架构上都分属两类。Transformer是一种编解码模型框架,适用于处理文本、代码这类强连续性生成任务;Diffusion、GAN、NeRF等框架善于处理图像生成类任务。叠加文图转换技术可以形成文生图模型。由单模态模型在实际训练时融合其他模态技术,可形成多模态、跨模态大模型,如GPT-4、文心一言、Midjourney等,由于多模态模型可接受文本、图像等不同输入输出形式,对应用场景能够更广泛适配,着力发展多模态模型成为产研两界共同趋势。
预训练大模型的发展业态
中美引领大模型产业发展,NLP仍是大模型的重点活跃领域
从全球范围来看,中美两国在大模型领域都取得了令人瞩目的成果。2019年,美国率先在大模型领域取得突破性进展,推出了BERT、GPT等具有里程碑意义的预训练模型。2020年,ERNIE系列模型和TinyBERT等轻量化模型的推出拉开了中国大模型产业快速发展的序幕。2021年以来,中美在大模型领域逐渐呈现出分庭抗礼的趋势,共同引领全球大模型产业的发展;聚焦国内,从技术领域来看,国产大模型广泛的覆盖了自然语言处理、多模态、机器视觉等多个技术分支,形成了紧跟世界前沿的大模型技术群。其中,自然语言处理是目前国内大模型最为活跃的技术领域,超六成的国产大模型主要基于自然语言处理技术进行预训练和微调;多模态领域活跃度仅次于自然语言处理技术,超两成的国产大模型可处理图像、视频、音频等多模态数据;而聚焦在计算机视觉和智能语音等领域的国产大模型数量相对较少。从研发主体来看,国内企业、高校、科研机构等不同创新主体均积极参与大模型研发。其中,企业仍是国内大模型研发的主力军,约46%的大模型由企业独立研发;高校及科研机构也对大模型的研发做出较大贡献,约37%的大模型由高校/科研机构独立研发。同时,我们也观察到目前由企业与高校/科研机构联合研发的大模型尚不足20%,展现出大模型开发在产学研合作方面仍有较大潜力。
【报告内容看点】
1.中国AIGC产业之“变”与“新”
2.技术变革的原生驱力—大模型层
3.价值传递的实际落位—应用层
4.不可忽视的资源引擎—算力层