【国信证券】AIGC系列研究:多模态大模型引领,应用端曙光初现.pdf

2024-04-29
31页
4MB

1. 大模型:海外引领,国内加速

OpenAI发布Sora引发产业与资本市场震动


OpenAI发布Sora文生视频模型,可以根据用户输入的文本描述,生成一段视频内容,视频时长可达1分钟且视觉质量较高。对于任何需要制作视频的艺术家、电影制片人或学生来说,这都带来了无限可能。 Sora 可以创建包含多人、特定运动类型和详细背景的复杂场景。它能生成准确反映用户提示的视频。例如,Sora 可以制作时尚女性走在霓虹闪烁的东京街头的视频、雪地里的巨型长毛象视频,甚至是太空人冒险的电影预告片。


谷歌:Gemini1.5上线


长语境理解方面取得突破,能够显著增加模型可处理的信息量,上下文窗口长度扩 展到100万个tokens; 一次处理大量的信息:包括1小时的视频、11小时的音频、超过3万行代码或超过70 万字的代码库;能对不同的模式执行高度复杂的理解和推理任务,包括视频、代码 等; “情境学习”技能:可以从长时间提示的信息中学习新技能,而无需额外的微调。


Meta:发布最强开源大模型Llama 3,多模态版本随后将上线


Meta在官网上宣布公布了旗下最新大模型Llama 3。目前,Llama 3已经开放了80亿(8B)和700亿(70B)两个小参数版本,上下文窗口为8k。Meta表示,通过使用更高质量的训练数据和指令微调,Llama 3比前代Llama 2有了“显著提升”。未来Meta将推出Llama 3的更大参数版本,其将拥有超过4000亿参数。Meta也将在后续为Llama 3推出多模态等新功能。 根据Meta的测试结果,Llama 3 8B模型在MMLU、GPQA、HumanEval等多项性能基准上均超过了Gemma 7B和Mistral 7B Instruct,70B模型则超越了名声在外的闭源模型Claude 3的中间版本Sonnet,和谷歌的Gemini Pro 1.5相比三胜两负。 在常规数据集之外,Meta还致力于优化Llama 3在实际场景中的性能,为此专门研发了一套高质量的人工测试集。该测试集包含1800条数据,涵盖了寻求建议、封闭式问题回答、头脑风暴、编码、写作等12个关键用例,并对开发团队保密。在这套测试集中,从结果来看,Llama3的成绩大幅超越了Llama 2,也胜过了Claude 3 Sonnet、Mistral Medium和GPT-3.5这些知名模型。


商汤科技发布“日日新SenseNova 4.0”


“日日新SenseNova 4.0”拥有更全⾯的知识覆盖、更可靠的推理能力,更优越的长文本理解力及更稳定的数字推理能力和更强的代码生成能力,并⽀持跨模态交互。日日新·商量大语言模型-通用版本(SenseChat V4),支持128K语境窗口长度,综合整体评测成绩水平比肩 GPT-4,相较GPT-3.5已经实现全⾯超越 。 商量多模态大模型(SenseChat-Vision V4)拥有300亿参数,图文理解能力在权威评测基准测试集MME Benchmark上综合得分排名首位,综合得分达2199.5(超过GPT-4V的1926.57) 。 秒画文生图大模型(SenseMirage V4)较此前版本,参数量提升至百亿量级,通过Mixture of text experts、Spatial-awareCFG等算法优化,语义理解能力与图像质感细节表现显著增强,可达成电影级海报生成水平。


2. C端场景持续泛化

场景落地:AI搜索


AI搜索引擎基于人工智能技术,利用自然语言处理、机器学习、深度学习等技术,对用户的搜索语句进行分析和理解,从而推荐更加准确的搜索结果。其实现原理是将用户的查询意图和知识库中的信息进行匹配和比对,找到最匹配的答案,并输出给用户。 在搜索结果的呈现方式上,更加注重智能化、个性化和交互化的体验。通过分析用户在搜索过程中的行为与反馈,AI搜索引擎能够推荐更符合个性化需求的搜索结果,并不断优化搜索算法,提升搜索结果的质量和准确性。


场景落地:AI社交


据Mordor Intelligence报告, AI社交应用规模将从2023年的16.4亿美元增长至2028年的56.6亿美元;海外的Characeter AI,国内出海应用Talkie(MiniMax)、linky(昆仑万维),国内市场X Eva(小冰)等均有不错表现;


场景落地:音乐&视频


OpenAI发布由Sora制作的MV(Music Video)——《Worldweight》 。音乐GPT时刻:只需要输入简单的提示词,比如音乐主题、风格、流派、歌词、音色等,Suno就能快速生成一首长达2分钟的完整音乐。


3. 国内应用端落地优势开始展现

应用端:全球百花争鸣,国内市场ChatBots主导


全球市场来看,ChatGPT访问量绝对领先,但从前十产品分布来看,赛道分布更为广泛;国内市场前十仍以ChatBots为主,主要在于国内LLM大模型技术差异显著性不高、底层技术相对滞后对应用扩散亦有所抑制。


应用端:国内新势力表现亮眼


国内应用增长势头更为迅猛。全球前十应用增速前十中一半为中国厂商,其中增速榜前二的秘塔、Kimi均为中小创业团队,印证国内更为活跃的应用创新活力。


4. 投资分析

市场回顾:春节后大幅反弹,近期波动明显


市场反弹+主题驱动,AI板块春节后反弹迅猛。在春节期间OpenAI发布Sora、谷歌发布Gemini1.5等事件催化以及市场反弹背景下,AI板块2月6日至3月22日上涨57%;近期主题波动较为明显。3月25日至今wind人工智能指数下跌近14%,成交量亦明显下降。


市场回顾:传媒板块表现与人工智能指数基本一致


传媒板块市场表现及节奏基本与人工智能指数基本一致; 个股表现来看,除人工智能之外,央国企、高分红概念表现相对较强。


报告节选:

相关报告

传媒行业AIGC专题研究:多模态大模型引领,应用端曙光初现.pdf

如何绕过三支柱模型的坑.docx

成交.pptx

电话邀约技巧.pptx

同策:新人带教指引.pptx

Business Media Study.pptx

【国信证券】AIGC系列研究:多模态大模型引领,应用端曙光初现.pdf-第一页
联系烽火研报客服烽火研报客服头像
  • 服务热线
  • 4000832158
  • 客服微信
  • 烽火研报客服二维码
  • 客服咨询时间
  • 工作日8:30-18:00