2024消费电子行业报告：AI算力推动多模态技术投资与增长

烽火研报•2024年05月21日•阅读 202

周观点：OpenAI和Google更新多模态，看好AI算力投资

1.1.OpenAI召开春季发布会发布GPT-4o新模型，解锁更多免费功能

5月14日凌晨1点，OpenAI召开春季发布会，发布了新旗舰模型GPT-4o。GPT-4o（“o”代表“omni”）迈向了更加自然的人机交互，它提供G PT-4 级别的智能，但速度更快，并且改进了其跨文本、语音和视觉的功能，它可以接受并生成任何组合的文本、音频、图像和视频作为输入。1）在反应上大大提速，在之前GPT平均延迟为2.8 秒(GPT-3.5)和5.4秒(GPT-4)，而GPT-4o它可以在短至232 毫秒的时间内响应音频输入，平均响应时间为320 毫秒，响应的时间大大缩短这与人类在对话中的响应时间相似。

它在英语文本和代码方面的性能与GPT-4 Turbo相当，在非英语文本方面有显著提升，同时速度更快，API成本降低了50%。与现有模型相比，GPT-4o在视觉和音频理解方面表现尤为出色。2）GPT-4o通过支持跨文本、语音和视觉的功能，提供了更丰富的模型功能。在OpenAI的演示中展示了GPT-4o使用新的视频功能可以提供的各种充满想象力的功能，包括进行语言教学、加入多人线上会议、实时翻译、创作音乐、庆祝生日3）更加出色的图像生成功能。

GPT-4o在理解和生成图像方面的能力比任何现有模型都要好得多。在Ope nAI的演示中，GPT-4o可以把Ope nAI的l ogo印到拍摄的杯垫上、支持3D视觉内容生成、创作漫画分镜、生成手写体并进行排版、设计艺术字、生成海报等功能。

4）GPT-4o在模型评估上表现良好。根据传统基准测试，GPT-4o 在文本、推理和编码智能方面实现了GPT-4 Turbo 级别的性能，同时在多语言、音频和视觉功能上实现突破。在改进推理上，G PT-4o 在0-shot COT MMLU（常识问题）上创下了88.7% 的新高分，在音频ASR 性能上，G PT-4o 相比Whispe r-v3 显著提高了所有语言的语音识别性能，特别是对于资源匮乏的语言。

OpenAI在发布会表示使命是为尽可能多的人提供先进的人工智能工具。现在在免费套餐中提供GPT-4o，但有一定限制，向付费用户提供高达5倍的消息限制。免费用户现在可以在GPT中体验GPT-4 级别智能，分析数据并创建图表，发送图片，上传图片，使用GPT s 和GPT 应用商店，开发人员现在还可以在API 中访问GPT-4o 作为文本和视觉模型。

OpenAI还在发布会上发布了推出了适用于macOS的新ChatG PT桌面应用程序，该应用程序能在无缝集成到计算机操作中。只需使用简单的键盘快捷键（Option + S pace），就可以立即向ChatGPT提问。还可以直接在应用程序中截取和并与G PT讨论屏幕截图。客户端还可以支持使用者直接从计算机与ChatGPT进行语音对话，更方便与GPT进行交流。此外，本次更新还为ChatGPT引入了新的外观和感觉，新的主屏幕、消息布局旨在更加友好和更具对话性。

1.2.Google召开2024 IO 开发者大会，宣布多项AI更新

5月15日，Google召开2024 IO 开发者大会，三个月前发布的Gemini 1.5 Pro将正式开放给订阅了Gemini Advance的用户，非订阅用户则可以免费试用两个月，在最重要的维度都做了加强。

1）模型性能方面，谷歌通过数据和算法改进增强了其代码生成、逻辑推理和计划、多回合对话以及音频和图像理解能力，最新版本的1.5 Pro 在多个be nchmark中取得了顶尖水准的成绩。

2）上下文方面，谷歌把新Gemi ni 1.5 Pro 的上下文窗口从业界最高的100万tokens扩展到合300本书的20 0万tokens。

3）在多模态支持上，Gemi ni Pro现在还把语音理解这个过去的短板部分进行了补齐，成了完全体。

4）指令跟随能力方面，Gemini 1.5 Pro也进行了一轮更新。现在可以遵循越来越复杂和细微的指令，包括那些指定产品级行为（如角色、格式和风格）的指令。从数据上看，现在Gemini 1.5 Pro已经可以全面超越了GPT4。

谷歌在本次IO大会上还宣布了Gemini 1.5 Flash，主要特色是快速反应。从功能上看，虽然比1.5 Pro 轻量化，但也能够跨大量信息进行多模态推理，并且擅长摘要、聊天、图像和视频字幕、长文档和表格的数据提取等工作。但Gemini 1.5 Flash还是牺牲了一些性能以达成其速度。从谷歌方面公布的技术上看，Flash 通过一种称为“蒸馏”的过程，从较大的模型中传递最重要的知识和技能到较小、更高效的模型，实现了速度的提升。1.5 Flash 将于周二在AI Studio 和Vertex AI 中提供。

谷歌宣布下一个重磅产品通用人工智能Project Astra，将其定义为自己Agent战略的核心。它是一种智能体框架：为了真正有用，智能体需要像人类一样理解和响应复杂多变的世界——并且记住它看到和听到的内容以理解上下文并采取行动。它还需要具有主动性、可教性和个性化，这样用户可以自然地与它交流而不会有滞后或延迟。低延迟的要求，让你可以把Astra理解成Gemini Light 的Agent形式。在谷歌的展示中，它的最佳形态就是个人助手。

所以，为了让它更有用，谷歌通过持续编码视频帧、将视频和语音输入结合到事件时间线上，并缓存这些信息以实现高效回忆来更快地处理信息，就是能与视频交互，还有时间记忆。通过语音模型，谷歌还增强了Astra的声音，使Agent具有更广泛的语调，让这些Agent可以更好地理解所处的上下文，并在对话中快速响应。谷歌表示，今年晚些时候，这些功能中也仅有“一些”将进入谷歌的产品，可能是XR眼镜，也可能是个人助手。

1）图像方面，谷歌推出文生图像模型Imagen 3。从细节拟真度来看与Midj ourney v6能达到同一级别，比起Dalle-3更胜一筹，而且在对细节的跟随上也要更细致。

2）音乐生成方面，谷歌给2023年发布的Lydia加入新拓展Music AI Sandbox，一套音乐AI 工具。这些工具旨在为创意打开新的游乐场，让人们从头开始创作新的器乐部分，以新的方式转换声音等等。

3) 视频方面，谷歌介绍了自己的视频生成模型——Ve o 。它属于谷歌之前的一系列视频生成尝试的集大成者：融合了GQN、Phenaki、W ALT、VideoPoet、自家Lumiere这几款在Sora之前发布的明星文生视频模型的长处。从能力上看，可以生成高质量的1080 p 分辨率视频，能够超过一分钟，涵盖广泛的电影和视觉风格。从示例视频上看，Ve o生成的画面相当一致且连贯：人物、动物和物体在镜头中移动的很真实。谷歌还表示，Veo 具有对自然语言和视觉语义的高级理解能力，能够生成与用户创意愿景紧密匹配的视频——准确呈现详细的长提示并捕捉情感。Veo甚至还能理解电影术语，如“延时”或“航拍镜头”。从质量上讲，谷歌的Ve o和Sora足有一战之力。然而，和Sora一样，Veo 只会将作为VideoFX 内的私人预览版提供给少量创作者，一般用户可以报名加入候补队列。

Googled的AI搜索服务ESG从2023年5月公布至今，整整一年时间后向公众开放使用。这个更强的AI搜索引擎被谷歌命名为人工智能概述AI Overview，但仅限美国。从Demo展示来看，谷歌搜索在功能上的创新主要集中在多模态。

首先，用户将能够通过简化语言或更详细地分解来调整AI 搜索结果概述。其次，借助Gemini 的多步推理能力，AI 搜索可以一次性处理复杂的多步，乃至多问题。同样构建在多步推理能力之上的是AI搜索的计划能力。通过AI搜索中的计划功能，你可以直接在搜索里获得一个完整的计划。然后是灵感延展功能，在问了一个问题后，谷歌搜索将会延展到其他可能你感兴趣的结果，按独特的AI 生成标题分类，展示广泛的视角和内容类型。最后，其他AI搜索暂时做不到的是多模态搜索。

靠Gemi ni的多模态功能，谷歌可以做到利用声音搜歌曲，利用图片搜产品。甚至可以用Ci rcle to Secarch功能圈出图片中的一部分去搜索。除了提问，谷歌AI 搜索还能制定计划、结合视频进行搜索。除了Cricle in Search这个聚焦具体图片局部的多模态搜索外，G oogle重点介绍了Gemi ni的手机应用，可以和手机上正在展示的内容进行互动。

比如阅读打开的PDF，从你正在看的YouTube频道反馈问题。谷歌宣布已将Gemini 模型整合到Android 中，包括最新的设备端模型：Ge mini Nano 多模态模型(Gemini Nano with Multi modality)，它可以处理文本、图像、音频和语音，在保证存储在设备上的信息私密性的同时解锁新的体验，这将为AI手机的进一步发展提供了可能。谷歌照片应用也迎来了升级，在未来几个月将推出「询问照片（Ask Photos）」功能，也是基于Gemini 模型，可以让用户以自然语言搜索照片和视频中的人物、宠物、地点等。

这次发布会上，所有的AI模型都是由谷歌最新第六代的TPU——T rillium T PU训练的。相较于前代，Trillium实现了每芯片峰值计算性能的4.7 倍提升，比TPU v5e 提高了一倍。高带宽内存（HBM）的容量和带宽和芯片间互连（ICI）的带宽也比v5e翻了一番。此外，Trillium 配备了第三代Sparse Core，这是一种专门用于处理超大嵌入的加速器，常见于先进的排序和推荐工作负载中。Trilli um TPU 使训练下一波基础模型更快，并以更低的延迟和更低的成本服务这些模型。T rillium 可以扩展到一个包含256 个TPU 的单个高带宽低延迟Pod。能耗上Trillium TPU 比TPU v5e 的能源效率提高了67% 以上。

下一代开源模型Gemma2 将采用全新架构，支持270亿参数大小。Gemma 2 27B 性能媲美Llama 3 70B。这一设计使其兼具突破性性能和效率，也为其在各种应用场景中的部署提供了更多可能性。目前外部开发人员能够使用预训练的Gemma 变体PaliGemma，是Gemma 家族中首个视觉语言模型，适用于图像标题、图像标签和视觉问答用例。

1.3.覆铜板：CCL周期拐点显现，关注原材料价格波动及稼动率变化对盈利能力影响，成长性凸显，关注AI服务器CCL国产化进；PCB环节关注高景气大Beta下游，关注订单外溢对应的供应商份额变动情况

CCL：周期性拐点显现，关注原材料价格波动及稼动率变化对盈利能力影响；成长性凸显，关注AI服务器CCL国产化进度。PCB：关注高景气大Beta下游，关注订单外溢对应的供应商份额变动情况。云厂商加快800G交换机部署，关注突破产业链的生益电子。周期性点显现：24Q2中游CCL有望持续往下游传导涨价，关注稼动率变化对盈利能力影响。

建议关注建滔积层板(1888. HK)（垂直整合模式，覆铜板+上游原材料（玻璃丝玻璃布+铜箔+环氧树脂）），关注金安国际、华正新材、生益科技、南亚新材。PCB中CCL原材料成本占比30%，对CCL自身来说，铜箔：树脂：玻纤布树脂材料成本占比=30%/40%/30%（厚覆铜板材料）或者50%/25%/25%（薄覆铜板材料）。具体来看，玻纤布24年4月对细纱薄布产品价格进行恢复性调整，762 8电子布复价3.1-3.6元/米，其他品类细纱薄布产品参考调整，原铜受国内外供给收缩+需求提升，原铜价格二季度我们预计持续涨价。

成长性凸显，关注AI服务器CCL国产化进度，重点关注生益科技。随着AI服务器出货量逐年的提升，超低耗损CCL目前处于供应紧张状态。并且，AI相关硬件PC等也有望迭代升级拉动超低损耗CCL需求。目前台资厂商如台光电和斗山为主要超低耗损CCL供应商，据产业链跟踪，生益科技的超低耗损CCL已通过英伟达的验证，且在配合英伟达进行下一代产品的研发，生益科技有望于24H2开始量产英伟达AI 服务器主板、O AM （加速器模组）与UBB （通用基板）用的CCL，持续优化产品结构。

1.4.华为夏季新品发布会：发布搭载云晰柔光屏MatePad、AI赋能MateBook14

华为发布MatePad 11.5英寸S（MatePad 11.5"S）平板电脑，分为柔光版和灵动款，全系支持星闪NearLink 连接技术，首发价分别为2499 元（8+256G B）和1899 元（8+128G B）。新款华为MatePad 11.5 英寸S 平板电脑采用金属机身，厚6.2mm、重510g，提供深空灰、冰霜银与紫罗兰三种配色。

其首发搭载“云晰”柔光屏，视觉疲劳程度可减少34%、大脑疲劳程度可减少14%，还可以有效消除眩光，具体参数方面，该屏幕规格为11.5 英寸3:2 比例的2.8K 144Hz。首发搭载华为天生会画应用。其他方面，这款平板内置“华为笔记”功能，提供AI 字迹调整、素材集市、音记同步等一系列功能。搭配HUAWEI M-Pencil（第三代）手写笔，支持星闪技术，拥有超万级压感，这是平板业界首支超万级压感写画体验的触控手写笔，连接更快更稳定。

2024款华为Mate Book 14笔记本在华为新品发布会上正式发布，是首款支持手写笔的华为笔记本，内置AI空间。核心配置上，新款华为MateBook 14 搭载了英特尔酷Ultra 7 高性能处理器，轻薄机身下拥有40 W TDP 性能释放；还有至高32G B 大内存；全新升级的Super Turbo 技术；华为鲨鱼鳍风扇，高负载35W 功耗时，噪音进一步下降了6db。

搭载了70Wh 的大电池，支持至高40W 的超级快充反向充电。屏幕规格上，华为MateBook 14 搭载了旗舰级别的2.8K OLED 屏，其采用了14.2 英寸，拥有91% 高屏占比，以及3:2 生产力屏，同时搭载了2.8K 分辨率、120Hz 高刷、最高亮度450nit、10.7 亿色显示；这块屏幕还具备三色域高色准，sRGB、P3、Adobe RGB 三色域下均达到了∆E＜1。新款华为MateBook 14 还支持了HUAWEI M-Pencil（套装）第三代。

在AI 体验方面，新款华为Mate Book 14 引入了华为盘古大模型，还与万兴喵影等第三方应用合作，通过调用NPU 的算力，用户可进行AI 特效创作，比如AI 特效、AI 抠图体验等。新款华为Mate Book 14 搭载的AI 空间，首批引入了百度文心一言、科大讯飞星火、智谱清言等AI 大模型伙伴，覆盖办公、学习、创作、软件开发等多种场景。

1.5.智能手机及PC：关注vivo、魅族新机发布，vivo四月中国市占率第一

观点：vivo发布新旗舰给用户提供更多选择、魅族发布新产品发力中端市场。魅族21 Note搭配如然护眼屏和360°立体散热系统。vi vo X100s/X100s Pro首发搭载天玑9300 +，蓝海电池、蔡司超级长焦加持，局部峰值亮度3000nit。vi vo X100 Ultra 搭载骁龙8 Gen 3 处理器，支持双向卫星通信，搭载蓝图影像芯片V3+。

据权威市调机构统计数据显示，vivo(含iQOO)继拿下2024年第一季度销量第一的成绩后，又以超17%的市场份额夺得4月份（4.1-5.5）中国手机市场销量市占率第一。随着iQOOZ9系列和Neo9系列的持续热销，vivo子品牌iQOO市场份额也增长迅猛，五一期间销量市场份额已达到5.2%，同比增长57%。从此前BCI公布的数据来看，20 24年一季度vivo的市场份额达到了16.9%，手机激活量1155.8万台位居第一。在没有新品开卖的前提下，vivo在一季度取得这样的成绩，已经说明了其自身的实力。202 4年4月，vivo X Fold3系列正式开售，并且销售超出预期，已开始加单。随着后续vivo X100 Ultra、vivo X100s、vivo X100s Pro、vivo S19系列、iQOO Neo9S Pro等众多新品的陆续发布与上市，vivo在5月的手机市场销售行情有望迎来突破，或将继续霸榜，蝉联中国市场销量第一的位置。

魅族21Note手机特种兵发布会宣布新款中端产品魅族21 Note。魅族21 Note采用的是天马U8发光材料，支持144 Hz LTPO 自适应刷新率，屏幕峰值亮度5000 nits，搭载骁龙8 Gen2处理器，采用台积电4nm工艺，CPU和GPU性能出色，此外还引入了高达5000mm²的VC综合散热，建立了手机的360°立体散热系统，配备5500mAh电池+66 W有线快充。采用Flyme AIOS系统，新增AI超能笔记/AI全局录音，配有L2主动信息提示，L3任务剧本及L4自动任务机器人三种级别的AI辅助功能。16GB+256G B起售价2599元，16GB+512GB起售价2799元。

（本文仅供参考，不代表我们的任何投资建议。如需使用相关信息，请参阅报告原文。）

参考报告：消费电子行业研究周报：OpenAI和Google更新多模态，看好AI算力投资.pdf

2024消费电子行业报告：AI算力推动多模态技术投资与增长

周观点：OpenAI和Google更新多模态，看好AI算力投资

最新报告

热门报告