2024消费电子行业报告:AI算力推动多模态技术投资与增长
周观点:OpenAI和Google更新多模态,看好AI算力投资
1.1.OpenAI召开春季发布会发布GPT-4o新模型,解锁更多免费功能
5月14日凌晨1点,OpenAI召开春季发布会,发布了新旗舰模型GPT-4o。GPT-4o(“o”代表“omni”)迈向了更加自然的人机交互,它提供G PT-4 级别的智能,但速度更快,并且改进了其跨文本、语音和视觉的功能,它可以接受并生成任何组合的文本、音频、图像和视频作为输入。1)在反应上大大提速,在之前GPT平均延迟为2.8 秒(GPT-3.5)和5.4秒(GPT-4),而GPT-4o它可以在短至232 毫秒的时间内响应音频输入,平均响应时间为320 毫秒,响应的时间大大缩短这与人类在对话中的响应时间相似。
它在英语文本和代码方面的性能与GPT-4 Turbo相当,在非英语文本方面有显著提升,同时速度更快,API成本降低了50%。与现有模型相比,GPT-4o在视觉和音频理解方面表现尤为出色。2)GPT-4o通过支持跨文本、语音和视觉的功能,提供了更丰富的模型功能。在OpenAI的演示中展示了GPT-4o使用新的视频功能可以提供的各种充满想象力的功能,包括进行语言教学、加入多人线上会议、实时翻译、创作音乐、庆祝生日3)更加出色的图像生成功能。
GPT-4o在理解和生成图像方面的能力比任何现有模型都要好得多。在Ope nAI的演示中,GPT-4o可以把Ope nAI的l ogo印到拍摄的杯垫上、支持3D视觉内容生成、创作漫画分镜、生成手写体并进行排版、设计艺术字、生成海报等功能。
4)GPT-4o在模型评估上表现良好。根据传统基准测试,GPT-4o 在文本、推理和编码智能方面实现了GPT-4 Turbo 级别的性能,同时在多语言、音频和视觉功能上实现突破。在改进推理上,G PT-4o 在0-shot COT MMLU(常识问题)上创下了88.7% 的新高分,在音频ASR 性能上,G PT-4o 相比Whispe r-v3 显著提高了所有语言的语音识别性能,特别是对于资源匮乏的语言。
OpenAI在发布会表示使命是为尽可能多的人提供先进的人工智能工具。现在在免费套餐中提供GPT-4o,但有一定限制,向付费用户提供高达5倍的消息限制。免费用户现在可以在GPT中体验GPT-4 级别智能,分析数据并创建图表,发送图片,上传图片,使用GPT s 和GPT 应用商店,开发人员现在还可以在API 中访问GPT-4o 作为文本和视觉模型。
OpenAI还在发布会上发布了推出了适用于macOS的新ChatG PT桌面应用程序,该应用程序能在无缝集成到计算机操作中。只需使用简单的键盘快捷键(Option + S pace),就可以立即向ChatGPT提问。还可以直接在应用程序中截取和并与G PT讨论屏幕截图。客户端还可以支持使用者直接从计算机与ChatGPT进行语音对话,更方便与GPT进行交流。此外,本次更新还为ChatGPT引入了新的外观和感觉,新的主屏幕、消息布局旨在更加友好和更具对话性。
1.2.Google召开2024 IO 开发者大会,宣布多项AI更新
5月15日,Google召开2024 IO 开发者大会,三个月前发布的Gemini 1.5 Pro将正式开放给订阅了Gemini Advance的用户,非订阅用户则可以免费试用两个月,在最重要的维度都做了加强。
1)模型性能方面,谷歌通过数据和算法改进增强了其代码生成、逻辑推理和计划、多回合对话以及音频和图像理解能力,最新版本的1.5 Pro 在多个be nchmark中取得了顶尖水准的成绩。
2)上下文方面,谷歌把新Gemi ni 1.5 Pro 的上下文窗口从业界最高的100万tokens扩展到合300本书的20 0万tokens。
3)在多模态支持上,Gemi ni Pro现在还把语音理解这个过去的短板部分进行了补齐,成了完全体。
4)指令跟随能力方面,Gemini 1.5 Pro也进行了一轮更新。现在可以遵循越来越复杂和细微的指令,包括那些指定产品级行为(如角色、格式和风格)的指令。从数据上看,现在Gemini 1.5 Pro已经可以全面超越了GPT4。
谷歌在本次IO大会上还宣布了Gemini 1.5 Flash,主要特色是快速反应。从功能上看,虽然比1.5 Pro 轻量化,但也能够跨大量信息进行多模态推理,并且擅长摘要、聊天、图像和视频字幕、长文档和表格的数据提取等工作。但Gemini 1.5 Flash还是牺牲了一些性能以达成其速度。从谷歌方面公布的技术上看,Flash 通过一种称为“蒸馏”的过程,从较大的模型中传递最重要的知识和技能到较小、更高效的模型,实现了速度的提升。1.5 Flash 将于周二在AI Studio 和Vertex AI 中提供。
谷歌宣布下一个重磅产品通用人工智能Project Astra,将其定义为自己Agent战略的核心。它是一种智能体框架:为了真正有用,智能体需要像人类一样理解和响应复杂多变的世界——并且记住它看到和听到的内容以理解上下文并采取行动。它还需要具有主动性、可教性和个性化,这样用户可以自然地与它交流而不会有滞后或延迟。低延迟的要求,让你可以把Astra理解成Gemini Light 的Agent形式。在谷歌的展示中,它的最佳形态就是个人助手。
所以,为了让它更有用,谷歌通过持续编码视频帧、将视频和语音输入结合到事件时间线上,并缓存这些信息以实现高效回忆来更快地处理信息,就是能与视频交互,还有时间记忆。通过语音模型,谷歌还增强了Astra的声音,使Agent具有更广泛的语调,让这些Agent可以更好地理解所处的上下文,并在对话中快速响应。谷歌表示,今年晚些时候,这些功能中也仅有“一些”将进入谷歌的产品,可能是XR眼镜,也可能是个人助手。
1)图像方面,谷歌推出文生图像模型Imagen 3。从细节拟真度来看与Midj ourney v6能达到同一级别,比起Dalle-3更胜一筹,而且在对细节的跟随上也要更细致。
2)音乐生成方面,谷歌给2023年发布的Lydia加入新拓展Music AI Sandbox,一套音乐AI 工具。这些工具旨在为创意打开新的游乐场,让人们从头开始创作新的器乐部分,以新的方式转换声音等等。
3) 视频方面,谷歌介绍了自己的视频生成模型——Ve o 。它属于谷歌之前的一系列视频生成尝试的集大成者:融合了GQN、Phenaki、W ALT、VideoPoet、自家Lumiere这几款在Sora之前发布的明星文生视频模型的长处。从能力上看,可以生成高质量的1080 p 分辨率视频,能够超过一分钟,涵盖广泛的电影和视觉风格。从示例视频上看,Ve o生成的画面相当一致且连贯:人物、动物和物体在镜头中移动的很真实。谷歌还表示,Veo 具有对自然语言和视觉语义的高级理解能力,能够生成与用户创意愿景紧密匹配的视频——准确呈现详细的长提示并捕捉情感。Veo甚至还能理解电影术语,如“延时”或“航拍镜头”。从质量上讲,谷歌的Ve o和Sora足有一战之力。然而,和Sora一样,Veo 只会将作为VideoFX 内的私人预览版提供给少量创作者,一般用户可以报名加入候补队列。
Googled的AI搜索服务ESG从2023年5月公布至今,整整一年时间后向公众开放使用。这个更强的AI搜索引擎被谷歌命名为人工智能概述AI Overview,但仅限美国。从Demo展示来看,谷歌搜索在功能上的创新主要集中在多模态。
首先,用户将能够通过简化语言或更详细地分解来调整AI 搜索结果概述。其次,借助Gemini 的多步推理能力,AI 搜索可以一次性处理复杂的多步,乃至多问题。同样构建在多步推理能力之上的是AI搜索的计划能力。通过AI搜索中的计划功能,你可以直接在搜索里获得一个完整的计划。然后是灵感延展功能,在问了一个问题后,谷歌搜索将会延展到其他可能你感兴趣的结果,按独特的AI 生成标题分类,展示广泛的视角和内容类型。最后,其他AI搜索暂时做不到的是多模态搜索。
靠Gemi ni的多模态功能,谷歌可以做到利用声音搜歌曲,利用图片搜产品。甚至可以用Ci rcle to Secarch功能圈出图片中的一部分去搜索。除了提问,谷歌AI 搜索还能制定计划、结合视频进行搜索。除了Cricle in Search这个聚焦具体图片局部的多模态搜索外,G oogle重点介绍了Gemi ni的手机应用,可以和手机上正在展示的内容进行互动。
比如阅读打开的PDF,从你正在看的YouTube频道反馈问题。谷歌宣布已将Gemini 模型整合到Android 中,包括最新的设备端模型:Ge mini Nano 多模态模型(Gemini Nano with Multi modality),它可以处理文本、图像、音频和语音,在保证存储在设备上的信息私密性的同时解锁新的体验,这将为AI手机的进一步发展提供了可能。谷歌照片应用也迎来了升级,在未来几个月将推出「询问照片(Ask Photos)」功能,也是基于Gemini 模型,可以让用户以自然语言搜索照片和视频中的人物、宠物、地点等。
这次发布会上,所有的AI模型都是由谷歌最新第六代的TPU——T rillium T PU训练的。相较于前代,Trillium实现了每芯片峰值计算性能的4.7 倍提升,比TPU v5e 提高了一倍。高带宽内存(HBM)的容量和带宽和芯片间互连(ICI)的带宽也比v5e翻了一番。此外,Trillium 配备了第三代Sparse Core,这是一种专门用于处理超大嵌入的加速器,常见于先进的排序和推荐工作负载中。Trilli um TPU 使训练下一波基础模型更快,并以更低的延迟和更低的成本服务这些模型。T rillium 可以扩展到一个包含256 个TPU 的单个高带宽低延迟Pod。能耗上Trillium TPU 比TPU v5e 的能源效率提高了67% 以上。
下一代开源模型Gemma2 将采用全新架构,支持270亿参数大小。Gemma 2 27B 性能媲美Llama 3 70B。这一设计使其兼具突破性性能和效率,也为其在各种应用场景中的部署提供了更多可能性。目前外部开发人员能够使用预训练的Gemma 变体PaliGemma,是Gemma 家族中首个视觉语言模型,适用于图像标题、图像标签和视觉问答用例。
1.3.覆铜板:CCL周期拐点显现,关注原材料价格波动及稼动率变化对盈利能力影响,成长性凸显,关注AI服务器CCL国产化进;PCB环节关注高景气大Beta下游,关注订单外溢对应的供应商份额变动情况
CCL:周期性拐点显现,关注原材料价格波动及稼动率变化对盈利能力影响;成长性凸显,关注AI服务器CCL国产化进度。PCB:关注高景气大Beta下游,关注订单外溢对应的供应商份额变动情况。云厂商加快800G交换机部署,关注突破产业链的生益电子。周期性点显现:24Q2中游CCL有望持续往下游传导涨价,关注稼动率变化对盈利能力影响。
建议关注建滔积层板(1888. HK)(垂直整合模式,覆铜板+上游原材料(玻璃丝玻璃布+铜箔+环氧树脂)),关注金安国际、华正新材、生益科技、南亚新材。PCB中CCL原材料成本占比30%,对CCL自身来说,铜箔:树脂:玻纤布树脂材料成本占比=30%/40%/30%(厚覆铜板材料)或者50%/25%/25%(薄覆铜板材料)。具体来看,玻纤布24年4月对细纱薄布产品价格进行恢复性调整,762 8电子布复价3.1-3.6元/米,其他品类细纱薄布产品参考调整,原铜受国内外供给收缩+需求提升,原铜价格二季度我们预计持续涨价。
成长性凸显,关注AI服务器CCL国产化进度,重点关注生益科技。随着AI服务器出货量逐年的提升,超低耗损CCL目前处于供应紧张状态。并且,AI相关硬件PC等也有望迭代升级拉动超低损耗CCL需求。目前台资厂商如台光电和斗山为主要超低耗损CCL供应商,据产业链跟踪,生益科技的超低耗损CCL已通过英伟达的验证,且在配合英伟达进行下一代产品的研发,生益科技有望于24H2开始量产英伟达AI 服务器主板、O AM (加速器模组)与UBB (通用基板)用的CCL,持续优化产品结构。
1.4.华为夏季新品发布会:发布搭载云晰柔光屏MatePad、AI赋能MateBook14
华为发布MatePad 11.5英寸S(MatePad 11.5"S)平板电脑,分为柔光版和灵动款,全系支持星闪NearLink 连接技术,首发价分别为2499 元(8+256G B)和1899 元(8+128G B)。新款华为MatePad 11.5 英寸S 平板电脑采用金属机身,厚6.2mm、重510g,提供深空灰、冰霜银与紫罗兰三种配色。
其首发搭载“云晰”柔光屏,视觉疲劳程度可减少34%、大脑疲劳程度可减少14%,还可以有效消除眩光,具体参数方面,该屏幕规格为11.5 英寸3:2 比例的2.8K 144Hz。首发搭载华为天生会画应用。其他方面,这款平板内置“华为笔记”功能,提供AI 字迹调整、素材集市、音记同步等一系列功能。搭配HUAWEI M-Pencil(第三代)手写笔,支持星闪技术,拥有超万级压感,这是平板业界首支超万级压感写画体验的触控手写笔,连接更快更稳定。
2024款华为Mate Book 14笔记本在华为新品发布会上正式发布,是首款支持手写笔的华为笔记本,内置AI空间。核心配置上,新款华为MateBook 14 搭载了英特尔酷Ultra 7 高性能处理器,轻薄机身下拥有40 W TDP 性能释放;还有至高32G B 大内存;全新升级的Super Turbo 技术;华为鲨鱼鳍风扇,高负载35W 功耗时,噪音进一步下降了6db。
搭载了70Wh 的大电池,支持至高40W 的超级快充反向充电。屏幕规格上,华为MateBook 14 搭载了旗舰级别的2.8K OLED 屏,其采用了14.2 英寸,拥有91% 高屏占比,以及3:2 生产力屏,同时搭载了2.8K 分辨率、120Hz 高刷、最高亮度450nit、10.7 亿色显示;这块屏幕还具备三色域高色准,sRGB、P3、Adobe RGB 三色域下均达到了∆E<1。新款华为MateBook 14 还支持了HUAWEI M-Pencil(套装)第三代。
在AI 体验方面,新款华为Mate Book 14 引入了华为盘古大模型,还与万兴喵影等第三方应用合作,通过调用NPU 的算力,用户可进行AI 特效创作,比如AI 特效、AI 抠图体验等。新款华为Mate Book 14 搭载的AI 空间,首批引入了百度文心一言、科大讯飞星火、智谱清言等AI 大模型伙伴,覆盖办公、学习、创作、软件开发等多种场景。
1.5.智能手机及PC:关注vivo、魅族新机发布,vivo四月中国市占率第一
观点:vivo发布新旗舰给用户提供更多选择、魅族发布新产品发力中端市场。魅族21 Note搭配如然护眼屏和360°立体散热系统。vi vo X100s/X100s Pro首发搭载天玑9300 +,蓝海电池、蔡司超级长焦加持,局部峰值亮度3000nit。vi vo X100 Ultra 搭载骁龙8 Gen 3 处理器,支持双向卫星通信,搭载蓝图影像芯片V3+。
据权威市调机构统计数据显示,vivo(含iQOO)继拿下2024年第一季度销量第一的成绩后,又以超17%的市场份额夺得4月份(4.1-5.5)中国手机市场销量市占率第一。随着iQOOZ9系列和Neo9系列的持续热销,vivo子品牌iQOO市场份额也增长迅猛,五一期间销量市场份额已达到5.2%,同比增长57%。从此前BCI公布的数据来看,20 24年一季度vivo的市场份额达到了16.9%,手机激活量1155.8万台位居第一。在没有新品开卖的前提下,vivo在一季度取得这样的成绩,已经说明了其自身的实力。202 4年4月,vivo X Fold3系列正式开售,并且销售超出预期,已开始加单。随着后续vivo X100 Ultra、vivo X100s、vivo X100s Pro、vivo S19系列、iQOO Neo9S Pro等众多新品的陆续发布与上市,vivo在5月的手机市场销售行情有望迎来突破,或将继续霸榜,蝉联中国市场销量第一的位置。
魅族21Note手机特种兵发布会宣布新款中端产品魅族21 Note。魅族21 Note采用的是天马U8发光材料,支持144 Hz LTPO 自适应刷新率,屏幕峰值亮度5000 nits,搭载骁龙8 Gen2处理器,采用台积电4nm工艺,CPU和GPU性能出色,此外还引入了高达5000mm²的VC综合散热,建立了手机的360°立体散热系统,配备5500mAh电池+66 W有线快充。采用Flyme AIOS系统,新增AI超能笔记/AI全局录音,配有L2主动信息提示,L3任务剧本及L4自动任务机器人三种级别的AI辅助功能。16GB+256G B起售价2599元,16GB+512GB起售价2799元。
(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)