【安信证券】电子行业专题:高通等IT龙头布局终端生成式AI,终端AI推理应用有望带动产业链升级.pdf

2023-08-16
31页
2MB

1.科技龙头加快布局 AI 市场,终端侧 AI 商业化应用落地加速

AI 市场持续火热,科技龙头积极布局终端侧 AI。年初以来,以 ChatGPT 为代表的生成式人 工智能带动了 AI 大模型的持续落地和商业化,IOS 版 ChatGPT 已于近期推出,不久的未来 OpenAl 或为安卓手机提供相应的服务。ChatGPT 应用的推出,无疑让更多人感受到了人工智 能带来的便利,随着 AI 走进千家万户,终端 AI 算力和应用的发展是必不可少的。Meta、微 软、谷歌、苹果、英特尔、联发科等各大科技巨头正在加速布局面向消费级和企业级的终端 侧 AI。


AI 大模型参数规模增势迅猛,面对算力的巨大消耗,终端算力的发展或成为当务之急。从 2012 年的 AlexNet 的百万级参数开始,AI 大模型参数规模每年都以指数级的增长速度在扩 大,如今不同领域的 AI 大模型参数规模已经开始逐渐迈入千亿级和万亿级时代。以自然语 言处理(NLP)为例,经过十余年的发展,模型参数已经达到了千亿级别,数据量增长了数百 万倍。AI 大模型可以从海量的数据中训练出通用的知识和能力,从而在不同的任务和领域中 表现出强大的泛化性能,而 AI 大模型参数规模和训练、推理时所需要的算力呈正比关系,因此可以推测未来随着大模型参数规模的增长,对算力的消耗加大,终端算力的发展或成为当 务之急。


2.高通有望引领混合 AI 发展,助力实现随时随地的智能计算

大模型有望走向端侧,混合 AI 前景广阔。2023 年 5 月,高通发布了混合 AI 白皮书,指出混 合 AI 是 AI 的未来。混合 AI 是指终端和云端协同工作,在适当的场景和时间下分配 AI 计算 的工作负载。在一些场景下,计算将主要以终端为中心,在必要时向云端分流任务。而在以 云为中心的场景下,终端将根据自身能力,在可能的情况下从云端分担一些 AI 工作负载。在 以终端为中心的混合 AI 架构中,许多生成式 AI 模型可以在终端上充分运行,云端仅用于分 流处理终端无法充分执行的任务。在基于终端感知的混合 AI 场景中,在边缘侧运行的模型 将充当云端大语言模型的传感器输入端,以进一步分流计算任务并减少连接带宽,从而节省 成本。终端和云端的 AI 计算也可以协同工作来处理 AI 负载,在性能和能耗上实现双赢。


混合 AI 能够带来成本、能耗、性能、隐私、安全和个性化优势。混合式 AI 能够解决大型生 成式 AI 模型推理成本高的问题。仅在云端进行推理,数据中心基础设施成本会持续增加,而 将一些处理从云端转移到边缘终端,云基础设施的压力能够减轻并且减少开支。边缘终端能 够以很低的能耗运行生成式 AI,实现环境和可持续发展目标。在混合 AI 架构中,终端侧 AI 处理稳定可靠,可以防止云服务器和网络连接拥堵时出现大量排队等待、高时延和拒绝服务 的情况。此外,用户无论身处何地都可以正常运行生成式 AI 应用。终端侧 AI 从本质上有助 于保护用户隐私,因为查询和个人信息完全保留在终端上,同时让更加个性化的体验成为可 能,能够在不牺牲隐私的情况下,根据用户的个性进行定制。




混合 AI 将赋能生成式 AI,高通有望引领混合 AI 发展。当前具备 AI 功能的智能手机、笔记 本电脑和 PC、汽车、XR 以及物联网等终端产品已达到数十亿台,混合 AI 架构将赋能生成式 AI 在上述这些终端领域提供全新的增强用户体验。目前可以在终端侧运行的生成式 AI 模型 参数规模在 10 亿至 100 亿之间,随着生成式 AI 模型不断缩小,以及终端侧处理能力的持续 提升,拥有 100 亿或更高参数的混合 AI 模型将能够在终端上运行。高通在终端侧 AI 优势的 核心是其 AI 引擎,通过开发低能耗、高性能 AI,已经形成了一个跨智能手机、汽车、XR、 PC、笔记本电脑以及企业级 AI 等领域的庞大终端 AI 生态系统。目前高通部署的边缘侧终端规模已经十分庞大,截至 2023 年 5 月,搭载骁龙和高通平台的已上市用户终端数量已达到 数十亿台,而且每年有数亿台的新终端仍在进入市场。


混合 AI 市场潜力巨大,有望在未来十年内为高通打开约 7000 亿美元市场。根据 IDC 预计, 到 2025 年,64%的数据将在传统数据中心之外创建,这意味着更多的数据将采用混合 AI 的 架构运行。高通是有能力打造云边缘融合的公司,根据高通公司官网的预测,混合 AI 有望在 未来十年内扩大公司的潜在市场,达到约 7000 亿美元的市场规模。


3.高通持续提升终端硬件 AI 性能,终端侧全栈 AI 不断优化

3.1.高通深耕 AI 研发 15 余年,不断突破 AI 可能性


高通重视前沿 AI 研发,拥有领先的边缘侧 AI 布局。高通由无线通信领域起家,自 2007 年 启动首个 AI 研究项目,深耕 AI 领域已超过 15 年。高通拥有行业领先的 AI 硬件和软件解决方案,开发的低功耗、高性能 AI,已经形成了一个跨智能手机、汽车、XR、PC、笔记本电脑 以及企业级 AI 等现有市场和新兴领域的庞大终端 AI 生态系统。


混合 AI 在各终端陆续落地,应用场景或将不断涌现。根据高通 CEO 在彭博技术峰会上的发 言,预计到 2024 年,高通公司将推出最新版 AI 处理器,在手机端可支持 10B 参数的大模型, 在笔记本端可支持 20B 参数的大模型,在汽车端可支持 40-60B 参数的大模型。手机端将会 出现越来越丰富的 AI 内容生成场景,笔记本端微软 Copilot 也将在高通 SoC 上运行。


高通终端侧 AI 处理器产品矩阵丰富,高性能产品已广泛应用于多个机型。高通处理器通常 利用芯片的数字命名来划分产品档次,骁龙系列产品为例,大致可划分为四个等级:入门级、 中级、高级和顶级。其中,骁龙 400 和 200 系列属于入门级,骁龙 600 系列属于中级,骁龙 700 系列属于高级,骁龙 800 系列属于顶级。在高通旗舰处理器骁龙 800 系列中,最新的骁 龙 8 Gen2 具备突破性的 AI 性能,采用了台积电 4nm 工艺制程,CPU 为八核心设计,分别为 一个 X3 大核、两个 A720 中核、两个 A710 中核以及三个 A510 小核,GPU 的规格为 Adreno740, 首批产品将搭载于小米、红米、荣耀、iQOO、一加、OV 等厂商。


3.2.高通全栈 AI 策略指引下,终端 AI 性能和能效卓越


高通持续推进全栈 AI 策略,助力 AI 生态系统大规模快速商业化。高通专注于研究跨应用程 序、神经网络模型、算法、软件和硬件的优化技术,以及跨公司内部的跨学科工作,持续推 进全栈 AI 研究和技术优化。该策略帮助高通在 AI 全领域创新,助力 AI 生态系统大规模快 速商业化。


高通终端侧全栈 AI 具备行业领先的性能和能效优势。近期高通在其官网发布了相关视频, 演示了全球首个在 Android 智能手机上运行的 Stable Diffusion 技术。突显了全栈策略的 优势。Stable Diffusion 是一种全栈研究和优化技术,使终端侧运行的操作能在仅 15 秒内 完成。这项技术已经成功集成进入高通的 AI 软件栈,预计将在未来的硬件设计中发挥重要 作用。此外,Stable Diffusion 能够在手机上高效运行的优化方式也可以用于笔记本电脑、 XR、汽车、智能耳机等其他终端。通过在高通 SoC 中已有的计算引擎 (如 CPU、GPU 和 DSP) 上运行各种机器学习任务,为边缘 AI 提供了最高效的解决方案。以高通的 Hexagon DSP 为 例,它最初是为多媒体工作而设计的,但它的性能已经进一步优化,以有效地运行人工智能 的工作负载。与在 CPU 上运行相同的工作负载相比,Snapdragon 865 上带有的 Hexagon DSP 已被证明在能效和性能方面有显著改善。


4.混合 AI 有望率先给手机和 PC 端带来 AI 体验变革

4.1.手机硬件结构复杂,APP 的运行涉及诸多硬件交互


智能手机相当于袖珍的计算机。智能手机包含处理器、存储器、输入输出设备(显示屏、USB 接口、耳机接口、摄像头等)及 I/O 通道。它通过空中接口协议(GSM、CDMA、PHS 等)和基 站通信,既可以传输语音,也可以传输数据。 主电路板是智能手机的核心,负责手机的供电、控制以及各种功能的实现。智能手机的主电 路板包括:射频电路、处理器及存储器电路、电源及充电电路、操作及屏显电路、接口电路, 以及其他功能电路。其中,射频电路主要用来接收、发射射频信号,包括射频接受电路和射 频发射电路,射频接收电路完成接收信号的滤波信号放大、调制等功能,射频发射电路完成 语音基带信号的调制、变频、功率放大等功能。处理器及存储器电路是手机的核心电路,主 要负责各种数据信号的处理、存储,向其他电路模块发送控制信号控制整机工作等。电源及 充电电路主要负责将电池的供电转换成各个电路模块需要的工作电压,同时负责对电池的充 电工作进行控制。操作与屏显电路主要用来驱动液晶显示屏显示图像,同时识别输人的人工 指令,并将指令送到处理器电路进行处理。接口电路主要包括 USB 接口、耳机接口、蓝牙接 口等,可以通过数据线与电脑、耳机或充电器连接。


处理器芯片是智能手机的大脑,集成了众多功能模块。手机处理器芯片 SoC(System On Chip), 即系统级芯片,它集成了各种功能模块,每一种功能都是由硬件描述语言设计程序,然后在 SoC 内由电路实现的。SoC 包括一个或多个计算引擎(微处理器/微控制器/数字信号处理器), 主、次存储器和输入/输出端口三个部分。相比于电脑的中央处理器(Center Processing Unit),手机的 SoC 集成了 CPU、DSP、数字电路、模拟电路、存储器及片上可编程逻辑等多 种电路。SoC 可以分为专用 SoC 和通用 SoC 两类,专用 SoC 是专用于集成电路向系统级的发 展;通用 SoC 是将 MCU、DSP、RAM、I/O 等集成在芯片上。




IP 核(Intellectual Property Core),即知识产权核,是满足特定规范并能在设计中可复 用的功能模块,构成了 SoC 的基本单元。IP 核可以应用在包含该电路模块的其他 SoC 设计中,从而缩短设计周期,提高复杂 SoC 设计的成功率。一个复杂的 SoC 通常是由芯片设计企 业自主设计的电路和多个外购的 IP 核连接构成的。IP 核按照设计的程度不同,可以划分为 软核、固核、硬核。其中,软核以加密源代码的形式提供,芯片设计企业可以根据自研芯片 情况调整和优化代码,软核灵活性高,对芯片设计企业的技术要求高。硬核相当于一块通过 了验证的完整设计模块,可以直接取用,可靠性高,但灵活性相对较低。固核介于软核和硬 核之间,它完成了比较关键的路径,并做好了预先的布局布线,其他部分仍可以通过编译器 进行优化处理。


智能手机的存储器有内存和闪存,分属于不同的存储器层次。智能手机的存储器主要包括 RAM (RandomAccessMemory,随机存取存储器)、ROM(Read-OnlyMemory,只读存储器)。其中, RAM 是随机存取存储器又称为主存,用于存储智能手机运行时的程序和数据,最常用的 RAM 是 SRAM 和 DRAM。如果有缓存层次结构,SRAM 通常被用于缓存,DRAM 通常被用于主存储器。 ROM 是只读存储器,只能从设备中读取数据而不能往里面写数据,ROM 中的数据是由手机制造 商事先编好固化在里面的,使用者不能随意更改,ROM 主要用于检查手机系统的配置情况, 并提供最基本的输入输出(I/O)程序。


总线是连接手机各芯片有关部件的公共信号线,是芯片间传递指令代码和通信信号的载体。 按照数据传输的方式,总线分为串行总线与并行总线,串行总线的代表是 I2C 与 USB,并行 总线的代表是 SDRAM 的总线、NAND Flash 的总线等。总线的作用是用来传输信号,为了各子 系统的信息及时有效地传送,避免信号的相互干扰和物理空间上的过于拥挤,总线在通信时 通常采用多路复用技术。评价总线性能主要关注宽度、频率和带宽这三大指标。其中,总线 宽度是并行总线宽度,即能同时传送数据的二进制位数,单位为 bit。在传输速率相同的情 况下,并行总线数据线根数越多,则单位时间内的传输数据量越大,总线宽度越大。总线频 率是总线一秒能够传送数据的次数,单位为 Hz。总线带宽即总线的数据传输速率,是指每秒 总线上可传送的数据总量,单位为 MB/s,总线带宽由总线宽度与总线频率共同决定。


APP 在智能手机上的运行离不开内存、闪存和处理器的交互。当用户点击手机上的 APP 图标 时,手机闪存接收到启动指令,将包含该程序的所有信息发送到内存中。内存在接收到数据 后,以极快的速度进行运算和处理,处理完毕的数据会再次传送回内存中。此时,手机上的 APP 程序已经完成了开启过程,但并不会立刻回到闪存。相反,它会一直驻留在内存中,这 是因为处理器需要随时准备接收来自用户操作的指令和数据。用户在操作 APP 期间,处理器 会根据用户的操作不断处理数据,并将新产生的数据保存在内存中。最终,当用户关闭 APP 时,内存将会把原本的数据和用户操作产生的新数据一起保存,并将最终结果写回闪存中, 以保证数据的更新和完整性。


4.2.SoC:面对生成式 AI 加速落地,SoC 算力提升潜力巨大


高通为智能手机、PC、智能汽车等各类终端平台打造了 SoC。在智能手机端,高通最初将骁 龙处理器划分成 S1、S2、S3、S4 四个层级,层级内又包含 Play、Plus、Pro 和 Prime 四 个子系列号。但复杂的编号不利于消费者记忆,于是 2013 年起,高通为骁龙处理器引入了如 今的数字命名方式和层级。目前智能手机端的高端算力芯片以骁龙 888、骁龙 888+、8Gen1、 8+Gen1、8550、8Gen2 为主,为后续混合 AI 算力提升奠定了基础。在 PC 端和智能汽车端, 高通的高端算力芯片性能同样表现出色,在 PC 端主要有 8cx、8cxGen2、8cxGen3,在智能汽 车端主要有 6155、8155、8295。


高通 SoC 推陈出新,AI 算力持续升维。据高通官网数据,骁龙 8Gen1 的 AI 算力为 9INT8, 骁龙 8Gen2 的 AI 算力为 48INT8,骁龙 8Gen2 的 AI 算力相比上一代约提升了 4.35 倍。2022 年 11 月,高通在 2022 骁龙峰会上正式发布了骁龙 8 Gen2 SoC,作为第二代旗舰级产品, 骁龙 8 Gen 2 在 CPU、GPU、AI 和网络连接、影音素质和游戏体验、网络安全等方面都有明 显提升。骁龙 8 Gen2 不但在算力和能耗上提升明显,还搭载了高通旗下速度最快、最先进的 高通 AI 引擎。此外,骁龙 8 Gen 2 采用了 Hexagon 处理器,这是全球首个支持 INT4 运算 单元的处理器。INT4 由于数据量很小,所以在处理一些轻度的、或者精度要求不高的运算时 拥有明显的效率优势,因此极大程度上提高了运算的效率。此外,高通预计在 2023 年 10 月 24 日举行骁龙技术峰会并推出骁龙 8 Gen 3,而联发科预计在 2023 年 10 月上旬或者中旬推 出天玑 9300,二者在性能上都有望得到大幅提升。


对比高通终端算力和英伟达云端算力,未来高通 SoC 算力提升仍有巨大潜能。当前高通 QCS 8550 IN8 算力约是英伟达 A10 算力的五分之一,未来伴随终端算力提升有望加速 AI 落地。 高通的手机芯片分为多款,以最新的手机 SoC 高通 QCS 8550 为例,据官网数据,它的算力 达到 48 INT8 TOPS,而用于云端生成式 AI 推理的英伟达 A10 算力达到 250 INT8 TOPS。


4.3.DRAM:生成式 AI 模型参数递增,DRAM 配置需同步递增


全球存储市场以 DRAM 和 NAND Flash 为主,市场规模在 2022 年小幅回落后或恢复温和增长。 根据中商产业研究院统计,2022 年,全球 DRAM 市场规模为 790.61 亿美元,占比 56.8%;全 球 NAND Flash 市场规模为 601.26 亿美元,占比 43.2%。据 CFM 闪存市场统计,2022 年全球 存储市场规模下跌 13%,DRAM 和 NAND Flash 价格均大幅下降,其中 Flash Wafer 512Gb TLC 价格已经跌至 1.9 美元,年内跌幅达 54%。在终端厂商去库存和降成本的努力下,2023 年存 储市场规模有望恢复温和增长,整体规模达到约 1450 亿美元。




2021 年 DRAM 市场规模约 961 亿美元,市场集中度较高。据 IC Insights 统计,2021 年 DRAM 市场规模约 961 亿美元,以三星、SK 海力士、美光三家龙头为主。2021 年三家龙头共占有 94% 的 DRAM 市场份额,其中三星占比约 43%,SK 海力士占比约 28%,美光占比约 23%。


根据产品特性和应用场景的不同,DRAM 可以分为 DDR、LPDDR 和 GDDR 三大类。DDR(Double Data Rate)是个人计算机和服务器标准内存,具备内存密度较大和传输速率较快的优势。 LPDDR(Low Power DDR)具备低功耗、小体积的优势,主要应用于智能手机、平板等便携式 终端。GDDR(Graphics Double Data Rate)一般称之为显存,是针对图形显示卡所特化的一 种 DDR 内存,适合高速图像处理,主要应用于显卡和游戏主机。


DDR 版本不断迭代,目前已经发展至第五代。DDR 后续迭代版本采用数据读写速率作为命名 标准,依次划分为 DDR2、DDR3、DDR4、DDR5。DDR5 从 2022 年开始量产,与上一代 DDR4 相比 整体性能有较大改善。


随着生成式 AI 模型参数递增,DRAM 配置也需提高。在 INT8 下,保守估计模型参数每增加 10 亿,DRAM 需要增加 1GB。在手机端,分析荣耀、三星当前最高端手机配置发现,当前部分旗 舰手机内存配置大多为 8GB 或 16GB,考虑到操作系统等对内存的占用,需要增加 DRAM 容量, 以支持在手机上进行 100 亿参数推理。在 PC 端,分析联想、苹果最高端笔记本配置发现,部 分旗舰机型内存为 32GB,苹果可选配为 64GB 或 96GB。 混合 AI 有望提升手机销量,DRAM 厂商受益较大。据 TrendForce 统计,2022 年全球 DRAM 各 类终端产品份额占比中,手机端占比为 38.5%,PC 端占比为 13.2%,二者合计占比为 51.7%; 2023 年全球 DRAM 各类终端产品份额占比中,手机端占比为 36.9%,PC 端占比为 12.4%,二 者合计占比为 49.3%。手机与 PC 合计占 DRAM 终端产品份额一半左右,市场空间大,因此混 合 AI 提升手机与 PC 销量及单机用量,则有望进一步带动 DRAM 需求增长。


4.4.NAND:未来生成式 AI 软件较大,NAND 配置需相应提高


NAND 市场规模与 DRAM 相近,预计 2025 年有望首次超越 DRAM 市场规模。根据市场研究公司 Omdia 预测,2023 年全球 NAND 闪存市场规模约为 585.13 亿美元,DRAM 市场规模约为 595.82 亿美元,二者当前市场规模趋近。预计到 2025 年,NAND 闪存市场规模将首次超越 DRAM 市场 规模达到 843.78 亿美元,而 DRAM 市场规模约为 833.97 亿美元。 NAND 市场主要有五大巨头,下游市场需求以手机端为主。根据国家发改委数据,2022 年第 三季度全球 NAND 出货量前五家企业市场份额总和为 95.4%,市场占比从高到低分别为三星、 铠侠、SK 海力士、西部数据、美光。根据 Trendforce 统计,2020 年 NAND 的下游市场需求以 智能手机端为主,预计到 2023 年,智能手机端的 NAND 需求将小幅上涨。


未来集成多个 APP 的生成式 AI 软件或较大,当前 NAND 配置需相应提高。手机端以荣耀、三 星当前最高端手机配置为例,荣耀 Magic5 至臻版闪存为 1TB,而三星 GalaxyS23 Ultra 闪存 为 256GB。PC 端以联想、苹果当前最高端笔记本配置为例,联想 Legion Pro 7i Gen8 的闪 存为 2TB,而苹果 MacBook Pro M2 的闪存为 1TB。由于 NAND 需要根据软件大小增加而增加, 预计未来集成了生成式 AI 的 APP 大小将会提高,NAND 容量也需要相应提高。


5.AI 行情由供给侧迈向应用侧,建议关注产业链投资机会

近年来消费电子换季周期逐渐延长,智能手机出货量有所放缓。根据 IDC 统计数据,2023 年 Q1 中国智能手机市场出货量约 6544 万台,同比下降 11.8%,延续了 2022 年的消费低迷状态。 与海外市场类似,中国手机市场需求也并未出现明显的反弹,消费电子整体行情仍然受到经 济低迷、消费信心等因素的影响。消费者换机周期不断拉长,消费者对于手机更新换代的需 求较弱,根据 IDC 统计,一部智能手机使用 3-4 年越来越普遍。




智能手机高端机型市场韧性较强,混合 AI 有望继续带动高端机型需求增长。将售价在 800 美元以上的智能手机机型划分为高端机型,售价在 400-799 美元的智能手机划分为中端机型, 售价在 399 美元的智能手机划分为低端机型。根据潮电智库统计,2023 年第一季度全球畅销 手机前 20 高端机型总销量为 5775 万部,同比 2022 年第一季度总销量的 5260 万部增长了 9%。高端机型手机销量每季度占比约在 30%水平,2023 年第一季度高端机型占比 38%。相比 之下,中低端机型的总销量都有所下降。未来混合 AI 或率先布局在高端机型市场,各大手机 厂商的旗舰机型销量有望进一步提升。


我们预计消费电子产业链有望受益于海外此轮混合 AI 趋势,在 AI 行情由供给侧迈向应用侧 之时恢复上行趋势。SoC、DRAM 和 NAND 用量或增加,未来智能手机和 PC 的换季周期或缩短, 有望带领行业加速走出周期底部,建议关注相关产业链投资机会。



(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)


相关报告

电子行业专题:高通等IT龙头布局终端生成式AI,终端AI推理应用有望带动产业链升级.pdf

电子税务局.pptx

管理信息系统电子教学课件.pptx

精品-电子政务.pptx

电子行业专题报告:AI浪潮汹涌,HBM全产业链迸发向上.pdf

精测电子邮件报告:面板+半导体+新能源平台化布局领先.pdf

新晨科技研究报告:银行IT稳健增长,低空经济空管先行.pdf

IT行业存储基础知识培训.pptx

云端制造:运营和IT高管将愿景转化为优势.pdf

易点云研究报告:办公IT服务龙头企业,AI业务如虎添翼.pdf

京北方研究报告:稳健增长的银行IT领军企业.pdf

中科创达研究报告:全球领先智能操作系统提供商迎终端AI机遇.pdf

澜起科技研究报告:DDR5渗透提速,AI助力互联新品持续发力.pdf

传媒行业研究报告:多模态AI的五重奏,国产大模型的探索序章.pdf

Astera Labs公司研究:数据中心连接方案独角兽,产品受益于AI服务器强劲需求.pdf

业务视角的中国企业AI+学习发展报告,燃动智火.pdf

【安信证券】电子行业专题:高通等IT龙头布局终端生成式AI,终端AI推理应用有望带动产业链升级.pdf-第一页
联系烽火研报客服烽火研报客服头像
  • 服务热线
  • 4000832158
  • 客服微信
  • 烽火研报客服二维码
  • 客服咨询时间
  • 工作日8:30-18:00