1 行情回顾
1.1 年初至今板块表现处于全部行业前列
截至 2023 年 12 月 8 日,计算机板块年初至今涨幅 15.21%,处于 A 股所有 板块第三位。
截至 2023 年 12 月 8 日,计算机板块涨幅前 20 家企业以中小市值企业为主, 随着人工智能、卫星互联网、华为数字底座、数据要素等多个领域出现从 0 到 1 突破,计算机个股行情呈现多元化趋势,专精特新行情或已经开启,而这一趋势 我们预计或将在未来进一步演绎。
截至 2023 年 12 月 8 日,中信计算机指数成分股涨幅平均数为 28.20%, 50-100 亿区间市值公司跑赢板块均值较为显著,涨跌幅平均数为 34.03%;30 亿 以下市值公司较大幅度跑输板块均值;其他市值区间公司表现与板块接近。 市值 500 亿以上的涨跌幅平均数:28.62%; 市值 100 亿-500 亿的涨跌幅平均数:29.79%; 市值 50 亿-100 亿的涨跌幅平均数:34.03%; 市值 30 亿-50 亿的涨跌幅平均数:28.48%; 市值 30 亿以下的涨跌幅平均数:14.89%。
1.2 产业资本频频回购与激励,或为行业向好前瞻指标
2023 年 1 月 1 日至 12 月 8 日,计算机板块共有 81 家上市公司实施回购股 份,总金额约 42 亿元,回购金额排名前十的公司细分行业多样化程度高,网络安 全(2 家)、能源 IT(2 家)数量居前;共 75 家上市公司发布股权激励预案,以 期权初始行权价格为准,总金额约为 93 亿元,总股本约 6.73 亿股。
1.3 计算机持仓比重进一步回落
通过对基金前十大重仓股进行估算,2023 年 Q3 计算机板块(中信计算机成 份股且剔除东方财富、加入海康威视和大华股份)占基金总持仓比重约为 4.63%, 较上个季度呈现稳中有落(2022Q3~2023Q2 分别为 2.64%、3.42%、5.71%、 5.62%)。
1.4 人均薪酬增速显著低于全部行业中位数
通过对计算机板块(本文选用 Wind 中 CS 计算机板块作参考)板块人均薪酬 增速中位数与全部行业增速中位数比较可得,计算机板块人均薪酬增速中位数 2019 年起大约领先全部行业一年,2020/2021/2022 计算机板块和行业人均薪酬 增速中位数分别为-0.22%/12.88%/7.00%和 7.92%/-0.83%/14.69%。考虑到计 算机行业降本增效进一步深化,我们预计 2023 年计算机板块人均薪酬增速中位 数将显著低于全部行业中位数水平。
在计算机板块相对表现突出的 2014-2015 年、2018-2019 年,计算机行业 归母净利润增速中位数显著高于全部行业归母净利润中位数。2020、2021、2022 年来看,计算机行业归母净利润增速中位数均显著低于全部行业中位数,随着板 块景气度回升、人员成本增长趋缓以及低基数多重因素下,2023 年前三季度计算 机板块净利润增速中位数的增速显著高于全部行业净利润增速中位数的增速,未 来有望推动计算机行业归母净利润增速中位数再次超越全部行业归母净利润中位 数,进而带动计算机行情上涨。
2 AI 由供给侧迈向应用侧拐点:2024 或是真正应 用元年
从 2022 年底 OpenAI 发布现象级应用 ChatGPT 让人们意识到 AI 已经具备 成为强大生产力的潜力,再到微软 100 亿美元入股 OpenAI 推动 GPT3.5 的技术 革新、GPT3.5turbo 的成本降低,以及全面内置于 Office365 全家桶发布 AI 标杆 级应用 Copilot,微软仅仅用了不到半年的时间即打破数十年生产力的输出方式, Copilot 的面世不仅仅只是功能的增加,其内核在于生产力的全新跃迁,Copilot 的发布使开发者意识到 AI 已经是正在实际发生的、正带来各行各业生产力质变的 人类历史最大科技革命。2023 年下半年,国外科技巨头 AI 软硬件产品商业化落 地进度加快,前有 OpenAI 发布 GPTs 打开原生 AI 应用市场,后有联想发布 AI PC 推动由软及硬的 AI 硬件创新浪潮,人工智能从供给侧正式进入应用侧的拐点。
今年以来的人工智能行情复盘,分为三个阶段: 我们选取中际旭创、恒为科技代表算力板块(红色系),选取三六零、昆仑万 维代表大模型板块(绿色系),选取科大讯飞、金山办公代表 AI 应用板块(蓝色 系),我们可以看到 AI 应用的行情演绎:
1)大模型:在 3 月 16 日微软 MS365 Copilot 发布后,当时大模型稀缺性 较强,率先发布大模型的公司迅速得到市场青睐,三六零、昆仑万维等公司领涨; 2)算力:算力作为 AI 时代的基础设施,确定性最强,在 5 月 24 日英伟达业 绩超预期后,以中际旭创为代表的算力股成为 AI 行情中军,后续 10-11 月芯片管 制对英伟达相关算力产生影响但开启了昇腾算力相关公司行情,以恒为科技为代 表的算力公司在 23Q4 涨幅居前; 3)AI 应用:AI 应用相关公司如科大讯飞、金山办公全年稳中有升,但并非 AI 标的中表现最突出者,主要原因为国内大模型 AI 应用尚未出现热门产品。国内 大模型多于 23Q4 接近对标 GPT3.5 水平且向全社会开放,而 GPT3.5 是 AI 商业 化应用的起点,国内大模型 AI 应用商业化落地进程刚刚开启,看好后续中国 AI 应用产业凭借中国对于应用层的强大创新力快速发展。
2.1 AI 行情当前阶段:进入从供给侧向应用侧的拐点
大模型可类比于当年的智能手机,算力、数据等大模型产业链可类比于当年 的手机产业链,产业链总体将延续智能手机先硬件后应用的演绎方向: 2013-2015 的 TMT 牛市的基础是 2010 年 iPhone4 发布后 2010-2012 年,移动 互联网的基础设施—智能手机渗透率快速提升至接近 50%左右水平,对应 AI 行情 的基础设施是大模型普及过程,该阶段投资重点应该集中在 AI 供给侧的基础设施 产业链,即大模型、算力、数据;智能手机应用数量快速增长的过程则对应 AI 行 行情中 AI 应用走入千家万户的过程。
重大变革下,带来算力国产化、AI 终端变革与多模态 AI 应用引领三大主线: 1)基础算力国产化与一体机:当前昇腾一体机主要商业模式是软件厂商将通 用或垂类大模型部署在昇腾一体机并结合自身业务打包出售,在英伟达管制持续 发酵的背景,稀缺性持续上升。昇腾一体机专注于大模型本地化部署的蓝海市场, 是国内 AI 软硬件技术的黄金交点,以国产算力领军者华为昇腾 AI 基础软硬件平 台为基础,联合国内领先 AI 厂商打造的先进生产力工具,有着数据安全可控、开 箱即用的特点,AI 大模型在数据安全与数据要素驱动下,带来央国企与政府大模 型本地化部署的刚需。 2)从 AI PC 到 AI pin 的 AI 终端变革:本次由大模型带来的 AI 浪潮中,首 次以软件先行定义一切基础。而在催生算力硬件等基础设施完善之后,开始逐步进入各个终端,各个终端开始重构和适应大模型放置在终端硬件上。 3)AI 应用:海外率先落地,国内有望复制规模商业化的大模型应用。海外 在大模型成熟赋能下,已形成 AI 大模型-AI 应用-商业模式落地的闭环。从 GPTs 发布不到一个月内,即超过 Apple store 上线一年的应用数量,正加速迈入应用 快速发展阶段;同时,多模态模型的不断进化打开文生视频等新领域;在国内大 模型基本具备或接近 GPT3.5 的水平,海外成功落地的模式已为国内 AI 应用的发 展明确后续的清晰路径。
3 AI 算力国产化迎来拐点:抛弃幻想,正视现实
3.1 华为昇腾:国产 AI 算力“扛旗者”
3.1.1 硬件是 AI 体系的基础,提供强大计算能力
华为昇腾芯片是华为发布的两款人工智能处理器,包含昇腾 310 用于推理和 910 用于训练业务,均采用自家的达芬奇架构。1)昇腾 310 处理器:本质上是 人工智能片上系统,主要应用于边缘计算产品和移动端设备等低功耗的领域。该 芯片采用12nm制造工艺,最大功耗仅为8W,半精度(FP16)算力可达8TFLOPS, 整数精度(INT8)算力可达 16TOPS,同时还集成了 16 通道全高清视频解码器。 2)昇腾 910 处理器:在算力方面,昇腾 910 表现非常出色,半精度(FP16)算 力可达 320TFLOPS,整数精度(INT8)算力可达 640TOPS,功耗只有 310W, 同时采用了 7nm 先进工艺进程,支持 128 通道全高清视频解码。从算力上看, 昇腾 910 和英伟达 A100 性能基本上相当。
行业性能领先的服务器。昇腾 AI 服务器具有超强算力,适用于中心侧 AI 推 理以及深度学习模型开发和训练场景。1)Atlas 800 推理服务器(型号:3000): 具有高算力和高能效特点。最大可支持 8 个 Atlas 300I/V Pro,提供强大的实时 推理能力,广泛应用于中心侧 AI 推理场景。2)Atlas 800 推理服务器(型号: 3010):具有灵活配置,适配多项负载特点。最大可支持 7 个 Atlas 300I/V Pro, 广泛应用于中心侧 AI 推理场景。3)Atlas 800 训练服务器(型号:9000):具 有高算力密度等特点。拥有 4 颗鲲鹏 920 芯片,广泛应用于深度学习模型开发和 训练,适用于智慧城市、智慧医疗、天文探索、石油勘探等需要大算力的行业领 域。4)Atlas 800 训练服务器(型号:9010):具有高算力密度等特点。可提供 2.24PFLOPS FP16 算力,广泛应用于深度学习模型开发和训练。5)Atals 800T A2 训练服务器:具有高速带宽等特点。双向互联带宽达 392GB/s,广泛应用于深度 学习模型开发和训练。6)Atlas 500 Pro 智能边缘服务器:具有易于部署维护和 支持云边协同等特点。最大支持 3 张 Atlas 300I/V Pro 推理卡,单卡功耗仅 72W, 发挥鲲鹏架构多核、低功耗优势,在边缘场景中广泛部署。
3.1.2 昇腾一体机率先构筑增量弹性
昇腾 AI 一体机是国内 AI 软硬件技术的黄金交点,是以国产算力领军者华为 昇腾 AI 基础软硬件平台为基础,联合国内领先 AI 厂商打造的先进生产力工具, 有着数据安全可控、开箱即用的特点。昇腾 AI 基础软硬件平台包含华为 Atlas 系 列硬件及伙伴自有品牌硬件、异构计算架构 CANN、全场景 AI 框架昇思 MindSpore、昇腾应用使能 MindX、一站式开发平台 ModelArts 和统一工具链 MindStudio 等。 国内各厂商陆续发布合作款昇腾一体机,应用范围由科研逐步扩展到 AI 全场 景乃至垂类模型落地。2023 年 3 月,华为昇腾与旗下华鲲振宇打造了专为高校和 科研院所设计的 AI 训练开发一体机,奠定了将 AI 算力、AI 平台软件、AI 开发框 架、开发组件和存储高效融合的算力底座基础架构;2023 年 6 月,软通动力发布 训推一体化平台,支持用户一站式 AI 开发、深度适配不同 AI 应用场景;2023 年 8 月起云从科技、科大讯飞、智谱 AI 等国内领先 AI 大模型厂商合作款昇腾一体机 面世,昇腾一体机应用范围扩展到 AI 全场景;后续医渡科技、安恒信息等公司将 昇腾一体机用于自身垂类模型落地。昇腾一体机凭借其领先的软硬件基础设施性 能,以及昇腾的优秀工程化能力,正逐渐成为千行百业大模型产业化重要抓手。
大模型本地化部署市场需求主要有数据安全需求和技术需求两大类: 1)数据安全需求:三星芯片代码泄露事件为重要标志,大模型或能够永久学 习泄露数据内容,造成不可逆损失。据澎拜新闻援引韩国媒体《economist》报 道,2023 年 3 月,三星内部发生三起涉及 ChatGPT 误用与滥用案例,包括两起 “设备信息泄露”和一起“会议内容泄露”,报道称半导体设备测量资料、产品良 率等内容或已被存入 ChatGPT 学习资料库中。据 Cyberhaven 统计,员工直接发 给 ChatGPT 的企业数据中,有 11%都是敏感数据。
2)技术需求:使用本地化部署的大模型,可以让机构和个人在这种不断变化 的市场环境中积累经验,而单单使用 API 则无法做到这一点。据 willows.ai,对 于 AI 原生应用,需要了解模型的内部状态、梯度和中间输出结果,使用基于 API 的模型,会限制进一步进行实验和增强模型的可能性。此外,AI 工程化开发成本 较高,中小厂商难以负担,使用打包工程化能力的 AI 一体机能够降低中小厂商进 行 AI 创业的门槛。 G 端数据安全最为迫切,推动大模型本地化部署需求率先落地,乐观预计 2027 年 G 端一体机市场规模超 4500 亿元。从数据自主可控出发,党政军对数据安全需求强烈:据维创,政府数据和军队国防机密若泄密极易造成重大负面影 响,甚至危及国家安全和社会稳定。优刻得与沐曦、智谱华章共同在宁夏的开放 平台上面向第一批用户也正是 G 端的航天医院、数字宁夏建设运营有限公司。首 批落地的大模型本地部署一体机主要分为推理型 AI 一体机、训推一体型 AI 一体 机以及编程一体机三类。
从最优化角度计算市场规模,AI 一体机需求量等于接入 AI 的 PC 数量除以 AI 一体机最大并发数量。由于目前市场 AI 一体机参数披露较少且主要以华为昇腾 芯片为主预计 AI 一体机硬件参数接近,使用摩尔线程一体机 40 台最大并发以及 智谱一体机最低 180 万单价进行市场测算:1)2022 年国家机关和事业单位住房 公积金实缴职工数量约 4745 万人,假设 70%职工配 PC、假设职工数量稳定略微 波动,则 2023-2027 年 G 端 PC 数量为 3300-3400 万台;2)乐观/中性/悲观情 况下,至 2027 年接入大模型的 PC 渗透率分别为 30%/20%/10%;3)参考摩尔 线程,假设 AI 一体机最大并发量为 40 台;4)定价参考智谱 AI 一体机单价为 180 万元/台(最低配置产品);5)综上可得,2027 年乐观/中性/悲观情况下,G 端 AI 一体机市场规模分别为 4590 亿元/3060 亿元/1530 亿元。
从最优化角度计算市场规模,编程一体机需求量等于接入 AI 的 IT 部门 PC 数 量除以 AI 一体机最大并发数量。由于目前市场编程一体机参数披露较少且主要以 华为昇腾芯片为主预计编程一体机硬件参数接近,使用摩尔线程一体机 40 台最大 并发以及智谱 AI 一体机最低 180 万单价进行市场测算:1)2022 年国家机关和 事业单位住房公积金实缴职工数量约 4745 万人,假设 70%职工配 PC、假设职工 数量稳定略微波动,则 2023-2027 年 G 端 PC 数量为 3300-3400 万台;2)根据 中公教育整理的 2024 中央党群机关公务员招聘信息估算,2024 年负责 IT 公务员 占比约为 6%,假设 2023- 2027 年稳定 6%;3)考虑到 IT 部门对于 AI 提升编程 效率需求更强,乐观预计 2027 年政府 IT 部门 50%接入编程 AI,高于政府部门总 体 30%渗透率(上文);4)参考摩尔线程和智谱 AI,假设编程一体机最大并发 40 台,单价 180 万元;5)综上可得,2027 年乐观/中性/悲观情况下国内编程一 体机 G 端市场规模分别为 92 亿元/55 亿元/37 亿元。
市场格局:软硬件一体化能力或成为核心竞争力
昇腾一体机需要 AI 厂商拥有强大的 AI 领域软硬件一体化工程能力。据芯智 讯,华为跟科大讯飞共同在昇腾 AI 的软硬件平台和软件的支撑工具上,把高算力 AI 芯片、高性能的算子库、多卡高速互联以及分布式存储结合起来,尤其是联合 针对人工智能所需要的最重要的算子库进行甄别和打磨;此外,科大讯飞的训练 和数据闭环全流程设计,以及训练和推理一体化设计的自研大模型训练平台支持 大规模的异构算力兼容、也支持混合云架构易拓展等特性也起到重要作用。
华为徐直军在 1024 全球开发者节宣布:科大讯飞联合华为正式发布基于昇 腾生态的“飞星一号”平台。公司与华为昇腾合作,实现从算力底层硬件基础设 施到大模型再到大模型应用开发平台全生命周期覆盖,在深度优化下华为 GPU 可 对标英伟达 A100。早在 2018 年 5 月,华为与科大讯飞签署战略合作协议,未来 双方将在公有云服务、ICT 基础设施产品、智能终端、以及办公 IT 四大领域开展 深度战略合作;在 2023 年 7 月,讯飞星火与华为昇腾进一步合作联手打造我国 通用智能新底座,通过软硬件的完美协同优化,构建算力集中、性能优越、供给 稳定、数据安全的大模型训练集群,加速了训练和数据的全流程闭环。据科大讯 飞董事长刘庆峰,在华为派出专门工作组在讯飞成立专班工作优化的背景下,华 为 GPU 可对标英伟达 A100。此外,公司于 2009 年开始算力基础设施建设,目 前已建成 4 城 7 中心深度学习计算平台,算力不仅完全满足 AI 算法模型训练,还 能够覆盖面向开放平台数百万开发者和其他行业伙伴提供相关 AI 服务的需求。据 IT 时报,讯飞 2023 年 1024 开发节上,科大讯飞联合华为正式发布基于昇腾生态 的“飞星一号”平台: 华为轮值董事长徐直军表示,“飞星一号”将为更大参数的星火 4.0 提供算力 支撑,目前华为公司在全球所有智能终端的语音技术都来自科大讯飞,未来将与 科大讯飞在大模型领域开展更多合作。 科大讯飞董事长刘庆峰表示,半年内讯飞和华为成立的“联合特战队”实现 星火大模型训练和推理效率均翻番。
讯飞星火一体机竞争优势显著。智谱 AI 的大模型 ChatGLM 与星火大模型、 文心一言并列国产大模型 TOP3,同样与昇腾合作,在一体机软硬件优势不突出的 前提下,定价最高达到 3960 万元/15 人(包括产品方案、模型部署、微调咨询等), 星火一体机凭借自身丰富软硬件一体化产品开发经验或能够带来更强性价比;云 从科技、恒为科技、软通动力等公司也发布基于昇腾硬件的一体机产品,但上述 公司大模型性能很难与国产大模型 TOP3 的星火大模型比较,导致昇腾一体机软 件部分使用体验或低于星火一体机;因此,我们认为星火一体机在市场竞争优势 显著。
4 AI 终端变革或启动空前终端硬件创新潮
本次由大模型带来的 AI 浪潮不同于移动互联网先“硬”后“软”,而是以软 件为基础设施先行定义一切,正开始推动终端重构的空前硬件创新潮:一是需要 适应大模型放置在终端硬件上,而是终端要为自然语言交互来重新设计。其机遇 集中于三个方向: 1、以 AI PC 为代表,包括手机、汽车、机器人等终端需要从计算芯片、内存、 散热与电池多方面重构适应大模型本地部署,更加速换机潮; 2、AI Pin 只是开始,会此起彼伏出现从 0 到 1 为大模型交互设计的新终端硬 件创新潮; 3、以耳机为代表的终端战略地位空前提升带来全新机遇。
4.1 以 Al PC 为代表的大模型本地化部署硬件革命
2023 年 10 月 24 日,联想创新科技大会上 AI PC 的概念首次面世,引发产 业热潮。联想杨元庆认为未来的大模型将根据不同的业务需求呈现端-边-云的混合 计算架构,其中 Al PC 将满足用户的端侧大模型应用需求。大模型的本地部署, 数据存储及推理均在本地设备完成,从而彻底解决数据安全风险。联想集团与合 作伙伴一起打造了混合 AI 框架,推出了企业级 AI 产品 Enterprise Al Twin 以及 个人 AI 产品 Personal Al Twin。王传东表示,未来,Personal Al Twin 将广泛应 用于智能终端,拥有诸多优势的 Al PC 也将承担开启大模型时代第一终端的重要 角色。2024 年将正式开启 AI PC 元年,AI PC 将为用户带来全新的 AI 体验。联 想将践行“Al for Al“的愿景,让 Al 变得“无时不在、无处不在、人人都有”,从 而为创造一个公平、开放、包容的智慧新世界贡献力量。AI PC 相较于目前的 PC 设备而言,有五大特质,包括:能够运行经过压缩和性能优化的个人大模型;具 备更强的算力,能够支持包括 CPU、GPU、 NPU 在内的异构计算;具备更大的 存储,能够容纳更多个人全生命周期的数据并形成个人知识库,为个人大模型的 学习、训练、推理、优化提供燃料;具备更顺畅的自然语言交互,甚至可以用语 音、手势跟它完成互动;具备更可靠的安全和隐私保护。
当前大模型的推理服务在云端进行,个人数据需上传,有隐私泄漏风险。因 算力限制,大模型目前主要在云端部署,而云端不可避免带来数据安全及隐私泄 露风险。例如用户在 ChatGPT 中输入的内容都会传至 OpenAl 的服务器,甚至会 作为新的语料更新迭代模型。据 36 氪,三星半导体在使用 ChatGPT 的 20 天内 或发生三起信息泄露事件。意大利个人数据保护局也于 2023 年 3 月禁止境内用 户使用 ChatGPT。而 AI PC 一般是用户个人数据的存储设备,端侧部署的私有化 大模型可以做到无泄漏风险地获取个人数据,更有机会诞生真正的 Al Agent。
4.1.1 大模型本地化部署推动终端产品硬件革命
大模型轻量化技术不断创新,推理算力需求降低,本地化部署逐渐可行。由 于大模型的参数量巨大,需要多块高性能 GPU 联合存储模型以供推理。据机器之 心 Pro 测算,ChatGPT 的单次推理需要 5 块 A100GPU,每秒钟可支持 15-20 次。 而通过压缩、剪枝等轻量化策略,将不断大模型降低大模型的推理算力需求。例 如联想演示环节中,展示了使用混合压缩技术的 Al PC 本地化模型的生成式对话 能力,其生成速度及生成质量均达到公有大模型的水准,并根据出发地点、航班 偏好、酒店偏好等对路线做出个性化定制。
实际上,各大科技巨头已在 AI PC 的设备及芯片领域有所布局。AI PC 对设 备的计算能力提出更高要求,从目前厂商已发布或预计发布的产品来看,其 AI 能 力主要体现为支持运行的大语言模型参数规模,以及文生图等生成式应用的生成速度等指标。
高通于 10 月 25 日重磅发布新一代 PC 处理器骁龙 X Elite,面向 Windows 11 系统。骁龙 X Elite 支持 130 亿参数的大语言模型,针对 70 亿参数大语言模 型每秒能够生成 30 个 token。并着重优化了 Al 相关的性能,包括邮件总结、图 像生成等任务;AMD 在 2023 年 CES 展会上推出了首款嵌入专用 Al 硬件的 x86 处理器 Ryzen 7040,该处理器内置 XDNA Al 加速器引擎,为 AMD 与微软深度 合作设计,有望打破传统 CPU 处理器的限制,加速轻量级 Al 推理工作负载,降 低 Al 落地成本,为超薄本等移动平台提供出色的 Al 性能。该引擎目前已在 Windows 11 中得到支持。
AI PC 为产业链条注入新活力。Al 芯片是 Al PC 相比于传统 PC 而言,在硬 件上的最大变化,主要体现为新增了神经网络处理器 NPU。 对于 PC 品牌而言,联想、惠普、戴尔等各大终端品牌的 Al PC 产品有望相 继落地,底层硬件和上层应用的变革将带来终端用户新的换机热潮,PC 终端或将迎来重估值。对于 Al 大模型应用而言,在端侧部署的大模型更加适合于需要使用 个人隐私数据及需高频次调用的应用,如微软 Copilot 等。 Al 的终端化趋势主要有以下需要重点关注的方面:模型压缩和加速。为了在 终端设备上运行大模型,需要对模型进行压缩和加速。这需要使用一些特殊的技 术,如量化、剪枝、蒸馏等;模型更新和迭代。大模型需要不断地更新和迭代, 以适应不断变化的应用场景。如何在终端设备上实现模型更新和迭代是一个重要 的难点;数据安全和隐私保护。大模型通常需要在终端设备上运行,因此需要考 虑数据安全和隐私保护的问题。这需要使用一些特殊的技术,如联邦学习、加密 计算等;芯片算力。大模型需要更多的计算资源,而终端设备的计算能力有限。 因此,如何在保证模型性能的同时,充分利用终端设备的计算能力是一个重要的 难点;软硬件协同。大模型需要与终端设备的硬件和软件进行协同,以保证模型 的性能和稳定性。如何实现软硬件协同是一个重要的难点。
4.1.2 鸿蒙产业链:AIOT 操作系统成熟赋能硬件创新
鸿蒙 4.0 较 3.0 更进一步,给使用者带来全新体验。在 8 月 4 日的华为开发 者大会 2023 大会上 HarmonyOS 4 正式发布。根据华为官网,截至 2023 年 8 月,鸿蒙生态的智能设备已超过 7 亿台,HarmonyOS 3 把分布式技术带到了更 多设备和场景,分布式通信让设备间的网络也能共享,元服务万能卡片让服务的 获取更便捷。HarmonyOS 4 在坚持稳定、流畅、安全前提下,主张让用户充分 彰显个性。HarmonyOS 4 采用全新华为方舟引擎,实现在图形、多媒体、内存、 调度、存储、低功耗等能力的显著提升。相比上一代系统,HarmonyOS 4 的滑 动流畅性提升 20%,续航增加 30 分钟。多项常用操作响应速度也得到大幅优化, 如相机启动速度提升 57%,用户在支付、导航等场景也有更顺滑的使用体验。
多端互联是鸿蒙 4.0 的一大重要亮点,“一次开发,多端部署”是鸿蒙重要理 念之一多端互联是鸿蒙 4.0 的一大重要亮点。“一次开发,多端部署”指的是一个 工程,一次开发上架,多端按需部署,目的是为了支撑开发者高效地开发多种终端设备上的应用。为了实现这一目的,鸿蒙系统打造了几个核心能力,包括多端 开发环境,多端开发能力以及多端分发机制。
华为鸿蒙在 PC 端积极尝试,不仅已经完成了针对 Intel PC 端的开源鸿蒙适 配工作,而且其技术内核支持 PC 端发展。 1)鸿湖万联率先完成了针对 Intel PC 端的开源鸿蒙适配工作,是业内首家 实现开源鸿蒙跨指令集能力的操作系统发行版厂商。2)华为鸿蒙应用开发白皮书 V2.0 指出,鸿蒙系统上的应用模型称之为“Stage 模型”。应用程序框架定义了 应用的全生命周期。鸿蒙系统是一个支持 1+8+N 多设备的统一操作系统,其生 命周期的管理和定义就更为复杂且重要。Stage 模型主要特点之一,就是支持多 设备的统一窗口管理。为更好的管理 PC、移动设备等终端的差异性,鸿蒙系统设 计了统一的窗口系统,给开发者提供统一的编程模型;同时,通过鸿蒙系统提供 的分布式能力,开发者只需要花费很小的成本便可实现用户的跨设备文档同步并 接续编辑的需求。用户只需要在手机编辑文档的页面点击流转按钮,选择需要流 转的 PC,手机的文档就会同步到 PC,同步完之后自动打开文档进入编辑页面, 用户就可以接着在 PC 上继续编辑这个文档了。
技术上的核心能力是鸿蒙在 PC 端拓展的重要支撑:1)多端开发环境: HUAWEI DevEco Studio 是面向全场景多设备提供的一站式开发平台,支持多端 双向预览、分布式调优、分布式调试、超级终端模拟、低代码可视化开发等能力, 帮助开发者降低成本、提升效率、提高质量。2)多端开发能力:多端开发能力的 核心目标是降低多设备应用的开发成本。为了实现该目标,鸿蒙系统提供了以 下 几个核心能力,支持多端 UI 适配,交互事件归一,设备能力抽象,帮助开发者 降低开发 与维护成本,提高代码复用度。3)多端分发机制:鸿蒙系统提供了“一 次开发,多端部署”的能力,开发者开发多设备应用,只需要一套工程,一次打 包出多个 HAP,统一上架,即可根据设备类型按需进行分发。除了可以开发传统 的应用,开发者还可以开发元服务。元服务是一种面向未来的服务提供方式,具 有独立入口的、免安装的、可为用户提供一个或多个便捷服务的应用程序形态。鸿蒙系统为元服务提供了更多的分发入口,方便用户获取,同时也增加了元服务 露出的机会。
深耕根技术的同时,生态的持续繁荣成为鸿蒙向 PC 端拓展的重要基础。1) 开发者生态持续繁荣:根据华为官网,截至 2023 年 8 月,鸿蒙生态的设备数量 已超过 7 亿,已有 220 万 HarmonyOS 开发者投入到鸿蒙世界的开发中。 OpenHarmony 已成为开源鸿蒙的根社区,位居 Gitee 指数第 1 名,已有 5100 名社区代码贡献者加入,华为也将持续投入 OpenHarmony 开源项目共建,使能 千行百业。2)持续深耕根技术:全新的鸿蒙内核和华为方舟图形引擎,为消费者 带来天生流畅、极致能效和纯净安全的体验。鸿蒙内核卓越的安全能力,获得了 业界的高度认可,刚刚过去的七月,获得了全球首张智能终端操作系统领域 CC EAL 6+证书。3)产业生态不断完善:截至 2023 年 8 月,鸿蒙底座已有超过 1 亿行代码,超 2 万个 API,超 7 亿鸿蒙生态设备,鸿蒙底座已经基本成熟,并且 已经有大量上市公司参与鸿蒙生态。
PC 市场重要潜力叠加信创产业发展大趋势,鸿蒙有望打开发展新空间。根 据 Canalys 数据,2022 年中国大陆地区个人电脑(大陆,台式机、笔记本电脑 和工作站)整体出货量达到 4850 万台。华为是国内市场的主力军,2022 年华 为中国大陆地区台式机和笔记本电脑出货量的同比增速高达 89%;市场份额由 2021 年的 3.3%提升至 7.4%。可以看到,国内 PC 市场仍具有重要潜力,华为快 速提升自身地位。同时,在国产替代大趋势下,华为作为信创产业的主力,也有 望受益于国产替代大趋势的推进。因此鸿蒙如果与 PC 进行结合,未来有望打开发 展的新空间。
AI 助手小艺由中国首个全栈自主的 AI 大模型盘古大模型支持。盘古大模型有 深厚的行业积累,分层解耦的架构,多样化的部署模式;使用全栈技术创新,极 致算力加速大模型开发;打造云原生应用平台 AppArts,成立大模型高质量数据 联盟加速盘古 AI 生态发展;此外,还打造金融、政务、制造、矿山、气象、铁路 等领域行业大模型和能力集,将行业知识 know-how 与大模型能力相结合。
AI 助手小艺针对终端消费者场景对盘古大模型进行精调。小艺背后的大模型 是在华为盘古 L0 基座大模型的基础上,针对终端消费者场景构建了大量的场景数 据与精调模型后的 L1 层对话模型,更加适用于终端消费者场景。主要体现在智慧 交互,实现了基于自然语言理解的设备控制、本机数字内容搜索、对话识别屏幕 内容;更高效的生产力,帮助用户快速摘要、文案内容辅助、图片二次创作;更 懂用户的个性化服务,实现了随口说随时记、贴心的组合服务建议提醒。
利用领先的大模型技术以及基于 HarmonyOS 原生的应用,小艺拥有了强大 的自然语言理解能力,并实现了接口调用与用户意图的匹配。用户无需准确说出 功能名,凭直觉表达需求,小艺就能理解并执行,是真“听得懂”。例如用户可 以直接问小艺:“怎样换一个带天气效果的壁纸?”,或者:“那个带天气效果 的桌面,怎么更换?”,甚至可以说“能不能把手机壁纸设置成带实时天气的?” 小艺都能理解用户是要了解和使用全景天气壁纸这个功能。此外,智慧场景功能也全面升级,例如用户可以把对小艺说“帮我创建晨跑场景。每周一到周五早上 6 点半为我播报当天天气,当我戴上蓝牙耳机的时候,就播放收藏的歌曲,并把手 机设为静音模式”,小艺能够自动创建任务。
AI 助手小艺多模态能力表现亮眼。基于 OCR、CV 技术,小艺智慧视觉还可 以智能识别图片中的文字、物体,并实现服务闭环。比如打开一张海报,通过对 话就能让小艺直接识别海报中的活动地址,并启动导航到目的地,还可以让小艺 识别图片中的快递、公司、网址、日期等。针对高频使用场景,如新闻播报、闲 聊、讲故事、自定义声音等,小艺播报体验也在不断地优化,为用户提供全面升 级的新闻播报音色、自定义声音、超拟人音色,满足多元需求。
AI 助手小艺在 AIGC 领域迎来重大升级。用户现在可以直接发送资讯链接、 文档(PDF/WORD)给小艺,对小艺说“这篇核心观点是什么”就可以快速总结 出要点,英文资讯也可以用中文进行摘要。同时支持用户针对资讯内容进行对话 式问答,一问一答间,快速吃透理解。而对文档“收藏大户”来说,小艺解决了 找文档的痛苦,一句“找一下前段时间下载的讲机器学习与深度学习关系的文 档”,就能快速找到含有相关内容的文档。除了资讯整理,小艺在 AI 创作上也毫 不逊色,根据用户文字提示内容,小艺支持内容创作辅助,如商务邮件、演讲稿、 邀请函、公文、商业文案、祝福语、故事、工作总结等上百种文案风格。跟小艺说,“请写一篇关于大模型技术研讨的会议邀请函”,小艺就可以为你生成一段 符合邮件规范的邀请函,用户可以再根据自己的需求对内容进行修改后使用。
AI 助手小艺通过元服务打造“ChatGPT+Plugin”式生态。鸿蒙万能卡片是 元服务最主要的呈现形态之一(其他形态如语音、图标等),每一个万能卡片都是 在桌面上“永远打开的”元服务/应用,将元服务/应用的重要信息以卡片的形式展 示在桌面,通过轻量交互行为实现服务直达。通过语音唤醒词,如“小艺小艺” 进入智慧语音,使用语音对话方式触发元服务。通过该 AI 应用生态,小艺将变身 你的随身助理,人与应用、服务的交互,以及获取服务的方式都在发生变化,如 停车、订餐、机票等功能都可以通过自然对话完成。
4.1.3 汽车终端:L3 政策落地与大模型带来全新机遇
L3 级别及以上的自动驾驶有望成为重量级应用。我们目睹了 L1-L2 级别的自 动驾驶在过去几年的迅速普及。然而,与 L3 级别的真正无人驾驶相比,这些级别 的自动驾驶技术在驾驶员干预和安全性方面仍存在明显差距。这一差距将成为无 人驾驶产业发展中的重要分水岭。这一分水岭的出现也将催生更多的投资机会和 市场需求。随着消费者对 L3 级别自动驾驶的认可和接受度的提高,汽车制造商、 科技公司和相关产业链将积极投资研发 L3 级别及以上的自动驾驶技术,以满足市 场需求并保持竞争优势。 11 月 17 日,工业和信息化部为了落实《关于加强智能网联汽车生产企业及 产品准入管理的意见》,发布了关于开展智能网联汽车准入和上路通行试点工作的 通知。其内容主要为,在智能网联汽车道路测试与示范应用工作基础上,遴选具 备量产条件的搭载自动驾驶功能的智能网联汽车产品 (以下简称智能网联汽车产 品),开展准入试点;对取得准入的智能网联汽车产品,在限定区域内开展上路通 行试点,车辆用于运输经营的需满足交通运输主管部门运营资质和运营管理要求。 通知中智能网联汽车搭载的自动驾驶功能是指国家标准《汽车驾驶自动化分级》 (GB/T 40429-2021)定义的 L3 和 L4 级驾驶自动化功能。实际上,自 2015 年以来,多项国家级政策相继提出引领行业发展。
国家层面的政策宏观上指引自动驾驶行业的发展方向和整体进度,而地方性 政策是主机厂及自动驾驶 Tier1 自动驾驶技术落地的主要推动力。2023 年全年多 项地方性政策颁布,提供了具体的路测实施方案及准入的企业白名单。
政府积极开展智能网联汽车准入和上路通行试点,加快自动驾驶汽车产品推 广应用。截至 2023 年 8 月,全国累计开放测试道路超过 2 万公里,一批智能网 联汽车产品开展大量研发测试验证,部分产品已具备一定的量产应用条件。在前期开展道路测试与示范应用工作基础上,组织开展智能网联汽车准入和上路通行 试点,推动量产车型产品上路通行和推广应用,有利于加快提升智能网联汽车产 品技术水平,有效促进产业生态迭代优化,加速智能网联汽车产业化进程。目前, 重庆、武汉、上海、北京相继宣布正式向无驾驶人智能网联汽车颁发道路测试牌 照,标志着全自动无人驾驶乘用车商业化运营迈出了新的一步。 政策为智能网联汽车生产企业、产品提出行业标准,加速智驾产品量产落地。 《试点实施指南》明确了智能网联汽车生产企业需具备车辆设计验证能力,模拟 仿真、封闭场地、实际道路、网络安全和数据安全、软件升级、数据记录等测试 验证能力;建立与智能网联汽车产品相适应的产品信息数据库,具备自动驾驶系 统开发和验证工具(含软件和设备);并对车辆的动态驾驶任务执行、接管、最小 风险策略、人机交互、产品运行安全、软件升级、数据记录作出要求,为智能网 联汽车、车企提供了明确的行业标准,有利于推动自动驾驶产品的完善、开发与 落地。
政策推动 L3 级别自动驾驶落地加快,德国 L3 自动驾驶法规或为重要参考。 2021 年底,德国联邦汽车运输管理局允许 L3 级自动驾驶汽车上路,奔驰成为世 界第一家满足条件的车厂。根据德国的 L3 级自动驾驶法案,一旦发生自动驾驶事 故,车厂将承担全部责任。L3 法规将要求车厂承担更多的责任和义务,促进研发 投入。厂商需要确保其自动驾驶系统的安全性和可靠性,以避免潜在的事故和风 险。厂商需要进行充分的测试和验证,确保系统在各种路况和环境下能够正常运 行,并承担由于系统故障或设计缺陷引起的事故责任。这意味着厂商会加大投入, 提升研发团队的规模和实力,不断改进算法、传感器和系统,以提高自动驾驶的 安全性和性能和应对法规要求和市场竞争。中国也有望通过明确的法规框架来推 动自动驾驶技术的应用和发展,为自动驾驶行业的未来奠定良好的基础。 政策对于自动驾驶导致的事故责任认定成为主机厂及 Tier1 技术落地的主要 考虑。根据当前主流自动驾驶级别划分标准 SAEJ3016, L3 是一个驾驶员与车辆 责任的分水岭。在 L3 级以下事故责任由驾驶员承担。如果主机厂宣称自己的方案 达到 L3 级别,就代表主机厂需要在自动驾驶的场景下对车辆事故负责。
国内政策明确高阶智驾事故责任归属,权责清晰,扫清高阶智驾法律障碍。《试 点实施指南》在【第三部分 上路通行】中对试点车的上路细则作出了详细规定, 包含试点车辆报备细则、驾驶员要求、行驶过程规定、交通事故及违法处理措施、 信息数据记录要求,并且首次对高阶智驾事故责任归属给出了明确的法律责任定 义:若车辆在自动驾驶系统未激活状态下发生事故,按现行规定承担责任;在自 动驾驶系统激活状态下发生违法或事故,试点企业与试点使用主体需在规定时间 内向相关部门提供证明材料。若未按规定提供材料,需承担事故责任。此外,《试 点实施指南》智能网联汽车在事故中可以作为责任判定对象,由试点使用主体承 担赔偿责任。如试点汽车生产企业、 自动驾驶系统开发单位有事故过错,试点使 用主体可依法追偿,扫清了高阶智驾法律障碍,有助于推动国内智能驾驶加速商 业化。 从技术层面看,大模型为自动驾驶技术的研究带来了新的思路和方向。受到 语言大模型研究的启发,Transformer 在自动驾驶领域的应用为该领域带来了几 个新的思路和研究方向。其一是借鉴视觉大模型和语言-视觉多模态大模型的思路, 在自动驾驶模型中通过使用 Transformer 注意力机制的性能优势用于感知。通过 让模型具备理解视觉信息含义的能力,可以使其感知能力具备强大的泛化性,从 而解决长久以来困扰自动驾驶落地的Corner Case问题;其二是由于Transformer 的出现,使得训练一个感知-决策架构统一、“端到端”的自动驾驶解决方案成为 可行方案,这种思路也是解决自动驾驶问题的全新思路。
目前工业界己有基于 Transformer 的自动驾驶方案出现。该技术方向在全 球范围内的引领者为特斯拉,国内技术领先厂商为小鹏及毫末智行。 特斯拉于 2021 年 8 月首次提出了基于 BEV 视角和 Transformer 结构的 自动驾驶解决方案,并尝试在超大规模的数据集上采用无监督的方式进行训练, 这成为了后续特斯拉纯视觉方案的指导思想。随后在 2022 年底,特斯拉进一步将 BEV 视图升级到了占用网络(Occupancy Network),占用网络相比 BEV 能够更 好的识别出目标物的高度信息。在 2023 年 8 月,特斯拉进行了 FSD(FSD,Full Self-Driving 为特斯拉的自动驾驶系统,目前尚处于 Beta 版本)Beta V12 试驾 直播,而 FSD Beta V12 是有史以来第一个端到端 AI 自动驾驶系统。
此外,L3 级别自动驾驶技术将推动整个车联网和路网基建行业的发展,为实 现车路协同奠定基础。这种车路协同的实现离不开对车辆和道路的高精度定位、 环境感知和通信技术的要求。车联网行业将成为 L3 级别自动驾驶技术落地的重要 推动力,为车辆提供高速稳定的数据传输和交互平台,实现车辆与车辆、车辆与 基础设施之间的信息共享与协同操作。同时,还将带动路网基建的发展。道路基 础设施的智能化和数字化将得到加强,包括智能交通信号灯、交通监控系统和道 路感知设备的建设和优化。这些基础设施的升级将有助于提高道路网络的安全性、 流畅性和容量,并为自动驾驶车辆提供更好的行驶环境和支持,而这也需要边缘 侧 AI 的技术支持。
华自动驾驶开启发展华为新时代,华为自动泊车 C 端入口值得期待。 HUAWEI ADS 2.0 高阶智能驾驶系统,在融合感知 BEV 网络,识别白名单障 碍物如车、人等物体的基础上,升级了 GOD 网络 2.0,拥有强大的识别及处理能 力,通用障碍物识别率达到 99%,识别种类更精细。HUAWEI ADS 2.0 自 2023 年 4 月发布以来,在 AI 训练集群上构建了丰富的场景库,每天深度学习超过 1000 万 km,持续优化迭代智能驾驶算法和场景策略。截至 2023 年 9 月数据,长距离 NCA 领航 MPI 高达 200km,城市高架汇入汇出成功率高达 99%,可靠程度堪比 “老司机”。
9 月 12 日 AITO 问界新 M7 系列正式上市,新车主要变化在于新增 HUAWEI ADS 2.0 高阶智能驾驶系统,新增 5 座版本。此外,车身结构、底盘用料、悬挂 结构、空间、驾驶舒适性、音响等方面均有提升。既问界 M5 首发华为 ADS 2.0 后,未来 10 余款车型有望持续落地华为 ADS 2.0。
捷停车打造华为无人代客泊车 C 端重要入口。通过深化鸿蒙系统核心应用, 捷停车为 C 端用户带来使用体验的提升。捷停车基于华为持续开放的能力,追逐更先进和更便捷的用户体验,共同打造了基于 HarmonyOS API 开发的捷停车元 服务。元服务拥有多端运行、卡片化体验、主动服务等特性,相对于传统方式的 需要安装的应用形态更加轻量,同时提供更丰富的入口、更精准的分发。 作为智慧停车一体化服务平台,捷停车依托自身庞大的停车场景基础以及精 细化车位运营能力,打造“找车位”产品为车主出行“停车难”提出了新的解决 方案。车主打开车门,坐进 HarmonyOS 智能座舱,下一步就很可能主动“找车 位”。车主可以通过语音唤醒,让小艺帮忙“找车位”,提前找到目的地或附近的 停车点位置,并开启导航服务;还能在“找车位”服务里获取捷停车智慧车场的 收费标准、剩余车位数、24 小时场内车位闲忙状态等。车主还可以在车厢里轻松 完成临停缴费、开通无感支付等操作,在提供预约服务的停车场还能预约车位, 进一步提升了车主的智慧停车体验。公司表示,捷停车“找车位”能力已在 AITO 问界M5、M7车型上应用,后续也将在搭载鸿蒙智能座舱的其他车型上普及应用。 具体来说,车主进入捷停车智慧停车场后,在道闸抬杆的瞬间,车载小艺建议便 会智慧识别并温馨提醒“您已经抵达支持室内导航的车场”,同步显示“停车服务 卡片及本车场余位信息”。
作为鸿蒙核心应用,捷停车有望成为泊车代驾的数字底座和 C 端核心入口, 目前已经在智界 S7 上应用。
1)泊车代驾的核心数字底座:泊车代驾功能下,用户到商场可以直接开到商场入口或是停车场的入口即可离开前去逛街购物,让车自己找停车位,而这种功 能的实现则必须需要对停车场的车位数量信息、空余车位信息、停车场整体楼层 结构等数据有精准的把握。因此,停车场的车位数量信息、空余车位信息、停车 场整体楼层结构等数据是实现相关功能的最基础和关键的底层信息,相关功能的 实现必须要有底层信息作精准的配合,因此捷停车作为泊车代驾的底层基座,捷 停车的联网车场数据和自动泊车系统是有着天然的结合点,在泊车代驾功能的实 现中起到至关重要的作用。根据公司公开公告,截止 2023 年 10 月,捷停车累计 覆盖联网停车场数约 3.9 万个(较 23 年年初增长 8000 个),庞大的覆盖数量以 及持续快速增长的态势,是捷停车成为泊车代驾数字底座的坚实基础。
2)泊车代驾的 C 端核心入口:实现泊车代驾之前,需要精准找到车位并完成 相关服务,对 C 端车主来说可以通过智能化语音唤醒,让小艺帮忙“找车位”,或 者通过华为手机端的捷停车服务卡片提前搜索到有空位的停车场。因此可以看到, 捷停车的“找车位”相关功能实际上是泊车代驾功能的一个重要前序功能,也是 C 端用户实现泊车代驾的一个入口。因此,捷停车有望成为无人代客泊车的 C 端重 要入口。
3)对于捷停车发展来说,深化鸿蒙应用、成为新的 C 端核心入口具有重要意 义:根据公司公开公告,截至 2023 年 10 月,捷停车线上触达车主用户规模超 1.18 亿,其中月活近 5 千万,已经是国内停车领域的重要应用,成为新的 C 端入口后 捷停车的流量有望进一步持续提升,停车相关服务也有望被进一步激活和赋能。
4.2 以 AI Pin 为代表的由 0 到 1 的 AI 终端创新革命
2023 年 11 月,消费硬件初创公司 Humane 推出了名为 Ai Pin 的可穿戴设 备。Humane 成立于 2018 年,总部位于旧金山。Imran 曾任苹果用户界面设计 总监,曾经深度参与过 iPhone 的主屏幕设计,而 Bethany 曾任苹果软件工程总 监,负责 iOS 和 MacOS 的开发,两人因共同参与了初代 iPad 的研发而结缘,成 为夫妻,又在 2017 年双双离开苹果。而且,公司 CTO Patrick Gates 也是苹果之 前的高级工程总监,在 Humane 的两百多员工里,有超过 90 人来自苹果,包括 曾负责 iPhone 触摸屏键盘设计、苹果工业元素设计等工作的员工,以及参与开发 iCloud、Apple Pay 和 Home 等苹果服务基础设施的员工。 Al Pin 为一款没有屏幕、纯靠语音及手势完成交互的无屏幕智能设备,由两 大部分构成,一部分是设备本体,另一部分是能够吸附的磁性电池组。
通过思考 Al Pin 的产品形态设计,可以展望其未来的应用潜力。Al Pin 的电 池部分为单独的磁吸体,在用户拥有多个电池的情况下可无缝更换,从而保证设 备能够覆盖长时间使用的场景;此外,这种补能方式避免了设备充电时非常容易 发生的人和设备物理空间上分离的情况,Al Pin 将尽可能地被用户携带在身边。 目前与 Al Pin 的使用场景和功能最为贴近的可穿戴设备为智能手表。但与之最大 的不同是,Al Pin 被佩戴在胸前,并添加了摄像头方便采集与用户视角基本相同 的视觉画面。因此 Al Pin 将收集到尽可能多的、与用户接受到的保持一致的信息。 AI Pin 的操作系统名为 Cosmos,是公司自研的一个更加无缝的系统,其特 点在于可以自动调用相应的 Al 大模型完成用户需求,实现不同应用之间的无缝切 换和筛选,我们不再需要下载、打开或安装各种应用,即模糊了过去所谓“应用 程序”的边界。此外,AI Pin 的软件方面背靠微软和 OpenAl 的支持,可原生调 用 ChatGPT。 Al Pin 的人机交互方式包括语音、视觉与动作交互三种。其中语音助手 Al Mic 借助 GPT 等大模型实现语音交互;视觉交互的方式为 Al Pin 将信息投影在例如手 掌等物理实体之上,供用户阅读。此外 Al Pin 的摄像头还能够拍摄用户前方视角的图片/视频并进行分析;动作交互利用内置的深度传感器,通过手势操作菜单。 Al Pin 可以根据用户需求、用户数据(如用户的照片、视频和笔记等)以及 对话时的上下文,结合不同的大型 Al 模型和应用程序进行信息处理,并且实时地 对用户的需求给出建议。例如,当用户询问最近的安排时,它可以自动搜索所有 相关信息,并将其总结后呈现给用户。此外,它还具有分类和处理拍摄照片或视 频的功能,以及最简单且常用的翻译功能。
Al Pin 的推出标志着人机交互范式的全面革新。传统的交互设备,如台式电 脑、笔记本电脑和智能手机等,用户通过键入/触控等方式进行交互,由于其硬件 的物理形态的限制,在一定程度上强化了设备硬件与用户之间的分隔;智能手表/ 手环等设备尽管为我们提供了方便的健康监测和信息获取手段,但在功能的全面 性和独立性方面仍有所欠缺;AR 和 VR 设备同样终究未能完全摆脱屏幕的局限。 而 Al Pin 通过语音、视觉和动作交互提供了更自然、无缝的用户体验。此外,Al Pin 采用了一种名为”信标链“的区块链技术,确保用户注册时的所有信息和数据只 属于用户本人,且只有用户可以访问,这在整个人机交互的演进中具有重要意义。
从台式机、便携式计算机,到智能手机,再到可穿戴智能设备以及 AI Pin, 各类硬件在物理空间上与人越来越近,技术的无形化趋势正在逐渐成为主流。 Ai Pin 的硬件配置及售价均可对标手机,展现了其颠覆者野心。Al Pin 设备 搭载 2.1GHZ 专用高通 A1 引|擎的骁龙处理器,4GB 运行内存;搭载的传感器包 括环境光传感器、加速度计和陀螺仪、磁强计、GPS,摄像头可拍摄 1300 万像素 照片;支持蜂窝移动网络、Wi-Fi、 Bluetooth 等无线信号的连接,以及 GPS、 北斗等定位功能。从售价上来看,Al Pin 整套系统包含两个版本,售价分别为 699 和 799 美元。该价格可对标高端的手机,如 iPhone14(699 美元)及 iPhone15 (799 美元)。过去的可穿戴设备一般需要与手机进行交互,作为手机的配件存在, 而 AI Pin 定位为独立的硬件产品,可单独使用。
4.3 以耳机为代表的大模型时代终端战略地位提升带来的 价值重构
耳机作为终端应用落地的重要载体战略地位空前提升。复盘移动互联时代苹 果的成长轨迹, 苹果手机直接与用户交互,坐拥海量交互数据,以此为基础打造 Appstore 应用平台,最终演变为苹果生态。根据高通《混合 Al 白皮书》,边缘终 端在起到传统交互入口的作用之外,正在转变为直接运行轻量化大模型成为真正 的边缘 AI 平台,实现边缘终端不但能自由切换接入不同大模型,还可以使用自有 大模型自成平台。边缘 AI 终端中,相比手机和音箱,耳机便携性优势凸显,或成 为当前阶段发展最快的边缘 Al 终端。 我们对耳机升级路径预判:蓝牙配件一 WiFi 联网一移动信号联网,最终成为 随时随地可以使用的独立的智能助理。目前,耳机主要通过蓝牙连接,这意味着 它们必须通过手机或电脑连接到云端,然后才能进行人工智能和人类之间的交互。 末来,耳机可能会向 WiFi 连接发展,最终走向移动互联网方向。如果实现了 WiFi功能或移动信号联网,耳机将能够直接连接到大模型,使我们能够随时随地访问 大模型。2023 年 5 月 24 日,科大讯飞发布新款智能耳机 nano 系列, 2023 年 6 月 29 日印象 A 录音转写会议耳机发布,AI 耳机发布已成燎原之势。
智能耳机作为 AIA(Artificial Intelligence Assistant)的一个重要载体,面 临着多项挑战,如隐私和安全性问题、大模型的端侧部署以及持续更新问题等。 隐私泄露风险指为了使智能耳机能够有效地执行类似 AIP(Artificial Intelligence Platform)的功能,它们需要集成麦克风、摄像头和传感器来读取 用户信息,这种长时间的陪伴和信息处理可能导致隐私泄露的风险。解决这一问 题的方法尚不明确,因为这一领域的发展还非常新。一种可能的方法是模仿 AI Pin 的做法,消除唤醒词,以减少设备持续监听的可能性,转而使用手势唤醒等方式。 此外,线上信息存储和硬件端信息存储也是需要考虑的问题。 大模型的端侧部署涉及到将云端的大模型有效压缩的问题,以及如何将 AI 内 容集成到现有系统或硬件中,包括与硬件端的芯片等进行结合等。另外,部署后 仍需考虑到基础设施或大模型的持续更新问题。自从大模型首次出现以来,在一 年的时间内 GPT 已经历了从 3.5 版本到 GPT-4,再到 GPTs 的几次重大更新。
(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)
相关报告
计算机行业2024年年度投资策略:2024,AI应用的真正元年.pdf
计算机行业专题报告:万物静息鸿蒙里,开源放量百花齐放开.pdf
计算机行业2024Q2前瞻策略:关注新质生产力与新型基础设施.pdf
计算机软件技术基础完整版.pptx
计算机系统组成与计算机工作原理.pptx
计算机行业算力深度报告:产业链全梳理.pdf
佳发教育研究报告:标考龙头加码AI,智慧教育未来可期.pdf
机械行业2024年春季策略报告:AI拉动算力需求,先进封装乘势而起.pdf
传媒行业专题报告:从F1到FE,从AI到MR应用,以体育赛事为支点,如何撬动体验经济?.pdf
半导体行业投资策略:AI有望推动新一轮半导体周期上行.pdf
生成式AI人居领域应用趋势调研报告.pdf