【东方证券】海外AI应用落地进展梳理:AIgc商业化浪潮将至.pdf

2023-10-26
25页
3MB

一、近期海外 AI 应用进展更新:商业化落地快马加鞭

距离 ChatGPT 的面世即将满一年,大模型带来的技术革命也催化了大量的 AI 应用涌现,现在这 些应用也逐步进入了商业化落地的阶段。海外的 AI 应用由于起步较早,已经有大量的 AI 应用的 商业化走在前列。本文将从海外各类 AI 应用落地进展的更新角度入手,尝试分析目前 AI 应用商 业化的发展已经达到什么阶段,并对国内相应的 AI 应用节奏进行展望。


1.1 科技巨头:AI 全产业链布局,应用端加速推广


海外科技巨头多数进行 AI 全产业链布局,正在加速应用端落地。自 ChatGPT 带来的大模型浪潮 启动以来,微软、谷歌、亚马逊、Meta等海外科技巨头扮演了本次AI大模型浪潮中的重要角色, 多数巨头布局了从 AI 芯片到大模型到 AI 应用的全系产业链。微软在 3 月公布的 Microsoft 365 Copilot 是人们对于基于大模型的 AI 应用的初步想象,经过半年多的研究与发展,近期各家巨头 厂商在应用端的更新也更加频繁,应用端落地正在加速。


1.1.1 微软:365 Copilot 即将上线,大模型嵌入全系软件生态


微软逐步将大模型接入全系软件生态中,C 端用户可以基于同一个底层逻辑体验 AI 能力。3 月份 公布的 Microsoft 365 Copilot 让世界初窥了接入大模型的 AI 应用可能形态,但微软从 2022 年就 一直在不断地探索大模型在旗下各类软件中的结合应用,如今微软已经将大模型能力拓展到了旗 下多款应用产品中。9 月 21 日,微软在发布会上推出了跨设备、跨操作系统、跨应用程序的 AI 伴 侣助手 Copilot,用户可以在 Windows 11、Microsoft 365 以及 Edge 和 Bing 的浏览器中使用。 Copilot 在 9 月 26 日作为 Windows 11 免费更新的一部分正式上线,并将于今年秋天加入到 Bing 和 Edge 浏览器以及 Office 应用中。


全新 Windows 11 提供 150 多项新功能,Copilot 把生成式 AI 能力无缝加入到多款应用中。 Copilot 从操作系统层级提供了强大的 AI 能力,在下一个 Windows 版本中,原生的画图、照片、 剪贴板、记事本等应用程序都将迎来能力升级,例如画图应用新增了背景移除和图层功能,照片 应用新增了图像编辑、背景虚化等功能。Outlook 也加入了 Copilot 的辅助,新版 Outlook 允许用 户在一个应用中连接并协调各种账户(包括 Gmail、Yahoo、iCloud 等)。用户可以让 Copilot 生 成电子邮件,并从 OneDrive 无缝附加重要文件和照片等。


Bing 和 Edge 浏览器新增更多 AI 功能。在更新后的 Bing 和 Edge 浏览器中,微软新增了几个新 的 AI 功能,包括:1)个性化答案,用户的聊天记录可以为结果提供参考;2)Microsoft 购物 Copilot,用户可以通过 Bing 或 Edge 更快地找到在线购物的商品,并且可以智能读取到最优惠的 价格;3)Bing 的图像创建器将更新为 OpenAI 的最新模型 DALL·E 3,图像生成质量迎来大幅 提升,微软还将 Microsoft Designer 直接集成到了 Bing 中,用户可以更轻松地编辑作品;4)内 容证书,Bing 中所有 AI 生成的图像将自动添加隐形数字水印,包括最初创建的时间和日期。另 外,画图和 Microsoft Designer 中也增添了此功能。




针对 B 端用户,Microsoft 365 Copilot 将于 11 月 1 日面向企业用户全面推出。企业用户是 AI 应 用商业化的重要收入来源,微软此次正式宣布 365 Copilot 开启商用,是 AI 应用落地的一大步。 此外,微软还为 365 Copilot 推出了一项新功能:Microsoft 365 Chat, Microsoft 365 Chat 最初 的名称是 Business Chat,经过几个月的飞速发展,现在已经提升到了一个全新的高度。它可以 梳理工作中的所有数据,包括电子邮件、会议、聊天、文档等。就像一个助手,它可以对用户、 用户的工作、优先事项和组织有深入的了解,无论是撰写战略文件、预订商务旅行,还是处理电 子邮件,它都能解决最复杂、最乏味的任务。


微软 Power Platform Copilot 能力迎来更新。Power Platform 是微软的低代码平台,是微软布局 企业服务领域的重要抓手。在 3 月份微软就推出了 Power Platform Copilot,通过 AI 大模型驱动 的方式重塑软件开发。在 10 月初的 Power Platform 大会上,微软针对 Power Platform 推出了多 项人工智能更新,一是在低代码应用开发中,Copilot 能够支持开发者用自然语言输入进行更加复 杂的应用开发,包括添加多个 Dataverse 作为数据来源,并通过 Power Virtual Agent 扩展 Copilot 能力;二是将 Power Platform 现有的连接器与 Microsoft 365 Copilot 插件集成,用户可以直接在 Copilot 中直接调用插件的相关能力。对于 OpenAI 现有插件,开发者或 ISV 能够通过 Power Automate 将其快速集成至低代码应用当中。可以预见,在 Copilot 能力的加持下,用户使用低代 码进行 APP 开发的门槛将会越来越低,并且能够不断丰富微软的插件生态,推动 Power Platform 和 Microsoft 365 Copilot 两个业务共同发展。


1.1.2 谷歌:C 端产品软硬件更新,B 端医疗行业率先落地


谷歌人工智能搜索 SGE 更新文生图功能。10 月 13 日,谷歌宣布其 AI 搜索功能 SGE(Search Generative Experience)迎来功能更新,用户现在能够直接在 SGE 中使用提示生成图像,类似 于 Bing 和 OpenAI 的 DALL-E 3 的结合方式。通过新的 AI 图像生成功能,用户可以输入创建图像 的prompt,SGE会直接返回四张图像结果,用户可以对其进行进一步调整。这一功能的底层模型 是谷歌的 Imagen 文生图模型,Imagen 模型由谷歌在 2022 年 5 月推出,其语言模型部分使用的 是谷歌自家的 T5-XXL,图像生成模型部分则是一系列的扩散模型。


谷歌 Pixel 8 系列手机接入大模型,新增多项 AI 功能。在 10 月的 Made By Google 硬件大会上, 谷歌发布了全新的 Pixel 8 系列手机,全系搭载 Google Tensor G3 处理器,提供系统层级的 AI 功 能支持。新增的 Magic Editor 功能让用户通过简单操作即可对图像进行复杂的编辑;Audio Magic Eraser 功能可以识别声音中的噪音部分并将其减少;Pixel 8 Pro 还独占推出图像缩放增强功能, 在图片放大后通过生成式 AI 来对低像素部分进行超分辨率。Pixel 8 Pro 将是首款在本地搭载 Google AI 基础模型的设备,用户可以在离线状态下使用这些 AI 功能。


谷歌宣布面向安卓与 iOS 设备,推出“Bard 助理(Assistant with Bard)”。Bard 助理将手机 的个人助手功能与生成式 AI 相结合,用户可通过文本、语音或图像与 Bard 助理互动,并能够与 Google Workspace 文档、Gmail 等应用直接集成。例如,当用户询问“本周我错过了哪些重要邮 件”时,Bard 助理会列出各项要点及具体内容,并附上具体对应邮件的链接,还可以帮助用户提取活动地址并在谷歌地图中显示。目前 Bard 助理还处于早期测试阶段,将在未来几个月内向公众 推出。


谷歌助力生成式 AI 落地医疗领域。谷歌在 2023 年 5 月推出了医学大模型 Med-PaLM 2,在医疗 执照考试和多模态医疗 AI 等问题上达到了专家级的表现,它不仅可以处理文本,还可以处理 X 射 线和其他类型的输入等医学图像。谷歌云针对医疗与生命科学行业的公司推出了新的 Vertex AI 搜 索功能,基于该工具当前搜索许多不同类型文档和其他数据源的能力,帮助组织更有效地找到准 确的临床信息。


针对生成式 AI 版权问题,谷歌提供完善的防护与赔偿机制。为了尽量保证生成式 AI 工具的安全 性,谷歌采用了多种手段。首先,通过谷歌生成式 AI 生成的图像都将添加元数据标签和 SynthID 水印,SynthID 是 DeepMind 于 2023 年 8 月推出的一种为 AI 生成的图像加上水印的工具,该技 术可以将数字水印直接嵌入图像的像素中,人的肉眼无法察觉,但可以由计算机检测到。即使是 在对图像进行了添加滤镜、更改颜色和亮度等修改后,水印也仍可以被检测到。其次,谷歌即将 推出“关于此图像”功能,用户可以通过此功能直接查询到图片可能存在的更多信息,例如首次 被谷歌编入索引的时间、可能的最初来源、网络上其他出现的位置等。通过这些信息,用户可以 更好地判断图像是否可靠。谷歌正在推动其他 AI 生成厂商在生成的图片中加入标签信息,未来将 有望直接从“关于此图像”中了解该图片是由哪一家厂商生成的。同时,为了更好地保护用户的 权益,谷歌宣布为 Duet AI 和 Vertex AI 的用户提供版权诉讼保护,如果用户因为版权原因受到质 疑,谷歌将对所涉及的潜在法律风险承担责任并进行赔偿。


1.1.3 Meta:让 AI 赋能 2C 应用


Meta 宣布将 AI 引入旗下产品与设备中。9 月召开的 Meta Connect 2023 上,扎克伯格提到公司 正在将最先进的 AI 带入覆盖数十亿人使用的应用程序,Facebook、Instagram、WhatsApp 等社 交软件。基于 Meta 的大语言模型 LLaMA 2、图像生成模型 Emu、分割模型 SAM,用户可以在 Meta 旗下的社交应用中体验 AI 表情、AI 图像编辑、AI 图像背景替换等功能。


Meta推出Meta AI,进军聊天机器人领域。Meta AI是一款类似于ChatGPT的聊天助手,在 Meta 旗下的社交应用中均可使用,并即将推广到 Meta 的 MR 眼镜 Quest 3 中。Meta AI 是一个通用助 手,能够直接接入 Bing 搜索引擎提供实时网络结果。与 ChatGPT 不同的是,Meta 还在旗下社交 应用中推出了 28 个 AI 角色,拥有不同的背景故事和人设,用户可以自由地与不同的 AI 角色进行 聊天社交,这些 AI 角色还在不断增加。




1.1.4 亚马逊:重点推进生成式 AI 企业服务


亚马逊生成式 AI 的重心更偏向于企业服务。与微软、Meta、Google 等巨头不同,亚马逊没有将 重点放在自研的大模型上,而是放在如何为企业提供更好的生成式 AI 服务上。9 月,亚马逊宣布 了一系列生成式 AI 企业服务更新:1)亚马逊旗下的生成式 AI 服务框架 Amazon Bedrock 正式可 用;2)代码助手 Amazon CodeWhisper 可以进行定制化,能根据企业内部 API、代码库和实例 等进行微调;3)Amazon QuickSight 的生成式 BI 功能上线预览版。


亚马逊战略投资 Anthropic 40 亿美元,扩展其 AI 产业链布局。9 月 25 日,亚马逊宣布与大模型 厂商 Anthropic 达成战略合作,亚马逊投资 40 亿美元,AWS 将成为 Anthropic 未来大模型研发的 主要云提供商,Anthropic 将使用 AWS 自研的 Trainium 和 Inferentia 芯片来构建、训练和部署其 未来的基础模型,并通过 Amazon Bedrock 为 AWS 的客户提供其模型的访问权限。通过这笔投 资,亚马逊持续拓展其在芯片层、模型层和应用服务层的全栈布局。


1.2 B 端企业服务:持续深化 AI 在原有产品领域赋能


1.2.1 Salesforce:收购 Airkit.ai,深入布局 AI 领域


在 Dreamforce 2023 上,Salesforce 宣布推出了 Einstein 1 平台。该平台对 Data Cloud 和 Einstein AI 功能进行了重大改进,所有这些都基于 Salesforce 的底层元数据框架构建。Einstein 1 平台使公司能够安全连接任何数据,以低代码构建人工智能驱动的应用程序,提供全新的CRM体 验。Salesforce 同步推出了全新的 Data Cloud 和对话助手 Einstein Copilot。Data Cloud 是 Salesforce 的实时超大规模数据引擎,是 Salesforce 生成式 AI 的基础。Data Cloud 目前每月处理 30 万亿笔交易,每天连接和统一 100 亿条记录。Einstein Copilot 通过协助用户完成工作流程来提 高生产力,用户能够用自然语言进行提问,并获得基于 Data Cloud 的答案。


10 月 16 日,Salesforce 正式宣布收购 Airkit.ai。Airkit.ai 于 2017 年创立,其创始人曾于 2014 年以 3.9 亿美元的价格将 RelateIQ 出售给 Salesforce。Airkit.ai 提供了一个易于使用的 AI Agent 平台,重点关注商业行业,回答与订单状态、退货、订单问题或产品支持有关的问题。Airkit.ai 基 于 GPT-4 提供服务,专注于解决客户查询,承诺即时解决 90%以上的客户问题。Salesforce 旗下的 AI 产品中也提供聊天机器人服务 Live Agent,该功能现在已无缝集成到 Service Cloud 中。通 过本次收购,将帮助 Salesforce 深化在 AI 服务、AI 营销等领域的布局。


1.2.2 SAP:发布人工智能助手 Joule


9 月 26 日,SAP 发布了生成式 AI 助手 Joule。Joule 以 SAP 现有的 Business AI 产品为基础进 行了增强,Joule 将嵌入 SAP 的企业云解决方案中,能够和 SAP 的各种业务系统进行深度交互。 Joule 的使用场景涵盖 HR、财务、供应链、采购和客户体验,以及 SAP 业务技术云平台。员工 只需用简单的语言向 Joule 提问或描述问题,就能从 SAP 解决方案和第三方来源的海量商业数据 中获得答案。比如,Joule可以帮助制造商识别销售表现欠佳的地区,并与其他数据集建立关联, 揭示供应链等方面的问题,然后自动连接到供应链系统,给制造商提供可能的解决方案供其参考。 Joule 将于今年晚些时候率先在 SAP HR 云解决方案和 SAP Start 中供用户使用,并于明年初在 SAP S/4HANA 公有云版本上搭载。SAP CRM 云、SAP 采购云和 SAP 业务技术云平台也将陆续 在之后上线。


1.2.3 C3.AI:发布全新生成式 AI 套件


9 月 6 日,美国 C3 AI 公司宣布推出 C3 Generative AI 套件,其中包括 28 个新的特定领域生成 AI 产品,可满足行业、业务流程和企业系统的独特需求。C3 的生成式 AI 最初于今年 3 月发布, 已经在多家美国机构中获得了应用,受到广泛好评。现在 C3 Generative AI 套件中的解决方案都可以直接从公司官网或是云厂商合作伙伴处直接订购,C3 支持客户在 12 周内完成生成式 AI 解决 方案的部署,成本为 25 万美元,之后将按照 vGPU 使用小时数计费。


1.2.4 ServiceNow:发布 Now Assist 企业 AI 套件


9 月 22 日,ServiceNow 发布了 Now Assist 企业 AI 套件,Now Assist 是基于 ServiceNow 的 Now Platform 的生成式 AI 服务,由 ServiceNow 自家的生成式 AI 引擎驱动。现在 Now Assist 提 供针对 IT 服务管理、客户服务管理、HR 服务交付和创作者的四种解决方案,在工作流程中嵌入 生成式 AI 能力,帮助客户提高生产力、改善体验并提高敏捷性。


B 端服务公司将持续探索 AI 大模型与原有产品和实际应用场景的结合。从海外来看,SAP、 Salesforce 等老牌企业服务厂商在今年上半年就已经多次展现了自己在 AI 大模型领域的进展,有 的已经形成了较成熟的产品并且开始对外提供服务。进入2023年三季度以来,这些公司仍在持续 探索 AI 与自身产品的结合,希望能让 AI 深度赋能到应用场景。我们认为,目前 B 端服务软件公 司与 AI 的结合已经是大势所趋,经过接近一年的摸索,现阶段的 ToB 公司基本已经实现了 AI 能 力和原有产品的初步结合,但结合程度仍比较浅,未能深入到更加细化的场景。今年四季度到明 年年初都仍将是深化 AI 在自身产品和应用场景赋能的阶段。




1.3 C 端:多模态能力涌现


1.3.1 Adobe:Adobe MAX 2023 大会召开,Firefly 系列模型更新


10 月 10 日,Adobe MAX 2023 大会正式召开。软件巨头 Adobe 推出了三个新的生成式人工智能 模型,分别为“第二代萤火虫图片模型”(Firefly Image 2 Model)、“萤火虫矢量模型” (Firefly Vector Model)和“萤火虫设计模型”(Firefly Design Model)。 与第一代 Firefly 相比, Firefly Image 2 模型可生成质量明显更高的图像,尤其是在渲染逼真的人体时,涉及树叶、皮肤 纹理、头发、手和面部特征等高频细节。Firefly Vector 模型适用于 Adobe illustrator,是世界上第 一个可生成矢量图的 AI 模型,用户可使用文本 prompt 创建可编辑的矢量图像,并自动将图形的 每个元素拆分为“逻辑组”和图层。Firefly Design 模型采用即时端到端设计,支持与图像模型结 合快速生成模板设计,支持大量主流比例模板,并在 Adobe Express 中直接编辑。除此之外, Adobe Creative Cloud 中所有软件几乎都新增了 AI 驱动的创新功能。


企业客户方面,Adobe 推出了 2B 的全新的端到端解决方案 GenStudio。GenStudio 以 Firefly 为 生成核心,能为品牌方提供基于生成式 AI 的能力来加速内容构思、创作、制作和激活的一系列产 品。企业可以在数字资产管理系统Adobe Experience Manager Assets中,通过Express和Firefly 对用于商业用途的数字内容进行即时编辑,加速企业内容供应链流程。Adobe 允许企业使用品牌 自己的风格、角色和对象来定制和微调 Firefly,并且能将定制的 Firefly 模型完全集成到企业的 Creative Cloud 工作流程中并自动化生产工作。


1.3.2 Canva:推出 AI 设计工具 Magic Studio


10 月 4 日,Canva 正式推出 AI 设计工具 Magic Studio,一次开放了十几种 AI 功能,涵盖了目 前几乎所有的 AI 设计工具功能,真正做到了“一站式 AI 设计工具箱”。Magic Studio 包含了一 键进行设计生成的 Magic Design、一键转换设计风格的 Magic Switch、一键文生图和视频的 Magic Media、一键生成文稿的 Magic Write 等 9 大 Magic 生成式 AI 能力,并且通过 Canva 应用 市场整合了图像生成工具 DALL-E、Imagen,虚拟主播 Nerio AI,语音生成工具 PlayHT 等多种 AI 工具和应用。目前 Magic Studio 可以面向个人免费试用,面向企业则需要 300 美元/年起步。


1.3.3 Character.AI:群聊功能


10 月 11 日,Character.AI 推出了一项新的群聊功能(Group Chat):C.ai+的订阅用户现在能和 平台上 1800 万个聊天机器人建立群聊,订阅收费为每月 9.99 美元。目前网站上绝大多数的 AI 机器人都是由其用户创建的。定义 AI 角色后,用户可以在后续的聊天中持续训练自己的 AI,让它以 特定方式与你互动。对于群聊功能的提出,Character.AI 的回应是希望能赋予人们与各种不同的 聊天机器人角色互动的能力,而不是局限于拥有一个单一、无所不包的 AI 伴侣。


C 端产品更加注重多模态、情感陪伴等方向。考虑到生成式 AI 本身的特性,2C 产品会更加集中 于文本图像生成、聊天、陪伴等方向。类似于 Adobe 和 Canva 这类设计工具产品基于大模型的多 模态能力,为自身原有产品附加 AI 能力,给用户更加方便高效的体验。而像 Character AI 这样的 AI 原生应用厂商则能够更全面地开发生成式 AI 的可能性,在聊天和陪伴体验上不断提升,延长用 户的使用时间。我们认为,2C 的 AI 应用具备更大的灵活性,且不断有初创公司基于生成式 AI 的 特性来开发使用场景和应用,落地节奏会更快。


二、GPT-4V 引领多模态能力跃升,广阔应用场景未 来可期

2.1 OpenAI 更新 DALL·E 3 和 GPT-4V,多模态能力迎 来跃升


OpenAI 宣布旗下文生图模型 DALL·E 即将升级至 DALL·E 3。9 月 20 日,OpenAI 在官网上 更新了 DALL·E 3 模型的最新信息,相比去年发布的 DALL·E 2,在提示词相同的情况下, DALL·E 3 对文字的理解程度及生成的图像质量显著提升。时常被诟病的“无法在图像上生成文 字”的问题,也在这次升级中得到了解决。


DALL·E 3 将于 10 月首先向 ChatGPT Plus 和企业版 客户开放,之后在秋季稍晚些将提供 API 接口并面向公众开放。 DALL·E 3 原生集成至 ChatGPT,用户无需进行复杂的提示词工程。目前的文生图系统大多将 重点放在生成图像的质量和水准上,而忽略了文字和描述的重要性,这使得用户不得不学习复杂 的提示词工程,例如 Midjourney 要求用户必须按照其指定的提示词规则进行输入才能达到比较好 的生成效果。而 DALL·E 3 通过集成 ChatGPT,使文字生成图像这一过程中的“文字”部分实现了质的飞跃。用户进行用自然语言对想要生成的图片进行描述,就可以直接在 ChatGPT里实现 图片生成。


OpenAI 正式上线 GPT-4V(ision),为 GPT-4 带来语音与图像功能。在 3 月份 GPT-4 正式亮 相之时,OpenAI 简要展示了 GPT-4 的图像识别能力,可以对直接输入的图片进行处理分析,但 这项能力一直未对外开放。直到 9 月 25 日,经历了长达半年的安全性调试,OpenAI 才将这项能 力正式对外开放,同时还为 ChatGPT新增了语音功能,用户可以直接与模型进行语音交互。根据 OpenAI 官网,语音对话功能目前将仅限于 iOS 和安卓手机端,网页端暂时不开放。从官网给出 的示例来看,现在 ChatGPT 可以选择 5 种不同的声线,用户可以与 ChatGPT 辩论、让它讲故事 等,通过给 ChatGPT 发送图片,可以让它帮忙排查问题、根据冰箱里的食物安排晚餐食谱等。




2.2 GPT-4V 多模态能力打开 AI 应用想象空间


微软详尽报告展现 GPT-4V 强大多模态能力,有望落地多领域应用。在 GPT-4V 上线后不久,微 软团队发布了一篇 166 页的论文,详细测评了 GPT-4V 在图像理解方面的能力,多模态的 GPT4V 将有望应用到多个行业领域中。 1) 医疗领域 GPT-4V 可以用于医学图像理解。根据微软的评测,对于给定的一幅手腕 X 射线图像,GPT-4V 可以对患者的手腕情况进行正确诊断并生成完整的放射学报告,但是对于另一张类似的手腕 X 射 线图像,GPT-4V没有发现明显的桡骨远端骨折。我们认为,GPT-4V展现出了对医疗影像的一定识别能力,且其按照医学标准生成的报告质量较高,可以作为辅助手段来减少医疗工作者在撰写 报告时的工作量。但是由于医疗行业的安全性要求,必须有专业人士对其生成的结果进行评估, 无法完全替代医疗人士。


2)工业制造业领域 GPT-4V 可以做到较为精确的缺陷检测。在工业制造业领域,缺陷检测是保证产品质量的制造过 程中的一个重要步骤,及时检测缺陷或故障并采取适当措施对于最小化运营和质量相关成本至关 重要。根据微软的测评,GPT-4V 对于比较明显的缺陷能够进行精准检测,但对于信息不够充分 的物品或者不太明显的缺陷,GPT-4V 难以直接做出判断。如果在 prompt 中提供了参考的图像案 例后,GPT-4V就能准确识别出在单图像检测中失败的案例。我们认为,GPT-4V具备强大的基础 图像理解能力,具有很高的潜在价值应用,如果针对工业场景进行微调训练后,有望在工业制造 业领域展现价值。


3)教育领域 GPT-4V 具备视觉解题能力。根据微软的测评,GPT-4V 具备广泛的科学常识和数学推理能力。 在面对数学问题时,GPT-4V 能够以结构良好的方式呈现解决方案,分步解决问题,展示了其提 供清晰解释的能力。我们认为,GPT-4V 在科学知识上的积累,以及其良好的逻辑能力和推理能 力让其对回答科学问题表现优良。多模态的输入使其更能适应真实的教学场景,未来,其在智能 辅助教学,教育机器人等教育应用领域的发展前景可观。


4)金融领域 GPT-4V 的图像理解能力可以用于保险理赔。微软将 GPT-4V 用于汽车车祸的保险理赔,该流程 分为两个阶段,车祸中的损害评估和保险报告生成。GPT-4V 可以准确识别和定位汽车损害,在 一些情况下甚至努力给出维修费用。在第二个阶段,GPT-4V 可以识别图像中描绘的车辆的品牌, 型号和车牌,并以 JSON 格式返回获取的信息,但是对于损伤较大的部分可能会出现识别错误或 者无法识别的情况。我们认为,实际的保险理赔流程中会提供不止一张图片作为评判的依据, GPT-4V 在单图像输入的情况下能够做到准确识别大量关键信息已经证明了它在保险领域的应用 潜力。


5)个人助理 Agent GPT-4V 具有 GUI 导航能力,有个人助理应用的潜力。微软测评了 GPT-4V 在与计算机或智能手 机的图形用户界面交互和导航的能力,因此可以帮助用户进行网页浏览、搜索、在线购物等操作。 微软还通过为 GPT-4V 提供多样的多模态插件比如 Bing 图像搜索等,建立起一个多模态链系统, 从而能够让 GPT-4V 实现更高级的推理和交互,多模态链的灵活性允许对多模态数据进行更全面 的理解和分析,并可能在各种应用中提高性能。我们认为,GPT-4V 的强大能力能够成为个人助 理 Agent 的核心大脑,如果能够结合更多的插件、自我反思、检索增强生成等框架后,GPT-4V 应用到个人助理 Agent 领域有很大的潜在价值。


6)具身智能 GPT-4V 有作为具身机器人的理解核心的潜力。微软对 GPT-4V 在具身智能方面的应用也进行了 测试,让 GPT-4V 扮演一名家庭机器人,去阅读咖啡机操作界面来给出指令操作。通过房间图片 的输入,要求 GPT-4V 去厨房冰箱取物品,GPT-4V 可以执行面向任务的导航。我们认为,GPT-4V 的图像识别能力可以成为具身机器人的“眼睛”和“大脑”,具有多模态输入的 GPT-4V 在面 对动态环境时可以很好地与环境交互,具身机器人结合大模型的发展将会到达一个新的高度。




三、商业化进展备受关注,AI 增量空间正在打开

AI 应用商业化落地情况和增量空间是市场关注的重点。海外的 AI 应用由于起步较早,已经有大 量公司在 AI 应用商业化上走在前列。国内在陆续出台了针对生成式 AI 算法的监管法案《生成式 人工智能服务管理暂行办法》 、《生成式人工智能服务安全基本要求(征求意见稿)》之后,首 批 8 家通过备案的大模型厂商均推出了相应的 C 端聊天应用,B 端企业服务的 AI 应用也正在逐步 试点推进中。我们认为,目前国内 AI 应用商业化落地的大环境条件已初步具备,一些进展较快的 产品已经明确了定价模式与部署方案,正在推广,AIGC 的新一波浪潮正在形成。市场关注的重 点已经进入到对 AI 应用产品化、商业化方案的跟踪上,以及 AI 大模型的接入能为产品带来多少 增量价值。


进展较快的国内公司已经开放明确的定价收费模式。C 端产品落地更加灵活,整体的商业化节奏 会较快,像万兴科技、福昕软件等有较大海外市场占比的公司产品,能够以 OpenAI 的模型作为 基础进行研发和推广,其 AI 产品的推进节奏更快。而国内的 B 端企业服务厂商大部分的服务对象 是国内的企业客户,AI 的应用在前期受到监管政策未明确的限制,推进进度略慢于 C 端,大部分 的 2B 厂商目前均已公开了自家的 AI 产品情况,仅有少量的以订阅制为主要商业模式的产品进入 了开放定价阶段。


从收费方式看,大部分 AI 应用的定价模式是为 AI 功能模块增量定价。除开 AI 原生应用之外,大 部分公司会先将 AI 赋能于自身的原有产品中,故带来的主要定价模式是为接入大模型的 AI 功能 进行增量定价,用户需要在原本产品的基础上付额外的费用来购买 AI 功能或者带有 AI 功能的高 级版本。在现阶段大模型成本仍较高的情况下,AI 功能带来的增量价值体现在收费上的弹性空间 也较大,部分订阅制产品的定价幅度提升超过 100%。


大模型成本成为影响 AI 应用商业化定价的重要因素,按使用量收费成为趋势。由于算力持续紧 缺,英伟达算力供应速度无法跟上庞大的 AI 需求,算力成本持续走高,极大程度上影响了当前大 模型应用的商业化落地,成为了 AI 应用厂商在定价时考虑的重要因素。从定价模式来看,很多公 司也因此采用了针对于使用量进行限制或者按使用量进行收费的定价方式,比如 Adobe 按月购买 生成点数,钉钉每年规定了使用次数上限等,都是厂商在成本和收费之间做出的妥协措施。


AI 应用厂商通过大小模型结合以控制落地成本。从目前全市场大模型 API 的调用价格来看,国内 大模型的 API 使用价格已达较低水平,基本和 OpenAI 的 GPT-3.5-Turbo 一致,但 GPT-4 的使用 价格则要远远超过其他大模型。对于应用厂商来说,如果能尽量少去调用大模型能力,就能够控 制产品的成本,从而提升更大的利润弹性空间。在大模型浪潮来临之前,一些 AI 应用公司也积累 了一些和自身产品相关的 AI 能力,比如 OCR 等基础的 AI 小模型。目前很多公司也正在积极探索 大小模型的结合使用,在 AI 产品中仅在需要的时候调用大模型的核心能力,部分基础的能力用原 有的小模型来替代,以此达到控制成本的目的。


B 端 AI 应用商业化以赋能原有产品为主,预期 24 年能有收入端体现。目前 2B 的 AI 应用厂商的 主要发展方向是将大模型能力接入到原有的产品中,以提升原产品的智能化程度和用户使用体验 为主,像 Salesforce、微软、SAP 等海外领先的企业服务厂商的产品都是着重在提升原有产品的 AI 体验上,国内 2B 的企服厂商也呈现出类似的趋势。由于 B 端产品整体实施流程更长,很多用 户对于新技术一般会抱有观望态度,有一个市场教育的环节,所以目前 B 端 AI 应用厂商的商业化 推进进程会相对较慢。我们认为,目前大部分的 B 端 AI 应用厂商已经进入了商业化落地尝试的初期阶段,部分厂商已经有了明确的定价模式并开始推广,预期 23 年 Q4 会有更多厂商持续推进商 业化进程,2024 年 AI 带来的价值增量将能够在收入端有所体现。


中长期增量空间值得期待。目前 AI 应用在传统市场里的渗透率仍处于非常低的状态,大部分用户 对 AI 带来的技术革新仍处于观望阶段。从中长期视角看,随着 AI 能力在传统应用市场中的渗透 率不断提升,有望打破传统应用市场空间天花板。以办公软件和 CRM 为例,根据 Statista 预测, 2023 年全球的办公软件市场规模约为 278 亿美元;根据 Fortune Business Insights 预测,2023 年全球 CRM 的市场规模约为 711 亿美元。根据微软 365 Copilot 和 Salesforce 的 Einstein 带来的 定价增幅来看,假设 AI 能力能够为办公软件应用带来平均 80%的客单价提升,为 CRM 带来 30% 的平均客单价提升,在中长期渗透率达到 30%的情况下,其市场增量空间分别为 67 亿美元和 64 亿美元。考虑到 AI 在其他 IT 软件领域如 OA、ERP、工业软件等带来的增量,中长期的增量空间 可达数百亿美元。


 



(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)


相关报告

海外AI应用落地进展梳理:AIGC商业化浪潮将至.pdf

中科创达研究报告:全球领先智能操作系统提供商迎终端AI机遇.pdf

Astera Labs公司研究:数据中心连接方案独角兽,产品受益于AI服务器强劲需求.pdf

业务视角的中国企业AI+学习发展报告,燃动智火.pdf

2024年生成式AI行业调查报告.pdf

传媒行业专题报告:AI+IP,AI多模态下的卖水人.pdf

固态电池行业专题报告:eVTOL商业化临近,固态电池迎来新机遇.pdf

腾讯控股研究报告:视频号进入商业化关键期,拉动高质量增长.pdf

科兴制药研究报告:稀缺的全球新兴市场医药商业化平台,海外大有可为.pdf

科笛研究报告:商业化为帆,创新作桨,迈向领先泛皮肤学平台型企业.pdf

可控核聚变行业专题报告:政策、技术、资本合力推动,聚变能商业化前景可期.pdf

【东方证券】海外AI应用落地进展梳理:AIgc商业化浪潮将至.pdf-第一页
联系烽火研报客服烽火研报客服头像
  • 服务热线
  • 4000832158
  • 客服微信
  • 烽火研报客服二维码
  • 客服咨询时间
  • 工作日8:30-18:00