【东吴证券】AI搜索行业深度：大模型催生搜索行业变革机遇，产品百花齐放效果几何？.pdf

2024-04-17

53页

10MB

1. AI搜索产品涌现，攻克传统搜索痛点

搜索引擎发展历程：信息检索效率逐步提升

搜索引擎：根据用户需求与一定算法，运用特定策略从互联网检索出指定信息反馈给用户的一门检索技术，纵观搜索引擎发展历程，随着信息量的不断膨胀，搜索引擎的发展趋势就是更为高效、精准检索并返回匹配用户需求的内容。随着AI等技术的加入，我们认为当前搜索引擎已逐步进入下一阶段，即以用户为中心，更好理解用户语义，并支持个性化推荐和跨模态、跨语言检索、交互等。搜索引擎鼻祖：Archie。Archie搜索的信息资源不是网页，而是FTP服务器上的文件名信息，用户需输入精确文件名进行检索。分类目录阶段：以Yahoo为代表，特点是人工分类存放网站的各种目录。文本检索阶段：以谷歌、百度为代表，随着网络信息爆炸，用户需要高效检索内容，因此出现了以谷歌为代表的，建立在网页链接分析技术基础上，使用关键字对网页进行搜索。链接分析阶段：仍以谷歌、百度等为代表，在文本检索基础上，深入分析网页连接中的信息，对网页重要性进行筛选。搜索引擎使用场景：以信息检索、资讯获取、网站导航入口等为主，近年来垂类应用的增长，用户移动端的购物、视频、攻略等搜索需求被分流至特定垂类应用内。

搜索引擎市场：谷歌为全球龙头，国内百度稳坐第一

搜索引擎商业化变现以广告为主：在搜索界面展示广告，以用户浏览、点击等数量作为广告价值依据。以谷歌和Bing为例，2023年全球搜索市占率第一的谷歌网站广告收入（主要为搜索和YouTube，以搜索为主）达2065亿美元，2023财年微软搜索广告收入达122.1亿美元（主要来自Bing搜索和微软广告业务）。国内方面，根据易观分析数据，2020年中国搜索引擎广告市场规模达1063亿元。以国内搜素引擎市占率第一百度为例，其2020、2023年在线营销服务收入（主要来自百度网站、百度联盟等）分别为728、812亿元。

AI搜索引擎：去除广告及冗余信息，高效简洁反馈内容

传统搜索引擎的检索包括处理数据——检索——匹配并返回结果。传统搜索引擎的工作流程可以分为：1）收集并处理互联网上的海量数据；2）为数据建立索引并设计检索算法，以便快速找到相关数据；3）收到用户发出的检索指令后，拆解指令，将指令中的核心信息与海量数据进行匹配，最终呈现相关度最高的结果。

传统搜索引擎用户使用体验逐步下降。随着数据的不断膨胀，以及广告商业模式的开启，传统搜索引擎的内容冗余、搜索获得感及效率低下的问题开始显现，比如，当用户检索某个问题时，希望得到的是全而准确的答案，但由于传统搜索引擎根据匹配结果返回的是多个网页内容，中间还参杂广告，用户需点击进入多个网页进行信息获取。

AI搜索通过AI理解用户意图、高效召回内容、生成全而准的内容，有效解决传统搜索痛点。检索增强生成（RAG）技术是目前AI搜索的核心技术之一，包括信息检索和答案生成两部分，即在数据库中检索用户问题的相关内容，并形成总结输入大模型，并由大模型输出最终答案，且答案具备索引功能，能对外部信息来源进行标记。通过RAG技术，一方面可以规避大模型“胡说八道”信息不准确无法溯源、时效性不足的问题，另一方面输出结果比传统搜索引擎信息浓度更高。

百度文心一言：用户规模平稳，联网搜索能力有限

文心一言于2023年3月16日首次亮相，并在同年8月31日正式开放，目前具有网页版和APP版。文心一言具备文本分类、情感分析、智能问答等自然语言处理任务的能力。两个亮点：1）多模态生成能力，能够生成文本、图片、音频甚至视频内容。2）支持大量的插件和百宝箱功能。缺点在于，免费版不提供搜索结果的网址。免费版基于文心大模型3.5，开通会员可切换为文心大模型4.0，并支持来源参考展示，更长的输入输出字数、图片生成、视频生成等功能。

秘塔AI搜索：无广告的学术研究利器，自动生成思维导图与大纲

秘塔AI搜索：基于自研MetaLLM大模型的搜索工具，提供无广告、高质量的搜索结果。产品亮点：1）包含引用源。2）自动生成大纲、思维导图、相关事件和人物。3）在数亿篇文献中筛选有用信息，助力学术研究。秘塔AI搜索在2023年3月的总流量环比上升512.6%，在国内AIGC产品中领先。

上海秘塔网络科技有限公司成立于2018年4月，是AI领域的一家新锐科技公司，致力于打造AI生产力产品。目前，秘塔科技已经拥有上千万用户，总部位于上海市徐汇区，并成立北京和成都两大研发中心。公司在AI搜索、AI写作、法律翻译等方向上开展研发与产品落地。公司基于自身业务特点和技术积累自主研发了大语言模型MetaLLM，该模型于2023年通过《生成式大模型备案》（第二批）、《大模型算法备案》（第二批）。

秘塔搭建了一个围绕自研大模型技术输出到产品落地的正循环：秘塔科技基于自研的 MetaLLM 大模型，在应用层做了各种尝试。自研大模型给自有产品提供了底层能力支撑，在具体应用场景中服务 b 端和 c 端用户，并产生新的数据反馈，帮助大模型实现迭代。

除了秘塔AI搜索，秘塔科技的其他产品包括：1）秘塔写作猫：一款AI写作辅助工具，具备改错、改写和插件功能，旨在提升文章质量和工作效率。2）秘塔翻译：专为法律人训练的机器翻译系统，专注于法律文书翻译，提供安全、专业和快捷的服务。3）MetaLaw：通过技术简化文档工作流程，提供高效、减少错漏和知识管理的解决方案。

2. AI搜索测评：重构搜索，但仍有较大优化空间

AI搜索能力测评

当前（2024年4月）海内外已涌现较多AI搜索产品，产品形态及宣传特色点均有所不同，我们认为各个AI搜索产品都在持续迭代、完善功能，产品力有望不断提升。出于研究目的，我们将以一套相同的测试题，对前述主流AI搜索产品进行测评，分析其能否准确识别用户意图，以及能否完成基础的准确检索功能，以及是否具备高阶功能，如追问、识图、图表绘制、音乐等。

问题设置方面，我们以2023年谷歌最常被搜索的问题作为模板，将搜索的基础需求分为：网址导航、常识性问题、强时效性的新闻问题、本地搜索，并基于这些搜索内容，设置了相关测试问题。

AI搜索能力测评总结

我们以上述问题集进行测评，基于搜索结果，我们认为AI搜索在常识科普性、开放探索性问题上表现已优于传统引擎，但在网址导航、本地化和操作指导上表现欠佳。

AI搜索基础能力测评结果——科普性问题

科普性问题：以“什么是做空、轧空？”为例，相比传统搜索，AI搜索回答内容完整且更为结构化，无需点击单个网页浏览。AI搜索中，豆包解释不足，360搜索AI内容延申丰富，秘塔文字分段略微逊色。

AI搜索基础能力测评结果——简单时效性+本地化问题

简单时效性+本地化问题：“今天天气如何”，搜索引擎需识别今天、用户所处地点，文心一言、360搜索AI、豆包、天工均准确回答，ChatGPT追加地点后回答错误，通义千问未询问直接回答北京天气，Perplexity未询问用户直接回答未知地点天气，但在追问地点后，智谱、通义千问、Perplexity等均能回答正确。而秘塔、kimi无法识别用户所处地点，概括回答各地区天气，也需追问。

AI搜索基础能力测评结果——意图理解及时效性问题

意图理解及时效性问题：输入“美股下跌原因”、“周五美股下跌原因”后，搜索引擎应理解用户意图，包括周五所指日期2024/4/12，并返回对应股评。测试结果中，传统搜索引擎—百度在最新相关信息中罗列相关链接并提供日期，供用户筛选点击；AI搜索针对“美股下跌原因”返回的是探索性回答，时间跨度长，限定“周五”后，Perplexity、天工、秘塔、豆包能识别具体日期并反馈正确结果，有效内容含量（日期正确条数/参考结果条数）分别为8/8、4/4、6/11、4/10，Kimi、360搜索AI有效内容含量较低，通义千问、智谱无法理解周五的日期，文心一言无溯源，此处不予评价。

AI搜索高级能力测评结果——追问

相比于传统搜索引擎，AI搜索的连续对话功能使得用户无需重复编辑问题，高效获得信息。以上述“如何评价电影肖申克的救赎”为例，用户如需要了解男主安迪的故事发展情节，只需输入“安迪主要发生了什么事情”、“最后他逃出监狱了吗”，而无需限定“肖申克的救赎中男主安迪发生了什么事情”“肖申克的救赎中男主是否逃出监狱”，问题输入效率大幅提升。但值得注意的是，AI搜索中360搜索AI网页版缺乏追问功能。

报告节选：

（本文仅供参考，不代表我们的任何投资建议。如需使用相关信息，请参阅报告原文。）