1. AI搜索产品涌现,攻克传统搜索痛点
搜索引擎发展历程:信息检索效率逐步提升
搜索引擎:根据用户需求与一定算法,运用特定策略从互联网检索出指定信息反馈给用户的一门检索技术,纵观搜索引擎发展历程,随着信息量的不 断膨胀,搜索引擎的发展趋势就是更为高效、精准检索并返回匹配用户需求的内容。随着AI等技术的加入,我们认为当前搜索引擎已逐步进入下一阶 段,即以用户为中心,更好理解用户语义,并支持个性化推荐和跨模态、跨语言检索、交互等。 搜索引擎鼻祖:Archie。Archie搜索的信息资源不是网页,而是FTP服务器上的文件名信息,用户需输入精确文件名进行检索。 分类目录阶段:以Yahoo为代表,特点是人工分类存放网站的各种目录。 文本检索阶段:以谷歌、百度为代表,随着网络信息爆炸,用户需要高效检索内容,因此出现了以谷歌为代表的,建立在网页链接分析技术基础 上,使用关键字对网页进行搜索。 链接分析阶段:仍以谷歌、百度等为代表,在文本检索基础上,深入分析网页连接中的信息,对网页重要性进行筛选。 搜索引擎使用场景:以信息检索、资讯获取、网站导航入口等为主,近年来垂类应用的增长,用户移动端的购物、视频、攻略等搜索需求被分流至特 定垂类应用内。
搜索引擎市场:谷歌为全球龙头,国内百度稳坐第一
搜索引擎商业化变现以广告为主:在搜索界面展示广告,以用户浏览、点击等数量作为广告价值依据。 以谷歌和Bing为例,2023年全球搜索市占率第一的谷歌网站广告收入(主要为搜索和YouTube,以搜索为主)达2065亿美元,2023财年微软搜索广告收 入达122.1亿美元(主要来自Bing搜索和微软广告业务)。 国内方面,根据易观分析数据,2020年中国搜索引擎广告市场规模达1063亿元。以国内搜素引擎市占率第一百度为例,其2020、2023年在线营销服务 收入(主要来自百度网站、百度联盟等)分别为728、812亿元。
AI搜索引擎:去除广告及冗余信息,高效简洁反馈内容
传统搜索引擎的检索包括处理数据——检索——匹配并返回结果。传统搜索引擎的工作流程可以分为:1)收集并处理互联网上的海量数据;2)为数 据建立索引并设计检索算法,以便快速找到相关数据;3)收到用户发出的检索指令后,拆解指令,将指令中的核心信息与海量数据进行匹配,最终呈 现相关度最高的结果。
传统搜索引擎用户使用体验逐步下降。随着数据的不断膨胀,以及广告商业模式的开启,传统搜索引擎的内容冗余、搜索获得感及效率低下的问题开 始显现,比如,当用户检索某个问题时,希望得到的是全而准确的答案,但由于传统搜索引擎根据匹配结果返回的是多个网页内容,中间还参杂广告, 用户需点击进入多个网页进行信息获取。
AI搜索通过AI理解用户意图、高效召回内容、生成全而准的内容,有效解决传统搜索痛点。检索增强生成(RAG)技术是目前AI搜索的核心技术之一,包括信息检索和答案生成两部分,即在数据库中检索用户问题的相关内容,并形成总结输入大模型,并由大模型输出最终答案,且答案具备索引功能, 能对外部信息来源进行标记。通过RAG技术,一方面可以规避大模型“胡说八道”信息不准确无法溯源、时效性不足的问题,另一方面输出结果比传 统搜索引擎信息浓度更高。
百度文心一言:用户规模平稳,联网搜索能力有限
文心一言于2023年3月16日首次亮相,并在同年8月31日正式开放,目前具有网页版和APP版。 文心一言具备文本分类、情感分析、智能问答等自然语言处理任务的能力。两个亮点:1)多模态生成能力,能够生成文本、图片、音频甚至视频内容。2) 支持大量的插件和百宝箱功能。缺点在于,免费版不提供搜索结果的网址。 免费版基于文心大模型3.5,开通会员可切换为文心大模型4.0,并支持来源参考展示,更长的输入输出字数、图片生成、视频生成等功能。
秘塔AI搜索:无广告的学术研究利器,自动生成思维导图与大纲
秘塔AI搜索:基于自研MetaLLM大模型的搜索工具,提供无广告、高质量的搜索结果。产品亮点:1)包含引用源。2)自动生成大纲、思维导图、相 关事件和人物。3)在数亿篇文献中筛选有用信息,助力学术研究。 秘塔AI搜索在2023年3月的总流量环比上升512.6%,在国内AIGC产品中领先。
上海秘塔网络科技有限公司成立于2018年4月,是AI领域的一家新锐科技公司,致力于打造AI生产力产品。目前,秘塔科技已经拥有上千万用户,总部 位于上海市徐汇区,并成立北京和成都两大研发中心。公司在AI搜索、AI写作、法律翻译等方向上开展研发与产品落地。公司基于自身业务特点和技 术积累自主研发了大语言模型MetaLLM,该模型于2023年通过《生成式大模型备案》(第二批)、《大模型算法备案》(第二批)。
秘塔搭建了一个围绕自研大模型技术输出到产品落地的正循环:秘塔科技基于自研的 MetaLLM 大模型,在应用层做了各种尝试。自研大模型给自有产 品提供了底层能力支撑,在具体应用场景中服务 b 端和 c 端用户,并产生新的数据反馈,帮助大模型实现迭代。
除了秘塔AI搜索,秘塔科技的其他产品包括:1)秘塔写作猫:一款AI写作辅助工具,具备改错、改写和插件功能,旨在提升文章质量和工作效率。2) 秘塔翻译:专为法律人训练的机器翻译系统,专注于法律文书翻译,提供安全、专业和快捷的服务。3)MetaLaw:通过技术简化文档工作流程,提供 高效、减少错漏和知识管理的解决方案。
2. AI搜索测评:重构搜索,但仍有较大优化空间
AI搜索能力测评
当前(2024年4月)海内外已涌现较多AI搜索产品,产品形态及宣传特色点均有所不同,我们认为各个AI搜索产品都在持续迭代、完善功能,产品力有 望不断提升。出于研究目的,我们将以一套相同的测试题,对前述主流AI搜索产品进行测评,分析其能否准确识别用户意图,以及能否完成基础的准 确检索功能,以及是否具备高阶功能,如追问、识图、图表绘制、音乐等。
问题设置方面,我们以2023年谷歌最常被搜索的问题作为模板,将搜索的基础需求分为:网址导航、常识性问题、强时效性的新闻问题、本地搜索, 并基于这些搜索内容,设置了相关测试问题。
AI搜索能力测评总结
我们以上述问题集进行测评,基于搜索结果,我们认为AI搜索在常识科普性、开放探索性问题上表现已优于传统引擎,但在网 址导航、本地化和操作指导上表现欠佳。
AI搜索基础能力测评结果——科普性问题
科普性问题:以“什么是做空、轧空?”为例,相比传统搜索,AI搜索回答内容完整且更为结构化,无需点击单个网页浏览。AI搜索中,豆包解释不 足,360搜索AI内容延申丰富,秘塔文字分段略微逊色。
AI搜索基础能力测评结果——简单时效性+本地化问题
简单时效性+本地化问题:“今天天气如何”,搜索引擎需识别今天、用户所处地点,文心一言、360搜索AI、豆包、天工均准确回答,ChatGPT追加地 点后回答错误,通义千问未询问直接回答北京天气,Perplexity未询问用户直接回答未知地点天气,但在追问地点后,智谱、通义千问、Perplexity等均 能回答正确。而秘塔、kimi无法识别用户所处地点,概括回答各地区天气,也需追问。
AI搜索基础能力测评结果——意图理解及时效性问题
意图理解及时效性问题:输入“美股下跌原因”、“周五美股下跌原因”后,搜索引擎应理解用户意图,包括周五所指日期2024/4/12,并返回对应股 评。测试结果中,传统搜索引擎—百度在最新相关信息中罗列相关链接并提供日期,供用户筛选点击;AI搜索针对“美股下跌原因”返回的是探索性 回答,时间跨度长,限定“周五”后,Perplexity、天工、秘塔、豆包能识别具体日期并反馈正确结果,有效内容含量(日期正确条数/参考结果条数) 分别为8/8、4/4、6/11、4/10,Kimi、360搜索AI有效内容含量较低,通义千问、智谱无法理解周五的日期,文心一言无溯源,此处不予评价。
AI搜索高级能力测评结果——追问
相比于传统搜索引擎,AI搜索的连续对话功能使得用户无需重复编辑问题,高效获得信息。以上述“如何评价电影肖申克的救赎”为例,用户如需要 了解男主安迪的故事发展情节,只需输入“安迪主要发生了什么事情”、“最后他逃出监狱了吗”,而无需限定“肖申克的救赎中男主安迪发生了什 么事情”“肖申克的救赎中男主是否逃出监狱”,问题输入效率大幅提升。但值得注意的是,AI搜索中360搜索AI网页版缺乏追问功能。
报告节选:
(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)
相关报告
AI搜索行业深度报告:大模型催生搜索行业变革机遇,产品百花齐放效果几何?.pdf
2024年AI营销应用解析报告.pdf
人工智能专题报告:人形机器人步入软件定义和AI驱动时代.pdf
AIGC助推元宇宙进程加速,未来商业化场景探究.pdf
计算机行业专题报告:AI浪潮之下,液冷投资机会全梳理.pdf
Unity公司研究:游戏引擎龙头,积极拓宽业务边界,顺应AI浪潮前进.pdf