【蚂蚁集团&OpenKG】2023语义增强可编程知识图谱SPG白皮书

知识图谱是早期专家系统和语义网技术的延续,自2012年Google将其应用于搜索推荐领域以来,知识图谱技术在各领域得到了广泛应用。然而,长期以来知识图谱语义表示和技术框架并未有显著进步,这大大提高了各领域图谱的构建成本和业务落地的复杂度。自2022年底以来,ChatGPT、GPT4等大模型掀起了人工智能的新浪潮,但当前大模型仍然存在知识幻觉性、复杂推理谬误和计算成本高等问题。符号化知识图谱的技术体系作为大模型的补充,可以实现可控的内容理解和内容生成,为大模型产业落地提供正确的领域知识和复杂推理能力的支持。


知识图谱作为符号化的知识表示体系,具备高阶语义、结构严谨、复杂推理等能力。在大语言模型(LLM)飞速发展的时代,知识图谱与LLM之间有丰富的互动关系,一方面LLM为低成本构建大规模知识图谱提供了有力工具,能否借助LLM构建超出现有知识图谱规模1-2个数量级的世界知识图谱成为一个有趣的研究问题;另一方面知识图谱的高质量、可解释的知识表示和推理能力,也为解决LLM的空想问题提供了一种可能的探索方向。


知识图谱是一种建模和管理数据的方法,它利用图结构、知识语义和逻辑依赖,提供存储、推理和查询事实知识的能力。早期的应用主要是从公开语料中提取百科类三元组来构建静态知识图谱,以提高搜索推荐的效率和体验。随着知识图谱应用从搜索推荐的C应用转向风险防控/经营管理的企业级B/C联动的领域应用,因前文所述长尾稀薄客群画像覆盖和风险洞察的需求,领域图谱需要具备全面性、正确性和可解释性等特点,图谱数据的来源也从文本语料转向了企业多源异构数据。这些数据包括非/半结构化的UGC/PGC内容、业务经营沉淀的结构化基础画像、交易事务、日志记录等,以及各领域特有的业务专家经验。围绕增长经营和风险防控,构建完整的客户、物料、渠道等的立体画像,以商家为例,图1展示了构建过程的示意图。


【报告内容看点】


1.从数据化到知识化:企业深化竞争优势,图谱技术与时俱进


2.基于属性图的知识管理存在的问题


3.语义增强可编程框架SPG


4.SPG-Schema层

【蚂蚁集团&OpenKG】2023语义增强可编程知识图谱SPG白皮书

知识图谱作为一种建模和管理数据的方法,已经在企业数字化过程中发挥了重要作用。然而,随着企业对知识图谱的需求不断增加,传统的知识图谱技术面临着一些挑战。基于对当前知识图谱技术的深入研究和实践经验的总结,蚂蚁集团发现,传统的知识图谱技术在应对复杂的业务场景和大规模数据时存在一些局限性。例如,知识图谱的构建需要统一的工业级知识建模框架,以便适应不同领域的需求;知识图谱的推理能力需要更加高效和可解释;知识图谱的构建和推理过程需要更好的可编程性和跨场景迁移性。


作为蚂蚁集团知识引擎的负责人,梁磊带领团队研制了一个工业级知识图谱语义框架——SPG(Semantic-enhancedProgrammableGraph)。当他第一次向我介绍蚂蚁的思考和SPG时,我惊喜地发现大家不约而同地在解决类似的问题,原来约定的1小时会议也慢慢演变成了一个上午的深度交流。之后我愈发感觉我们整合力量去扩展SPG来应对大模型时代新的机遇和需求,并向整个社区开源这个一站式全新的知识图谱平台工具。当我将这个想法告诉了梁磊,他和蚂蚁集团非常支持,我们也积极推进OpenKG的各个研发力量和蚂蚁知识图谱团队的合作,最终形成了一个虚拟团队开展了后续的双周交流,设计规划和研发工作。


SPG框架以属性图为基础,融合了RDF/OWL的语义性和LPG的结构性,兼具语义简洁和大数据兼容的优势。通过SPG框架,我们可以实现知识的动态到静态自动分层、领域内知识的唯一性和知识之间的依赖关系定义。同时,SPG框架还提供了可编程的范式,支持快速构建新的领域图谱和跨场景迁移。其在解决典型问题和场景方面具有广泛的应用价值。在黑产图谱和产业链事理图谱中,SPG框架可以帮助企业更好地识别和应对黑灰产对抗,提高风险防控能力;在知识推理和智能问答中,SPG框架可以提供更加准确和可解释的推理结果,提升用户体验和决策效果。


上一篇

【易安联&云计算开源产业联盟】零信任关键技术白皮书

2023-11-15
下一篇

【中国联通】2023年中国联通DPU网络域场景应用白皮书

2023-11-15