KAG 学习笔记

KAG 是什么

是蚂蚁开源的一个基于图谱和大语言模型的问答框架。用于构建垂直领域知识库的逻辑推理问答解决方案。

KAG 可以有效克服传统 RAG 向量相似度计算的歧义性引入的噪声问题。KAG 支持逻辑推理、多跳事实问答，并且明显优于目前的 SOTA 方法

私域知识库场景，非结构化数据、结构化信息、业务专家经验往往三者共存，KAG 提出了一种对大型语言模型（LLM）友好的知识表示框架，在 DIKW（数据、信息、知识和智慧）的层次结构基础上，将 SPG 升级为对 LLM 友好的版本，命名为 LLMFriSPG。

这使得它能够在同一知识类型（如实体类型、事件类型）上兼容无 schema 约束的信息提取和有 schema 约束的专业知识构建，并支持图结构与原始文本块之间的互索引表示。

这种互索引表示有助于基于图结构的倒排索引的构建，并促进了逻辑形式的统一表示、推理和检索。同时通过知识理解、语义对齐等进一步降低信息抽取的噪声，提升知识的准确率和一致性。

image(7).png

KAG 提出了一种逻辑符号引导的混合求解和推理引擎。该引擎包括三种类型的运算符：规划、推理和检索，将自然语言问题转化为结合语言和符号的问题求解过程。

在这个过程中，每一步都可以利用不同的运算符，如精确匹配检索、文本检索、数值计算或语义推理，从而实现四种不同问题求解过程的集成：图谱推理、逻辑计算、Chunk 检索和 LLM 推理。

image(8).png

image(9).png