菜单

知识图谱

相关源文件

目的与范围

本文档介绍了 funNLP 仓库中的知识图谱资源,包括知识图谱构建、表示学习和领域特定应用的工具。知识图谱表示实体及其关系的结构化信息,是语义搜索、问答和智能信息系统的基础。本文档侧重于传统的知识图谱技术;关于大型语言模型在问答中的应用,请参阅 文档问答系统

funNLP 中的知识图谱概述

funNLP 仓库包含各种知识图谱资源,从通用知识库到专业领域知识图谱,以及用于构建、查询和应用开发的工具。

funNLP 仓库中的知识图谱生态系统

来源: README.md514-549

知识图谱构建

该仓库包含用于从非结构化文本和结构化数据源构建知识图谱的各种工具和框架。这些工具支持从文本处理到实体提取和关系识别的整个知识图谱流程。

实体和关系抽取

实体和关系抽取是知识图谱构建的基础。该仓库中的一些工具专注于从文本中提取结构化信息

知识图谱构建流程

来源: README.md514-549

实体和关系抽取的主要工具

  • EventTriplesExtraction:基于依赖句法和语义角色标注抽取事件三元组
  • KnowledgeGraph_NER:专注于中文医学知识图谱的命名实体识别
  • BERT-AttributeExtraction:使用基于 BERT 的方法从百度百科人物条目中抽取属性
  • Jiagu:一个包含知识图谱关系抽取功能的综合 NLP 工具

知识图谱框架

该仓库包含用于构建和管理知识图谱的几个框架

框架描述主要功能
Zincbase知识图谱构建工具包构建和查询知识图谱
TextGrapher文档图生成自动将文档转换为图格式
dstlr从非结构化文本构建 KG 的平台用于大规模文本处理的可扩展架构
AbstractKnowledgeGraph抽象知识图谱框架支持名词实体、状态描述和事件动作

来源: README.md520-536

领域特定知识图谱

该仓库包含用于各种专业领域的知识图谱及相关工具

医学知识图谱

医学领域知识图谱是临床决策支持系统、医学问答和医疗信息检索的基础。

医学知识图谱生态系统

来源: README.md521-547

值得关注的医学知识图谱资源

  • QASystemOnMedicalGraph:基于医学领域知识图谱的问答系统
  • KGQA-Based-On-medicine:利用医学知识图谱的智能问答系统
  • COKG-19:关于 COVID-19 的大规模、结构化、双语知识图谱

其他领域特定知识图谱

该仓库包含各种其他领域的知识图谱

领域资源描述
人物关系PersonRelationKnowledgeGraph中文人物关系知识图谱
电子商务ProductKnowledgeGraph京东商品知识图谱
军事QAonMilitaryKG具有问答功能的军事领域知识图谱
金融Stock-Knowledge-Graph股票知识图谱/知识库
娱乐ONEPIECE-KG动漫“海贼王”的知识图谱
因果关系CausalityEventExtraction因果关系图谱抽取工具

来源: README.md522-548

知识图谱表示学习

知识图谱表示学习涉及将实体和关系转换到连续向量空间,同时保留图的结构信息。

嵌入库

该仓库包含几个用于知识图谱表示学习的库

知识图谱表示学习框架

来源: README.md523-550

主要库

  • AmpliGraph:用于知识图谱表示学习和概念链接预测的 Python 库
  • LibKGE:用于知识图谱嵌入的库,专注于可复现的研究
  • DGL-KE:图嵌入表示学习算法

知识图谱应用

问答系统

基于知识图谱的问答系统利用结构化知识来回答自然语言问题。

知识图谱问答架构

来源: README.md527-541

主要问答系统

  • KBQA-BERT:基于知识图谱的问答系统,使用 BERT
  • QASystemOnMedicalGraph:医学领域问答系统
  • QAonMilitaryKG:军事领域问答系统

其他应用

知识图谱支持了仓库中的各种其他应用

应用程序描述工具/资源
文档分析文档图的自动生成TextGrapher
实体链接将文本提及与知识库中的实体连接起来BLINK
信息抽取从文本中提取结构化信息EventTriplesExtraction
语义搜索基于概念的信息检索各种 KG 应用

来源: README.md520-530

知识图谱资源

数据集和集合

该仓库包含许多知识图谱数据集

  • XLORE:清华大学推出的跨语言知识图谱,整合了百度、中文维基百科和英文维基百科的数据
  • OpenKG.CN:132 个涵盖各领域的知识图谱数据集
  • KnowledgeGraphData:大规模中文知识图谱,包含 14 亿实体
  • CausalDataset:因果关系抽取数据集

学习资源

学习知识图谱的资源

  • KnowledgeGraphCourse:东南大学关于知识图谱的研究生课程
  • Knowledge-Graph:关于知识图谱深度学习的资源集合
  • Awesome-Knowledge-Graph:全面的学习材料和资源列表

来源: README.md524-540

结论

funNLP 仓库中的知识图谱涵盖了广泛的领域、工具和应用。它们提供了结构化的知识表示,为各种 NLP 任务提供了支持,从实体提取到复杂的问答系统。资源包括通用知识库和领域特定知识图谱,以及用于其构建、表示和应用的工具。