ONEPICE-KG 是一个面向《海贼王》领域数据的知识图谱项目。
本项目内容包括数据采集、知识存储、知识抽取、知识计算、知识应用五大部分
本次项目主要采集构建了两个知识图谱和一个关系抽取数据集
- 人物知识图谱:主要包含各个人物的信息
- 关系抽取数据集:标注出自然语言中存在的实体以及他们之间的关系
- 实体关系知识图谱:构建《海贼王》中各个实体之间关系的知识图谱
尝试使用了三元组数据库Apace Jena和原生图数据库Neo4j,并分别使用RDF结构化查询语言SPARQL和属性图查询语言Cypher,在知识图谱上进行查询。
基于之间构建的关系抽取数据集,利用deepke中提供的工具进行关系抽取实践,测试了包括PCNN、GCN、BERT等模型在我们构建数据集上的效果
- 图计算:在Neo4j上对实体关系知识图谱进行了图挖掘,包括最短路径查询、权威结点发现、社区发现等
- 知识推理:在Apache Jena上对关系知识图谱进行了知识推理,补全了一部分的数据
- 智能问答:基于REfO实现一个对于《海贼王》中人物的知识库问答系统(KBQA),可以参考相关介绍在微信微信公众号上体验部分查询功能。
- 可视化图片:通过D3对实体关系图片进行可视化,并整合了人物知识图谱中的信息,进行展示。
各个部分的具体内容和使用方法,可以参见 docs
文件夹下的项目文档
实体关系可视化页面可以参见项目的GitHub Pages