这个工具用于清洗 Ownthink 的知识图谱 RDF 数据,将它变成属性图模型。产出结果为一个 vertex.csv 文件和 edge.csv 文件, 分别是清洗后的顶点数据和边数据。目前只对数据进行了简单去重。
你也可以直接去 kaggle 下载完全去重后的数据(包涵原始数据和 Nebula 1.x 版本数据)。
使用 --path 参数指定知识图谱的三元组数据的路径
$ go build
$ head rdf_data.csv
猫,捕食,老鼠
$ ./rdf-converter --path rdf_data.csv
这条命令会在当前目录下生成 vertex.csv
文件和 edge.csv
文件。
$ head vertex.csv
猫
老鼠
$ head edge.csv
猫,老鼠,捕食
之后, 就可以使用nebula-importer来导入到 Nebula 图数据库 中啦。
说明:nebula-importer要求使用一个yaml配置文件去导入数据,你可以直接使用我写好的这个rdf-import.yaml。
特殊说明:这个分支的 rdf-converter 适用于 Nebula 2.x 和 3.x,如果你使用的是 Nebula 1.x 版本,请访问 https://github.com/jievince/rdf-converter/blob/v1/ 。