Dieses Repository enthält Verweise auf Forschungsdaten(banken) und -repositorien, die für NFDI4Objects relevant sind und in einem Knowledge Graph zusammengeführt werden sollen.
Eine HTML-Ansicht der Liste von Datenbanken befindet sich unter https://nfdi4objects.github.io/n4o-databases/.
Der Datensatz besteht aus zwei CSV-Dateien.
Die Liste von Forschungsdatenbanekn und Repositorien n4o-databases.csv
mit zwei Spalten:
name
der Datenbankwikidata
Identifier der Datenbank (QID)
Weitere Informationen werden in Wikidata eingetragen und von dort abgerufen und in die Datei n4o-databases.json
geschrieben. Jede Datenbank ist dabei mit folgenden Feldern beschrieben:
name
der Datenbankwikidata
QID in Wikidataurl
Homepagepublisher
Herausgeber mitname
undwikidata
QIDre3data
Identifier bei https://www.re3data.org/api
Schnittstellen miturl
,protocol
undformat
Zusätzlich wird die JSON-Datei als JSON-LD mit diesem Kontext
nach RDF konvertiert und im NTriples-Format in der Datei n4o-databases.nt
gespeichert und im Turtle-Format in der Datei n4o-databases.ttl
.
Dabei wird im Wesentlichen das Datenmodell des NFDI4Culture
Knowledge Graph
verwendet mit folgenden Unterschieden:
- Zur Angabe einer Homepage wird
foaf:url
verwendet, da diese RDF Property bereits etabliert ist - Es werden keinen eigenen URIs für Herausgeber, APIs und Dateiformate gebildet sondern Wikidata-URIs verwendet
Darüber hinaus werden die Daten als Property Graph als PG-JSON bzw. PG format gespeichert.
In n4o-collections.csv
stehen bekannte Sammlungen und
Datenpublikationen, deren Daten übernommen werden können und falls vorhanden
die dazu gehörige übergeordnete Datenbank aus n4o-databases.csv
.
Das Skript pg.py
konvertiert die Datei n4o-collections.csv
ins PG format.
Mit make
wird damit die Datei no4-collections.pg
aktualisiert. Diese Datei
kann mit n4o-databases.pg
zusammengeführt werden.
Die Dateien n4o-databases.csv
und n4o-collections.csv
können per Pull-Request in GitHub geändert werden.
Für Datenbanken und Repositorien sollen in Wikidata folgende Angaben eingetragen werden:
- offizielle Website (P856)
- Herausgeber (P98)
- API-Endpunkt (P6269) mit den Qualifikatoren
- Protokoll (P2700)
- Dateiformat (P2701)
Ein Beispieldatesatz ist https://www.wikidata.org/wiki/Q21040628 (KENOM).
Zusätzlich sollte die Datenbank bei re3data.org eingetragen werden, von wo weitere Informationen übernommen werden können.
Zum Zusammenführen der Daten aus n4o-databases.csv
und Wikidata wird Node benötigt:
git clone https://github.com/nfdi4objects/n4o-databases.git
npm install
make
Alle Daten stehen als Public Domain (CC0) frei zur Verfügung.