Triplestores

 

Ontotext GraphDB   commercial guteWahl geosparql

Skalierbar, zuverlässig, schnelle, inkrementelle SHACL-Engine! Unkompliziert zu installieren. best-of-breed Ansatz, d.h. akzeptiert andere Produkte für UI, Visualisierung, ETL. Sehr guter Support.

Unbedingt empfehlenswert für große Datenmengen und sehr gute SHACL-Implementation!

RDFox   commercial guteWahl inferenz fastmainMemory

In-Memory Implementation, ausgerichtet auf schnelle Inferenz. Schnelle Abfragen, schnellere Inferenz. Truth Maintenance. Unkompliziert zu installieren und zu betreiben. OWL-RL, im Hintergrund scheint eine Datalog-Db zu sein. Viele Beispiele benutzen Datalog statt OWL oder SHACL. Dadurch sehr mächtig, aber man verläßt auch den Standard. best-of-breed Ansatz, d.h. akzeptiert andere Produkte für UI, Visualisierung, ETL. Sehr guter Support.

Ich habe in 256Gb RAM 4 Millarden Triple benutzt, aktuelle Server können mit 8Tb RAM konfiguriert werden, wobei der Speicherbedarf vermutlich nichtlinear steigt. Trotzdem, einige zig Milliarden Triple sollten machbar sein. 

Unbedingt empfehlenswert für alles, wo Geschwindigkeit und Inferenz nützlich sind, und die Beschränkung oder Kosten durch die Hauptspeichergröße kein Problem darstellt. 

Stardog commercial ETL

Legt Wert auf alles-aus-einer-Hand. Versucht eine Art SAP der Triplestores zu werden: UI, ETL Visualisierung, alles kommt von Stardog. Dadurch gute Integration, aber nicht immer gute Funktionalität. OWL-Implementation mit "closed-world"-Semantic, die dadurch massiv vom Standard abweicht. Skalierbar. 

AllegroGraph von Franz, Inc   commercial geosparql

Skalierbar. In Lisp eingebunden. Bindet LLMs ein. Interessant, aber ich weiß noch nicht genug darüber.

qEndpoint   geosparql opensource

von https://the-qa-company.com/ welche auf Wikidatta und query answering (QA) über KGs spezialisiert ist.

Blazegraph   geosparql benutzen opensource

Abandonware, aber relativ schnell, wird lt. einer Aussage auf der KGC2023 z.B. von Wikidata genutzt.

Qlever Uni Freiburg, read-mostly   beobachten geosparql ausprobieren opensource

Soll deutlich schneller sein als z.B. blazegraph.

Aber nur POC-Implementation für Update, und ohne Inferenz.

Evtl. als Store für die reine Auslieferung von Daten.

Jena TDB   opensource

TripeStore und Bibliotheken, wird aktiv weiterentwickelt. Eher für kleinere Graphen.

Knowledge Graphs UI

 

metaphactory  commercial guteWahlETL

Flexible Oberfläche für Knowledge Graphs, einfache Visualisierungen, ETL-Adapter für diverse Systeme.

eccenca Corporate Memory  commercial guteWahlETL

Flexible Oberfläche für Knowledge Graphs, einfache Visualisierungen, ETL-Adapter für diverse Systeme.

Cambride Intelligence Graph Visualizations  commercial guteWahlvisualization

Leistungsfähige Bibliotheken für komplexe, gut zu bedienende Graphvisualisierungen in Javascript oder React. Eine eigene Bibliothek um Timelines zu visualisieren. Eines der besten Produkte auf diesem Gebiet.

LinkedDataHub als Open-Source-Alternative  opensource


Visualisierung, editieren, Abfragen und mehr. Noch nicht ausprobiert.

 

ETL & Federation

 

Stardog, GraphDB und andere Anbieter haben hier teils ihre eigenen Angebote.
 
Außerdem spezialisieren sich generische KG-Tools wie metaphacts und ecceca auf Adapter für RDF von/zu sehr vielen Anwendungen.
 

Awesome KGC Tools   liste

R2RML, RML und RML-star, Excel, im Grunde Alles-zu-RDF tools und Virtualizers. Eine gute Liste mit mehr Einträgen als hier.

SILK - The Linked Data Integration Framework   opensource

Hilft dabei, Verbindungen zwischen Instanzen, Klassen und Eigenschaften in verschiedenen KGs zu finden:

"Using the declarative Silk - Link Specification Language (Silk-LSL), developers can specify which types of RDF links should be discovered between data sources as well as which conditions data items must fulfill in order to be interlinked. These link conditions may combine various similarity metrics and can take the graph around a data item into account, which is addressed using an RDF path language. Silk accesses the data sources that should be interlinked via the SPARQL protocol and can thus be used against local as well as remote SPARQL endpoints. Link Specifications can be created using the Silk Workbench graphical user interface or manually in XML."

Ist also dazu da, verschiedene KGs untereinander zu vernetzen, nicht dazu, in andere Datenformate zu exportieren oder davon zu importieren.

Im Gegenteil: es erstellt neue Daten, die Links zwischen den Datensets. Also  owl:seeAlso, owl:equivalentClass, owl:sameAs etc.

SPARQL Anything   opensource

Erlaubt "alles" mit Sparql abzufragen. Also einfach eine Sparql-Abfrage mit einem Service-Keyword und los gehts. Hat für alle Format standardisierte Wege, um sie nach RDF zu konvertieren; also kein R2RML schreiben.

Mit passender Option wird z.B. für CSVs der Header benutzt um benannte properties zu generieren.

morph-kgc   opensource

CSV, XML, JSON und mehr zu RDF Python. Unterstützt r2rml, rml und yarrrml

RML.io   opensource

CSV, XML, JSON und mehr zu RDF Java. Grafische Editoren für r2rml, rml und yarrml

FedX   opensource

Query Federation von RDF4J. Aber siehe die Bewertung im Metaphacts-Paper. Die haben eine eigene Federation engine geschrieben, weil die existierenden nicht gut genug für sie waren.

Large RDF Federation Benchmark   opensource

A Billion Triples Benchmark for SPARQL Query Federation

Quetzal-RDF   opensource

Sparql to Relational engine, federated

Ontop   opensource

R2RML Server, ein virtuellen Knowledge Graph. Ontop wandelt SPARQL-Abfragen in SQL um, führt diese Abfragen aus, und wandelt die Ergebnisse wieder in RDF. Von aussen also ein SPARQL-Endpoint, der im Hintergrund SQL-Datenbanken abfragt.

OBG-gen   opensource

Ontology-Based GraphQL Server Generation for Data Acess and Integration (SPARQL -> GraphQL)

 

Verbindung mit LLMs

 

LlamaIndex LLMs (ChatGPT, Llama) mit eigenen Daten trainieren

 
  • rdf-qa question answering over RDF using LLamaIndex
     
 
 
German