Software

Triplestores

Ontotext GraphDB commercial guteWahl geosparql

Skalierbar, zuverlässig, schnelle, inkrementelle SHACL-Engine! Unkompliziert zu installieren. best-of-breed Ansatz, d.h. akzeptiert andere Produkte für UI, Visualisierung, ETL. Sehr guter Support.

Unbedingt empfehlenswert für große Datenmengen und sehr gute SHACL-Implementation!

RDFox commercial guteWahl inferenz fastmainMemory

In-Memory Implementation, ausgerichtet auf schnelle Inferenz. Schnelle Abfragen, schnellere Inferenz. Truth Maintenance. Unkompliziert zu installieren und zu betreiben. OWL-RL, im Hintergrund scheint eine Datalog-Db zu sein. Viele Beispiele benutzen Datalog statt OWL oder SHACL. Dadurch sehr mächtig, aber man verläßt auch den Standard. best-of-breed Ansatz, d.h. akzeptiert andere Produkte für UI, Visualisierung, ETL. Sehr guter Support.

Ich habe in 256Gb RAM 4 Millarden Triple benutzt, aktuelle Server können mit 8Tb RAM konfiguriert werden, wobei der Speicherbedarf vermutlich nichtlinear steigt. Trotzdem, einige zig Milliarden Triple sollten machbar sein.

Unbedingt empfehlenswert für alles, wo Geschwindigkeit und Inferenz nützlich sind, und die Beschränkung oder Kosten durch die Hauptspeichergröße kein Problem darstellt.

Stardogcommercial ETL

Legt Wert auf alles-aus-einer-Hand. Versucht eine Art SAP der Triplestores zu werden: UI, ETL Visualisierung, alles kommt von Stardog. Dadurch gute Integration, aber nicht immer gute Funktionalität. OWL-Implementation mit "closed-world"-Semantic, die dadurch massiv vom Standard abweicht. Skalierbar.

AllegroGraph von Franz, Inc commercial geosparql

Skalierbar. In Lisp eingebunden. Bindet LLMs ein. Interessant, aber ich weiß noch nicht genug darüber.

qEndpoint geosparql opensource

von https://the-qa-company.com/ welche auf Wikidatta und query answering (QA) über KGs spezialisiert ist.

Blazegraph geosparql benutzen opensource

Abandonware, aber relativ schnell, wird lt. einer Aussage auf der KGC2023 z.B. von Wikidata genutzt.

Qlever Uni Freiburg, read-mostly beobachten geosparql ausprobieren opensource

Soll deutlich schneller sein als z.B. blazegraph.

Aber nur POC-Implementation für Update, und ohne Inferenz.

Evtl. als Store für die reine Auslieferung von Daten.

Jena TDB opensource

TripeStore und Bibliotheken, wird aktiv weiterentwickelt. Eher für kleinere Graphen.

Knowledge Graphs UI

metaphactory commercial guteWahlETL

Flexible Oberfläche für Knowledge Graphs, einfache Visualisierungen, ETL-Adapter für diverse Systeme.

eccenca Corporate Memory commercial guteWahlETL

Flexible Oberfläche für Knowledge Graphs, einfache Visualisierungen, ETL-Adapter für diverse Systeme.

Cambride Intelligence Graph Visualizations commercial guteWahlvisualization

Leistungsfähige Bibliotheken für komplexe, gut zu bedienende Graphvisualisierungen in Javascript oder React. Eine eigene Bibliothek um Timelines zu visualisieren. Eines der besten Produkte auf diesem Gebiet.

LinkedDataHub als Open-Source-Alternative opensource

Visualisierung, editieren, Abfragen und mehr. Noch nicht ausprobiert.

ETL & Federation

Stardog, GraphDB und andere Anbieter haben hier teils ihre eigenen Angebote.

Außerdem spezialisieren sich generische KG-Tools wie metaphacts und ecceca auf Adapter für RDF von/zu sehr vielen Anwendungen.

Awesome KGC Tools liste

R2RML, RML und RML-star, Excel, im Grunde Alles-zu-RDF tools und Virtualizers. Eine gute Liste mit mehr Einträgen als hier.

SILK - The Linked Data Integration Framework opensource

Hilft dabei, Verbindungen zwischen Instanzen, Klassen und Eigenschaften in verschiedenen KGs zu finden:

"Using the declarative Silk - Link Specification Language (Silk-LSL), developers can specify which types of RDF links should be discovered between data sources as well as which conditions data items must fulfill in order to be interlinked. These link conditions may combine various similarity metrics and can take the graph around a data item into account, which is addressed using an RDF path language. Silk accesses the data sources that should be interlinked via the SPARQL protocol and can thus be used against local as well as remote SPARQL endpoints. Link Specifications can be created using the Silk Workbench graphical user interface or manually in XML."

Ist also dazu da, verschiedene KGs untereinander zu vernetzen, nicht dazu, in andere Datenformate zu exportieren oder davon zu importieren.

Im Gegenteil: es erstellt neue Daten, die Links zwischen den Datensets. Also owl:seeAlso, owl:equivalentClass, owl:sameAs etc.

SPARQL Anything opensource

Erlaubt "alles" mit Sparql abzufragen. Also einfach eine Sparql-Abfrage mit einem Service-Keyword und los gehts. Hat für alle Format standardisierte Wege, um sie nach RDF zu konvertieren; also kein R2RML schreiben.

Mit passender Option wird z.B. für CSVs der Header benutzt um benannte properties zu generieren.

morph-kgc opensource

CSV, XML, JSON und mehr zu RDF Python. Unterstützt r2rml, rml und yarrrml

RML.io opensource

CSV, XML, JSON und mehr zu RDF Java. Grafische Editoren für r2rml, rml und yarrml

FedX opensource

Query Federation von RDF4J. Aber siehe die Bewertung im Metaphacts-Paper. Die haben eine eigene Federation engine geschrieben, weil die existierenden nicht gut genug für sie waren.

Large RDF Federation Benchmark opensource

A Billion Triples Benchmark for SPARQL Query Federation

Quetzal-RDF opensource

Sparql to Relational engine, federated

Ontop opensource

R2RML Server, ein virtuellen Knowledge Graph. Ontop wandelt SPARQL-Abfragen in SQL um, führt diese Abfragen aus, und wandelt die Ergebnisse wieder in RDF. Von aussen also ein SPARQL-Endpoint, der im Hintergrund SQL-Datenbanken abfragt.

OBG-gen opensource

Ontology-Based GraphQL Server Generation for Data Acess and Integration (SPARQL -> GraphQL)

Verbindung mit LLMs

LlamaIndex LLMs (ChatGPT, Llama) mit eigenen Daten trainieren

rdf-qa question answering over RDF using LLamaIndex

Sprache

German