Triplestores
Ontotext GraphDB commercial guteWahl geosparql
Skalierbar, zuverlässig, schnelle, inkrementelle SHACL-Engine! Unkompliziert zu installieren. best-of-breed Ansatz, d.h. akzeptiert andere Produkte für UI, Visualisierung, ETL. Sehr guter Support.
Unbedingt empfehlenswert für große Datenmengen und sehr gute SHACL-Implementation!
RDFox commercial guteWahl inferenz fastmainMemory
In-Memory Implementation, ausgerichtet auf schnelle Inferenz. Schnelle Abfragen, schnellere Inferenz. Truth Maintenance. Unkompliziert zu installieren und zu betreiben. OWL-RL, im Hintergrund scheint eine Datalog-Db zu sein. Viele Beispiele benutzen Datalog statt OWL oder SHACL. Dadurch sehr mächtig, aber man verläßt auch den Standard. best-of-breed Ansatz, d.h. akzeptiert andere Produkte für UI, Visualisierung, ETL. Sehr guter Support.
Ich habe in 256Gb RAM 4 Millarden Triple benutzt, aktuelle Server können mit 8Tb RAM konfiguriert werden, wobei der Speicherbedarf vermutlich nichtlinear steigt. Trotzdem, einige zig Milliarden Triple sollten machbar sein.
Unbedingt empfehlenswert für alles, wo Geschwindigkeit und Inferenz nützlich sind, und die Beschränkung oder Kosten durch die Hauptspeichergröße kein Problem darstellt.
Stardog commercial ETL
Legt Wert auf alles-aus-einer-Hand. Versucht eine Art SAP der Triplestores zu werden: UI, ETL Visualisierung, alles kommt von Stardog. Dadurch gute Integration, aber nicht immer gute Funktionalität. OWL-Implementation mit "closed-world"-Semantic, die dadurch massiv vom Standard abweicht. Skalierbar.
AllegroGraph von Franz, Inc commercial geosparql
Skalierbar. In Lisp eingebunden. Bindet LLMs ein. Interessant, aber ich weiß noch nicht genug darüber.
qEndpoint geosparql opensource
von https://the-qa-company.com/ welche auf Wikidatta und query answering (QA) über KGs spezialisiert ist.
Blazegraph geosparql benutzen opensource
Abandonware, aber relativ schnell, wird lt. einer Aussage auf der KGC2023 z.B. von Wikidata genutzt.
Qlever Uni Freiburg, read-mostly beobachten geosparql ausprobieren opensource
Soll deutlich schneller sein als z.B. blazegraph.
Aber nur POC-Implementation für Update, und ohne Inferenz.
Evtl. als Store für die reine Auslieferung von Daten.
Jena TDB opensource
TripeStore und Bibliotheken, wird aktiv weiterentwickelt. Eher für kleinere Graphen.
Knowledge Graphs UI
metaphactory commercial guteWahlETL
Flexible Oberfläche für Knowledge Graphs, einfache Visualisierungen, ETL-Adapter für diverse Systeme.
eccenca Corporate Memory commercial guteWahlETL
Flexible Oberfläche für Knowledge Graphs, einfache Visualisierungen, ETL-Adapter für diverse Systeme.
Cambride Intelligence Graph Visualizations commercial guteWahlvisualization
Leistungsfähige Bibliotheken für komplexe, gut zu bedienende Graphvisualisierungen in Javascript oder React. Eine eigene Bibliothek um Timelines zu visualisieren. Eines der besten Produkte auf diesem Gebiet.
LinkedDataHub als Open-Source-Alternative opensource
Visualisierung, editieren, Abfragen und mehr. Noch nicht ausprobiert.
ETL & Federation
Awesome KGC Tools liste
R2RML, RML und RML-star, Excel, im Grunde Alles-zu-RDF tools und Virtualizers. Eine gute Liste mit mehr Einträgen als hier.
SILK - The Linked Data Integration Framework opensource
Hilft dabei, Verbindungen zwischen Instanzen, Klassen und Eigenschaften in verschiedenen KGs zu finden:
"Using the declarative Silk - Link Specification Language (Silk-LSL), developers can specify which types of RDF links should be discovered between data sources as well as which conditions data items must fulfill in order to be interlinked. These link conditions may combine various similarity metrics and can take the graph around a data item into account, which is addressed using an RDF path language. Silk accesses the data sources that should be interlinked via the SPARQL protocol and can thus be used against local as well as remote SPARQL endpoints. Link Specifications can be created using the Silk Workbench graphical user interface or manually in XML."
Ist also dazu da, verschiedene KGs untereinander zu vernetzen, nicht dazu, in andere Datenformate zu exportieren oder davon zu importieren.
Im Gegenteil: es erstellt neue Daten, die Links zwischen den Datensets. Also owl:seeAlso
, owl:equivalentClass
, owl:sameAs
etc.
SPARQL Anything opensource
Erlaubt "alles" mit Sparql abzufragen. Also einfach eine Sparql-Abfrage mit einem Service-Keyword und los gehts. Hat für alle Format standardisierte Wege, um sie nach RDF zu konvertieren; also kein R2RML schreiben.
Mit passender Option wird z.B. für CSVs der Header benutzt um benannte properties zu generieren.
morph-kgc opensource
CSV, XML, JSON und mehr zu RDF Python. Unterstützt r2rml, rml und yarrrml
RML.io opensource
CSV, XML, JSON und mehr zu RDF Java. Grafische Editoren für r2rml, rml und yarrml
FedX opensource
Query Federation von RDF4J. Aber siehe die Bewertung im Metaphacts-Paper. Die haben eine eigene Federation engine geschrieben, weil die existierenden nicht gut genug für sie waren.
Large RDF Federation Benchmark opensource
A Billion Triples Benchmark for SPARQL Query Federation
Quetzal-RDF opensource
Sparql to Relational engine, federated
Ontop opensource
R2RML Server, ein virtuellen Knowledge Graph. Ontop wandelt SPARQL-Abfragen in SQL um, führt diese Abfragen aus, und wandelt die Ergebnisse wieder in RDF. Von aussen also ein SPARQL-Endpoint, der im Hintergrund SQL-Datenbanken abfragt.
OBG-gen opensource
Ontology-Based GraphQL Server Generation for Data Acess and Integration (SPARQL -> GraphQL)
Verbindung mit LLMs
LlamaIndex LLMs (ChatGPT, Llama) mit eigenen Daten trainieren
- rdf-qa question answering over RDF using LLamaIndex