Was ist ein Wissensgraph?

Ein Wissensgraph stellt reale Entitäten und die Beziehungen zwischen ihnen als Netzwerk aus Knoten und Kanten dar und ermöglicht es Maschinen, vernetzte Fakten abzufragen, zu verknüpfen und darüber zu schlussfolgern.

Ein Wissensgraph ist eine Methode, um Informationen als Netzwerk aus Entitäten (den Dingen in der Welt, wie Personen, Orte, Produkte oder Konzepte) und den Beziehungen, die sie verbinden, zu organisieren. Anstatt Fakten in isolierten Tabellen oder Dokumenten zu speichern, verknüpft ein Wissensgraph sie miteinander, sodass eine Aussage wie „Paris ist die Hauptstadt von Frankreich" als strukturiertes Tripel dargestellt wird: ein Subjekt (Paris), ein Prädikat (ist die Hauptstadt von) und ein Objekt (Frankreich). Diese Struktur ermöglicht es Software, Verbindungen zu durchlaufen, Bedeutungsketten zu folgen und Antworten zu liefern, die über einfaches Keyword-Matching hinausgehen.

Wie ein Wissensgraph funktioniert

Im Kern besteht ein Wissensgraph aus Tripeln, die in einem formalen Schema ausgedrückt werden, am häufigsten im Resource Description Framework (RDF) oder im Property-Graph-Modell, das von Datenbanken wie Neo4j verwendet wird. Jedes Tripel behauptet einen Fakt: (Marie Curie) — entdeckte — (Radium). Knoten tragen Eigenschaften und Typen (z. B. eine „Person"), während Kanten die Art der Beziehung tragen. Ein Schema oder eine Ontologie definiert, welche Arten von Entitäten und Beziehungen zulässig sind, sodass der Graph Konsistenz erzwingen und grundlegendes Schließen unterstützen kann.

Die Konstruktion ist typischerweise eine Pipeline aus Extraktion und Integration. Quelldokumente, Datenbanken oder Webseiten werden analysiert, benannte Entitäten werden erkannt, Kandidatenbeziehungen werden extrahiert (häufig mit Machine-Learning-Modellen), und die Ergebnisse werden gegen einen bestehenden Graphen abgeglichen, um Duplikate zusammenzuführen. Abfragesprachen wie SPARQL oder Cypher ermöglichen es Anwendungen dann, graphförmige Fragen zu stellen, etwa „welche Wissenschaftler haben an Institutionen gearbeitet, die von X finanziert wurden, und zu Y publiziert?" – etwas, das in einer relationalen Datenbank kostspielige Joins erfordern würde.

Warum es wichtig ist

Wissensgraphen bieten KI-Systemen ein gemeinsames, explizites Substrat an Fakten, auf das sie zurückgreifen können. Suchmaschinen nutzen sie, um direkte Antwortpanels zu liefern; Empfehlungssysteme nutzen sie, um verwandte Elemente über gemeinsame Attribute zu finden; und große Sprachmodelle nutzen sie als Quelle fundierter, aktueller Informationen durch Techniken wie Retrieval-Augmented Generation. Indem Beziehungen als erstklassige Objekte behandelt werden, macht ein Wissensgraph auch Provenienz und Kontext nachvollziehbar – was in Bereichen wie Gesundheitswesen, Finanzen und Enterprise-Wissensmanagement entscheidend ist, wo Halluzinationen und veraltete Daten reale Risiken darstellen.

Wichtige Typen

  • Offene / öffentliche Wissensgraphen – große, allgemeine Graphen wie Wikidata, DBpedia und Googles Knowledge Graph, die aus öffentlichen Quellen erstellt und zur Anreicherung von Suche und Assistenten verwendet werden.
  • Enterprise-Wissensgraphen – private Graphen, die die internen Daten eines Unternehmens (Kunden, Produkte, Verträge, Assets) für Analysen, Compliance und KI-Anwendungen vereinheitlichen.
  • Domänen-Wissensgraphen – fokussierte Graphen in einem bestimmten Bereich, etwa Biomedizin (z. B. UMLS, Gene Ontology) oder Materialwissenschaft, wo Vokabular-Kontrolle und Kuratierung wichtiger sind als Breite.
  • Multimodale Wissensgraphen – Erweiterungen, die Textknoten mit Bildern, Videos oder Audio verknüpfen und so cross-modale Suche und Schlussfolgerung ermöglichen.

Bei all seinen Varianten liegt das definierende Merkmal eines Wissensgraphen darin, dass Beziehungen genauso abfragbar sind wie die Dinge, die sie verbinden – wodurch verstreute Fakten in eine navigierbare, maschinenlesbare Karte eines Bereichs verwandelt werden.

Das könnte Ihnen auch gefallen

Verwandte Beiträge