📖

Was ist Wissensgraph?

Ein Wissensgraph stellt reale Entitäten und die Beziehungen zwischen ihnen als Netzwerk aus Knoten und Kanten dar und ermöglicht es Maschinen, vernetzte Fakten abzufragen, zu verknüpfen und darüber zu schlussfolgern.

Ein Wissensgraph ist eine Methode, um Informationen als Netzwerk aus Entitäten (den Dingen in der Welt, wie Personen, Orte, Produkte oder Konzepte) und den Beziehungen, die sie verbinden, zu organisieren. Anstatt Fakten in isolierten Tabellen oder Dokumenten zu speichern, verknüpft ein Wissensgraph sie miteinander, sodass eine Aussage wie „Paris ist die Hauptstadt von Frankreich" als strukturiertes Tripel dargestellt wird: ein Subjekt (Paris), ein Prädikat (ist die Hauptstadt von) und ein Objekt (Frankreich). Diese Struktur ermöglicht es Software, Verbindungen zu durchlaufen, Bedeutungsketten zu folgen und Antworten zu liefern, die über einfaches Keyword-Matching hinausgehen.

Wie ein Wissensgraph funktioniert

Im Kern besteht ein Wissensgraph aus Tripeln, die in einem formalen Schema ausgedrückt werden, am häufigsten im Resource Description Framework (RDF) oder im Property-Graph-Modell, das von Datenbanken wie Neo4j verwendet wird. Jedes Tripel behauptet einen Fakt: (Marie Curie) — entdeckte — (Radium). Knoten tragen Eigenschaften und Typen (z. B. eine „Person"), während Kanten die Art der Beziehung tragen. Ein Schema oder eine Ontologie definiert, welche Arten von Entitäten und Beziehungen zulässig sind, sodass der Graph Konsistenz erzwingen und grundlegendes Schließen unterstützen kann.

Die Konstruktion ist typischerweise eine Pipeline aus Extraktion und Integration. Quelldokumente, Datenbanken oder Webseiten werden analysiert, benannte Entitäten werden erkannt, Kandidatenbeziehungen werden extrahiert (häufig mit Machine-Learning-Modellen), und die Ergebnisse werden gegen einen bestehenden Graphen abgeglichen, um Duplikate zusammenzuführen. Abfragesprachen wie SPARQL oder Cypher ermöglichen es Anwendungen dann, graphförmige Fragen zu stellen, etwa „welche Wissenschaftler haben an Institutionen gearbeitet, die von X finanziert wurden, und zu Y publiziert?" – etwas, das in einer relationalen Datenbank kostspielige Joins erfordern würde.

Warum es wichtig ist

Wissensgraphen bieten KI-Systemen ein gemeinsames, explizites Substrat an Fakten, auf das sie zurückgreifen können. Suchmaschinen nutzen sie, um direkte Antwortpanels zu liefern; Empfehlungssysteme nutzen sie, um verwandte Elemente über gemeinsame Attribute zu finden; und große Sprachmodelle nutzen sie als Quelle fundierter, aktueller Informationen durch Techniken wie Retrieval-Augmented Generation. Indem Beziehungen als erstklassige Objekte behandelt werden, macht ein Wissensgraph auch Provenienz und Kontext nachvollziehbar – was in Bereichen wie Gesundheitswesen, Finanzen und Enterprise-Wissensmanagement entscheidend ist, wo Halluzinationen und veraltete Daten reale Risiken darstellen.

Wichtige Typen

  • Offene / öffentliche Wissensgraphen – große, allgemeine Graphen wie Wikidata, DBpedia und Googles Knowledge Graph, die aus öffentlichen Quellen erstellt und zur Anreicherung von Suche und Assistenten verwendet werden.
  • Enterprise-Wissensgraphen – private Graphen, die die internen Daten eines Unternehmens (Kunden, Produkte, Verträge, Assets) für Analysen, Compliance und KI-Anwendungen vereinheitlichen.
  • Domänen-Wissensgraphen – fokussierte Graphen in einem bestimmten Bereich, etwa Biomedizin (z. B. UMLS, Gene Ontology) oder Materialwissenschaft, wo Vokabular-Kontrolle und Kuratierung wichtiger sind als Breite.
  • Multimodale Wissensgraphen – Erweiterungen, die Textknoten mit Bildern, Videos oder Audio verknüpfen und so cross-modale Suche und Schlussfolgerung ermöglichen.

Bei all seinen Varianten liegt das definierende Merkmal eines Wissensgraphen darin, dass Beziehungen genauso abfragbar sind wie die Dinge, die sie verbinden – wodurch verstreute Fakten in eine navigierbare, maschinenlesbare Karte eines Bereichs verwandelt werden.

Häufig gestellte Fragen

What is the difference between a knowledge graph and a database?
A traditional relational database stores data in tables with predefined schemas and relies on joins to connect records. A knowledge graph stores data as a network of entities and relationships, where the connections themselves are first-class and can be traversed directly. This makes knowledge graphs more flexible for highly connected, evolving, or semantically rich data.
How is a knowledge graph different from a large language model?
A large language model (LLM) is a neural network that learns statistical patterns from text and generates fluent responses, but it does not store facts in a structured, queryable form. A knowledge graph is an explicit, curated store of facts and relationships. They are often combined — the graph supplies verified, up-to-date facts while the LLM handles natural-language understanding and generation.
What is retrieval-augmented generation (RAG) and how does it use a knowledge graph?
Retrieval-augmented generation is a pattern in which a model first retrieves relevant information from an external source and then generates an answer conditioned on that information. A knowledge graph can serve as the retrieval source, allowing the system to pull specific entities and relationships rather than raw text passages, which improves precision and makes the grounding of each claim inspectable.
Do small teams need a knowledge graph, or is it only for large companies?
Public knowledge graphs such as Wikidata and DBpedia are freely available, and lightweight graph databases make it practical for small teams to build focused graphs for specific projects. The investment only pays off when the data is genuinely relational and the team needs to query connections directly; for simple structured data, a spreadsheet or relational database is usually sufficient.