Anwendung von Ontologien für die Wissensrepräsentation und Kommunikation im Bereich des Kulturellen Erbes
Georg Hohmann (Germanisches Nationalmuseum)
ABSTRACT
Die wissenschaftliche Forschung an Einrichtungen des Kulturellen Erbes, den sog. Gedächtnisinstitutionen (Museen, Archive, Bibliotheken), produziert kontinuierlich eine große Menge an digitalen Daten. Im Gegensatz zu Bibliotheken liegt in Museen und Archiven weitgehend eine heterogene Infrastruktur vor, die nicht zuletzt in der Eigenart der Sammlungsmaterie begründet liegt. Daten zu Museums- und Archivobjekten, dem Kulturellen Erbe, repräsentieren nur zu einem geringen Teil faktisches Wissen, sondern sind weitgehend das Ergebnis (geistes-)wissenschaftlicher Forschung. Das Internet hat aber den Druck auch auf diese Institutionen erhöht, ihr vorgehaltenes Wissen verfügbar zu machen und zu kommunizieren. Wissenskommunikation bedeutet hier auch die automatisierte Kommunikation zwischen technischen Systemen, die durch die Unfähigkeit der Maschine zur Interpretation inhaltlich und strukturell exakt definiert sein muss.
Die heute gängige Praxis für den Datenaustausch ist die Verwendung von Datenaustauschformaten. Um diese Formate nutzen zu können, müssen die Daten aus dem lokalen System zunächst auf diese abgebildet werden (Mapping). Damit geht allerdings fast immer ein Daten- und Granularitätsverlust einher, da ein für den Austausch konzipiertes Format in der Regel inhaltlich wesentlich eingeschränkter und detailärmer ist als das Speicherformat des Ursprungssystems. Der Ausgangsdatensatz lässt sich daher aus dem Zielformat nicht mehr vollständig rekonstruieren. Die automatisierte Kommunikation zwischen Systemen für Wissen über das Kulturelle Erbe kann daher bis heute nicht als zufriedenstellend gelöst angesehen werden.
Diese Problematik wird von sog. Ontologien adressiert. Ihr Einsatz verspricht einen beliebigen Detailgrad der Daten bei gleichzeitiger Gewährleistung einer konsistenten inhaltlichen Ebene. Mit dem CIDOC Conceptual Reference Model (CRM) liegt bereits eine Ontologie für das Kulturelle Erbe vor. Das CRM wurde 2006 durch die International Organization for Standardization (ISO) in der Version 3.4.9 standardisiert und hat seitdem zunehmend an Bedeutung gewonnen. Ein Ziel des CRM ist explizit die Verbindung von Daten aus heterogenen Datenquellen zum Kulturellen Erbe. Erreicht werden kann diese Datenintegration durch die Zuordnung von einzelnen Dateneinheiten lokaler Systeme - basierend auf ihrem (impliziten) Gehalt - zu den Klassen und Eigenschaften des CRM.
War die Anwendung des CRM bisher auf die theoretische Modellierung von Daten beschränkt, so bieten sich heute Techniken aus dem Umfeld des Semantic Web zur technischen Realisierung an. Die Implementierung des CRM unter Verwendung der Web Ontology Language (OWL) ist die Voraussetzung zu seiner Verwendung als Referenzontologie. Auf dieser Basis können lokale
Applikationsontologien zur Datenerfassung erstellt werden, die trotz beliebiger Ausspezifizierung eine vollständige semantische Integrität bewahren und so einen vollautomatisierten Datenaustausch ohne explizites Mapping und Datenverlust ermöglichen. Wie das Projekt "Wissenschaftliche KommunikationsInfrastruktur" (WissKI) am Germanischen Nationalmuseum
zurzeit exemplarisch zeigt, werden mit diesem Ansatz Systeme realisierbar, die eine neue Form der vollautomatischen Wissenskommunikation nicht nur im Bereich des Kulturellen Erbes ermöglichen können.
« Hide