Semantic Web Technologien im Kontext geisteswissenschaftlicher und explorativer Forschungsprozesse
Niels-Oliver Walkowski (Berlin-Brandenburgischen Akademie der Wissenschaften)
ABSTRACT
Semantic Web Technologien sind in der Vergangenheit angetreten, um dem Computer die Bedeutung von Ressourcen zu vermitteln und ihn in die Lage zu setzen, aus Wissensbasen selbständig Inferenzen ziehen zu können. Die Nützlichkeit, aber auch die Anwendbarkeit dieser Idee mit utopischen Charakter wird in der Praxis von unterschiedlichen Problemstellungen begleitet. Gerade in den Geisteswissenschaften hat es im Bereich der digitalen Wissensrepräsentation kritische Einwände gegeben, so z.B. in der Auseinandersetzung mit relationalen und objektorientierten Datenmodellen (Ingo Jonas: 2007). Aspekte, die dabei immer wieder identifiziert wurden, sind die notwendige Reduktion von relevanter Komplexität (Stefanie Rüther: 2007) und der Eintritt in einen zirkulären Forschungsprozess (Katrinette Bodarwe: 2007), bei dem die Prämissen einer Hypothese in das Inhaltsmodell externalisiert werden und so möglichen Ergebnisse einer Abfrage vorgreifen. Ebenfalls wurde die Starrheit von Datenmodellen als problematisch empfunden, die sich parallel zur Arbeit an den Daten nicht mehr verändern lassen, ohne dass dabei die Integrität der Datenbank verloren geht (Holger Gast: 2006).
Das Semantic Web besitzt jenseits übertriebener Hoffnungen auf computergeneriertes Wissen mit RDF aber auch ein Datenmodell mit einer Reihe von Eigenschaften, das es als Modell zur Wissensrepräsentation in den Geisteswissenschaften qualifiziert und dabei die zuvor aufgezählten Schwierigkeiten vermindert bis aufhebt. So setzt die Strukturierung der Daten durch RDF Triples kein Klassifikationsschema oder Inhaltsmodell voraus, wie es in der Arbeit mit Datenbanken der Fall ist. Hingegen ermöglicht RDF die Spezifizierung und Organisation der Daten ausgehend von den einzelnen Daten selbst. Eine Abstraktion auf der Meta-Ebene lässt sich im Nachhinein aus der erfolgten Datenorganisation deduzieren. Diese Vorgehensweise ermöglicht ein computer-unterstütztes Arbeiten auch mit heterogenen Datenbeständen. Ein weiterer Vorteil dieser horizontalen Datenstrukturierung ist die Möglichkeit der Mehrfacherschließung und der Abbildbarkeit kontingenter Strukturierungen, z.B. durch Container. Datenobjekte können so später kontextualisiert und unterschiedliche Diskurse mit ein und derselben Datenbasis erzeugt werden.
Weitere Vorteile von Semantic Web Technologien werden insbesondere in Abgrenzung zu anderen verbreiteten Ansätzen wie z.B. Topic Maps oder OWL deutlich. So kann die stärkere Implementierung von Mustern aus der formalen Logik auch die Integration von Datenbeständen erschweren, die diese Strenge noch nicht vorweisen oder deren Brauchbarkeit sich durch sie vermindern würde. Des Weiteren knüpfen sich an RDF andere Initiativen wie Linked Data an, die Daten kommunizier- und verknüpfbar machen. Dies ermöglicht ein vernetztes Arbeiten mit Datenbeständen, welches den diskursintensiven Charakter von Geistes- und Sozialwissenschaften besonders zu gute kommt. Nicht die Ersetzung bestimmter Abschnitte im Forschungsprozess, sondern ihre bessere Unterstützung durch Möglichkeiten der Wissensorganisation bildet das Potenzial des Semantic Web für die Geisteswissenschaften, welches im Vortrag beschrieben werden soll. Die beschriebenen Ansätze fußen dabei auf Überlegungen aus dem Projekts Personendaten-Repositorium der BBAW.

