Praxisbericht zu notwendigen Strategien und Infrastrukturen für datenorientierte Publikationen im Semantic Web

Erfassung, Digitalisierung und Online-Publikation kunsthistorischer Fotos und Objekte sowie die Entwicklung von Standards und Best Practices sind seit Jahrzehnten Hauptaktivitäten des Deutschen Dokumentationszentrums für Kunstgeschichte – Bildarchiv Foto Marburg (DDK). Als „Agent“ der „Domäne Kunstgeschichte“ betreibt das DDK seit 1999 Web-Portale mit über zwei Millionen Datensätzen, die ständig im Kontext der informationstechnischen Fortschritte angepasst und weiterentwickelt werden. Über die bloße Produktion und Publikation von Digitalisaten und Metadaten hinaus, sind die Vernetzung der digitalen Angebote sowie die Entwicklung der dazu notwendigen Infrastruktur Hauptarbeitsgebiete des DDK. Im Kontext von Linked Open Data stellt sich hier die Aufgabe der Aufbereitung kunsthistorischer Daten für das Semantic Web.

Die Anbindung kunsthistorischer Daten und Objekte an das Web muss unter zwei Perspektiven betrachtet werden. Die erste richtet sich auf das dokumenten- und browserbasierte „normale“ Web, die andere auf das datenbasierte „Web of Data“ bzw. Semantic Web. Das normale Web ist dominiert von großen IT-Konzernen wie Suchmaschinen, Sozialen Medien etc., daher ist es notwendig eine Marketing-Strategie zu bilden, um das digitale Objekt im Web sichtbar zu machen. Dagegen fordert das Semantic Web eine wissenschaftliche Tätigkeit, in der das Objekt formal mit Wissensrepräsentationssprachen beschrieben und im Kontext von Linked Open Data zur Verfügung gestellt wird. Die Datenqualität ist in beiden Perspektiven die Schlüsselbedingung, um das Objekt im Web auffindbar und im Semantic Web domänenübergreifend verfügbar zu machen. Um diese Ziele zu erreichen, hat das DDK mehrere Projekte gestartet.

Zum einen werden auf MIDAS und LIDO basierende Datenbestände auf Semantic-Web-konforme Daten konvertiert, wobei das CIDOC-CRM als Referenz- und Ziel-Modell eingesetzt wird. Darüber hinaus wird die Software für die Datenerfassung und -redaktion dahingehend angepasst, dass kunsthistorische Objekte dauerhaft mit Persistent Identifiern publiziert werden können. Die Persistenz von URIs ist Grundvoraussetzung für die Nachhaltigkeit von Linked-Data-Anwendungen. Nach der Publikation müssen weitere Aufgaben und Analysen folgen, um das Objekt im Web auffindbar zu machen. Um diese Prozesse zu realisieren, ist die Anpassung und Neubildung von Infrastrukturen notwendig. Der Vortrag stellt die konkreten Erfahrungen, den Stand der aktuellen Aktivitäten und die Strategie des DDK vor.