Drei Bibliothekarinnen aus der ZB Zürich reisten im Dezember 2018 an die ersten GNDCon in Frankfurt. Sie berichten von internationalen Projekten und Kooperationen und zeigen auf, wie spannend normierte Daten sein können.
Am 3. und 4. Dezember 2018 lud die Deutsche Nationalbibliothek (Arbeitsstelle für Standardisierung) zur ersten GNDCon nach Frankfurt. Die glücklichen fast 300 an der Gemeinsamen Normdatei GND Interessierten, die sich einen Platz für die rasch ausgebuchte Veranstaltung ergattert hatten, trafen sich zum Austausch über eine Vielfalt von Themen rund um die GND.
Die Convention stand unter dem Motto »Öffnung der GND«, und so nahmen neben Bibliotheksmitarbeitenden auch Interessierte aus Archiven und Museen (siehe auch das Projekt „GND für Kulturdaten (GND4C)“), aus Forschung und Softwareentwicklung sowie schwerpunktmässig von Wikimedia Deutschland teil. Wikimedia gehörte neben den Partnern in der GND-Kooperative auch zu den Sponsoren der Tagung.
Konferenz-Webseite: https://wiki.dnb.de/display/GNDCON2018/GNDCon+2018
Nach einführenden Keynote-Reden und einer Podiumsdiskussion setzten sich die Teilnehmenden in den in vier Blöcken parallel geführten Sessions mit der Gegenwart und Zukunft der GND und von Normdaten generell auseinander. Nach je zwei Blöcken wurden die Fragen und Resultate der einzelnen Sessions im Plenum präsentiert, so dass alle über die Diskussionen informiert waren.
Programm/Päsentationen: https://wiki.dnb.de/display/GNDCON2018/Programm+%7C+GNDCon+2018
Keynotes (Madeleine Boxler)
Einleitend unterstrichen Harriet Aagard (Svenska Kungliga Biblioteket), Vincent Boulet (Bibliothèque Nationale de France) und Jürgen Kett (DNB) in den Keynotes die Qualitäten der bibliothekarischen Normdaten. Dank Regeln und Standards, der Verwendung von stabilen Identifiern sowie einer verlässlichen Langzeitsicherung durch die beteiligten Institutionen zeichnen sich die Normdaten durch hohe Interoperabilität aus und eignen sich so sehr gut zur Nachnutzung als Linked Data – insbesondere wenn sie in den entsprechenden Formaten und passenden Lizenzen auch als Open Data zur Verfügung gestellt werden. Einig war man sich auch, dass die Verlinkung von Daten einfacher und zukunftsgerichteter ist als die Datenübernahme (aggregation) aus verschiedenen Quellen in den eigenen Katalog bzw. den eigenen Thesaurus.
Neue französische Normdatei
Vincent Boulet erläuterte das Projekt einer neuen nationalen Normdatei in Frankreich. Bis 2022/23 soll – als Kooperation von öffentlichen und wissenschaftlichen Bibliotheken , Museen und Archiven – ein Fichier national d’entités (FNE) entstehen, das konzeptionell auf dem IFLA-LRM und technisch auf Wikibase beruht. Zum Amusement aller prägte Boulet den Begriff „vintage linked data“ für die Bibliothekskatalogdaten, da diese seit jeher bibliographische Daten und Autoritätsdaten miteinander verbinden.
Wikidata: Wissen strukturiert erfassen
Als Keynote-Speakerin von ausserhalb der Bibliothekswelt wurde Lydia Pintscher (Wikimedia) eingeladen. Sie führte ins Universum von Wikidata ein, in dem sich ca. 20‘000 Freiwillige damit beschäftigen, das Wissen der Welt in strukturierter Form zu erfassen. Jeder der ca. 52 Millionen Einträge in Wikidata hat einen permanenten Identifier (Q plus Numerus currens) und ist mit anderen Normdateien und Datenbanken (ca. 3‘400 externe Datenbanken) verknüpft.
Zurzeit figuriert die GND an fünfter Stelle der am häufigsten verlinkten externen Vokabulare. Wie alle Wikimedia-Projekte ist Wikidata mehrsprachig und multikulturell, es sind darin verschiedene Weltsichten und Meinungen vertreten. Für die Transparenz sind deshalb Quellenangaben zentral. Für die Qualitätssicherung werden automatisierte Plausibilitätskontrollen durchgeführt, „verdächtige“ Daten werden von Redaktoren intellektuell kontrolliert. Trotzdem steht der Mitmachgedanke mit einer eigentlichen Autoritätskontrolle in Konkurrenz, ebenso der Wille zur Korrektheit mit dem Willen zur Offenheit.
Ein grosser konzeptioneller Unterschied zwischen Wikidata und den bibliothekarischen Normdaten besteht darin, dass Wikidata die Welt insgesamt beschreiben will, die Normdaten der Bibliotheken jedoch dazu angelegt werden, dass damit Ressourcen und deren Inhalte beschrieben werden, um den Zugang zu ihnen zu gewährleisten.
Sessions (Madeleine Boxler)
Aufgrund meiner Mitarbeit im SLSP-Track 4 „Multilingual Authorities“ und der Gruppe Metadaten, die empfiehlt, für die mehrsprachige Normdatenarbeit in SLSP nach einer innovativen Lösung zu suchen, besuchte ich Sessions, die sich mit verschiedenen Vokabularen und Möglichkeiten der Multilingualität auseinandersetzten. Ausserdem interessierte es mich, mehr über Wikidata zu lernen.
Übersetzung von GND-Schlagwörtern
Martin Fassnacht (UB Tübingen) präsentierte das DFG-Projekt zur Übersetzung von GND-Schlagwörtern. Das Projekt hat zum Ziel, dass die internationalen Nutzenden der Fachbibliographie Index Theologicus (IxTheo) darin in ihrer eigenen Muttersprache suchen können. Dafür wurden 28‘000 Schlagwörter identifiziert, die für den IxTheo relevant sind, und durch professionelle Übersetzer in acht Sprachen übersetzt. Diese Übersetzungen sind bislang nicht in der überregionalen GND eingespielt, die englischen immerhin im GND-Derivat des SWB. Es wurde angedacht, die Übersetzungen der Original-GND z.B. in einem zweiten Datensatz anzugliedern (anstatt sie einzuspielen), damit sie je nach Bedarf genutzt werden können oder nicht.
Diskutiert wurde die Frage nach der Äquivalenz von Begriffen und die Schwierigkeiten, die sich durch die den verschiedenen Vokabularen zugrundeliegenden unterschiedlichen Konzepte (z.B. Präkombination vs. Postkoordination) für die Multilingualität ergeben. Damit Übersetzungen in der GND nicht stören, wäre eine konsequente Disambiguierung notwendig.
Mapping von Normdateien
Dieselben Fragen stellen sich beim Mapping verschiedener Normdateien, egal ob diese deutsch oder in verschiedenen Sprachen vorliegen. Unschärfen in der Begrifflichkeit lassen sich nicht vermeiden, zentral wäre aber, dass beim Mapping Angaben gemacht werden, wie exakt es ist und um welchen Relationstyp es sich handelt (gleicher/ähnlicher Begriffsumfang, Unter-/Oberbegriff etc.). Ernüchternd ist, dass das Mapping für gute Resultate nach wie vor intellektuell gemacht werden muss, allenfalls automatisch unterstützt. Dies gilt insbesondere dann, wenn das Mapping von den Vokabularen und einzelnen Begriffen ausgeht. Ausgehend von den Dokumenten, die mit den verschiedenen Normdaten beschrieben sind, ist maschinelles Mapping aufgrund von „co-occurences“ eher möglich, braucht aber ebenfalls intellektuelle Kontrolle. Mappings können Suchräume erweitern (Beispiel WebDewey: Angabe von GND-Begriffen, die zu den Klassen gehören), die Metasuche über heterogen erschlossene Bestände unterstützen (Beispiel European Library) oder der Fremddatenübernahme dienen (Anreicherung mit Begriffen aus einem anderen Thesaurus, Beispiel Digitaler Assistent DA3).
Im Projekt Coli-conc des GBV werden zurzeit Mappings gesammelt und erstellt, auch solche mit der GND. Zur Erstellung von Mappings steht das Cocoda Mapping Tool zur Verfügung. Schwierig sind Konkordanzen v.a. im Bereich der Sachbegriffe, aber auch bei Körperschaften und Geografika. Einfacher sind die Mappings für Personen.
Auch die DNB hat ein auf 2019 bis 2020 angelegtes Mapping-Projekt: GNDmul. Dabei geht es um die Erarbeitung kooperativer Prozesse für die Pflege (regelmässige Updates) und Nutzung von Mappings. Die Ergebnisse des MACS-Projekts sollen in die Organisation der GND integriert werden. Der Fokus liegt zunächst auf englischen Thesauri (LCSH, MeSH, AGROVOC). Die Datenstrukturen werden vereinheitlicht und als Linked Data zur Verfügung gestellt.
Auch mit diesem Projekt wird die GND nicht durchgängig mehrsprachig, schon gar nicht auf der Ebene des Labelings der Felder und Beziehungen für die Nutzenden und die Bibliotheksmitarbeitenden. Es wäre aber für SLSP zu prüfen, inwiefern solche Mappings und Verlinkungen mit französisch- und italienischsprachigen Normdaten fruchtbar gemacht werden können, um Mehrfacharbeit zu verringern oder sogar zu vermeiden und Sucheinstiege in allen Sprachen realisieren zu können.
Maschinelles Annotieren
Trotz technischen Fortschritten ist das maschinelle Annotieren mit Schlagwörtern oder Sachgruppen weiterhin mit Schwierigkeiten verbunden. Dies zeigte sich auch in der Präsentation einer Masterarbeit über die automatische Vergabe von Sachgruppen aus Titeldaten. Andreas Hess und Alexander Gerling (Hochschule Furtwangen) befassten sich mit maschinellem Lernen und konnten anhand von Versuchen mit ca. 34‘000 Titeldaten von Hochschulschriften aus der DNB zeigen, dass die Nutzung neuronaler Netze zu besseren Resultaten führen als die klassischen Methoden Naive Bayes (statistisches Verfahren) und Support Vector Machines. Auch die Einbeziehung von Hintergrundwissen etwa zu den Autoren oder den Hochschulen, die mit den Hochschulschriften zusammenhängen, kann die Resultate verbessern.
Wikidata als Ersatz?
Warum aber eigentlich noch eine eigene Normdatei pflegen und nicht einfach Wikidata zur Beschreibung der Ressourcen in Bibliotheken nutzen? Jens Ohlig (Wikimedia Deutschland) unterstrich in zwei Sessions die Pluspunkte von Wikidata: Wikidata …
- ist eine strukturierte Wissensdatenbank
- ist öffentlich verfügbar
- wird kooperativ gepflegt
- sammelt generelle Begriffe aus allen bibliothekseitig genutzten Kategorien
- widerspiegelt durch Belege und Quellenangaben transparent die Wissensvielfalt
- kann mit spezialisierten Ontologien verknüpft werden
- ist mehrsprachig (Speicherung der Konzepte als Nummern mit Bezeichnungen/Labels in unterschiedlichen Sprachen)
- kann mit unterschiedlichen Schriften umgehen
- gehört zum Linked Open Data Web
- ist ein „Hub für Identifikatoren“ (intellektuelle Verlinkung mit Identifiern aus anderen (Norm-)Datenbanken), abfragbar über SPARQL
- basiert auf der Open Source-Software Wikibase (www.wikiba.se), die auch ausserhalb der Wikimedia-Projekte genutzt werden kann (Beispiele: FactGrid, Rhizome, WikiGenomes)
- wurde von Wikimedia Deutschland entwickelt
- liegt auf den Servern der Wikimedia Foundation (in den USA und den Niederlanden)
- will mit der DNB ein Kooperationsprojekt starten.
Für eine komplementäre Nutzung von GND und Wikidata plädierte Joachim Neubert (wissenschaftlicher IT-Entwickler, Zentralbibliothek für Wirtschaftwissenschaften). Die Mitarbeitenden könnten aktiv zu Wikidata beitragen und von den Arbeiten der internationalen Wikidata-Community profitieren. „Kerninformationen“ sollten Neuberts Ansicht nach weiterhin in der GND gespeichert sein, zusätzliche Informationen könnten aber über Wikidata verlinkt werden. Skripts könnten die automatische Verknüpfung bzw. Bearbeitung oder Erstellung von Wikidata-Einträgen aus der GND heraus unterstützen.
Fazit
Stabilität und Verlässlichkeit – dafür stehen die Nationalbibliotheken als Betreiber der nationalen Normdateien und das sind die Punkte, die zurzeit (noch) für die Nutzung bibliothekarischer Thesauri sprechen. Welche Mechanismen zur Qualitätssicherung – zur Autoritätskontrolle – braucht es weiterhin? Wo könnten Kooperationen mit Wikimedia (oder anderen Projekten) das Universum der Normdaten erweitern? Die Öffnung der GND scheint greifbar zu werden und die DNB will offensichtlich kräftig zum Gelingen beitragen, indem sie sich den neuen Entwicklungen nicht verschliesst und sowohl technisch als auch organisatorisch neue Wege einschlagen will. Darum bleibt die GND m.E. auch für eine mehrsprachige Normdatenlösung in SLSP eine wichtige Instanz.
Sessions und Talks (Stephanie Bolliger)
Werke
Arno Barnert (Herzogin Anna Amalia Bibliothek) und Karin Schmidgall (DLA Marbach) berichteten von ihrem geplanten Projekt, in dem sie die Entität „Werk“ auch im Onlinekatalog sichtbar und für den Benutzer suchbar machen wollen. Dafür möchten sie einen entitätenbasierten Suchschlitz bauen. Zudem plädierten sie für die Visualisierung der FRBR-Entitäten im Online-Katalog. Dazu kam in der anschliessenden Diskussion aus der Gruppe Kritik an den Discovery-Software-Herstellern, welche in dieser Hinsicht noch nicht viel liefern können. Es entspann sich eine Nutzen-Aufwand-Diskussion von Werktitel-Sätzen, wobei sich zwei Meinungen herauskristallisiert haben: Einerseits wurde der grosse Nutzen von Autor-Werk-Sätzen hervorgehoben:
- „RDA lohnt sich doch überhaupt nur wegen dem Thema“, „Das ist ja genau das Positive an RDA“
- deutliche Verbesserung der Recherchemöglichkeiten, weil verschiedene Realisierungen gebündelt werden
- spartenübergreifende Bestandsvernetzung: von den ersten handschriftlichen Entwürfen bis zu verschiedenen Drucken: alle Ressourcen zu einem Titel könnten, auch über Institutionen hinweg, zusammengebracht werden – Bestände werden sichtbarer gemacht
Andererseits wurden die Werktitel-Sätze auch als Luxus bezeichnet, für den nur wenige Bibliotheken Zeit haben.
Forschungspraxis
In dieser Session wurden zwei Projekte präsentiert. Harald Lordick (Steinheim-Institut) stellte den (STI Linked Data) Service vor, eine Informationsdatenbank, welche im Zusammenhang mit dem Projekt „Posener Heimat in der Literatur und Publizistik deutscher Juden 1918-1938“ die GND-Daten als Quelle nutzt. Darüber hinaus bringen die Historiker dabei in Form einer Kooperation mit einer Universitätsbibliothek und über das GND-Webformular auch Informationen in die GND.
Die zweite Kurzpräsentation kam von Olaf Simons (Forschungszentrum Gotha der Universität Erfurt), der für sein historisches Projekt zum Thema Illuminaten eine eigene Datenbank (Wikibase-Instanz) erstellt hat: Factgrid. Dabei steht in Bezug auf die Personen-Datensätze eine Zusammenarbeit mit der GND an.
GND für Verlage
Alexander Haffner, Datenmanager beim VLB (Verzeichnis lieferbarer Bücher), berichtete über die Bestrebungen, den Verlagen zur eindeutigen Identifikation von Autoren und zur Steigerung der Metadatenqualität Identnummern (GND, ISNI, ORCID) schmackhaft zu machen. VLB plant – ähnlich wie z.B. bereits bei Amazon sichtbar (Beispiel: Jürgen Roth auf Amazon) – Autorenseiten mit Kurzinformationen und Titelliste. Dafür könnten Daten der GND genutzt werden. Weitere Idee: Verlage könnten ihrerseits auch Daten oder Korrekturen für die GND liefern.
GND für Kulturdaten
Martin Lüpold (UB Basel) und Esther Ernst (GND Verbundredaktion UB Basel) berichteten, dass sie schon mehrere Anfragen von ausserbibliothekarischen Projekten erhalten haben, die ihre Daten gerne in die GND einbringen würden. Das gestalte sich mit dem GND-Webformular im Moment schwierig, da es dabei oft um eine grosse Personendatenmenge geht, die man mit maschinellen Verfahren einspeisen müsste. In einer Zusammenarbeit sehen die Referenten für die GND sowie für Forschungsprojekte Vorteile: Die GND reichert ihre Daten an und die Forschungsprojekte können auf eine stabile qualitativ gute Datenbank mit persistenter ID und einem semantischen Netz zurückgreifen. Für die Bibliothek sei es doch eine gute Aufgabe, unter dem Stichwort Forschungsdatenmanagement als Vermittlerin für lokale Archive und Museen und der GND aufzutreten. Die GND möchte sich für nicht-bibliothekarische Kulturinstitutionen öffnen und mit dem Projekt GND4C die Grundlagen für eine bessere Zusammenarbeit erarbeiten.
Fazit
Die GND ist nicht nur für Bibliotheken, sondern auch für die historische Forschung wertvoll. Umgekehrt können auch Forschungsprojekte einen Beitrag an die GND-Redaktion leisten. Die GND hat also viel Potential (sowohl bibliothekarisch als auch nicht-bibliothekarisch) und ich finde es lohnend, Arbeit hineinzustecken.
Sessions und Talks (Alice Robinson)
Das Motto “Öffnung der GND” hat mich neugierig gemacht. Als Erschliesserin von Bildmaterial sowie Redaktorin für die Normdaten der Graphischen Sammlung begrüsse ich den Impuls, Museen, Kulturerbe-Sparten und die Forschungs-Community der Geisteswissenschaften aktiver in die GND einzubinden. Aber wie? Aus meiner Arbeit in der AG Bild (D-A-CH) sind mir die Defizite der GND z.B. für Kunstwerke sehr bewusst. Meine erste Session sollte das Thema ausführlicher behandeln:
Druckgraphik
Geleitet von Antje Theise (SUB Hamburg), Franziska Ehrl (Graphische Sammlung, Staatsbibliothek Bamberg), Maria Effinger (Universitätsbibliothek Heidelberg) und Christian Bracht (Deutsches Dokumentationszentrum für Kunstgeschichte, Bildarchiv Foto Marburg) drehte sich die Fragestellung um GND-Werktitelnormdaten für Kunstwerke. Wir haben den im Projekt HeidlCON erstellten Datensatz für Christus am Ölberg (ca. 1496 von Albrecht Dürer) zusammen diskutiert. Das Projekt hat als Ziel, alle Einträge des kunsthistorischen Schlüsselwerks von Adam Bartsch in der GND als Werktitelnormdaten anzusetzen. Demzufolge hat der Holzschnitt von Dürer seinen Hauptsucheinstieg auf Französisch, die Bartsch-Nummer ist ebenfalls inkorporiert. Alles etwas gewöhnungsbedürftig. Anschliessend diskutierten wir vier Fragen (mit Stoppuhr):
- Integration im Graphikportal: Aus der Graphischen Sammlung der ZB sind ca. 23’500 Bilddokumente hier online. Bei solchen Fachdatenbanken kann die GND als gemeinsamer Anker funktionieren, der für Disambiguierung, Verifizierung und weitere Verlinkungen sorgt.
- Inhaltsbeschreibung: Bereicherung von GND-Normdaten durch Anwendung von weiteren Erschliessungselementen. ICONCLASS ist ein Favorit in der Kunstcommunity, da bereits sehr etabliert und nuanciert für die Inhaltsbeschreibung von Kunstwerken: das Interesse an der GND von nicht-bibliothekarischen Fachleuten wurde thematisiert.
- Nutzung für lokale Präsentation: Selbstverständlich würden Werktitelnormdaten, sofern sie existierten, verwendet werden, auch auf lokaler Ebene. Wie gehen aber Sammlungen um mit Normdaten für dokumentarische, mittelmässige oder gar anonyme Bilder, wovon die Graphische Sammlung der ZB zahlreiche besitzt? Was ist überhaupt “ansetzungswürdig”
- Elefantenrunde: Mehrheitlich waren die Teilnehmenden überzeugt von der Nutzung von Werktitelnormdaten, mit einem Plädoyer für kooperative Produktion und Pflege der Daten. Wer darf Normdaten erstellen? Die Regeln werden als zu anspruchsvoll erachtet: das Webformular sollte weiter entwickelt werden. Wer hat die wissenschaftliche Hoheit bei Unklarheiten bezüglich Zu- und Abschreibung von Kunstwerken?
Ich fand das Thema wichtig, da Kulturobjekte im semantischen Web positioniert werden müssen: normiert, verlinkbar und korrekt. Der Weg zu diesem Ziel braucht aber noch Input.
Normdaten in den Digital Humanities
Diese sehr gut besuchte Präsentation befasste sich mit den Schnittstellen von Normdaten und Forschung. Was kann die GND den Digital Humanities anbieten? Zwei Projekte erläuterten die Frage: Eine Kooperation zwischen der Schweizerischen Nationabibliothek und metagrid.ch ermöglicht die Eingliederung von bibliothekarischen Standards (z.B. die Pflege mit klaren Regeln von Normdaten zur Schweizer Geschichte) in das Projekt metagrid. Der Webservice bietet die Einrichtung, Verwaltung und Analyse von Links zu identischen Entitäten (z.B. Personen) von verschiedenen Websites und Datenbanken (z.B. der GND) via eine Konkordanz. Christiane Sibille (metagrid.ch) und Christian Aliverti (SNB) diskutierten über die Zusammenarbeit einer Nationalbibliothek und einem Webservice. Der Wissens- und Erfahrungsaustausch wird gefördert, die Sichtbarkeit beider Teilnehmer steigt und die GND wird herausgefordert: braucht es eine neue Zwischenschicht von GND-Datensätzen ausserhalb der Bibliotheks-Community? Sind die Ansetzungsregeln der GND zu kompliziert?
Das zweite Projekt in dieser Session correspSearch (Sascha Grabsch, Berlin) verwendet die GND für digitale Editionen in den Geisteswissenschaften. Der Webservice ermöglicht projekt- und editionsübergreifende Recherchen von editierten Briefen: Verzeichnisse verschiedener digitaler und gedruckter Briefeditionen können nach Absender, Empfänger, Schreibort und Datum durchsucht werden. CorrespSearch ergänzt bestehende Infrastrukturen (frei lizenzierte digitale Briefverzeichnisse) und arbeitet standardbasiert (TEI-XML/CMIF, Normdaten). Zu den Projektaufgaben zählen die Nutzung von Normdaten, die Anreicherung bestehender Daten, der Abgleich bestehender Register sowie der Abgleich verschiedener Normdatensysteme. Sie ergänzen auch vorhandene Normdaten, z.B. mit “unbedeutenden” Personen. (Hier wurde wieder über den Schwierigkeitsgrad der Ansetzungsregeln für die GND und über das GND-Webformular diskutiert). Ein wichtiger Punkt wäre die Einbeziehung von bibliothekarischen Fachleuten in solche Webservices, um die Normdaten regelkonform zu pflegen. Die Referentin betonte den Bedarf an Normdaten in den folgenden Bereichen: Personen, Orte/Gebäude, Literarische Werke, Werke der bildenden Kunst und der Musik, Tiere und Pflanzen, Masseinheiten, fachspezifisch (z.B. Orden, Währungen).
Von essentieller Bedeutung sind gut dokumentierte und nutzbare APIs; als Beispiel dafür zitierte die Referentin GeoNames.org. Internationalität ist auch essentiell (VIAF, BNF, LC usw.). Die APIs werden verwendet, unter anderem, um den sogenannten csLink zu kreieren, eine dynamische Erzeugung von Korrespondenznetzwerken. In diesem Zusammenhang wurde die GND gelobt. Für die Graphische Sammlung relevant war der Wunsch nach Bilddateien (z.B. Porträts) generell, um die Materialien visuell auszustatten.
Zusammenfassend wurden die Desiderata von correspSearch aufgelistet:
- Recherchetools und klare Dokumentation, Best Practices etc.
- Einfachere Ergänzung der GND
- Gut ausgestattete, performante und stabile APIs (Eingrenzung von Queries, Auto-Suggest etc.)
- Fokus der GND auf Stärken – klare Aufteilung von “Verantwortlichkeiten” durch verschiedene Normdatengeber
- URIs für Einträge der VD16/VD17/VD18 – und ein VD19
- Umfangreiche Normdaten für (literarische) Werke: Werk vs. Ausgabe
Diese Session war augenöffnend: die Forschungscommunities der Digital Humanities sind sehr interessiert an der GND und benutzen sie auch: die GND muss demzufolge auch von Forschungsprojekten und Webservices wie metagrid und correspSearch profitieren können, aber wie fliessen die Ergebnisse in die Normdaten ein? Ist die GND immer noch zu bibliotheksorientiert? Es bräuchte bessere Schnittstellen zwischen den Sparten und ebenfalls grössere Sichtbarkeit der spezialisierten Agenturen, die der Forschung bei der Verwendung von Normdaten assistieren könnten.
GND für Bauwerke: Ausbau zum Knotenpunkt in semantischen Kulturdatenetz
Mein Liebling unter den Präsentationen: Angela Kailus (Dokumentationszentrum für Kunstgeschichte, Philipps-Universität Marburg) und Martha I. Rosenkötter (Bildarchiv Foto Marburg) referierten über ortsgebundene Bauwerke in der GND.
Da wir in der Graphischen Sammlung der ZB Zürich zahlreiche Datensets für helvetische Bauwerke ansetzen, sind wir sehr interessiert an den Entwicklungen rund um dieses Thema. Die Frage “Worum kümmern sich die historischen Wissenschaften?” identifizierte den historischen Kontext als ausschlaggebend. Bauwerke sind nicht isolierte, autonome Entitäten, sondern gelten als kritische Zeugnisse des kulturellen Erbes und existieren innerhalb eines Beziehungsgeflechts. Zu diesen Beziehungen gehören u.a. Archive, Bibliotheken, Graphische Sammlungen, Museen, Ämter der Denkmalpflege, kunsthistorische Communities, Forscher, Personen (Architekten, Bauherren, Besitzer), Fotosammlungen, andere Bauwerke und Stadtplaner. Die relevanten Materialien umfassen Texte, Bilder (Zeichnungen, Druckgrafiken), Fotos, Pläne, Webressourcen, Datenhubs, Archivgut, wissenschaftliche Forschungsergebnisse usw. Diese Ressourcen sind noch viel zu verteilt und zerstreut für eine sinnvolle Nutzung. Das Wissen ist oftmals bereits vorhanden, nur ist es zu unstrukturiert niedergelegt, hier helfen URIs.
Je mehr Daten maschinell referenzierbar sind, desto grösser ist die Chance für die verlinkte Verwendung davon. Aktuell gibt es ca. 67’000 Ansetzungen in der GND für ortsgebundene Bauwerke (Entität gib). Eine bauhistorisch interessierte Nutzerin erahnt vielleicht schon die ungehobenen Schätze der Sonderbestände in vielen kulturellen Einrichtungen: gerade die GND bietet eine Chance, diese Ressourcen als maschinenlesbare Referenz unterzubringen. Die GND ist ein Angebot einer vertrauenswürdigen Institution (DNB), diese steht für dauerhafte Verfügbarkeit. Sie ist mit der CCO-Lizenz versehen, funktioniert mit URIs für LOD und Semantic-Web-Anwendungen und ist international unterwegs durch Koreferenzierungsprojekte wie VIAF und Wikidata. Nur ist die Datenbank bislang in der nicht-bibliothekarischen Welt viel zu wenig bekannt.
GND4C
Im Sinne des Mottos der Convention (“Öffnung der GND”) berichteten die Referentinnen anschliessend über das DFG-gefördertes Projekt GND4C, welches zum Ziel hat, diverse Kulturerbe-Sparten an die GND anzubinden. Auch die Strukturen der GND selbst werden in diesem fünfjährigen Projekt neu gestaltet, um bessere Kooperations- und Datenmodelle zu entwickeln: “Normdaten als Rückgrat eines maschinenenlesbaren, semantischen Netzes der Kultur und Wissenschaft”: Für GND4C liegt das grösste Potential in der GND als Erzeuger und Pfleger von Normdaten.
Arbeitspakete 2 und 3 des Projekts wurden vorgestellt: die Weiterentwicklung der GND wird angestrebt (AP 2). Ein abstraktes Basisdatenmodell soll erarbeitet werden, das den Aufbau fachlicher Sichten unterstützt: Ziel ist die Spezifikation eines gemeinsamen Mindeststandards (GND-CORE), sowie fachspezifischer Erweiterungen (GND-PLUS). Bei Bauwerken beispielsweise wären die CORE-Elemente “Bauwerkname”, “Ort”und “Instantieller Oberbegriff”, die PLUS-Elemente “Personen”, “Datierung”, “Bilder”, “Bauwerkkomponenten”, “Georeferenzen” und “Adresse”.
Arbeitspaket 3 befasst sich mit der Entwicklung von Tools und Schnittstellen: Matching & Mapping sollten als Service aufgebaut werden und die Definition des Formats und der Regeln für die Verarbeitung müssten bestimmt werden. Web-basierte Suchdienste im Browser sind vorgesehen; hierzu arbeitet das Projekt bereits mit DigiCULT.
Anhand der 18 Landesdenkmalämter von Deutschland hörten wir von Fallbeispielen (veranschaulicht durch Bremen), wo schon sehr dichtes Material zu Denkmälern existiert und zwar als kunsthistorisch relevant gesichert. Die Basisdaten liegen oft durchgängig vor. Die Herausforderung für GND4C besteht darin, die zahlreichen separaten Lösungen für Software, Datenhaltung und Regelwerke, die in den Ämtern herrschen, interoperabel zu machen. Mit der GND steigt die Identifizierbarkeit der einzelnen Instanzen, gleichzeitig werden sie referenzierbar gemacht.
Noch zu diskutieren sind Fragen zur Granularität der Dokumentation, die Notwendigkeit nachträglicher Qualifizierung der Fachdaten für neue Nutzung und Mindestkriterien für die Identifizierung von Bauwerken. Die Inhaltserschliessung für Kulturobjekte wurde auch kurz tangiert. Dies ist ein sehr breites Feld und setzt eine Erweiterung der Normdaten der GND für Gattungsbegriffe, Materialbezeichnungen, Technik usw. voraus: eine Bestätigung meiner Eindrücke aus der AG Bild.
Die aktuellsten Themen der GND-Convention
- Was ist die künftige Rolle der GND? Mittel zum Zweck (URLs)? Informations-Hub an sich? Datenaustausch ermöglichen?
- Qualitätssicherung der Daten ist entscheidend, Formate und Standards exakt definieren und pflegen
- Neue Strukturen werden entwickelt: GND-Agenturen als Schnittstellen, Modell von CORE- und PLUS-Datensets, Webformular für schnellere, nutzerfreundlichere Einspielung von Normdaten
- Kooperation und Einbindung, sowohl mit der Forschungscommunity der Geisteswissenschaften als auch mit anderen Normdatensystemen wie Wikidata, sowie mit Software-Entwicklern
- Bibliotheken als digitale Gatekeepers für Forschungsdatenmanagement?
Madeleine Boxler: Fachreferat Germanische Philologie, ZB Zürich
Stephanie Bolliger: Gruppenleiterin Bestandsentwicklung Printmedien, ZB Zürich
Alice Robinson: Stv. Leiterin Graphische Sammlung und Fotoarchiv, ZB Zürich
Januar 2019
