Die beiden Partner CLARIN-D und DARIAH-DE haben in den letzten Jahren eine Reihe von inhaltlichen und technologischen Grundlagen geschaffen, um die Geisteswissenschaften in einer Vielzahl unterschiedlicher Forschungsfelder zu unterstützen. Die Angebote an technischen Infrastrukturen, Repositorien, Forschungen und Angeboten zur Lehre beider Partner sollen in CLARIAH-DE nun weiter aufeinander abgestimmt, integriert, weiterentwickelt und zusammen weiterbetrieben werden. Parallel dazu übernehmen CLARIN-D und DARIAH-DE den Weiterbetrieb ihrer bisherigen Dienste und Repositorien. Insgesamt sind so zwölf Einrichtungen als ausführende Partner an CLARIAH-DE beteiligt und zusätzlich sind weitere 13 Einrichtungen mit in den Weiterbetrieb der Infrastrukturen einbezogen (weitere Partner). Damit erreicht das Vorhaben ein großes Spektrum unterschiedlicher Forschungen an Hochschulen, außeruniversitären Einrichtung und der Wirtschaft.
Die Durchführung und Entwicklung von CLARIAH-DE wird durch das Ineinandergreifen strategischer, operativer und partizipativer Gremien gewährleistet. Gemeinsam stellen sie die Balance der technischen Anforderungen an Infrastruktur und den forschungsgeleiteten Bedarfen der Wissenschaft her. Die Gesamtkoordination liegt gemeinschaftlich bei der Eberhard Karls Universität Göttingen und der SUB Göttingen.
Beraten wird der Verbund CLARIAH-DE durch den Entwicklungsrat. Ihm gehören an:
Die inhaltliche Arbeit in CLARIAH-DE wird von sechs Arbeitspaketen (AP) getragen, die jeweils gemeinschaftlich von Teams aus Wissenschaftlerinnen und Wissenschaftlern beider Partner vorangetrieben werden.
Der Umgang mit Daten als gemeinsamer Gegenstand der beiden Infrastrukturprojekte CLARIN-D und DARIAH-DE bringt zwangsläufig Überschneidungen und komplementäre Entwicklungen – und damit das Potential für Synergien mit sich. Daher werden seit 2019, aufbauend auf früheren Kooperationen und Abstimmungsprozessen, beide Infrastrukturen sowie deren Verfahren und Standards innerhalb von CLARIAH-DE vereinheitlicht und die vormals parallel laufenden Entwicklungen zukünftig interoperabel gestaltet.
Ermöglicht wird dies unter anderem durch die innerhalb des Arbeitspakets (AP) 1 geplante Abstimmung von Standards und Verfahren für die Erstellung, Aufbereitung und Archivierung von Daten und Werkzeugen. Die Texte der Digitalen Bibliothek im TextGrid Repository (TGR) werden in das Basisformat des Deutschen Textarchivs (DTABf) transformiert. Dadurch werden die Annotationen beider großer Textsammlungen auf der Formatebene vereinheitlicht, wodurch der Bestand des TGR zugleich auch durch die innerhalb des DTA bzw. von CLARIN-D entwickelten Werkzeuge erschlossen werden kann.
Während das DTABf bereits als Pivotformat für Textsammlungen, v. a. zur Repräsentation der Volltexte historische Druckwerke, Zeitungen sowie einfach strukturierter Manuskripte etabliert ist, erfolgt im Rahmen von CLARIAH-DE seine Evaluierung als Standard auch für Editionen. Für Bestände, die eine hinreichend große Heterogenität aufweisen, wird untersucht, wie sie über das Data Modelling Environment der DARIAH-DE Data Federation Architecture angebunden werden können.
Innerhalb der Projekte CLARIN-D und DARIAH-DE wurden spezialisierte Werkzeuge und Forschungsumgebungen zur Organisation und Verarbeitung text- und sprachbasierter Ressourcen und Forschungsdaten konzipiert, entwickelt und bereitgestellt. Diese sollen nun nachhaltig zu einem einheitlichen Angebot für die Geisteswissenschaften miteinander verschränkt werden. Zur Überwindung der damit verbundenen technischen und organisatorischen Herausforderungen und zur Herstellung der Interoperabilität soll das Language Ressource Switchboard (LRS) als webbasierte Brückentechnologie eingesetzt werden. Hierfür ist es notwendig, das LRS und das bestehende Beschreibungsformat zur Klassifikation der Werkzeuge, z.B. durch den Einsatz von TaDiRAH, zu erweitern. Um eine Verarbeitung von spezifischen Sprach- und Textressourcen und -kollektionen im LRS zu unterstützen, ist es darüber hinaus notwendig, ein projektübergreifendes Pivot-Format (DTA-Basisformat) für die darauf aufbauenden bidirektional funktionierenden Konvertierungswerkzeuge zu definieren.
Die erreichten Arbeitsschritte werden in zusammenfassenden Blog-Artikeln und Schritt-für-Schritt-Anleitungen dokumentiert und der interessierten Öffentlichkeit verständlich zugänglich gemacht.
Eine digitale Forschungsinfrastruktur für ein Forschungsfeld, das durch rapide technische Weiterentwicklung geprägt ist, muss auch die Vermittlung technischer Kompetenzen und Förderung einer für die effiziente Nutzung dieser Infrastruktur notwendige "Data Literacy" als Teil ihrer Aufgabe begreifen. Das Arbeitspaket Kompetenzvermittlung und Nachwuchsförderung übernimmt diese Aufgabe in CLARIAH-DE. Hierbei kann auf Angebote und Formate zurückgegriffen werden, die bereits in CLARIN-D und DARIAH-DE entwickelt wurden und sich bewährt haben. Darum steht nun die Bündelung der Aktivitäten aus den Vorgängerprojekten in ein gemeinsames Angebot ebenso im Mittelpunkt wie die Katalogisierung und Reflexion von Methoden und Tools, die im Forschungsfeld eingesetzt werden, mit dem Zeil der Identifikation und Beseitigung verbliebener Lücken im Lehrangebot.
Kompetenzvermittlung und Nachwuchsförderung in CLARIAH-DE stützen sich auf drei Säulen: Bleibende Lehrmaterialien mit disziplinübergreifender Reichweite; gezielte Schulungen mit größerem Impact auf spezifische Fachcommunities; die individuelle Förderung von Nachwuchswissenschaftlerinnen und -wissenschaftlern. Dies wird gewährleistet durch z.B. Reisekostenbeihilfen für Konferenzbesuche Methodenworkshops, und Summer Schools. In diesem Arbeitspaket werden hierfür ein gemeinsames Angebot entwickelt, zusammengeführt und weiterentwickelt.
Die Basis einer nutzerfreundlichen Forschungsinfrastruktur mit einer Vielzahl von Angeboten für die Fachwissenschaft ist die technische Infrastruktur. Sie stellt Speicher, grundlegende Funktionen und spezifische Werkzeuge so zur Verfügung, dass die Nutzung bruchlos, verlässlich und ohne zeitliche Verzögerungen möglich ist. Um dies zukünftig übergreifend für alle Angebote von CLARIN-D und DARIAH-DE zu erreichen, befasst sich Arbeitspaket 4 mit der technischen Vernetzung und Koordination der beiden Forschungsinfrastrukturen.
CLARIN-D und DARIAH-DE haben sehr unterschiedliche fachliche Traditionen, entsprechend haben sie verschiedene Technologien, Werkzeuge, Dienste und Abläufe entwickelt, die sich nun ergänzen können. Die Zusammenführung ist jedoch nicht trivial, wie insbesondere die Kombination der drei Such- und Recherchefunktionalität Generische Suche, die Federated Content Search und Virtual Language Observatory belegen. Hier wird Arbeitspaket 4 grundlegende konzeptionelle Arbeit leisten. Vielfach erfordert die Zusammenführung auch die Harmonisierung von Standards und Schnittstellen (Metadaten von Ressourcen, Austauschformate). In anderen Bereichen, wie der Authentication und Authorization (AAI) hat das AP4 bereits eine Lösung basierend auf der DARIAH-DE AAI gefunden. Eingerahmt wird das Arbeitspaket durch eine Technology Watch, die über CLARIN und DARIAH hinaus versucht, die wichtigsten Entwicklungen im Feld aufzunehmen und nach Möglichkeit in die eigene Planung zu integrieren
Die Arbeit baut auf intensiver Zusammenarbeit in der Vergangenheit, beispielsweise im gemeinsamen Technical Advisory Board, sowie ersten Integrationsbestrebungen der letzten Jahre auf.
Eine große Stärke von CLARIN-D und DARIAH-DE ist die Akzeptanz in den Fachcommunitys. Im Arbeitspaket 5 werden die Aktivitäten im Bereich des Community-Engagements und des Outreach zusammengefasst und gemeinsam weiter ausgebaut. Eine besondere Bedeutung hat dabei die Webseite als zentraler Einstiegspunkt zu allen Angeboten der verteilten Forschungsinfrastruktur. Aufgrund der unterschiedlichen Struktur der gewachsenen Angebote von CLARIN-D und DARIAH-DE wird dieser Prozess der Portalverschmelzung in mehreren Phasen durchgeführt.
Eine wichtige Rolle bei der Entwicklung einer gemeinsamen Identität spielen eine Corporate Identity, Social Media und die persönliche Präsenz auf Fachtagungen und Konferenzen mit eigenen Informationsangeboten. Das Arbeitspaket konzipiert hierfür eine Logo und verschiedene Printmedien.
Die Koordination von CLARIAH-DE erfordert die Entwicklung einer Governance mit der die Durchführung und Entwicklung des Verbundes geordnet und transparent gesteuert werden kann. Das Arbeitspaket 6 hat dazu eine Geschäftsordnung entwickelt, in der alle wesentlichen Organe beschrieben und Geschäftsabläufe festgelegt sind. Damit wird das Ineinandergreifen strategischer, operativer und partizipativer Gremien gewährleistet. Die Umsetzung der Geschäftsordnung wird von den Geschäftsstellen der beiden Infrastrukturen CLARIN-D und DARIAH-DE unterstützt, die sich im Arbeitspaket koordinativ abstimmen.
Ein weiteres Aufgabenfeld ist die Einrichtung des gemeinsamen Helpdesks, der ab Winter 2019 alle First-Level-Support Anfragen zu den Diensten und Angeboten von CLARIN-D, CLARIAH-DE und DARIAH-DE annehmen und an die Expertinnen und Experten aus den anderen Arbeitspaketen und bei Bedarf an weitere Partner weiterleiten wird.
Das Arbeitspaket hat weiterhin zum Ziel, die bewährte Anbindung an das CLARIN und das DARIAH ERIC (European Research Infrastructure Consortium) zu pflegen sowie weitere Kooperationen zur Mitgestaltung an der europäischen Forschungslandschaft anzustreben.