Die Gemeinsame Wissenschaftskonferenz hat das Konsortium „Text+” bewilligt, an dem die Sächsische Akademie der Wissenschaften zu Leipzig als Projektpartner beteiligt ist. „Text+” hat sich zum Ziel gesetzt, text- und sprachbasierte Forschungsdaten langfristig zu erhalten und ihre breite Nutzung in der Wissenschaft zu ermöglichen. Die Initiative startet nach mehrjähriger Vorbereitungszeit und wird zunächst für fünf Jahre durch die Deutsche Forschungsgemeinschaft gefördert.
Die Gemeinsame Wissenschaftskonferenz von Bund und Ländern hat in ihrer Sitzung am 2. Juli 2021 entschieden, das Konsortium „Text+” im Rahmen der Nationalen Forschungsdateninfrastruktur (NFDI) zu finanzieren. Dem Verbund „Text+” gehören schon jetzt mehr als 30 Partner aus universitären sowie außeruniversitären Forschungseinrichtungen und Gedächtniseinrichtungen an.
„Text+” baut eine auf Sprach-, Schrift- und Textdaten ausgerichtete Forschungsdateninfrastruktur auf. Das Konsortium konzentriert sich zunächst auf digitale Sammlungen, lexikalische Ressourcen und wissenschaftliche Text-Editionen. Derartige digitale Daten sind von großer Bedeutung für alle sprach- und textbasierten Disziplinen, insbesondere für die Sprach-, Literatur- und Kulturwissenschaften, die Philosophie, für Klassische Philologien und für die Anthropologie. Da Text und Sprache in der Kommunikation in den Wissenschaften eine zentrale Rolle spielen, können alle weiteren Disziplinen von „Text+” profitieren, insbesondere die Sozial-, Wirtschafts-, Politik-Geschichtswissenschaften.
Die NFDI soll in Form eines wissenschaftsgetriebenen Prozesses forschungsrelevante Datenbestände systematisch erschließen, sichern, zugänglich machen und verknüpfen. Insgesamt beabsichtigen Bund und Länder, bis zu 30 Konsortien über alle wissenschaftlichen Disziplinen hinweg zu fördern. Hierfür stehen bis zu 85 Millionen Euro jährlich zur Verfügung.
Sprache, Schrift und Text sind Grundlagen der menschlichen Kultur, des Wissens und der Kommunikation. Diese Materialien umfassen mehrere tausend Jahre Kulturerbe, die durch Forschende aus den Geisteswissenschaften und den angrenzenden Disziplinen oft über viele Jahre gesammelt und angereichert wurden. Bei den Quellen herrschen große Unterschiede hinsichtlich ihrer Erschließung und Verfügbarkeit: Während viele dieser Materialien und Forschungsdaten bereits in digitaler Form verfügbar sind, liegen andere Quellen bislang nicht in maschinenlesbarer oder gar digitalisierter Form vor. Diese Verfügbarkeitslücke betrifft praktisch alle Bereiche von Sprach-, Schrift- und Textdaten, insbesondere aber die kleinen und gefährdeten Sprachen und Literaturen. Somit bleiben eine qualitativ hochwertige Digitalisierung, die Kuratierung solcher Daten und die Standardisierung von Formaten für digitalisierte Daten große Herausforderungen. Diesen Herausforderungen stellt sich „Text+”. Der Beitrag der Sächsischen Akademie der Wissenschaften liegt in der Bereitstellung digitaler lexikalischer Ressourcen und der Weiterentwicklung von Suchmöglichkeiten in textbasierten Forschungsdaten.