Global Basic Lexicon (GloBasLex)

Mit dem Akademieprojekt ›Global Basic Lexicon (GloBasLex)‹ entsteht eine frei zugängliche digitale Datenbank, die für rund 1.500 Sprachen einen einheitlich erfassten Grundwortschatz bereitstellt.

The project has a clear goal: to create a freely accessible digital collection of basic vocabulary for around 1,500 languages around the world. For each of these languages, 1,000 basic terms will be recorded. In addition to a standardized phonetic transcription, the database will also contain information about how the words are structured. This will make it easier to look up words and evaluate them statistically.

Die Daten sollen nicht nur eine verlässlichere Grundlage für sprachtypologische Forschung bieten, sondern auch eine wichtige Basis für datengetriebene historische Sprachwissenschaft schaffen. Damit können neue Erkenntnisse über viele bisher wenig erforschte Sprachfamilien und Regionen gewonnen werden. Darüber hinaus ist die Datenbank GloBasLex auch für andere Wissenschaftsdisziplinen wertvoll, etwa für Kognitionswissenschaft, Archäologie oder Genetik, die eigene Forschungsergebnisse mit sprachlichen Mustern vergleichen.

Für die Öffentlichkeit wird GloBasLex als online zugänglicher Sprachatlas verfügbar sein. Er soll die Faszination für die sprachliche Vielfalt der Welt wecken – eine Vielfalt, die zunehmend bedroht ist – und das Bewusstsein für kleinere Sprachen stärken, sodass ein wichtiger Teil des kulturellen Erbes bewahrt wird.

Das Vorhaben der Heidelberger Akademie der Wissenschaften startet 2026, hat eine Laufzeit von 15 Jahren und wird unter der Leitung von Prof. Dr. Gerhard Jäger in Tübingen umgesetzt.

Three pieces of paper with different scripts on a brown background.

HAdW

The Global Basic Lexicon (GloBasLex) project collects and documents basic vocabulary from languages around the world based on published dictionaries. The goal is to build a freely accessible database of parallel word lists for 1,000 basic concepts, covering nearly all sufficiently documented languages worldwide. With around 1,500 languages from all continents, this is one of the most comprehensive resources of its kind.

Die lexikalischen Einträge werden in standardisierter phonetischer Transkription (IPA) bereitgestellt und um Informationen zur morphologischen Struktur ergänzt. Alle Daten werden in einfachen, maschinenlesbaren Formaten veröffentlicht. Dies schafft eine verlässliche Grundlage für vergleichende Forschung in lexikalischer, morphologischer und phonologischer Typologie sowie für datengestützte historische Sprachwissenschaft.

Ein besonderer Schwerpunkt liegt auf einer ausgewogenen Repräsentation aller Weltregionen und Sprachfamilien, einschließlich kleinerer Familien und isolierter Sprachen, für die bislang kaum vergleichbare digitale Ressourcen existieren. GloBasLex stellt lexikalische Daten in konsistenter und interoperabler Form zur Verfügung. Die Ressource ermöglicht systematische sprachübergreifende Vergleiche und eröffnet neue empirische Perspektiven auf sprachliche Vielfalt und Sprachwandel. Sie unterstützt ein breites Spektrum linguistischer und interdisziplinärer Forschung – von lexikalischer Semantik und Phonologie bis hin zur Erforschung der menschlichen Kultur- und Bevölkerungsgeschichte.

Das digitale Lexikon GloBasLex ist derzeit im Aufbau.

head of research

Prof. Dr. Gerhard Jäger

staff

Dr. Johannes Dellert

Adresse

Prof. Dr. Gerhard Jäger

Eberhard Karls Universität Tübingen

Philosophische Fakultät

Seminar für Sprachwissenschaft

Keplerstraße 2, 1. Stock, Raum 159

Telefon: +49 7071 29-77302

E-Mail: gerhard.jaeger@uni-tuebingen.de

Dr. Johannes Dellert

Telefon: +49 7071 29-73960

E-Mail: jdellert@sfs.uni-tuebingen.de