Die sprachliche Vermessung der Welt

Der öffentliche Diskurs über Sprachsysteme hängt sich häufig an oberflächlichen Aspekten wie der Orthografie und Interpunktion oder aber an Fragen der „korrekten“ Aussprache oder des Wortschatzes auf. Für den Wissenschaftler ist dagegen die grammatische Struktur von Sprache und Sprachen ein wesentlich interessanterer Forschungsbereich. Die Gründe dafür sind vielfältig, aber unter anderem liegt es daran, dass sich Aussprache und Wortschatz relativ schnell verändern und über verschiedene Sprachen hinweg relativ unsystematisch variieren (lexikalische Semantiker, Phonetiker und Phonologen mögen mir diese grobe Vereinfachung verzeihen). Grammatische Strukturen verändern sich dagegen zwar stetig aber relativ langsam, und vor allem variieren sie in höchst systematischer Weise. So gibt es Bereiche, in denen Sprachen bestimmte strukturelle Eigenschaften stark bevorzugen — zum Beispiel haben über 95 Prozent aller Sprachen einen grundlegenden Satzbau, bei dem das Subjekt im Satz irgendwo vor dem Objekt auftritt (wir haben hier einmal darüber diskutiert); andere Eigenschaften bedingen sich gegenseitig, sodass sich feststellen lässt, dass eine Sprache, die Eigenschaft A hat, mit hoher Wahrscheinlichkeit auch Eigenschaft B hat (wenn eine Sprache beispielsweise die Satzstellung Subjekt-Objekt-Verb hat, ist es sehr wahrscheinlich, dass sie Postpositionen hat (dass also Wörter wie von, in oder bei hinter dem Substantiv stehen, auf das sie sich beziehen).

Solche allgemeinen Regeln sind deshalb interessant, weil sie allgemeingültige, also sprachübergreifende oder gar sprachunabhängige Erklärungen verlangen. Aber solche Regeln zu finden ist häufig schwierig. Es erfordert oft monatelange Lektüre grammatischer Beschreibungen von vielen hundert Sprachen, die dann auf eine Art zusammengefasst werden müssen, die es dem Forscher ermöglicht, allgemeine Regeln oder Tendenzen auch als solche zu erkennen. Außerdem müssen zwei mögliche Erklärungen stets von vorneherein ausgeschlossen werden: erstens, dass eine Gruppe von Sprachen deshalb ähnliche Eigenschaften hat, weil die Sprachen von einem gemeinsamen Vorläufer abstammen; zweitens, dass Sprachen deshalb ähnliche Eigenschaften haben, weil sie über lange Zeit in Kontakt miteinander standen.

Als deshalb die drei Leipziger Sprachwissenschaftler Bernard Comrie, David Gil und Martin Haspelmath vom Max-Planck-Institut für Evolutionäre Anthropologie und der New Yorker Sprachwissenschaftler Matthew S. Dryer von der SUNY Buffalo den World Atlas of Language Structures (2005, Oxford University Press) herausbrachten, der die Verteilung vieler wichtiger grammatischer Parameter in Form von Landkarten zusammenfasst, war das eine kleine Sensation: die Karten in diesem Atlas präsentieren hochkomplexe Informationen auf einen einzigen Blick (an dem Atlas haben übrigens dutzende international anerkannter Experten mitgearbeitet, unter anderem meine Bremer Kollegen Thomas Stolz, Andreas Ammann, Cornelia Stroh und Aina Urdze).

Seit etwa einem Monat ist diese fantastische Ressource nun frei online zugänglich, und das Max-Planck-Institut hat alles richtig gemacht, was man bei der Übertragung eines gedruckten Buches in das Internet richtig machen kann. Die Kapiteltexte sind untereinander verlinkt, zu zitierten Werken und den erwähnten Sprachen sind per Verküpfung Zusatzinformationen verfügbar und mit einem Mausklick bekommt man alle Angaben, die man benötigt, um das entsprechende Kapitel zu zitieren. Die Kapitel können sogar über eine Blogfunktion kommentiert werden und die Kommentare können per RSS-Feed abonniert werden.

Das eigentlich spektakuläre aber sind die Karten. Sie sind über Google Maps eingebunden und bieten zunächst alle Funktionen, die man von dort gewohnt ist (Vergrößerung, Karten-/Satellitenansicht, usw.). Außerdem kann man zu jeder Karte den direkten Link oder eine Beschreibung in XML oder in Googles Keyhole Markup Language herunterladen. Farben, Formen und Größe der Legende kann man frei wählen oder einfach die Voreinstellungen übernehmen. Vor allem, und das ist viel spektakulärer, als ich es hier vermitteln kann, lassen sich Karten erstellen, die zwei oder mehr grammatische Merkmale kombiniert darstellen. Damit kann man mit ein paar Mausklicks Forschungsarbeit leisten, die früher hunderte von Stunden gekostet hätte.

Obwohl sich das Projekt von seinen Möglichkeiten klar an Sprachwissenschaftler richtet, haben die Macher also alles getan, um die sehr komplexen Informationen noch zugänglicher zu machen, als es der gedruckte Atlas bereits tut.

Um nur einen kleinen Eindruck zu vermitteln, wie auch interessierte Laien mit dem World Atlas of Language Structures einen Eindruck von der Art und Verteilung grammatischer Merkmale in den Sprachen der Welt bekommen können, habe ich hier einmal das Merkmal „Anzahl der (morphologischen) Fälle“ herausgegriffen. Die Karte für Europa (in der kleinsten Ansicht) sieht dabei so aus (die vollständige Karte findet sich hier):

Karte der Kasus in den Sprachen Europas

Die Farben stehen für die Anzahl der Fälle, von Weiß für „Gar keine“ über Hellgelb, Gelb, Orange, Hellrot, und Dunkelrot bis Schwarz für „Zehn oder mehr“. Mit eine paar Ausnahmen stammen alle gezeigten Sprachen vom Proto-Indo-Europäischen ab, das vor fünf- bis zehntausend Jahren gesprochen wurde und acht Fälle hatte. Wie die Karte zeigt, sind davon in den meisten Sprachen nicht viele übrig: die romanischen Sprachen und das Englische und Holländische haben die Fälle ganz abgeschafft und die gälischen und skandinavischen Sprachen haben nur zwei Fälle übrig gelassen. Das Griechische hat immerhin noch drei.

Holen wir an dieser Stelle einmal kurz Luft, um die Sprachnörgler darauf hinzuweisen, dass alle diese Sprachen quicklebendig sind und großen Dichtern und Denkern als Werkzeug dienten und dienen, obwohl keine von ihnen mehr den Dativ vom Akkusativ unterscheidet und obwohl sie bis auf das Griechische auch den Genitiv abgeschafft haben. Wir brauchen uns also keine Sorgen um das Verschwinden von Dativ und Genitiv zu machen, das sich im Deutschen seit vielen hundert Jahren stetig vollzieht — wir liegen damit klar im europäischen Trend.

Noch aber haben wir vier der ursprünglichen acht Fälle und liegen damit gleichauf mit dem Isländischen und dem Albanischen. Mehr Fälle als wir haben aus der indoeuropäischen Familie nur die slawischen Sprachen übrig gelassen, die in Rot daherkommen und damit fünf bis sieben Fälle haben. In der selben Kategorie finden wir in Nordfinnland das Saami (eine finno-ugrische Sprache) und das Türkische (eine Turksprache). Beide gehören nicht zur indoeuropäischen Sprachfamilie, ebensowenig wie die vier absoluten Europameister bei der Anzahl der Fälle, die hier in Schwarz dargestellt sind: das Finnische, das Estnische und das Ungarische (alle finno-ugrische Sprachen) und das Baskische (eine isolierte Sprache, die zu keiner bekannten Familie gehört.

Egal, ob man Profi oder interessierter Laie ist, ein paar Stunden intensive Beschäftigung mit dem World Atlas of Language Structures vermitteln einem auf fast spielerische Art und Weise die Komplexität und die „Artenvielfalt“ menschlicher Sprachen. In die reine Spielfreude, die Dank der exzellent gemachten Webseite garantiert ist, mischt sich dann schnell Ehrfurcht vor der sprachlichen Kreativität unserer Spezies.

IGGESEN, Oliver A. (2008): Number of Cases (Kapitel 49). In: Martin Haspelmath, Matthew S. Dryer, David Gil and Bernard Comrie (Hgg.), The World Atlas of Language Structures Online. München: Max Planck Digital Library. (URL http://wals.info/feature/49, letzter Zugriff: 2008-05-17).

Via Mark Dingemanse

15 Kommentare zu „Die sprachliche Vermessung der Welt“

  1. Herr Stefanowitsch,

    danke erstmal.
    Werde da mal reinschauen.
    Aber, da war doch noch was.
    Ich mecker halt so gerne. ;–)

  2. Nachtrag:
    Ich habe aber gerade festgestellt, auf dieser
    “wals.info-seite” unten bei der Legende, wenn man da mit der Maus neben die Kreise “kreiselt” erscheint:
    click to toggle visibility of markers
    damit lassen sich die einzelnen Farben an- und ausschalten.
    Zwischen “schneeweiß” und “eierschalen”
    und “3″ und “4″
    und “5″ und “6-7″ und “8-9″
    ist nämlich ziemlich schwerzu unterscheiden.
    Das es durchaus barrierefreier geht, beweist das “Diamanten/Karo/?” Symbol, welches auch verwendet wird.

    Deshalb:
    und das Max-Planck-Institut hat alles richtig gemacht, was man bei der Übertragung eines gedruckten Buches in das Internet richtig machen kann.

    Nein, leider wurden entgegen des AGG und des GG auf eine bestimmte Minderheit keine Rücksicht genommen, obwohl es technisch kein großer Aufwand gewesen wäre.
    Bei einer Institution wie dem MPI kann man deshalb nur sagen:
    “6 setzen” nachbessern, schnell.

  3. Corax, ob das Max-Planck-Institut (bzw. dessen Digitale Bibliothek) selbst für jede Nutzergruppe eine passende Darstellung bieten muss, darüber kann man sicher streiten. Da man aber auf alle Karten im offenen und standardisierten KML-Format zugreifen kann, sehe ich nicht, wo es ernsthafte Probleme mit der Barrierefreiheit geben sollte.

  4. Vielen Dank hierfür.

    Dennoch ein paar kleine Kritikpunkte am WALS und an Ihrer Werbung dafür:
    Man sollte vielleicht hinzufügen, dass die Daten des WALS stark spezifisch sind, die von Ihnen genannten Kasusmarkierungen sind beispielsweise auf Nomen beschränkt; zumindet im Englischen haben wir sehr wohl Kasus, nämlich in den Personalpronomen.
    Jochen Trommer (2004), der ebenfalls in Leipzig arbeitet, allerdings an der Uni nicht am MPI-EVA, konnte zeigen, dass das Ungarische weit weniger Fälle hat (vier, wenn ich mich recht entsinne), die meissten vermeintlichen Kasusmarker sind klitisierte Postpositionen.
    Auch halte ich es für recht “gefährlich” sich ausschliesslich auf die Daten des WALS zu verlassen und zu implizieren, er würde einem monatelange Arbeit abnehmen. Der WALS ist sicher geeignet, um sich einen groben Überblick zu verschaffen, Recherche und Datensammlung kann er dennoch nicht ersetzen. Beispielsweise bechränkt sich die Darstellung einiger Variablen auf Datensätze mit weniger als 100 Sprachen. Man kann zwar mit statistischen Methoden einigermaßen sichere Aussagen treffen, aber wer weiß, ob in den übrigen etwa 5900 Sprachen Sachen passieren, die eine Erweiterung der Variablen nötig machen.

    Davon abgesehen kann ich ihre Begeisterung für den WALS aber teilen :)

  5. Englisch hat aber zwei Kasus bei den Substantiven: Nominativ und Genitiv. Das sagt auch WALS.

  6. Bertilo Wennergren, dass dem Englischen zwei Kasus zugeschrieben werden, habe ich ja auch berichtet — und Sie haben natürlich Recht, damit müssen beim Substantiv Nominativ und Genitiv gemeint sein. Ich habe diese Einsicht wohl etwas verdrängt, weil der „Genitiv“ im Englischen ja weder ein Genitiv, noch überhaupt ein Kasus ist (es soll hier dafür das schlichteste der Argumente reichen, nämlich, dass dass „Genitiv“-s nicht das Substantiv sondern die Nominalphrase modifiziert).

    Patrick Schulz, das Problem mit den ungarischen Kasus ist im Prinzip dasselbe Problem wie das mit dem englischen Genitiv — des einen Kasus ist des anderen Postposition, Possessiv-Klitikon, etc. Der WALS kann dem Forscher natürlich nicht theoretisch motivierte Entscheidungen über Definitionen und Grenzen der verwendeten Kategorien abnehmen, genausowenig, wie die Lektüre der zugrundeliegenden Grammatiken das könnte. Die Begleitkapitel machen aber in den meisten Fällen sehr deutlich, von welchen Annahmen die Autor/innen ausgegangen sind. Der WALS ist hier aber m.E. nur in dem Sinne problematisch, in dem jede typologische Forschung problematisch ist, denn natürlich kann er nicht den analytischen Verstand des Forschers ersetzen.

  7. Anatol Stefanowitsch hat geschrieben:

    “Bertilo Wennergren, dass dem Englischen zwei Kasus zugeschrieben werden, habe ich ja auch berichtet”

    Ich kann leider diesen Bericht im Artikel nicht finden. Ich habe mich hauptsächlich über volgendes gewundert: “die romanischen Sprachen und das Englische und Holländische haben die Fälle ganz abgeschafft”.

    Wenn man das Englische Genitiv nicht als echtes Kasus rechnet, dann ist das auch richtig. Aber die WALS-Autoren sehen offenbar das Englische Genitiv (bei den Substantiven) als ein echtes Kasus.

    (Ich bitte um Entschuldigung für mein schlechtes Deutsch.)

  8. Dann sollten wir gleich der Akkusativ abschaffen, uns von der Dativ verabschieden und uns der Genitiv entledigen! Warum warten, bis die Sprachgeschichte das für wir erledigt?

  9. Also, die Karte zeigt, dass das Englische zwei Kasus hat, aber berichtet haben Sie es nicht ;-) Ist ja auch egal — was ich auf der Gesamtkarte interessant fand, war, dass die Sprachen ohne Fälle in der Mehrzahl ist. Woran liegt das?

  10. … in der Mehrzahl SIND, meine ich natürlich.

  11. @Frank: Das erinnert mich ein wenig an die Rechtschreibreform - wer vorher falsch geschrieben hat, schrieb auf einmal richtig, wer vorher richtig geschrieben hat, schrieb auf einmal falsch (Die pessimistische Darstellung ist, dass vorher die eine Hälfte richtig schrieb, hinterher die andere). Insofern wäre die Verwirklichung dieses Vorschlages eine soziale Revolution - er katapultiert die Unterschicht nach oben und entlarvt oben das wahre Elend des Konservativismus - dass nur gut ist, was sich nicht ändert. Strukturell ändert, wohlgemerkt. Denn gerade wo der Konservativismus regiert, muss sich alles ändern, damit alles so bleibt wie es ist (frei nach Lampedusa). Und auch O. Wilde hätte keinen Grund mehr zum Nörgeln, weil es kein ganzes Leben mehr dauert, Deutsch zu lernen.

  12. Danke für den Hinweis zu diesem spannenden Projekt; es macht sich wieder einmal bezahlt, euren Feed unter den dutzenden anderen genauer zu lesen.

  13. vom Proto-Indo-Europäischen ab, das […] acht Fälle hatte.

    Das scheint darauf anzukommen, welchen Verzweigungspunkt im Stammbaum man “PIE” nennt. Wenn man den jüngeren nimmt (den letzten gemeinsamen Vorfahren der lebenden IE Sprachen), stimmt es mit großer Sicherheit. Wenn man den älteren nimmt (den letzten gemeinsamen Vorfahren des erwähnten jüngeren mit den anatolischen Sprachen), stimmt es wahrscheinlich nicht, denn was sonst überall die Genitivendung ist, war im Luwischen (einer anatolischen Sprache — ausgestorben wie der Rest der Familie) eine Adjektivendung, hinter die Fallendungen gesetzt wurden; Genitiv scheint es keinen gegeben zu haben. Die Schlussfolgerung liegt nahe, dass der IE Genitiv eine Abkürzung solcher Adjektive ist.

  14. Habe das auch mitbekommen und finde es eine gute Sache; schön zu sehen, dass die Linguisten vielleicht doch noch irgendwann den Sprung ins digitale Zeitalter schaffen.

    Habe allerdings auch negative Meldungen gehört. Der eine Dozent bei uns am Institut, der sich mit Südostasiatischen Sprachen ziemlich gut auskennt, meinte, ihm wären mehrere Fehler in den Beschreibungen der jeweiligen Sprachen aufgefallen. Das kann ich natürlich nicht beurteilen, wollte es aber dennoch einbringen.

    Ein guter Einstiegspunkt z.B. wenn man gezielt nach Sprachen mit einem bestimmten Merkmal sucht, ist es aber allemal.

    PS: Sehr guter Blog.

  15. Was ich noch vergass:
    Die Leute, die sich mit solchen Fragestellungen beschäftigen, sind ja die Sprachtypologen. Ob das schlussendlich spannender ist als phonetische Untersuchungen zur fortis-lenis-Unterscheidung oder zur linguistischen Relativität ist ja prinzipiell subjektiv; grundsätzlich ist es aber vor allem einmal ein anderer Forschungsansatz.

Dies ist eine archivierte Seite des Bremer Sprachblogs, das von 2007 bis 2010 betrieben wurde. Anatol Stefanowitsch bloggt jetzt hier zu Themen rund um Sprache und Sprachen.