Bienchen summ herum

Ein kurzer Hinweis auf einen vergnüglichen Artikel von Oliver Bendel auf Telepolis, „Im Rachen des Thesaurus: Beobachtungen zum Synonymwörterbuch von Microsoft“. Eine Leseprobe:

Dem erstaunten studentischen Publikum führte ich vor, welche Synonyme Microsoft für „Mädchen“ kannte: „Fräulein, Besen, Kind, Bluse, Biene …“. Spätestens an dieser Stelle begannen alle zu lachen. Ich bildete angeberische Beispielsätze wie „Die Mädchen fielen über mich her.“ Mit Bienen ergab sich ein völlig anderes Bild, in dem ich einen eher jämmerlichen Anblick bot.

Ein Synonymwörterbuch muss möglichst viele Wörter für einen Austausch anbieten. Schon beim „Mädchen“ war mir aber aufgefallen, dass die Programmierer des Thesaurus bis in die äußersten Randbereiche der Sprache vorgedrungen waren. „Fratz“, hieß es da weiter, „Jungfrau, Ricke, Käfer“. Käfer? Nun ja, warum nicht, wenn bereits die Bienen summten. [Telepolis, 5. April 2008

Man sieht: der deutsche Wortschatz ist unerschöpflich — solange man weiß, wo man danach suchen muss…

7 Kommentare zu „Bienchen summ herum“

  1. Mein Word schlug mir für die Person “Abaelard” (französischer Theologe und Philosoph des 11. Jahrhunderts) dann “Abledern” vor…

    Was hat sich derjenige denn bitte bei “dunkel” und “negerfarbig” gedacht?

  2. Ich habe (allerdings schon vor Jahren) mit Word mal ein Protokoll einer Sitzung geschrieben, bei der einer der Teilnehmer mit Nachnamen Didden hieß. Word ließ nicht davon ab, das durch “Titten” ersetzen zu wollen.

  3. Mit Bedauern musste ich gerade feststellen, dass mein Bücherregal gar kein gedrucktes Synonymwörterbuch beherbergt. Ich bin mir nämlich recht sicher, dass sich ganz ähnlich »sinnige« bzw. »unsinnige« synomvorschlagsverhunzte Sätze auch damit bilden lassen.

    Vergnüglich ist der Artikel in der Tat. Mir scheint es, vor allem deshalb, weil nicht ganz klar wird, ob er reine Glosse, ernstgemeint oder irgendwo dazwischengeworfen sein will. Was der Autor macht, ist ja folgendes: Er nimmt an, die vom Word-Thesaurus vorgeschlagenen Wort-Beziehungen seien von jemandem erdacht worden, der darin einen Sinn gesehen hat. Und dann geht er hin und führt in feinsinniger Eloquenz einige selbstausgewählte Vorschläge ad absurdum. So weit, so vergnüglich.

    Leider habe ich auf die Schnelle keine Informationen darüber gefundern, woher das deutsche Synonymwörterbuch in Word 2007 stammt. Programmierer werden es kaum erdacht haben; entweder ist es ein eingekauftes, von Menschen redaktionell erstelltes Werk (und damit genauso viel oder wenig vertrauenswürdig wie das Wörterbuch im Schrank) oder das Werk automatisierter Synonym-Erkennungs-Algorithmen. Wenn man sich deren Ergebnisse anschaut, z.b. hier: http://www.dwds.de/?kompakt=1&sh=1&qu=M%C3%A4dchen beim »Digitalen Wörterbuch der deutschen Sprache« oder beim »Projekt Deutscher Wortschatz«: http://wortschatz.uni-leipzig.de (dort nach Mädchen suchen) beschleicht einen das gleiche Gefühl von gemischter Sinn- und Unsinnigkeit. Und sich nur langsam erschließender Zusammenhänge. »Kraft« als Synonym von »Mädchen«? Aber klar. »Die Hausherrin rief: Schnell, wir brauchen noch drei Kräfte fürs Buffet!«

    Bei solchen Gelegenheiten frage ich mich schon länger und immer wieder, wieviel Intelligenz oder menschliche Denkmuster der Nutzer dem Computer zuzutrauen bereit ist, wenn er mit den Resultaten von Sprachtechnologie konfrontiert wird. Der Autor des Telepolis-Artikel scheint sich nicht ganz sicher, wer verantwortlich zu machen ist. Das selbst agierende Wörterbuch: »Der Thesaurus verweigerte sich im Naheliegenden«, »Der Thesaurus machte das Wort noch interessanter«, »doch so weit (und so deutsch) dachte das Wörterbuch nicht«? Oder eine Art technischer Programmierer-Verschwörung: »dass die Programmierer des Thesaurus bis in die äußersten Randbereiche der Sprache vorgedrungen waren«, »Veranstalten die Programmierer […] etwa Saufgelage […], bei denen aus eher humoristischer Bildung heraus Neologismen […] entstehen«?

    Des Pudels Kern zwischen Belustigung, Angstahnung und Kulturuntergangsvision im Telepolis-Artikel steckt wohl in der Aussage: »Leider nichts davon in dem elektronischen Buch mit sieben Siegeln«. Da steht vor mir eine Maschine, die irgendwie behauptet, »Sprache zu können«. Einerseits weiß ich, dass sie das nicht können kann, andererseits sind die meisten ihrer Vorschläge nicht so abwegig und ich muss mich fragen: Wie weit kann und will ich mich auf die angebotenen Hilfen einlassen? Der Computer behauptet erst einmal recht unterschiedslos. Er begründet nicht, unterscheidet nicht zwischen selten, häufig, veraltet, regional,… Das aber tut das gedruckte Wörterbuch im Zweifelsfall auch nicht - zumindest behauptet es auf gleich unantastbare Weise.

    Weshalb also gibt es Witze darüber, welch seltsame Synonym-Ketten Word konstruiert, nicht aber darüber, was bei blinder Anwendung des entsprechenden Duden-Bandes herauskommt? Ich vermute: Dem Computer wird an solchen Stellen, bewusst oder unbewusst, belustigt oder beängstigt, tatsächlich Wissen oder absichtsvolles Handeln zugeschrieben; das Wörterbuch hingegen ist eindeutig ein Werkzeug, dass ich durch aktiven Gebrauch sinnvoll einsetzen muss. Wenn ich dort für meinen Arbeitskontext Unsinniges auswähle, bin ich selbst schuld.

    In diesem Sinne halte ich den Telepolis-Artikel für sehr gelungen, indem er unserem eigenem Umgang mit der Sprachmaschine Computer (oder: Word, Thesaurus, …) den Spiegel vorhält. Ohne Wissen darüber, was das Textverarbeitungs-Werkzeug »Thesaurus« ist, wozu es taugt und wozu nicht, kann ich es nicht Gewinn bringend einsetzen. Manche tun es trotzdem, ist zu befürchten.

    P.S.: Ein sehr schönes Beispiel, wie diese Irritation zwischen “intelligenter Sprachmaschine” und “dummer Rechenmaschine” (keine Wertung bzgl. Sprache und Mathematik herauslesen!) produktiv nutzbar ist, liefert Elin-Birgit Berndt mit ihrer Dissertation »Interaktion mit Digitalen Rechtschreibhilfen: Ein Vergleich von Schülertexten. Neue Wege zur Förderung der Rechtschreibkompetenz in der Sekundarstufe I.« (http://deposit.ddb.de/cgi-bin/dokserv?idn=975248367) Sie hat Schüler beobachtet, die ihre Texte mithilfe der Word-Rechtschreibkorrektur überarbeitet haben und sie ermuntert, auszuloten, wie, an welchen Stellen und warum die Vorschläge des Computer sinnvoll zu nutzen sind. Ergebnis waren neue und vertiefte Einsichten über Sprache und Rechtschreibung (und über Computer, natürlich).

  4. Es gibt ein nettes Gedicht von Billy Collins dazu:
    Thesaurus (hier auch zum Anhören).

    It means treasury, but it is just a place
    where words congregate with their relatives …

  5. Zufällig kennt die Kollegin aus dem FB3, Frau Berndt, dieses Blog auch und vielleicht liest sie ja zufällig schon mit bei diesem Beitrag. Ansonsten weise ich sie zufällig mal am Donnerstag darauf hin in der Uni :)

    Insgesamt zeigt für mich die Erfahrung mit bestimmten Wörterbüchern in Programmen, sei es jetzt Word oder der Writer von OpenOffice, dass sämtlichen Korrekturen nur bedingt zu trauen ist. Selbst das Programm “Duden Korrektur” schlägt einem unsinnige Dinge vor. Als Schreibender sollte man nicht nur seine Thesen in der Hausarbeit hinterfragen, sondern auch die Vorschläge, die uns das Schreibprogramm unterbreitet. So kommt es mir zumindest oft vor.

    Mich würde es indes interessieren, mit welchem Programm Wissenschaftler schreiben. Schreiben sie ihre Texte in Word oder OpenOffice oder greifen sie sofort zu LaTeX? Wie wird dann das mit der Rechtschreibung gehandelt unter LaTeX?

  6. @indy: Wissenschaftler sind auch nur Menschen. Die meisten schreiben also mit Word. Meist entscheiden sie das aber gar nicht selbst, sondern die Vorgaben, z.B. der Herausgeber von Tagungsbänden oder Zeitschriften. Je nach Disziplin und Tradition ist da Word oder LaTeX vorherrschend. In der Linguistik spielt LaTeX eine relativ große Rolle, wenn es um Formales (v.a. Baumdiagramme) geht. Seit sich aber Unicode als endlich einheitliche Möglichkeit durchsetzt, sprachspezifische Sonderzeichen und vor allem phonetische Zeichen in all ihren Nuancen zu verwenden, verliert LaTeX an einigen Stellen an Boden. Nach wie vor gibt es aber viele beliebte und beachtenswerte LaTeX-Erweiterungen für Linguisten, die das Leben bisweilen arg erleichten können. Und: Da mittlerweile kaum ein wissenschaftlicher Verlag noch Lektoratsdienste anbietet, der komplette Prozess bis zur Druckfassung also beim Wissenschaftler selbst liegt, ist PDF häufig das Zielformat der Wahl und der Weg dahin individuell gestaltbar. Rechtschreibprüfung für LaTeX erledigen aspell oder ispell und sind in LaTeX-Umgebungen wie TeXEdit oder TeXnicCenter eingebungen, oft sogar transparent, d.h. im Hintergrund während der Eingabe.

  7. War es nicht so, dass über die Brauchbarkeit eines Wörterbuchs die Kompetenz des Benutzers mitentscheidet?

Dies ist eine archivierte Seite des Bremer Sprachblogs, das von 2007 bis 2010 betrieben wurde. Anatol Stefanowitsch bloggt jetzt hier zu Themen rund um Sprache und Sprachen.