Plappermäuler

Bisher haben wir hier im Blog eine Geschichte beharrlich ignoriert, die seit bestimmt einem Jahr durch die Medien geistert: die amerikanische Psychaterin Louann Brizendine behauptet in ihrem Buch The Female Brain neben einer Menge anderem Unfug auch, dass Frauen viel geschwätziger seien als Männer. Zwanzigtausend Wörter gäben Frauen pro Tag von sich, während Männer es gerade einmal auf siebentausend brächten.

Mein Kollege Mark Liberman, der mit dem Language Log das Mutterschiff aller Sprachblogs kommandiert, hat oft und ausführlich darauf hingewiesen, dass es für diese Behauptung nicht den geringsten Beleg gibt. Außerdem hat er einen großen Teil der Forschungsliteratur aufgearbeitet und gezeigt, dass es, ganz im Gegenteil, gute Gründe für die Annahme gibt, dass Männer und Frauen in etwa gleich viel reden. Brizendine, die seine Kritik irgendwann nicht mehr ignorieren konnte, ersetzte die ursprüngliche Behauptung dann durch eine Reihe ähnlicher Behauptungen — Frauen würden mehr „Kommunikationsereignisse“ produzieren, Männer würden weniger zuhören, etc. –, die Liberman jedes Mal innerhalb von Stunden oder Tagen widerlegte oder als völlig inhaltslos entlarvte. Wer seinen heldenhaften Kampf gegen die lange Reihe von Brizendines medialen Schachzügen und Täuschungsmanövern nachlesen will, findet hier die Links zu allen relevanten Blogeinträgen.

Der Psychologe Matthias Mehl von der University of Arizona hat nun gemeinsam mit vier Kollegen das offensichtlichste getan, was man nur tun kann um die Frage ein für alle Mal aus der Welt zu schaffen: er hat nachgezählt und die Ergebnisse in der aktuellen Ausgabe von Science veröffentlicht. Die Forscher statteten amerikanische und mexikanische Studenten und Studentinnen mit tragbaren Aufnahmegeräten aus, die sich in regelmäßigen Abständen einschalteten und dreißig Sekunden lang aufnahmen, ob und was ihr Träger gerade redete. Die Hochrechnung ergab, das Frauen pro Tag 16.215 Wörter von sich geben, und Männer 15.669. Dieser Unterschied von 546 Wörtern ist statistisch nicht signifikant.

Damit sollte der Mythos eigentlich vom Tisch sein — wenn man den Wissenschaftsjournalismus tatsächlich Wissenschaftsjournalisten überlassen würde (ich empfehle hier übrigens wärmstens den Artikel im Tagesspiegel und merke mir den Namen des Verfassers, Michael Simm, als Positivbeispiel seiner Zunft).

Leider tun das nicht alle Medien. Auf der Webseite des SWR, beispielsweise, durfte jemand über die Geschichte schreiben, der offensichtlich keine Ahnung hat, was „statistische Signifikanz“ bedeutet. Damit legt der/die anonyme Autor/in den Grundstein für eine weitere Verbreitung des Mythos, der eigentlich widerlegt ist:

Tatsächlich trennen beide Geschlechter gerade mal 546 Wörter am Tag. Das sind in der Woche zwar 3822 Wörter und in noch größeren Zeiträumen also durchaus Anlass für Verdruss. Auf den einzelnen Tag berechnet aber ist der statistische Unterschied zugegeben lächerlich.

Genau, im Jahr produzieren Frauen also 199.290 Wörter mehr, was im Laufe einer durchschittlichen Ehe — die in Deutschland 14,7 Jahre hält — dann einen Vorsprung von fast drei Millionen Wörtern ergibt. Kein Wunder, dass die Männer sich da verbal überrollt fühlen.

Aber halt, so geht das doch gar nicht! Wenn ein Unterschied zwischen zwei Werten „nicht signifikant“ ist, dann bedeutet das, das die Unterschiede innerhalb der jeweiligen Gruppen wesentlich größer sind als die Unterschiede zwischen den Gruppen. Ein solcher Unterschied liegt damit im Bereich zufällig zu erwartender Schwankungen zwischen den Gruppen, hätte also genausogut anders herum ausfallen können (liebe Studierende aus meinem Methodikseminar: jetzt wisst ihr, warum ihr ein Semester lang p-Werte, Effektgrößen und Konfidenzintervalle über euch ergehen lassen musstet).

Man kann den Unterschied also keineswegs einfach durch Multiplikation auf größere Zeiträume hochrechnen. Im Gegenteil: man kann fest davon ausgehen, dass der Unterschied überhaupt nicht existiert. Würde man eine größere Gruppe von Versuchspersonen über einen größeren Zeitraum beobachten, so würden mal die Männer und mal die Frauen vorne liegen. Insgesamt würden sich die Unterschiede aber ausgleichen.

10 Kommentare zu „Plappermäuler“

  1. Die Ergebnisse dieses Experiments bleiben allerdings wiederum solange beschränkt aussagekräftig und damit leicht angreifbar, bis nachgewiesen wird, dass Studenten in dieser Beziehung repräsentativ für die Grundgesamtheit stehen. Es könnte z.B. sein, dass mehr Frauen über 25 – warum auch immer – alltäglich Tätigkeiten nachgehen, die wortreiche Kommunikation erfordern, während Student und Studentin einen ähnlichen Tagesablauf haben. (Aber dieses Problem haben ja viele soziologische und psychologische Studien.)
    Interessanter für die, die Brizendines These dankbar aufgreifen („Ein Mann, ein Wort – eine Frau, ein Wörterbuch“), wäre wohl eine Untersuchung, die sich auf den Vergleich innerhalb von (heterosexuellen) Paaren beschränkt und die Ergebnisse dabei auch nach dem Kontext (gemeinsame Zeit, Arbeit, mit Freunden ohne Partner etc.) aufschlüsselt sowie möglichst die Dauer der Partnerschaft berücksichtigt. Aber wie gut eine Studie auch immer ist, wird sie in diesem Bereich dennoch stets mit dem Vorwurf zu kämpfen haben, zielgerichtet gewesen zu sein, schließlich haben die meisten Menschen den Sinn eines Vorurteils nicht begriffen. Ein gutes Vorurteil passt auf eine signifikante Anzahl von Exemplaren der betreffenden Gruppe, aber man muss es für den Einzelnen jederzeit bedenkenlos revidieren können, darf es nur bedingt auf die Gruppe als Ganzes anwenden und muss es ganz aufgeben, wenn sich herausstellt, dass seine Gültigkeit beschränkter ist als angenommen – dafür sind, wie für die Vorurteilsbildung auch, wissenschaftliche Untersuchungen ein Kriterium.

  2. Herr Päper,

    Es könnte z.B. sein, dass mehr Frauen über 25 – warum auch immer – alltäglich Tätigkeiten nachgehen, die wortreiche Kommunikation erfordern, während Student und Studentin einen ähnlichen Tagesablauf haben.

    Das ist richtig, aber das ist tatsächlich ein Vorteil der Studie. Brizendines Behauptung ist ja, dass Frauen mehr Reden als Männer, weil ihr Gehirn anders strukturiert ist. Wenn nun aber Frauen und Männer mit gleichen Lebensumständen (Studium) gleichviel reden, ist klar, dass hypothetische Unterschiede bei anderen Bevölkerungsgruppen nicht auf unterschiedliche Gehirnstrukturen sondern eben auf unterschiedliche Lebensumstände (z.B. „kommunikative Tätigkeiten“ im Vergleich zu „technischen Tätigkeiten“) zurückzuführen wären. Aber es gibt keine Hinweise darauf, dass solche Unterschiede tatsächlich existieren (was keinesfalls heißen soll, dass es überhaupt keine Unterschiede im Kommunikationsverhalten von Männern und Frauen gäbe).

  3. Auch unterschiedliche Lebensumstände können auf unterschiedliche Gehirnstrukture zurückzuführen sein.
    Sind Studenten und Studentinnen gleichermaße repräsentativ für Mannen und Frauen?

  4. Herr Kleiweg,

    Auch unterschiedliche Lebensumstände können auf unterschiedliche Gehirnstrukture zurückzuführen sein.

    Mit Sicherheit. Nun wäre erstens zu klären, ob die Gehirne von Männern und Frauen tatsächlich nennenswert unterschiedlich sind. Abschließend geklärt ist das wohl nicht, aber es deutet vieles darauf hin. Zweitens wäre zu klären, ob diese Unterschiede in systematischer Weise die Lebensumstände von Männern und Frauen beeinflussen (z.B. die Berufswahl). Auch hier scheint einiges darauf hinzudeutet, dass dies der Fall ist. Drittens wäre zu klären, ob Frauen in den von Frauen bevorzugten Lebensumständen mehr reden als Männer in den von Männern bevorzugten. Und hier gibt es nun einmal nicht den geringsten Grund, anzunehmen, dass das so ist. Und selbst wenn sich herausstellen sollte, dass es doch so ist, würde das immer noch nicht Brizendines Behauptung stützen, dass der Unterschied auf das Konto verschiedener Gehirnstrukturen gehe — stattdessen wäre er dann eben auf die Lebensumstände zurückzuführen.

    Sind Studenten und Studentinnen gleichermaße repräsentativ für Mannen und Frauen?

    Eine interessante Frage. Bei der Fächerwahl gibt es klare geschlechterspezifische Präferenzen, aber ob es auch in Bezug auf das Student/innensein an sich Unterschiede gibt, weiß ich nicht.

    Entscheidend ist aber dies: Studenten und Studentinnen reden gleich viel. Das ist eine Tatsache (zumindest für die USA und Mexiko). Wenn es einen quantitativen Unterschied gäbe, der direkt auf unterschiedliche Gehirnstrukturen zurückzuführen wäre, dann müsste der sich aber genau hier zeigen, egal wie repräsentativ das Student/innenleben für Männer oder Frauen ist.

  5. Die Zahlen sagen, Studentinnen benützen 3,4% mehr Wörter als Studenten. In diese Studie ist das statistisch nicht signifikant, aber das heißt nicht daß es kein Unterschied gibt zwischen Studenten und Studentinnen. Es sagt nur, man sollte diese Studie wiederhohlen mit einer größeren Stichprobe.

    Wenn es eine Zusammenhang gibt zwischen Gehirnstrukturen und Lebensumstände, und es gibt eine Zusammenhang zwischen Lebensumstände und wieviele Wörter man braucht (und das ist so, Einzelgänger sprechen nur einmahl weniger), dann kann man eine Zusammenhang zwischen Gehirnstrukturen und Gebrauch von Wörter nicht einfach ausschließen. Es gibt Zusammenhang zwischen A und B, es gibt Zusammenhang zwischen B und C, dann gibt es auch eine Zusammenhang zwischen A und C. Wie die Zusammenhang sich erklären läßt ist eine andere Sache.

  6. @Peter Kleiweg:
    „In diese Studie ist das statistisch nicht signifikant, aber das heißt nicht daß es kein Unterschied gibt zwischen Studenten und Studentinnen“
    In dieser Studie wurden 396 Studierende gestestet. Die individuellen Unterschiede innerhalb der Gruppen waren dabei riesig (bei den Männern schwankte der Wert zwischen 500 und 47.000). Sicherlich können Sie die Größe der Stichprobe nun immer weiter vergrößern und hoffen, dass irgendwann ein von Ihnen gewünschtes Ergebnis dabei herauskommt und signifikant wird. Sie sollten dann aber viel Zeit und unbegrenzte Mittel für die Datenerhebung einplanen und Sie sollten nicht enttäuscht sein, wenn Ihr Ergebnis — falls es zustandekommt — keine nennenswerte Effektstärke aufweist.

    „Es gibt Zusammenhang zwischen A und B, es gibt Zusammenhang zwischen B und C, dann gibt es auch eine Zusammenhang zwischen A und C“
    Sicher gibt es da einen Zusammenhang zwischen A und C, nämlich B. Hier geht es aber darum, ob es einen direkten Zusammenhang gibt — und genau den haben Sie mit Ihrem kleinen ABC eben nicht hergestellt.

  7. Wenn man beweisen will daß es kein Unterschied von 3,4% gibt, denn muß man eben eine Stichprobe nehmen wobei dieses Procent nicht unter der Grenze der Signifikanz liege. Ich könnte eine Monat lang herum stöbern, und keine einzigen Elefant sehen (oder Vielleicht einer, aber das wäre nicht signifikant), und Erklären, es sei bewiesen est gibt keine Elefanten. Beweisen? Wenn man gezielt seine Stichprobe wählt kann man alles beweisen. “Lies, damned lies, and statistics.”

    Ebenso beweist die Existenz von B nicht das es keinen direkten Zusammenhang zwischen A und C gibt.

  8. Wenn man beweisen will daß es kein Unterschied von 3,4% gibt, denn muß man eben eine Stichprobe nehmen wobei dieses Procent nicht unter der Grenze der Signifikanz liege.

    Niemand will oder muss das beweisen. Die Beweislast liegt bei denen, die behaupten dass es einen Zusammenhang zwischen Geschlecht und Menge der täglich gesprochenen Wörter gibt. Die müssen versuchen, die Nullhypothese (= kein Zusammenhang) zu widerlegen. Genau das kann man mit den Daten, die Mehls et al. vorlegen, nicht. Die Daten legen, unter Einbeziehung des Konfidenzniveaus, außerdem nahe, dass es auch mit einer größeren Stichprobe nicht gelingen wird. Natürlich können Sie es trotzdem gerne versuchen und uns das Ergebnis Ihrer Studie dann mitteilen.

    Ich könnte eine Monat lang herum stöbern, und keine einzigen Elefant sehen (oder Vielleicht einer, aber das wäre nicht signifikant), und Erklären, es sei bewiesen est gibt keine Elefanten.
    Interessant, aber leider im Zusammenhang mit der oben diskutierten Studie völlig irrelevant (da vermischen Sie Poppersche Wissenschaftstheorie mit Stochastik, fast immer eine schlechte Idee).

    Wenn man gezielt seine Stichprobe wählt kann man alles beweisen. “Lies, damned lies, and statistics.”
    Da spricht der Experte…

    Ebenso beweist die Existenz von B nicht das es keinen direkten Zusammenhang zwischen A und C gibt.
    Darum geht es auch gar nicht. Sie haben behauptet, dass damit ein Zusammenhang zwischen A und C bewiesen sei. Das ist erstens schlicht falsch, denn A und C können völlig unabhängig voneinander einen Zusammenhang mit B haben (nicht alle Beziehungen in der Welt sind transitiv), und zweitens beweist es selbst in dem Fall, in dem durch B tatsächlich ein Zusammenhang zwischen A und C hergestellt wird, nicht, dass dieser Zusammenhang ein „direkter“ ist (mehr hat NvonX nicht gesagt). Natürlich beweist es auch nicht, dass dies nicht der Fall ist, aber die Beweislast liegt hier wiederum bei Ihnen.

    Ich weise hier einfach noch einmal Herrn Päpers wertvollen Hinweis aus #1 oben hin und zitiere die entscheidende Passage:

    „Man muss [ein Vorurteil] ganz aufgeben, wenn sich herausstellt, dass seine Gültigkeit beschränkter ist als angenommen – dafür sind, wie für die Vorurteilsbildung auch, wissenschaftliche Untersuchungen ein Kriterium.“

    Oder man behält seine Vorurteile bei, egal wie die Faktenlage ist. Aber dann, wie ein ehemaliger Professor von mir immer sagte, ist man mit Religion besser bedient als mit Wissenschaft. Und Religion betreiben wir hier nicht.

  9. Ich habe nirgendwo behauptet da wäre eine Zusammenhang bewiesen. Ich meine nur daß das sogenante Gegenbeweiß überhaupt nichts beweist. Eine einzige, eingegrenste Zählung in eine bestimmte, eingeschränkte Situation als Beweiß darfür nehmen, die “Vorurteile” sei entgultig Entlarft, das ist was gar nicht mit Wissenschaft zu schaffen hat.

  10. Der Blogg ist echt empfehlenswert

Dies ist eine archivierte Seite des Bremer Sprachblogs, das von 2007 bis 2010 betrieben wurde. Anatol Stefanowitsch bloggt jetzt hier zu Themen rund um Sprache und Sprachen.