Für das Thema der „Komplexität“ gibts als „Anhang“ einige Erläuterungen, die ich hier im Blog teilweise den Beiträgen über die Komplexität voranstelle. Hier das erste Thema dazu:

Wahrscheinlichkeitsrechnung und Statistik gehört oft zu den grausligsten Themen für Studierende aller Fachrichtungen. Ich kann hier keine vollständige Einführung und Erklärung liefern, aber einige Grundgedanken müssen wir kennen, um dahin vordringen zu können, wo es wirklich spannend wird. Zur Einführung vielleicht gleich einen politischen Einstieg: Es gab in Moskau anlässlich der Proteste gegen Wahlfälschungen Plakate, die „Für die Normalverteilung“ forderten. Warum wohl?

Bei der am häufigsten verwendeten Form von Statistik geht es um eine Menge an Ereignissen, eine Menge an Messwerten – entweder für einen Größenwert eines bestimmten Objekttyps (der Durchmesser von Äpfeln, die Körpergröße von Menschen…) oder für die Ergebnisse vieler Messungen einer Größe jeweils mit unterschiedlich großen Messfehlern. In der Physik geht es meistens um zufällige Schwankungen um einen tatsächlich festen Wert, in der Biologie eher um eine Streuung der Werte, die von der biologischen Variabilität herrührt. Der Wert für jede einzelne Messung ist zufällig – aber es gibt eine Gesetzmäßigkeit für alle Messwerte zusammen, die die Gesamtheit kennzeichnet.

Also: Nehmen wir eine Menge von Werten für bestimmte Größen, etwa die Größe von Menschen zu einer bestimmten Zeit an einem bestimmten Ort. Wenn wir nun auf der x-Achse den jeweiligen Größenwert eintragen und auf der y-Achse die Häufigkeit des Auftretens der jeweiligen x-Größe, so erhalten wir für viele Werte, wie die Größe der Menschen, die bekannte „Glockenkurve“ (Quelle: Wikipedia):

In der x-Achse stehen die Größenwerte, in der y-Achse die prozentuale Häufigkeit dieser Größe für Frauen bzw. Männer. Über ein Viertel der Männer sind zwischen 175 und 179 cm groß, und fast 30% der Frauen haben eine Größe um die 165 bis 169 cm. Je mehr die Werte von diesen Durchschnittswerten abweichen, desto seltener gibt es Menschen mit der jeweiligen Größe.

Diese Verteilung setzt voraus, dass die gemessenen Größen von vielen Faktoren abhängen (so z.B. von der genetischen Veranlagung, der Ernährung usw.), die allerdings voneinander unabhängig sind und von denen jeweils eine im Verhältnis zu allem nur einen geringen Beitrag liefert.

Mehr zu den statistischen Methoden auf dieser Grundlage siehe z.B. hier. Sie werden vor allem für Fehlerrechnungen eingesetzt. Was viele nicht beachten, sind jedoch die Voraussetzungen: Es müssen auch tatsächlich Daten vorliegen, die einer Gleichverteilung entsprechen (hier etwas zum „Test auf Normalverteilungen“). Bei Messwerten um einentatsächlichen Wert herum (wenn systematische Fehler ausgeschlossen wurden) gilt das durchaus – bei der Verteilung variabler Werte gilt es sogar häufig nicht (siehe die nächsten Abschnitte).

Gleichzeitig lässt sich das aber auch so anwenden: Zahlen, die gleichverteilt sein sollen, müssen eine Gaußsche Verteilungskurve entsprechen. Das sollte man auch für die Wahlbeteiligung bei Wahlen annehmen. Bei der Wahl in Russlandwurde jedoch nachgewiesen, dass es hier eine auffallende Abweichung gab: In auffallend vielen Wahllokalen gab es eine unerklärlich hohe Wahlbeteiligung bei fast 100 Prozent. Das lässt an der Wahl zweifeln (genauere Erklärungen siehe auch hier).