Infos Home | Impressum | Original Artikel & Autoren Liste


Binomialverteilung

Die Binomialverteilung ist eine der wichtigsten diskreten Wahrscheinlichkeitsverteilungen. Sie beschreibt Ergebnisse von Bernoulli-Prozessen.

Ein Bernoulli-Prozess (auch: Bernoulli-Kette) besteht aus einer Abfolge mehrerer, unter gleich bleibenden Bedingungen durchgeführter Bernoulli-Versuche.

Ein Bernoulli-Versuch (auch: Bernoulli-Experiment) ist ein Zufallsversuch mit genau zwei möglichen Ergebnissen. Die Wahrscheinlichkeit dieser Ergebnisse wird durch die Bernoulli-Verteilung beschrieben.

Die negative Binomialverteilung wird in einem eigenen Artikel behandelt.

Inhalt
1 Bernoulli-Versuch und Bernoulli-Verteilung
2 Bernoulli-Prozess und Binomial-Verteilung
3 Eigenschaften der Binomialverteilung
4 Weitere Beispiele:

Bernoulli-Versuch und Bernoulli-Verteilung

Ein Bernoulli-Versuch ist ein Zufallsversuch mit genau zwei möglichen Ergebnissen, die wir im folgenden als Erfolg und Misserfolg bezeichnen werden. Die Wahrscheinlichkeit für einen Erfolg sei p; dann ist die Wahrscheinlichkeit für einen Misserfolg q = 1 - p.

Beispiele:

Die Bernoulli-Verteilung ist die
Wahrscheinlichkeitsverteilung P(X) einer Zufallsvariable X, die bei Erfolg den Wert 1 und bei Misserfolg den Wert 0 annimmt. Die Fallunterscheidung
kann man durch folgenden geschlossenen Ausdruck ersetzen:

Der Erwartungswert lautet <X>=p, die Varianz <X2>-<X>2=pq.

Bernoulli-Prozess und Binomial-Verteilung

Ein Bernoulli-Prozess ist ein zeitlich diskreter stochastischer Prozess, der aus einer endlichen oder abzählbar-unendlichen Folge Bernoulli-Versuchen besteht. Er kann durch eine Folge von Zufallsvariablen X1, X2, X3,..., beschrieben werden, deren jede mit der konstanten Wahrscheinlichkeit p den Wert X=1 (Erfolg) und mit der Wahrscheinlichkeit q=1-p den Wert X=0 (Misserfolg) annimmt.

Je nach Fragestellung interessiert man sich für eine oder mehrere der folgenden Zufallsvariablen:

Beispiele: Eigenschaften: Die Zufallsvariable K, die angibt, wie viele von n Bernoulli-Versuchen erfolgreich waren, folgt der Binomial-Verteilung. Wir leiten diese Verteilung anhand eines Beispiels her:
Beim Würfeln mit einem Würfel werde die Sechs als Erfolg gewertet; die Erfolgswahrscheinlichkeit ist also p=1/6, die komplementäre Misserfolgswahrscheinlichkeit q=5/6. Gefragt sei nun nach der Wahrscheinlichkeit, in n=5 Würfen genau k=2 Sechsen zu werfen. Antwort: Die Wahrscheinlichkeit erst zwei Sechsen, dann drei Nicht-Sechsen zu werfen ist p2q3. Da es auf die Reihenfolge aber nicht ankommt, ist diese Wahrscheinlichkeit zu multiplizieren mit der Anzahl der Möglichkeiten, zwei (ununterscheidbare) Sechserwürfe auf fünf Würfe zu verteilen. Der Kombinatorik zufolge ist diese Anzahl durch den Binomialkoeffizienten "5 über 2" gegeben; die gesuchte Wahrscheinlichkeit lautet also:

Davon verallgemeinert, lautet die Wahrscheinlichkeit, in n Bernoulli-Versuchen genau k mal Erfolg zu haben,
mit q=1-p. Diese Funktion heißt Binomial-Verteilung oder binomische Verteilung. Es gibt keine einheitliche Notation; neben B(k | p,n) findet man viele andere Schreibweisen wie zum Beispiel Pp(k|n) oder Wpn(k).

Eigenschaften der Binomialverteilung

Die Binomialverteilung besitzt den Erwartungswert np und die Varianz npq.

Die Binomialverteilung besitzt die Symmetrie B(k | p,n) = B(k | q,n-k).

Symmetrische Binomialverteilung (p gleich 1/2)

Dieses Bild zeigt die Binomialverteilung für p=0.5 und verschiedene Werte von n als Funktion von k:

Diese Funktion ist spiegelsymmetrisch um den Wert k=n/2:

B(k|0.5,n) = B(k|0.5,n-k),
wie die folgende Auftragung zeigt:

Die Breite der Verteilung wächst proportional zur Standardabweichung σ=(√n)/2. Der Funktionswert bei k=n/2, also das Maximum der Kurve, sinkt proportional zu σ. Dementsprechend kann man Binomialverteilungen mit unterschiedlichem n aufeinander skalieren, indem man die Abszisse k-n/2 durch σ teilt und die Ordinate mit σ multipliziert:

Das folgende Bild zeigt noch einmal reskalierte Binomialverteilungen, nun für andere Werte von n und in einer Auftragung, die besser verdeutlicht, dass sämtliche Funktionswerte mit steigendem n gegen eine gemeinsame Kurve konvergieren. Indem man die Stirling-Formel auf die Binomialkoeffizienten anwendet, findet man, dass diese Kurve (im Bild schwarz durchgezogen) eine Gaußsche Glockenkurve ist:

.
Dies ist die Wahrscheinlichkeitsdichte zur Standard-Normalverteilung N(0,1). Im zentralen Grenzwertsatz wird dieser Befund dahingehend verallgemeinert, dass auch Folgen anderer diskreter Wahrscheinlichkeitsverteilungen gegen die Normalverteilung konvergieren.

Und hier die gleichen Daten in einer halblogarithmischen Auftragung, die sehr zu empfehlen ist, wenn man überprüfen möchte, ob auch seltene Ereignisse, die um mehrere Standardabweichungen vom Erwartungswert abweichen, einer Binomial- oder Normalverteilung folgen:

Allgemeiner Fall (p≠1/2)

Näherungen im Fall sehr vieler Bernoulli-Versuche

Im Grenzfall großer n konvergiert die Binomialverteilung gegen eine
Normalverteilung:
Eine Faustregel besagt, dass diese Näherung brauchbar ist, sofern np>4 und nq>4. Je asymmetrischer die Binomialverteilung, umso größer muss n sein, bevor die Normalverteilung eine brauchbare Näherung liefert.

Eine asymptotisch asymmetrische Binomialverteilung, deren Erwartungswert np für große n gegen eine von n unabhängige Konstante λ konvergiert, kann man durch die Poisson-Verteilung nähern:

Eine Faustregel besagt, dass diese Näherung brauchbar ist, sofern np≤10 und n>1500p.

Weitere Beispiele:

In einem Behälter befinden sich 80 Kugeln, davon sind 16 gelb. Es wird 5-mal eine Kugel entnommen und anschließend wieder zurückgelegt. Wegen des Zurücklegens ist die Wahrscheinlichkeit, eine gelbe Kugel zu ziehen, bei allen Entnahmen gleich groß: 16/80 = 1/5 = 0.2. Die Verteilung B 5,0.2 gibt die Wahrscheinlichkeit dafür an, dass genau 0, 1, 2, 3, 4, 5 der entnommenen Kugeln gelb sind.

Die Wahrscheinlichkeit, dass eine Person in diesem Jahr an einem Wochenende Geburtstag hat, beträgt 2/7. In einem Raum halten sich 10 Personen auf ( Darunter sind keine Zwillinge ). Die Verteilung B 10,2/7 gibt die Wahrscheinlichkeit dafür an, dass genau 0, 1, 2, 3, ..., 10 der Anwesenden in diesem Jahr an einem Wochenende Geburtstag haben.

Zahlenwerte zu den Beispielen:

B 5 , 0.2
nWahrscheinlichkeit (n) in %
0 32.768
1 40.96
2 20.48
3  5.12
4  0.64
5  0.032
100
Erw.Wert1
Streuung0.8

B 10 , 2/7
nWahrscheinlichkeit (n) in %
0  3.457161303360777
1 13.828645213443108
2 24.89156138419759
3 26.55099880981076
4 18.585699166867535
5  8.921135600096417
6  2.973711866698805
7  0.6797055695311554
8  0.1019558354296733
9  0.009062740927082069
10  0.0003625096370832828
100
Erw.Wert2.8571428571428568
Streuung2.040816326530612


Der Ursprungsartikel stammt von der deutschsprachigen Wiki pedia (siehe oben: "Original Artikel & Autoren Liste").
Der Text steht unter der GNU Freie Dokumentation Lizenz.