Multinomialverteilung

Van Wikipedia, de gratis encyclopedie

Die Multinomialverteilung oder Polynomialverteilung ist eine Wahrscheinlichkeitsverteilung in der Stochastik. Sie ist eine diskrete Wahrscheinlichkeitsverteilung und kann als multivariate Verallgemeinerung der Binomialverteilung aufgefasst werden. Sie hat in der Bayesschen Statistik als konjugierte A-priori-Verteilung die Dirichlet-Verteilung.

Definition und Modell

[Bearbeiten | Quelltext bearbeiten]

Seien und mit . Dann ist die Zähldichte der Multinomialverteilung gegeben durch

.

Hierbei ist der Multinomialkoeffizient.

Anwendung und Motivation

[Bearbeiten | Quelltext bearbeiten]

Die Multinomialverteilung kann ausgehend von einem Urnenmodell mit Zurücklegen motiviert werden. In einer Urne sind Sorten Kugeln. Der Anteil der Sorten Kugeln in der Urne ist . Der Urne wird -mal jeweils eine Kugel entnommen, ihre Eigenschaft (Sorte) notiert und die Kugel danach wieder in die Urne zurückgelegt.

Man interessiert sich nun für die Anzahl der Kugeln einer jeden Sorte in dieser Stichprobe. Da der Multinomialverteilung folgt, besitzt die Stichprobe die Wahrscheinlichkeit:

.

Nimmt man eine Urne mit Sorten Kugeln mit jeweils einer Kugel pro Sorte, so erhält man den klassischen Würfel: Man wirft diesen -mal, hat dabei mögliche Ausgänge und interessiert sich dafür, wie groß die Wahrscheinlichkeit dafür ist, dass gerade -mal auftritt, gerade -mal und so weiter. Weiter beschreiben die jeweiligen die Wahrscheinlichkeiten der Würfelflächen und somit, ob es sich um einen fairen oder unfairen Würfel handelt.

Für jedes ist die Zufallsvariable binomialverteilt mit den Parametern und , hat also den Erwartungswert

Für die Varianz gilt

.

Kovarianz und Korrelationskoeffizient

[Bearbeiten | Quelltext bearbeiten]

Die Kovarianz zweier Zufallsvariablen und mit berechnet sich als

,

und für den Korrelationskoeffizienten (nach Pearson) folgt:

.

Wahrscheinlichkeitserzeugende Funktion

[Bearbeiten | Quelltext bearbeiten]

Die multivariate wahrscheinlichkeitserzeugende Funktion ist

In einer Schulklasse sind 31 Schüler, 12 aus Dorf A, 11 aus Dorf B und 8 aus Dorf C. Jeden Tag wird ein Schüler ausgelost, der die Tafel wischen muss. Wie groß ist die Wahrscheinlichkeit, dass in einer Woche kein Schüler aus Dorf A, zwei Schüler aus Dorf B und 3 Schüler aus Dorf C die Tafel wischen müssen? Es ist und , da jeder Schüler gleich wahrscheinlich gezogen werden soll. Dann ist

Beziehung zu anderen Verteilungen

[Bearbeiten | Quelltext bearbeiten]

Beziehung zur Binomialverteilung

[Bearbeiten | Quelltext bearbeiten]

Im Spezialfall ergibt sich die Binomialverteilung, genauer ist die gemeinsame Verteilung von und für eine -verteilte Zufallsvariable .

Beziehung zur multivariaten hypergeometrischen Verteilung

[Bearbeiten | Quelltext bearbeiten]

Die Multinomialverteilung und die multivariate hypergeometrische Verteilung sind miteinander verwandt, da sie aus demselben Urnenmodell hervorgehen. Einziger Unterschied ist, dass bei der multivariaten hypergeometrischen Verteilung ohne Zurücklegen gezogen wird. Die multivariate hypergeometrische Verteilung lässt sich unter gewissen Umständen durch die Multinomialverteilung approximieren, siehe hierfür den Artikel über die multivariate hypergeometrische Verteilung.