Bernoulli-Verteilung
Zufallsgrößen mit einer Null-Eins-Verteilung bzw. Bernoulli-Verteilung benutzt man zur Beschreibung von zufälligen Ereignissen, bei denen es nur zwei mögliche Versuchsausgänge gibt. Einer der Versuchsausgänge wird meistens mit Erfolg bezeichnet und der komplementäre Versuchsausgang mit Misserfolg. Die zugehörige Wahrscheinlichkeit <math>p</math> für einen Erfolg nennt man Erfolgswahrscheinlichkeit und <math>q=1-p</math> die Wahrscheinlichkeit eines Misserfolgs. Beispiele:
- Werfen einer Münze: Kopf (Erfolg), <math>p=1/2</math>, und Zahl (Misserfolg), <math>q=1/2</math>.
- Werfen eines Würfels, wobei nur eine „6“ als Erfolg gewertet wird: <math>p=1/6</math>, <math>q=5/6</math>.
- Qualitätsprüfung (einwandfrei, nicht einwandfrei).
- Anlagenprüfung (funktioniert, funktioniert nicht).
- Betrachte sehr kleines Raum/Zeit-Intervall: Ereignis tritt ein <math>(p\gtrapprox 0)</math>, tritt nicht ein <math>(q\lessapprox 1)</math>.
Die Bezeichnung Bernoulli-Versuch (Bernoullian trials nach Jakob I. Bernoulli) wurde erstmals 1937 in dem Buch Introduction to Mathematical Probability von James Victor Uspensky verwendet<ref>James Victor Uspensky: Introduction to Mathematical Probability, McGraw-Hill, New York 1937, Seite 45</ref>.
Inhaltsverzeichnis
- 1 Definition
- 2 Eigenschaften
- 3 Beziehung zu anderen Verteilungen
- 3.1 Beziehung zur Binomialverteilung
- 3.2 Beziehung zur verallgemeinerten Binomialverteilung
- 3.3 Beziehung zur Poisson-Verteilung
- 3.4 Beziehung zur Zweipunktverteilung
- 3.5 Beziehung zur Rademacher-Verteilung
- 3.6 Beziehung zur geometrischen Verteilung
- 3.7 Beziehung zur diskreten Gleichverteilung
- 3.8 Urnenmodell
- 4 Simulation
- 5 Einzelnachweise
- 6 Literatur
Definition
Eine diskrete Zufallsgröße <math>X</math> mit Werten in der Menge <math>\{0,1\}</math> unterliegt der Null-Eins-Verteilung bzw. Bernoulli-Verteilung mit dem Parameter <math>p \in \,]0,1[</math>, wenn sie die folgenden Einzelwahrscheinlichkeiten besitzt.
- <math>\operatorname{P}(X=1)=p</math> und <math>\operatorname{P}(X=0)=q=1-p</math>.
Die Verteilungsfunktion ist dann
- <math> F_X(x)=\begin{cases}
0 & \text{ falls } x <0 \\ 1-p & \text{ falls } 0 \leq x < 1 \\ 1 & \text{ falls } x \geq 1 \end{cases} </math> Man schreibt dann <math> X \sim B(p) </math> oder <math> X \sim Ber_p </math>.
Eine Reihe von unabhängigen identischen Versuchen, bei der jeder Einzelversuch der Bernoulli-Verteilung genügt, wird Bernoulli-Prozess oder bernoullisches Versuchsschema genannt.
Eigenschaften
Erwartungswert
Die Bernoulli-Verteilung mit Parameter <math>p</math> hat den Erwartungswert:
- <math>\operatorname{E}\left(X\right)=p</math>
Dies hat den Grund, dass für eine Bernoulli verteilte Zufallsvariable <math>X</math> mit <math>P(X=1)=p</math> und <math>P(X=0)=q</math> gilt
- <math>\operatorname{E}(X) = P(X=1)\cdot 1 + P(X=0)\cdot 0 = p \cdot 1 + q\cdot 0 = p</math>
Varianz und weitere Streumaße
Die Bernoulli-Verteilung besitzt die Varianz
- <math>\operatorname{Var}(X) = p(1-p)= pq</math>
denn es ist <math>E(X^2)=p\cdot 1^2+ q\cdot 0^2=p</math> und damit
- <math>\operatorname{E}\left(X^2\right)-\operatorname{E}(X)^2=p-p^2 = p\cdot(1-p) = pq</math>.
Damit ist die Standardabweichung
- <math> \sigma_X= \sqrt{pq} </math>
und der Variationskoeffizient
- <math>
\operatorname{VarK}(X) = \sqrt{\frac{q}{p}}</math>
Schiefe
Die Schiefe der Bernoulli-Verteilung ist
- <math> \operatorname{v}(X)=\frac{1-2p}{\sqrt{pq}} </math>
Dies kann folgendermaßen gezeigt werden. Eine standardisierte Zufallsvariable <math>\frac{X-\operatorname{E}(X)}{\sqrt{\operatorname{Var}(X)}}</math> mit <math>X</math> Bernoulli-verteilt nimmt den Wert <math>\frac{q}{\sqrt{pq}}</math> mit Wahrscheinlichkeit <math>p</math> an und den Wert <math>-\frac{p}{\sqrt{pq}}</math> mit Wahrscheinlichkeit <math>q</math>. Damit erhalten wir für die Schiefe
- <math>\begin{align}
\operatorname{v}(X) &= \operatorname{E} \left[\left(\frac{X-\operatorname{E}(X)}{\sqrt{\operatorname{Var}(X)}}\right)^3\right] \\ &= p \cdot \left(\frac{q}{\sqrt{pq}}\right)^3 + q \cdot \left(-\frac{p}{\sqrt{pq}}\right)^3 \\ &= \frac{1}{\sqrt{pq}^3} \left(pq^3-qp^3\right) \\ &= \frac{pq}{\sqrt{pq}^3} (q-p) \\ &= \frac{q-p}{\sqrt{pq}} \end{align}</math>
Wölbung und Exzess
Der Exzess der Bernoulli-Verteilung ist
- <math> \gamma (X)=\frac{1-6pq}{pq} </math>
und damit ist die Wölbung
- <math> \beta _2 (X)= \frac{1-3pq}{pq}</math>
Momente
Alle k-ten Momente <math> m_k </math> sind gleich und es gilt
- <math> m_k=p </math>
Es ist nämlich
- <math>m_k = E\left(X^k\right) = p \cdot 1^k + 0 \cdot q^k = p</math>
Entropie
Die Entropie der Bernoulli-Verteilung ist
- <math>\Eta = -q\log_2(q)-p\log_2(p)</math>
gemessen in Bit.
Modus
Der Modus der Bernoulli-Verteilung ist
- <math>x_D=\begin{cases}
0 & \text{falls } q > p\\ 0; 1 & \text{falls } q=p\\ 1 & \text{falls } q < p \end{cases}</math>.
Median
Der Median der Bernoulli-Verteilung ist
- <math>\tilde m_X=\begin{cases}
0 & \text{falls } q > p\\ 0.5 & \text{falls } q=p\\ 1 & \text{falls } q<p \end{cases}</math>.
Kumulanten
Die kumulantenerzeugende Funktion ist
- <math> g_X(t)=\ln (pe^t+q) </math>.
Damit sind die ersten Kumulanten <math> \kappa_1=p, \kappa_2=pq </math> und es gilt die Rekursionsgleichung
- <math>\kappa_{n+1}=p (1-p) \frac{d\kappa_n}{dp}.</math>
Wahrscheinlichkeitserzeugende Funktion
Die wahrscheinlichkeitserzeugende Funktion ist
- <math> m_X(t) = 1-p + p t</math>
Charakteristische Funktion
Die charakteristische Funktion ist
- <math>\varphi_X(t)=1-p+pe^{\mathrm{i}t}</math>.
Momenterzeugende Funktion
Die momenterzeugende Funktion ist
- <math>M_X(t) = 1-p+pe^t</math>
Beziehung zu anderen Verteilungen
Beziehung zur Binomialverteilung
Die Bernoulli-Verteilung ist ein Spezialfall der Binomialverteilung für <math>n=1</math>. Mit anderen Worten, die Summe von unabhängigen Bernoulli-verteilten Zufallsgrößen mit identischem Parameter <math>p</math> genügt der Binomialverteilung, demnach ist die Bernoulli-Verteilung nicht reproduktiv. Die Binomialverteilung ist die <math>n</math>-fache Faltung der Bernoulli-Verteilung bei gleichem Parameter <math>p</math> bzw. mit gleicher Wahrscheinlichkeit <math>p</math>.
Beziehung zur verallgemeinerten Binomialverteilung
Die Summe von <math> n </math> voneinander unabhängigen Bernoulli-verteilten Zufallsvariablen, die alle einen unterschiedlichen Parameter <math> p_i </math> besitzen, ist verallgemeinert binomialverteilt.
Beziehung zur Poisson-Verteilung
Die Summe von Bernoulli-verteilten Zufallsgrößen genügt für <math>n\to\infty</math>, <math>p_{n}\to 0</math> und <math>\lim\limits_{n\to\infty}np_{n}=\lambda>0</math> einer Poisson-Verteilung mit dem Parameter <math>\lambda</math>. Dies folgt direkt daraus, dass die Summe binomialverteilt ist und für die Binomialverteilung die Poisson-Approximation gilt.
Beziehung zur Zweipunktverteilung
Die Bernoulli-Verteilung ist ein Spezialfall der Zweipunktverteilung mit <math> a=0 , b=1 </math>. Umgekehrt ist die Zweipunktverteilung eine Verallgemeinerung der Bernoulli-Verteilung auf beliebige zweielementige Punktmengen.
Beziehung zur Rademacher-Verteilung
Sowohl die Bernoulli-Verteilung mit <math> p=q=0{,}5 </math> als auch die Rademacher-Verteilung modellieren einen fairen Münzwurf (oder eine faire, zufällige Ja/Nein-Entscheidung). Der Unterschied besteht lediglich darin, dass Kopf (Erfolg) und Zahl (Mißerfolg) unterschiedlich codiert werden.
Beziehung zur geometrischen Verteilung
Bei Hintereinanderausführung von Bernoulli-verteilten Experimenten ist die Wartezeit auf den ersten Erfolg (oder letzten Misserfolg, je nach Definition) geometrisch verteilt
Beziehung zur diskreten Gleichverteilung
Die Bernoulli-Verteilung mit <math> p=q=\frac{1}{2} </math> ist eine diskrete Gleichverteilung auf <math> \{0,1\}</math>
Urnenmodell
Die Bernoulli-Verteilung lässt sich auch aus dem Urnenmodell erzeugen, wenn <math> p=\frac{p_1}{p_2} \in \mathbb{Q} </math> ist. Dann entspricht dies dem einmaligen Ziehen aus einer Urne mit <math> p_2 </math> Kugeln, von denen genau <math> p_1 </math> rot sind und alle anderen eine andere Farbe besitzen. Die Wahrscheinlichkeit, eine rote Kugel zu ziehen, ist dann Bernoulli-Verteilt.
Simulation
Bei der Simulation macht man sich zunutze, dass wenn <math> \mathcal{U} </math> eine stetig gleichverteilte Zufallsvariable auf <math> [0,1] </math> ist, die Zufallsvariable <math> Y=\mathbf{1}_{\{\mathcal{U}\geq 1-p\}} </math> Bernoulli-verteilt ist mit Parameter <math> p </math>. Da fast jeder Computer Standardzufallszahlen erzeugen kann, ist die Simulation wie folgend:
- Erzeuge eine Standardzufallszahl <math> u_i </math>
- Ist <math> u_i \leq 1-p </math>, gib 0 aus, ansonsten gib 1 aus.
Dies entspricht genau der Inversionsmethode. Die einfache Simulierbarkeit von Bernoulli-verteilten Zufallsvariablen kann auch zur Simulation von binomialverteilten oder verallgemeinert Binomialverteilten Zufallsvariablen genutzt werden.
Einzelnachweise
<references />
Literatur
- Hans-Otto Georgii: Stochastik: Einführung in die Wahrscheinlichkeitstheorie und Statistik., 4 Auflage, de Gruyter, 2009, ISBN 978-3-110-21526-7.
Diskrete univariate Verteilungen für endliche Mengen:
Benford |
Bernoulli |
beta-binomial |
binomial |
Dirac |
diskret uniform |
hypergeometrisch |
kategorial |
negativ hypergeometrisch |
Rademacher |
verallgemeinert binomial |
Zipf |
Zipf-Mandelbrot |
Zweipunkt
Diskrete univariate Verteilungen für unendliche Mengen:
Boltzmann |
Conway-Maxwell-Poisson |
discrete-Phase-Type |
erweitert negativ binomial |
Gauss-Kuzmin |
gemischt Poisson |
geometrisch |
logarithmisch |
negativ binomial |
parabolisch-fraktal |
Poisson |
Skellam |
verallgemeinert Poisson |
Yule-Simon |
Zeta
Kontinuierliche univariate Verteilungen mit kompaktem Intervall:
Beta |
Cantor |
Kumaraswamy |
raised Cosine |
Dreieck |
U-quadratisch |
stetig uniform |
Wigner-Halbkreis
Kontinuierliche univariate Verteilungen mit halboffenem Intervall:
Beta prime |
Bose-Einstein |
Burr |
Chi-Quadrat |
Coxian |
Erlang |
Exponential |
F |
Fermi-Dirac |
Folded normal |
Fréchet |
Gamma |
Gamma-Gamma |
Extremwert |
verallgemeinert invers Gauß |
halblogistisch |
halbnormal |
Hotellings T-Quadrat |
hyper-exponentiale |
hypoexponential |
invers Chi-Quadrat |
scale-invers Chi-Quadrat |
Invers Normal |
Invers Gamma |
Lévy |
log-normal |
log-logistisch |
Maxwell-Boltzmann |
Maxwell-Speed |
Nakagami |
nichtzentriert Chi-Quadrat |
Pareto |
Phase-Type |
Rayleigh |
relativistisch Breit-Wigner |
Rice |
Rosin-Rammler |
shifted Gompertz |
truncated normal |
Type-2-Gumbel |
Weibull |
Wilks’ Lambda
Kontinuierliche univariate Verteilungen mit unbeschränktem Intervall:
Cauchy |
Extremwert |
exponential Power |
Fishers z |
Fisher-Tippett (Gumbel) |
generalized hyperbolic |
Hyperbolic-secant |
Landau |
Laplace |
alpha-stabil |
logistisch |
normal (Gauß) |
normal-invers Gauß’sch |
Skew-normal |
Studentsche t |
Type-1-Gumbel |
Variance-Gamma |
Voigt
Diskrete multivariate Verteilungen:
Ewen |
multinomial |
multivariat hypergeometrisch |
Dirichlet compound multinomial
Kontinuierliche multivariate Verteilungen:
Dirichlet |
generalized Dirichlet |
multivariat normal |
multivariat Student |
normalskaliert invers Gamma |
Normal-Gamma
Multivariate Matrixverteilungen:
Invers Wishart |
Matrix-normal |
Wishart