Standardabweichung


aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche
25px Dieser Artikel {{{1}}}
</math> des Stichproben-Mittelwertes siehe: Standardfehler.}}

Die Standardabweichung ist ein um 1860 von Francis Galton eingeführter Begriff der Statistik und der Wahrscheinlichkeitsrechnung und ein Maß für die Streuung der Werte einer Zufallsvariablen um ihren Erwartungswert. Sie ist für eine Zufallsvariable <math>X</math> definiert als die Quadratwurzel aus deren Varianz und wird als <math alt="σ(X) = √Var(X)">\sigma_X = \sqrt{\operatorname{Var}(X)}</math> notiert.

Liegt eine Beobachtungsreihe <math alt="(x1, x2, … xN)">(x_1, x_2, \dots, x_N)</math> der Länge <math>N</math> vor, so sind empirischer Mittelwert und empirische Standardabweichung die zwei wichtigsten Maßzahlen in der Statistik zur Beschreibung der Eigenschaften der Beobachtungsreihe.

Die Standardabweichung besitzt die gleiche Dimension wie die Messwerte der Beobachtungsreihe. Die Dimension der Varianz ist dagegen das Quadrat der Dimension der Beobachtungswerte.

Als Abkürzung findet man neben <math alt="σ">\sigma</math> (sprich: „Sigma“) in Anwendungen insbesondere für die empirische Standardabweichung oft s oder SD (für englisch standard deviation), sowie m. F. für mittlerer Fehler. In der angewandten Statistik findet man häufig die Kurzschreibweise der Art „Ø 21 ± 4“, was als „Mittelwert 21 mit einer Standardabweichung von 4“ zu lesen ist.

Definition

Die Standardabweichung <math alt="σ(X)">\sigma_X</math> einer Zufallsvariablen <math>X</math> ist definiert als die Quadratwurzel der Varianz <math alt="Var(X)">\operatorname{Var}(X)</math>:

<math>

\sigma_X := \sqrt{\operatorname{Var}(X)}. </math>

Dabei ist die Varianz

<math alt="Var(X) = E((X − E(X))²) = E(X²) − E(X)²">\operatorname{Var}(X) = \operatorname E((X-\operatorname E(X))^2) = \operatorname E(X^2) - (\operatorname{E}(X))^2</math>

von <math>X</math> stets größer oder gleich 0. Das Symbol <math alt="E(·)">\operatorname E(\cdot)</math> bezeichnet den Erwartungswert.

Beispiele und Faustformeln

Normalverteilung

Eindimensionale Normalverteilungen werden durch Angabe von Erwartungswert <math alt="µ">\mu</math> und Varianz <math alt="σ²">\sigma^2</math> vollständig beschrieben. Ist also <math>X</math> eine <math alt="µ">\mu</math>-<math alt="σ²">\sigma^2</math>-verteilte Zufallsvariable – in Symbolen <math alt="X ∼ 𝒩(µ, σ²)">X \sim \mathcal{N}(\mu,\sigma^2)</math> –, so ist ihre Standardabweichung einfach <math alt="σ(X) = √σ² = σ">\sigma_X = \sqrt{\sigma^2} = \sigma</math>.

Streuintervalle

Datei:Standard deviation diagram.svg
Intervalle um <math alt="µ">\mu</math> bei der Normalverteilung

Aus der Tabelle der Standardnormalverteilung ist ersichtlich, dass für normalverteilte Zufallsgrößen jeweils ungefähr

68,3 % der Realisierungen im Intervall <math alt="µ ± σ">\mu\pm\sigma</math>,
95,4 % im Intervall <math alt="µ ± 2σ">\mu\pm 2\sigma</math> und
99,7 % im Intervall <math alt="µ ± 3σ">\mu\pm 3\sigma</math>

liegen. Da in der Praxis viele Zufallsgrößen annähernd normalverteilt sind, werden diese Werte aus der Normalverteilung oft als Faustformel benutzt. So wird beispielsweise σ oft als die halbe Breite des Intervalls angenommen, welches die mittleren zwei Drittel der Werte in einer Stichprobe umfasst, siehe Quantil.

Datei:Kontaminierte Normalverteilung.svg
Normalverteilung (a) und kontaminierte Normalverteilung (b)

Diese Praxis ist aber nicht empfehlenswert, denn sie kann zu sehr großen Fehlern führen. Zum Beispiel ist die Verteilung <math>0{,}9\cdot\mathcal{N}(\mu,\sigma^2)+0{,}1\cdot\mathcal{N}(\mu,(10\sigma)^2)</math> optisch kaum von der Normalverteilung zu unterscheiden (siehe Bild), aber bei ihr liegen im Intervall <math alt="µ ± σ">\mu\pm\sigma</math> ganze 95,2 % der Werte. Solche kontaminierten Normalverteilungen sind in der Praxis sehr häufig; das genannte Beispiel beschreibt die Situation, wenn zehn Präzisionsmaschinen etwas herstellen, aber eine davon schlecht kalibriert ist und zehnmal weniger präzise als die anderen neun produziert.

Werte außerhalb der zwei- bis dreifachen Standardabweichung werden oft als Ausreißer behandelt. Ausreißer können ein Hinweis auf grobe Fehler der Datenerfassung sein. Es kann den Daten aber auch eine stark schiefe Verteilung zu Grunde liegen. Andererseits liegt bei einer Normalverteilung im Durchschnitt ca. jeder 20. Messwert außerhalb der zweifachen Standardabweichung und ca. jeder 500. Messwert außerhalb der dreifachen Standardabweichung.

Da der Anteil der Werte außerhalb der sechsfachen Standardabweichung mit ca. 2 ppb verschwindend klein wird, gilt ein solches Intervall als gutes Maß für eine nahezu vollständige Abdeckung aller Werte. Das wird im Qualitätsmanagement durch die Methode Six Sigma genutzt, indem die Prozessanforderungen Toleranzgrenzen von mindestens 6σ vorschreiben. Allerdings geht man dort von einer langfristigen Mittelwertverschiebung um 1,5 Standardabweichungen aus, so dass der zulässige Fehleranteil auf 3,4 ppm steigt. Dieser Fehleranteil entspricht einer viereinhalbfachen Standardabweichung (4,5σ). Ein weiteres Problem der 6σ-Methode ist, dass die 6σ-Punkte praktisch nicht bestimmbar sind. Bei unbekannter Verteilung (d. h. wenn es sich nicht ganz sicher um eine Normalverteilung handelt) grenzen zum Beispiel die Extremwerte von 1'400'000'000 Messungen ein 75%-Konfidenzintervall für die 6σ-Punkte ein.<ref>H. Schmid, A. Huber: Measuring a Small Number of Samples and the 3σ Fallacy. (PDF) In: IEEE Solid-State Circuits Magazine. vol. 6, no. 2, 2014, S. 52–58.</ref>

Datei:Confidence interval by Standard deviation.svg
Abhängigkeit der Wahrscheinlichkeit (Prozent innerhalb) von der Größe des Streuintervalls p(z)
Datei:Standard deviation by Confidence interval.svg
Abhängigkeit der Streuintervallgrenze von der eingeschlossenen Wahrscheinlichkeit z(p)
Erwartete Anteile der Werte einer normalverteilten Zufallsvariablen innerhalb bzw. außerhalb der Streuintervalle (μ−zσ, μ+zσ)
zσ Prozent innerhalb Prozent außerhalb ppb außerhalb Bruchteil außerhalb
0,674 490σ 50% 50% 500.000.000 ppb 1 / 2
0,994 458σ 68% 32% 320.000.000 ppb 1 / 3,125
68,268 9492% 31,731 0508% 317.310.508 ppb 1 / 3,151 4872
1,281 552σ 80% 20% 200.000.000 ppb 1 / 5
1,644 854σ 90% 10% 100.000.000 ppb 1 / 10
1,959 964σ 95% 5% 50.000.000 ppb 1 / 20
95,449 9736% 4,550 0264% 45.500.264 ppb 1 / 21,977 895
2,575 829σ 99% 1% 10.000.000 ppb 1 / 100
99,730 0204% 0,269 9796% 2.699.796 ppb 1 / 370,398
3,290 527σ 99,9% 0,1% 1.000.000 ppb 1 / 1.000
3,890 592σ 99,99% 0,01% 100.000 ppb 1 / 10.000
99,993 666% 0,006 334% 63.340 ppb 1 / 15.787
4,417 173σ 99,999% 0,001% 10.000 ppb 1 / 100.000
4,891 638σ 99,9999% 0,0001% 1.000 ppb 1 / 1.000.000
99,999 942 6697% 0,000 057 3303% 573,3303 ppb 1 / 1.744.278
5,326 724σ 99,999 99% 0,000 01% 100 ppb 1 / 10.000.000
5,730 729σ 99,999 999% 0,000 001% 10 ppb 1 / 100.000.000
99,999 999 8027% 0,000 000 1973% 1,973 ppb 1 / 506.797.346
6,109 410σ 99,999 9999% 0,000 0001% 1 ppb 1 / 1.000.000.000
6,466 951σ 99,999 999 99% 0,000 000 01% 0,1 ppb 1 / 10.000.000.000
6,806 502σ 99,999 999 999% 0,000 000 001% 0,01 ppb 1 / 100.000.000.000
99,999 999 999 7440% 0,000 000 000 256% 0,002 56 ppb 1 / 390.682.215.445

Die Wahrscheinlichkeiten <math>p</math> für bestimmte Streuintervalle <math>[\mu -z\sigma;\mu+z\sigma]</math> können berechnet werden als

<math>p = 2 \Phi(z) - 1</math>,

wobei <math>\Phi(z) = \frac{1}{\sqrt{2\pi}} \int_{-\infty}^z e^{-\frac{x^2}{2}}\,dx</math> die Verteilungsfunktion der Standardnormalverteilung ist.

Umgekehrt können für gegebenes <math>p \in (0,1)</math> durch

<math>z = \Phi^{-1}\left(\frac{p+1}{2}\right)</math>

die Grenzen des zugehörigen Streuintervalls <math>[\mu -z\sigma;\mu+z\sigma]</math> mit Wahrscheinlichkeit <math>p</math> berechnet werden.

Ein Beispiel (mit Schwankungsbreite)

Die Körpergröße des Menschen ist näherungsweise normalverteilt. Bei einer Stichprobe von 1.284 Mädchen und 1.063 Jungen zwischen 14 und 18 Jahren wurde bei den Mädchen eine durchschnittliche Körpergröße von 166,3 cm (Standardabweichung 6,39 cm) und bei den Jungen eine durchschnittliche Körpergröße von 176,8 cm (Standardabweichung 7,46 cm) gemessen.<ref>Mareke Arends: Epidemiologie bulimischer Symptomatik unter 10-Klässlern in der Stadt Halle. Dissertation. Martin-Luther-Universität Halle-Wittenberg, 2005, Tabelle 9, S. 30. (Abstract & Volltext)</ref>

Demnach lässt obige Schwankungsbreite erwarten, dass 68,3 % der Mädchen eine Körpergröße im Bereich 166,3 cm ± 6,39 cm und 95,4 % im Bereich 166,3 cm ± 12,78 cm haben,

  • 16 % [≈ (100 % − 68,3 %)/2] der Mädchen kleiner als 160 cm (und 16 % entsprechend größer als 173 cm) sind und
  • 2,5 % [≈ (100 % − 95,4 %)/2] der Mädchen kleiner als 154 cm (und 2,5 % entsprechend größer als 179 cm) sind.

Für die Jungen lässt sich erwarten, dass 68 % eine Körpergröße im Bereich 176,8 cm ± 7,46 cm und 95 % im Bereich 176,8 cm ± 14,92 cm haben,

  • 16 % der Jungen kleiner als 169 cm (und 16 % größer als 184 cm) und
  • 2,5 % der Jungen kleiner als 162 cm (und 2,5 % größer als 192 cm) sind.

Diskrete Gleichverteilung, Würfel

Die diskrete Gleichverteilung auf den Zahlen <math>1,\dots,n</math> hat einen Erwartungswert von <math>m = \tfrac{n+1}{2}</math> und eine Standardabweichung von <math>\sigma = \sqrt{\tfrac{n^2-1}{12}}</math>. Das Ergebnis des Wurfes eines fairen sechsseitigen Würfels hat also beispielsweise den Erwartungswert 3,5 und eine Standardabweichung von etwa 1,7.

Binomialverteilung

Ist <math>X</math> binomialverteilt mit Parametern <math>n</math> (Anzahl der Wiederholungen) und <math>p</math> (Erfolgswahrscheinlichkeit), so gilt <math>\operatorname{E}(X) = np</math> und <math>\operatorname{Var}(X) = n p (1-p)</math>, also <math>\sigma_X = \sqrt{n p (1-p)}.</math>

Würfelt man beispielsweise 500 Mal mit einem fairen Würfel, so ist die Anzahl der Einser binomialverteilt mit <math>n=500</math> und <math>p=\tfrac{1}{6}</math>. Der Erwartungswert beträgt

<math>\mu=np=\frac{500}{6}\approx 83{,}3</math>

und die Standardabweichung

<math>\sigma = \sqrt{np(1-p)}= \sqrt{ 500 \cdot \frac{1}{6} \cdot \frac{5}{6}}\approx 8{,}3.</math>

Weil eine Binomialverteilung mit den obigen Parametern nähernd normalverteilt ist, lassen die Faustformeln also erwarten, dass in 68 % der Fälle die Anzahl der Einser zwischen 75 und 92 liegt und in 95 % der Fälle zwischen 67 und 100.

Schätzung der Standardabweichung der Grundgesamtheit aus einer Stichprobe

Allgemeiner Fall

Berechnungsgrundlagen

Sind die <math>n</math> Zufallsvariablen <math>X_i</math> unabhängig und identisch verteilt, also beispielsweise eine Stichprobe, so wird die Standardabweichung der Grundgesamtheit der Stichprobe häufig mit der Formel

<math>

S = \sqrt{S^2} = \sqrt{\frac{1}{n-1} \sum_{i=1}^n{(X_i-\bar{X})^2}} </math> geschätzt. Dabei ist

  • <math>S</math> die Schätzfunktion für die Standardabweichung <math>\sigma_X</math> der Grundgesamtheit
  • <math>n</math> der Stichprobenumfang (Anzahl der Werte)
  • <math>X_i</math> die Merkmalsausprägung am <math>i</math>-ten Element der Stichprobe
  • <math>\bar{X}= \frac{1}{n} \sum_{i=1}^n{X_i}</math> der empirische Mittelwert, also das arithmetische Mittel der Stichprobe.

Diese Formel erklärt sich daraus, dass die korrigierte Stichprobenvarianz <math>S^2</math> ein erwartungstreuer Schätzer für die Varianz <math>\sigma_X^2</math> der Grundgesamtheit ist. Im Gegensatz dazu ist aber <math>S</math> kein erwartungstreuer Schätzer für die Standardabweichung. Da die Quadratwurzel eine konkave Funktion ist, folgt aus der Jensenschen Ungleichung

<math>\operatorname{E}(S) = \operatorname{E}\left(\sqrt {S^2}\right) \leq \sqrt{\operatorname{E}\left(S^2 \right)} = \sigma_X</math>.

Dieser Schätzer unterschätzt also in den meisten Fällen die Standardabweichung der Grundgesamtheit.

Beispiel

Wählt man eine der Zahlen <math>-1</math> oder <math>+1</math> durch Wurf einer fairen Münze, also beide mit Wahrscheinlichkeit jeweils <math>\tfrac 12</math>, so ist das eine Zufallsgröße mit Erwartungswert 0, Varianz <math>\sigma^2=1</math> und Standardabweichung <math>\sigma=1</math>. Berechnet man aus <math>n=2</math> unabhängigen Würfen <math>X_1</math> und <math>X_2</math> die korrigierte Stichprobenvarianz

<math>S^2=\frac 1{2-1}\left(\left(X_1-\bar X\right)^2+\left(X_2-\bar X\right)^2\right),</math>

wobei

<math>\bar X=\frac{X_1+X_2}2</math>

den Stichprobenmittelwert bezeichnet, so gibt es vier mögliche Versuchsausgänge, die alle jeweils Wahrscheinlichkeit <math>1/4</math> haben:

<math>X_1</math> <math>X_2</math> <math>\bar{X}</math> <math>S^2</math> <math>S</math>
<math>-1</math> <math>-1</math> <math>-1</math> <math>0</math> <math>0</math>
<math>-1</math> <math>+1</math> <math>0</math> <math>2</math> <math>\sqrt{2}</math>
<math>+1</math> <math>-1</math> <math>0</math> <math>2</math> <math>\sqrt 2</math>
<math>+1</math> <math>+1</math> <math>+1</math> <math>0</math> <math>0</math>

Der Erwartungswert der korrigierten Stichprobenvarianz beträgt daher

<math>\operatorname{E}\left(S^2\right) = \frac{0+2+2+0}4 = 1 = \sigma^2</math>.

Die korrigierte Stichprobenvarianz ist demnach also tatsächlich erwartungstreu. Der Erwartungswert der korrigierten Stichprobenstandardabweichung beträgt hingegen

<math>\operatorname{E}(S)= \frac{0 + \sqrt 2 + \sqrt 2 + 0}4 = \frac{\sqrt 2}2 < 1 = \sigma</math>.

Die korrigierte Stichprobenstandardabweichung unterschätzt also die Standardabweichung der Grundgesamtheit.

Berechnung für auflaufende Messwerte

In Systemen, die kontinuierlich große Mengen an Messwerten erfassen, ist es oft unpraktisch, alle Messwerte zwischenzuspeichern, um die Standardabweichung zu berechnen.

In diesem Zusammenhang ist es günstiger, eine modifizierte Formel zu verwenden, die den kritischen Term <math>\textstyle \sum_{i=1}^n{(x_i-\bar{x})^2}</math> umgeht. Dieser kann nicht für jeden Messwert sofort berechnet werden, da der Mittelwert <math>\bar{x}</math> nicht konstant ist.

Durch Anwendung des Verschiebungssatzes und der Definition des Mittelwerts <math>\textstyle \bar{x} = \frac{1}{n}\sum_{i=1}^n{x_i}</math> gelangt man zur Darstellung

<math>\begin{align}

s & = {} \sqrt{\frac{1}{n-1} \left[\left(\sum_{i=1}^n x_i^2\right) - \frac{1}{n}\left(\sum_{i=1}^n x_i\right)^2\right]} \end{align}</math>

die sich für jeden eintreffenden Messwert sofort aktualisieren lässt, wenn die Summe der Messwerte <math>\textstyle \sum_{i=1}^n{x_i}</math> sowie die Summe ihrer Quadrate <math>\textstyle \sum_{i=1}^n{x_i^2}</math> mitgeführt und fortlaufend aktualisiert werden. Diese Darstellung ist allerdings numerisch weniger stabil, insbesondere kann der Term unter der Quadratwurzel numerisch durch Rundungsfehler kleiner als 0 werden.

Eine andere Formulierung dieses Algorithmus ohne diese Nachteile wird von Donald E. Knuth in The Art of Computer Programming, 4.2.2, S. 232 beschrieben.<ref> Donald E. Knuth: The Art of Computer Programming. Volume 2: Seminumerical Algorithms. 3. Auflage. Addison-Wesley Longman, Amsterdam 1997, ISBN 0-201-89684-2.</ref>

Normalverteilte Zufallsgrößen

Berechnungsgrundlagen

Für den Fall normalverteilter Zufallsgrößen lässt sich allerdings ein erwartungstreuer Schätzer angeben:<ref>Eric W. Weisstein: Standard Deviation Distribution. From MathWorld – A Wolfram Web Resource.</ref>

<math>
 \hat{\sigma} =
  \sqrt{\frac{N-1}{2}} \ \frac{\Gamma\left(\frac{N-1}{2}\right)}
  {\Gamma\left(\frac{N}{2}\right)} \ s_X

</math>

Dabei ist

  • <math>\hat{\sigma}</math> die erwartungstreue Schätzung der Standardabweichung und
  • <math>\Gamma(x)</math> die Gammafunktion.
Korrekturfaktoren für die erwartungstreue Schätzung der Standardabweichung
Stichprobenumfang Korrekturfaktor
2 1,253314
5 1,063846
10 1,028109
15 1,018002
25 1,010468

Beispiel

Es wurden bei einer Stichprobe aus einer normalverteilten Zufallsgröße die fünf Werte 3, 4, 5, 6, 7 gemessen. Man soll nun die Schätzung für die Standardabweichung errechnen.

Der Stichprobenvarianz ist:

<math>s_X^2=\tfrac 14(2^2+1^2+0+1^2+2^2)=2{,}5</math>

Der Korrekturfaktor ist in diesem Fall

<math>

\sqrt{2} \ \frac{\Gamma\left(2\right)}{\Gamma\left(2{,}5\right)} \approx 1{,}063846 </math>

und die erwartungstreue Schätzung für die Standardabweichung ist damit näherungsweise

<math>\hat{\sigma} =1{,}064 \sqrt{2{,}5}=1{,}68</math>

Weblinks

Wiktionary Wiktionary: Standardabweichung – Bedeutungserklärungen, Wortherkunft, Synonyme, Übersetzungen
Commons Commons: Standardabweichung – Album mit Bildern, Videos und Audiodateien

Einzelnachweise

<references />