Wiki

Standardabweichung: Streuung von Daten messen

Wie man Standardabweichung und Varianz berechnet und der Unterschied zwischen Stichproben- und Populationsformeln. Berechnungsbeispiele und praktische Anwend...

Verified against Khan Academy - Statistik und Wahrscheinlichkeit on 20 Feb 2025 Updated 20 February 2025 4 min read
Open calculator
Translated article · View in English

Zusammenfassung

Die Standardabweichung misst, wie stark eine Menge von Zahlen um ihren Durchschnitt (Mittelwert) streut. Eine niedrige Standardabweichung bedeutet, dass die Werte eng um den Mittelwert gruppiert sind; eine hohe Standardabweichung bedeutet, dass sie weit gestreut sind. Sie ist das am häufigsten verwendete Streuungsmaß in der Statistik und findet Anwendung in Bereichen von der Finanzwirtschaft (Portfoliorisiko) über die Fertigung (Qualitätskontrolle) bis zur Wissenschaft (Messfehler).

Funktionsweise

Der Rechner berechnet drei zusammenhängende statistische Kennzahlen:

  1. Mittelwert — der arithmetische Durchschnitt aller Werte: Summe geteilt durch Anzahl.
  2. Varianz — der Durchschnitt der quadrierten Abweichungen vom Mittelwert. Durch das Quadrieren wird verhindert, dass sich positive und negative Abweichungen gegenseitig aufheben.
  3. Standardabweichung — die Quadratwurzel der Varianz, wodurch das Maß wieder in den ursprünglichen Einheiten vorliegt (z. B. Euro, Zentimeter).

Population vs. Stichprobe

Es gibt zwei Formeln, je nachdem, ob Ihre Daten eine gesamte Population oder eine Stichprobe aus einer größeren Population darstellen:

  • Die Populations-Standardabweichung teilt durch N (die Gesamtanzahl). Verwenden Sie diese, wenn Sie jeden Datenpunkt haben — zum Beispiel Testergebnisse aller Schüler einer Klasse.
  • Die Stichproben-Standardabweichung teilt durch N - 1 (sogenannte Bessel-Korrektur). Verwenden Sie diese, wenn Ihre Daten eine Teilmenge einer größeren Gruppe sind — zum Beispiel Umfrageantworten von 200 aus 10.000 Kunden. Die Division durch N - 1 korrigiert die Verzerrung, dass eine Stichprobe die tatsächliche Populationsvarianz tendenziell unterschätzt.

Die Formeln

Population SD: sigma = sqrt((1/N) * sum((xi - mu)^2))

Where

sigma= Standardabweichung der Population
N= Gesamtanzahl der Datenpunkte
xi= Jeder einzelne Wert
mu= Mittelwert der Population (Durchschnitt)
Sample SD: s = sqrt((1/(N-1)) * sum((xi - x_bar)^2))

Where

s= Standardabweichung der Stichprobe
N-1= Freiheitsgrade (Bessel-Korrektur)
xi= Jeder einzelne Wert
x_bar= Mittelwert der Stichprobe (Durchschnitt)
Variance = (Standard Deviation)^2

Where

Variance= Das Quadrat der Standardabweichung, in quadrierten Einheiten

Berechnungsbeispiele

Populations-SD von {2, 4, 4, 4, 5, 5, 7, 9}

1

Mittelwert berechnen

(2 + 4 + 4 + 4 + 5 + 5 + 7 + 9) / 8 = 40 / 8

= 5

2

Quadrierte Abweichungen ermitteln

(2-5)^2 + (4-5)^2 + (4-5)^2 + (4-5)^2 + (5-5)^2 + (5-5)^2 + (7-5)^2 + (9-5)^2 = 9+1+1+1+0+0+4+16

= 32

3

Durch N teilen (Population)

32 / 8

= 4 (Varianz)

4

Quadratwurzel ziehen

sqrt(4)

= 2

Result

Standardabweichung der Population = 2

Stichproben-SD von {2, 4, 4, 4, 5, 5, 7, 9}

1

Mittelwert und Summe der quadrierten Abweichungen (wie oben)

Mean = 5, sum of squared deviations = 32

= 32

2

Durch N - 1 teilen (Stichprobe)

32 / (8 - 1) = 32 / 7

= 4.571 (Stichprobenvarianz)

3

Quadratwurzel ziehen

sqrt(4.571)

= 2.138

Result

Standardabweichung der Stichprobe = 2,138

Praktische Anwendungen

  • Finanzwirtschaft — die Standardabweichung der Renditen misst das Anlagerisiko. Eine Aktie mit einer SD von 20 % ist volatiler als eine mit einer SD von 10 %.
  • Qualitätskontrolle — in der Fertigung wird das „Six Sigma”-Konzept verwendet, bei dem Prozesse Ergebnisse innerhalb von 6 Standardabweichungen vom Zielwert liefern müssen.
  • Benotung — standardisierte Testergebnisse werden häufig angegeben als Anzahl der Standardabweichungen über oder unter dem Mittelwert (z-Werte).
  • Wissenschaft — Fehlerbalken in Diagrammen stellen typischerweise eine oder zwei Standardabweichungen vom Mittelwert dar.

Annahmen und Einschränkungen

  • Normalverteilungsannahme — die „68-95-99,7-Regel” (68 % der Daten innerhalb von 1 SD, 95 % innerhalb von 2 SD) gilt nur für normalverteilte Daten. Bei schiefen Verteilungen kann die Standardabweichung allein irreführend sein.
  • Empfindlichkeit gegenüber Ausreißern — da Abweichungen quadriert werden, kann ein einzelner Extremwert die Standardabweichung erheblich aufblähen. Erwägen Sie die Verwendung der medianen absoluten Abweichung bei Daten mit Ausreißern.
  • Mindestdatenmenge — die Stichproben-Standardabweichung erfordert mindestens 2 Datenpunkte (die Division durch N - 1 ist bei N = 1 nicht definiert).

Sources

standard-deviation variance statistics mean math