Streuungsparameter

Streuungsparameter geben an, wie zerstreut deine Daten sind und helfen bei der Bestimmung der statistischen Signifikanz.

Spannweite

Die Spannweite ist einfach nur die Differenz zwischen dem größten und dem kleinen Wert deiner Stichprobe. Sie gibt damit an, wie weit deine Werte gehen.

Varianz

Die Varianz gibt an, wie sehr die Daten streuen. Eine besonders große Varianz deutet auf eine sehr große Streuung hin.

Diskret

Diese Formel gilt für diskrete, mindestens intervallskalierte oder binäre Zufallsvariablen.

Das heißt: Die Varianz von X ist die summierte Differenz zwischen den Werten und dem arithmetischen Mittel () quadriert in Verbindung mit der Auftrittswahrscheinlichkeit des Wertes ().

Stetig

Diese Formel gilt für stetige Zufallsvariablen.

Das heißt: Die Varianz von X ist die Differenz der Flächeninhalte zwischen den Werten und dem arithmetischen Mittel () in Verbindung mit der Auftrittswahrscheinlichkeit des Wertes () in der Ableitung nach .

Standardabweichung

Dieser Wert ist eine standardisierte Metrik zur Begutachtung der Streuung der Daten.

Standardisierung

Die Standardisierung hilft bei einigen Berechnungen von Wahrscheinlichkeit. Eine Standardisierung wird über diese Formel erreicht:

Dies resultiert in einem konstanten Erwartungswert und einer konstanten Varianz.

Quantile

Quantile definieren Grenzen, unter denen ein bestimmter Prozentsatz an Werten liegt. Möchtest du zum Beispiel eine Aussage treffen wie "35% aller Bahnfahrer sind weiter gereist als 1.000km.", wäre 1.000 km das 35%-Quantil, genannt 0.35-Quantil.

Spezielle Quantile

  • Median: 0.5-Quantil
  • Terzile: p-Quantile für und
  • Quartile: p-Quartile für und
  • Quintile: you get the idea…
  • Perzentile: Alle p-Quartile für in -Schritten

Interquartilsabstand

Der Interquartilsabstand ist der Abstand zwischen dem 0,25-Quartil und dem 0,75-Quartil. So berechnest du ihn ( bedeutet, abzurunden):

  1. Stichprobe sortieren. bezeichnet das -Quartil. ist die Größe deiner Stichprobe.

  2. 0,25-Quartil bestimmen:
    Wenn das Ergebnis nicht ganzzahlig ist, berechne das nächste ganzzahlige Quartil:

  3. 0,75-Quartil bestimmen:
    Wenn das Ergebnis nicht ganzzahlig ist, brechne das nächste ganzzahlige Quartil:

  4. Subtrahiere die Werte: .

Kovarianz

Die Koovarianz gibt an, ob hohe Werte zweier Stichproben mit hohen oder niedrigen Werten einhergehen oder gar kein Zusammenhang besteht.

oder auch:

Mit Verschiebungssatz gilt auch:

Es gilt:

  • Ist positiv, korrelieren hohe Werte in mit hohen Werten in und umgekehrt.
  • Ist negativ, korrelieren hohe Werte in mit niedrigen Werten Werten in und umgekehrt.
  • Ist 0, korrelieren die Werte nicht.

Korrelationskoeffizient

Während die Kovarianz nur angibt, ob Werte zweier Stichproben möglicherweise korrelieren, gibt der Korrelationskoeffizient an, wie stark diese Korrelation ist.

(Das Symbol ist ein Rho.)

Es gilt:

  • befindet sich immer zwischen -1 und 1, also .
  • Wenn wir vom linearen Zusammenhang ausgehen, kannst du zwischen diesen Fällen unterscheiden:
    • : Dann ist
    • : Dann ist
    • : Dann ist und es besteht kein linearer Zusammenhang.
  • Wenn und stochastisch unabhängig sind, so besteht auch kein Zusammenhang zwischen ihnen. Es gilt also .
  • Das Gegenteil gilt nicht: Nur, weil gilt, müssen sie nicht unkorreliert sein.

Beispiel

perfekt
stark
mittel
schwach
kein
schwach
mittel
stark
perfekt