Zufallsvariablen

Eine Zufallsvariable, auch Merkmal genannt, ist eine Funktion, die jedem möglichen Ergebnis eines Experiments eine Zahl zuordnet (Wahrscheinlichkeitsverteilung).

Der Wert, den eine solche Zufallsvariable annehmen kann, nennt man dann die Realisation oder den Wert der Variable.

Diskrete Zufallsvariablen

Eine Zufallsvariable heißt diskret, wenn sie nur endlich oder abzählbar unendlich viele Werte annehmen kann.

Tipp

Die Wahrscheinlichkeit für das Eintreten eines Ereignisses ist gleich der Summe der Wahrscheinlichkeiten aller günstigen Ergebnisse der Variable. Werte außerhalb des Trägers erhalten die Wahrscheinlichkeit .

Verteilungsfunktion

TODO: Erklärungen

Stetige Zufallsvariablen

Eine Zufallsvariable heißt stetig, wenn es eine Funktion gibt, so dass für jedes Intervall gilt:

Es gilt:


  1. Das heißt: Alle Realisationen addiert ergeben .


  2. Das heißt: Es ist irrelevant, ob und inklusive oder exklusive Grenzen sind.

  3. Jeder spezielle Punkt hat die Wahrscheinlichkeit . Es werden also immer nur Intervalle betrachtet.

  4. Die Werte der Dichtefunktion sind keine Wahrscheinlichkeiten. ist möglich.

Verteilungsfunktion

Es gilt:

  1. ist stetig und monoton wachsend.

  2. = 0
    Das heißt: Die untere Grenze des Wertebereichs ist 0.

  3. = 1
    Das heißt: Die obere Grenze des Wertebereichs ist 1.

Tipp

Siehe dir dazu auch die Verteilungen an.

Mehrdimensionalität

Oftmals wird in Untersuchungen und Experimenten mehr als nur ein Merkmal aufgezeichnet, z.B. Alter und Geschlecht. Man kann jedoch nicht immer garantieren, dass diese Merkmale unabhängig voneinander sind. So hängt z.B. die Intelligenz nicht vom Geschlecht ab.

Um mehrdimensionale Merkmale festhalten zu können, definieren wir uns ein Tupel , das mehrere Merkmalsausprägungen enthält:

So könnte ein solches Tupel z.B. diese Merkmale erfassen:

Eine Ausprägung wäre dann:

Randverteilung

Als Randverteilung wird die Verteilung einer Zufallsvariable ohne Berücksichtigung der Zufallsvariable bezeichnet. Aus unserem oberen Beispiel wäre z.B. das Geschlecht alleine eine Randverteilung, weil wir dann Alter und Haarfarbe ignorieren.

Randverteilung in diskreten Zufallsvariablen

Das heißt: Die Randverteilung für ohne Berücksichtigung von ist die Summe aller Verteilungen von für jedes (analog andersherum für ).

Randverteilung in stetigen Zufallsvariablen

TODO: Erklärungen

Bedingte Verteilungen

Oftmals stehen Verteilungen zweier Merkmale in Verbindung zueinander, z.B. Reaktionszeiten bei alten Menschen (also die Merkmale Reaktionszeit und Alter). Dafür gibt es bedingte Wahrscheinlichkeiten.

für ein festes und .

Das heißt: Die Wahrscheinlichkeit für gegeben ist die Wahrscheinlichkeit für ein gemeinsames Auftreten von und normiert auf die Randverteilung von (analog andersherum für ).

Hinweis

Für gilt .

Unabhängigkeit

Zwei Zufallsvariablen und sind stochastisch unabhängig, wenn für alle ihre Werte und gilt:

Das heißt: Die Verteilung für (, ) ist nur eine Kombination aus den Verteilungen für und .

Wenn zwei Zufallsvariablen unabhängig sind, kann durch Wissen über eine nicht auf die andere geschlossen werden.

Beispiele:

  • 2 Würfe mit demselben Würfel

  • Ist das Alter zweier Personen aus zwei endlichen Grundgesamtheiten unabhängig? TODO: elaborieren

  • Sind zwei Reaktionszeiten einer Versuchsperson unabhängig?