Zufallsvariablen
Eine Zufallsvariable, auch Merkmal genannt, ist eine Funktion, die jedem möglichen Ergebnis eines Experiments eine Zahl zuordnet (Wahrscheinlichkeitsverteilung).
Der Wert, den eine solche Zufallsvariable annehmen kann, nennt man dann die Realisation oder den Wert der Variable.
Diskrete Zufallsvariablen
Eine Zufallsvariable heißt diskret, wenn sie nur endlich oder abzählbar unendlich viele Werte annehmen kann.
Tipp
Die Wahrscheinlichkeit für das Eintreten eines Ereignisses ist gleich der Summe der Wahrscheinlichkeiten aller günstigen Ergebnisse der Variable. Werte außerhalb des Trägers erhalten die Wahrscheinlichkeit .
Verteilungsfunktion
TODO: Erklärungen
Stetige Zufallsvariablen
Eine Zufallsvariable heißt stetig, wenn es eine Funktion gibt, so dass für jedes Intervall gilt:
Es gilt:
Das heißt: Alle Realisationen addiert ergeben .
Das heißt: Es ist irrelevant, ob und inklusive oder exklusive Grenzen sind.Jeder spezielle Punkt hat die Wahrscheinlichkeit . Es werden also immer nur Intervalle betrachtet.
Die Werte der Dichtefunktion sind keine Wahrscheinlichkeiten. ist möglich.
Verteilungsfunktion
Es gilt:
ist stetig und monoton wachsend.
= 0
Das heißt: Die untere Grenze des Wertebereichs ist 0.= 1
Das heißt: Die obere Grenze des Wertebereichs ist 1.
Tipp
Siehe dir dazu auch die Verteilungen an.
Mehrdimensionalität
Oftmals wird in Untersuchungen und Experimenten mehr als nur ein Merkmal aufgezeichnet, z.B. Alter und Geschlecht. Man kann jedoch nicht immer garantieren, dass diese Merkmale unabhängig voneinander sind. So hängt z.B. die Intelligenz nicht vom Geschlecht ab.
Um mehrdimensionale Merkmale festhalten zu können, definieren wir uns ein Tupel , das mehrere Merkmalsausprägungen enthält:
So könnte ein solches Tupel z.B. diese Merkmale erfassen:
Eine Ausprägung wäre dann:
Randverteilung
Als Randverteilung wird die Verteilung einer Zufallsvariable ohne Berücksichtigung der Zufallsvariable bezeichnet. Aus unserem oberen Beispiel wäre z.B. das Geschlecht alleine eine Randverteilung, weil wir dann Alter und Haarfarbe ignorieren.
Randverteilung in diskreten Zufallsvariablen
Das heißt: Die Randverteilung für ohne Berücksichtigung von ist die Summe aller Verteilungen von für jedes (analog andersherum für ).
Randverteilung in stetigen Zufallsvariablen
TODO: Erklärungen
Bedingte Verteilungen
Oftmals stehen Verteilungen zweier Merkmale in Verbindung zueinander, z.B. Reaktionszeiten bei alten Menschen (also die Merkmale Reaktionszeit und Alter). Dafür gibt es bedingte Wahrscheinlichkeiten.
für ein festes und .
Das heißt: Die Wahrscheinlichkeit für gegeben ist die Wahrscheinlichkeit für ein gemeinsames Auftreten von und normiert auf die Randverteilung von (analog andersherum für ).
Hinweis
Für gilt .
Unabhängigkeit
Zwei Zufallsvariablen und sind stochastisch unabhängig, wenn für alle ihre Werte und gilt:
Das heißt: Die Verteilung für (, ) ist nur eine Kombination aus den Verteilungen für und .
Wenn zwei Zufallsvariablen unabhängig sind, kann durch Wissen über eine nicht auf die andere geschlossen werden.
Beispiele:
2 Würfe mit demselben Würfel
Ist das Alter zweier Personen aus zwei endlichen Grundgesamtheiten unabhängig?
TODO: elaborieren
Sind zwei Reaktionszeiten einer Versuchsperson unabhängig?