02 – Zufallsvariablen und ihre Verteilung

 

Zufallsvariablen

Sei \left( {\Omega ,\mathcal{A},P} \right) ein W-Raum, \left(F,\mathcal{F}\right) ein Ereignisraum, X eine \mathcal{A}-\mathcal{F}-meßbare Abbildung von \Omega nach F, also X:\Omega\to F derart, dass X^{-1}\left(B\right) \in \mathcal{A} \forall B \in \mathcal{F}. Dann heißt X eine (F-wertige) Zufallsvariable (ZV; auch: Zufallsgröße) auf \left( {\Omega ,\mathcal{A},P} \right).

Spezialfälle

X heißt reelle Zufallsvariable, falls \left(F,\mathcal{F}\right) = \left(\mathbb{R}, \mathcal{B}\right).
Ist k\geq 2 und \left(F,\mathcal{F}\right) = \left(\mathbb{R^k}, \mathcal{B^k}\right), so heißt X k-dimensionaler Zufallsvektor.
Zufallsgrößen werden meist mit Großbuchstaben bezeichnet: X, Y, Z, …

Schreibweisen:

Ist B \in \mathcal{F}, so schreibt man

\left\{ {X \in B} \right\}: = {X^{-1}}\left( B \right) = \left\{ {\omega  \in \Omega |X\left( \omega  \right) \in B} \right\}

\left\{ {X = x} \right\}: = \left\{ {X \in \left\{ x \right\}} \right\}

P\left( {X \in B} \right): = P\left( {{X^{-1}}\left( B \right)} \right)

speziell für reelle ZV:

\left\{ {X \leq x} \right\}: = \left\{ {X \in \left] {-\infty ,x} \right]} \right\}

\left\{ {X \geq x} \right\}: = \left\{ {X \in \left[ {X,\infty } \right[} \right\}

Die Verteilung einer Zufallsvariablen

Sei \left( {\Omega ,\mathcal{A},P} \right) ein W-Raum, \left(F,\mathcal{F}\right) ein Ereignisraum,X:\Omega\to F eine F-wertige Zufallsvariable.
Das Bildmaß P_X von P unter der Abbildung X ist erklärt gemäß

{P_X}\left( B \right) = P\left( {X \in B} \right)\forall B \in \mathcal{F}

P_X ist ein W-Maß auf \left(F,\mathcal{F}\right) und heißt die Verteilung der Zufallsvariablen X.
Statt P_X schreibt man auch X\left(P\right) oder P \circ {X^{-1}}.

Beispiel:

Sei \left( {\Omega ,\mathcal{A},P} \right) ein W-Raum,

\left( {F,\mathcal{F}} \right) = \left( {\Omega ,\mathcal{A}} \right),

X: \Omega \to \Omega die identische Abbildung.

Dann ist P_X = P. Jedes W-Maß auf \left( {\Omega ,\mathcal{A}} \right) kann also als Verteilung einer Zufallsgröße X aufgefaßt werden.

Identisch verteilte Zufallsgrößen

Für i=1,2 seien \left( {\Omega_i ,\mathcal{A}_i,P_i} \right) W-Räume, \left(F,\mathcal{F}\right) ein Ereignisraum,

X_i:\Omega_i \to F Zufallsgrößen.

X_1 und X_2 heißen identisch verteilt, wenn ihre Verteilungen identisch sind, also

X_1\left(P_1\right) = X_2\left(P_2\right).

Die Verteilungsfunktion einer reellen Zufallsvariablen

Sei X eine reelle Zufallsvariable auf dem W-Raum \left( {\Omega ,\mathcal{A},P} \right). Die Funktion F_X:\mathbb{R}\to\mathbb{R} gemäß F_X\left(x\right) := P\left(X\leq \right). x \in \mathbb{R} heißt Verteilungsfunktion von X.

Die Verteilungsfunktion F := F_X ist stets monoton wachsend und rechtsseitig stetig und es
gilt: F(x) \to 0 für X\to -\infty und F(x) \to 1 für X\to +\infty. Insbesondere ist 0 \leq F\left(x\right) \leq 1 \forall x \in \mathbb{R}.

Durch die Verteilungsfunktion ist die Verteilung von X eindeutig bestimmt.
Ferner gilt für alle X,a,b \in \mathbb{R},\quad a<b:

1-F\left(x \right) = P\left(X > x \right)

F\left(x- \right) = P\left(X < x \right)

F\left(x \right)-F\left(x- \right) = P\left(X = x \right)

P\left( {a < X \leqslant b} \right) = F\left( b \right)-F\left( a \right)

F ist genau dann stetig auf \mathbb{R}, wenn P\left(X=x\right) = 0 für alle x\in\mathbb{R}.

Quantile

Sei X eine reelle Zufallsverteilung mit der Verteilungsfunktion F = F_X und sei \alpha\in\left]0,1\right[. Eine Zahl x_\alpha\in\mathbb{R} heißt α-Quantil von F (oder von X, oder von P_X), falls F\left(x_\alpha-\right) \leq \alpha\leq F\left(x_\alpha\right)

Äquivalent: P\left(X>x_\alpha\right) \leq 1-\alpha \leq P\left(X\geq x_\alpha\right)

Zu \alpha\in\left]0,1\right[ existiert stets ein α-Quantil von F, z.B. x_\alpha = \inf \left\{ {x \in \mathbb{R}|F\left( x \right) \geq \alpha } \right\}

(Diesen Wert liefert der Quantil-Aufruf in “R”). Allerdings ist das α-Quantil nicht notwendig eindeutig bestimmt. Bei den in der Statistik auftretenden stetigen Verteilungen sind die Quantile in der
Regel eindeutig bestimmt, nämlich durch die Umkehrfunktion der Verteilungsfunktion: für

\alpha\in\left]0,1\right[ ist F^{-1}\left(\alpha\right) das α-Quantil von F.

Spezialfall: Ein 0.5-Quantil heißt Median. m ist also genau dann Median von X, falls
P\left(X\leq m\right) \geq 0.5 und P\left(X \geq m\right) \geq 0.5

Diskrete Zufallsvariablen und ihre Wahrscheinlichkeitsfunktion

Sei \left( {\Omega ,\mathcal{A},P} \right) ein W-Raum, \left(F,\mathcal{F}\right) ein Ereignisraum.
Eine F-wertige ZV X:\Omega\to F heißt diskret, wenn eine höchstens abzählbare Menge T \subset F
existiert mit P\left(X\in T\right) = 1. Man nennt dann T einen Träger von X (oder der Verteilung von X).
Definiere f_X: T \to \mathbb{R}_+ gemäß f_X \left(x\right) = P\left(X=x\right) = P_X\left(\left\{x\right\}\right) für X\in T.

f_X heißt Wahrscheinlichkeitsfunktion (W-Funktion, Zähldichte, Massefunktion) von X.
P_X ist durch f_X eindeutig bestimmt, denn für alle B\in \mathcal{F} gilt (mit f:= f_X):

P_X\left(B\right) = P\left(X\in B\right) = P\left(X\in B\cap T\right) =  \sum\limits_{x \in B \cap T} {f\left( x \right)}

Insbesondere ist \sum\limits_{x \in T} {f\left( x \right)} = 1

Stetige Zufallsvariablen und ihre Dichte

Sei n eine natürliche Zahl, \left( {\Omega ,\mathcal{A},P} \right) ein W-Raum, X: \Omega \to  \mathbb{R}^n eine ZV. Die Verteilung P_X von X ist also ein W-Maß auf der σ-Algebra \mathcal{B}^n der Borelschen Teilmengen des \mathbb{R}^n.

X heißt stetig (verteilt), wenn eine nichtnegative Funktion f: \mathbb{R}^n \to  \mathbb{R}_+ existiert derart, dass für alle Borelschen Mengen B\in \mathcal{B}^n gilt:

P\left(X\in B\right) = P_X\left(B\right) = \int_B{f d\lambda^n}. (Lebesgue-Integral; \lambda^n ist das n-dimensionale Lebesguemaß)

Eine solche Funktion f heißt dann eine (Lebesgue-Wahrscheinlichkeits-) Dichte von X; sie ist
Lebesgue-fast eindeutig bestimmt. Man schreibt f = f_X, um auszudrücken, dass f eine Dichte
von X ist.

Bemerkungen

Sei X eine stetige reelle Zufallsvariable auf \left( {\Omega ,\mathcal{A},P} \right) mit der Verteilungsfunktion F und
der Dichte f. Dann ist F stetig auf \mathbb{R} und es ist F\left( x \right) = \int_{-\infty }^x {f\left( t \right)dt} \forall x \in \mathbb{R}
Für alle a,b\in\mathbb{R} mit a<b gilt dann:

P\left(a < X \leq b\right) = P\left(a \leq X < b\right) = P\left(a < X < b\right) = P\left(a \leq X \leq b\right)

Sei X eine stetige reelle Zufallsvariable auf \left( {\Omega ,\mathcal{A},P} \right) mit der Verteilungsfunktion F und sei F stetig und stückweise stetig differenzierbar, d.h. es existiere eine endliche Zerlegung der Zahlengeraden -\infty = a_0 < a1 < \ldots < a_n = +\infty, so dass F für jedes i=1,\ldots,n auf \left]a_{i-1}, a_i\right[ stetig differenzierbar ist.
Setze f\left(x\right) := F'\left(x\right) für \bigcup\limits_{i = 1, \ldots ,n} {\left] {{a_{i-1}},{a_i}} \right[} bzw. f\left(x\right) := 0 sonst.
Dann ist X stetig verteilt und F ist eine Dichte von X.

Sei X eine stetige Zufallsvariable. Dann ist P\left(X\in N\right) = 0 für jede λn-Nullmenge N, also für jedes N\in \mathcal{B}^n mit \lambda^n\left(N\right)=0.

Eine reelle ZV X mit der Verteilungsfunktion F heißt (bezüglich 0) symmetrisch verteilt,
wenn P\left(X > x\right) = P\left(X < -x\right) für alle x\in\mathbb{R}; im stetigen Fall heißt dies: F\left(-x\right) = 1-F\left(x\right) für alle x\in\mathbb{R}, was immer dann gilt, wenn die Dichte f eine gerade Funktion ist. Ist dann \alpha\in\left]0,1\right[ und x_{1-\alpha} ein (1-α)-Quantil von X, so ist -x_{1-\alpha} ein α-Quantil von X.

Transformationssatz für Dichten

Sei X ein n-dimensionaler stetiger reeller Zufallsvektor mit der Dichte f_X.
Sei U eine offene Teilmenge des \mathbb{R}^n mit P\left(X\in U\right) = 1;
\tau : U \to  \mathbb{R}^n sei ein C1-Diffeomorphismus, d.h. V := \tau\left(U\right) ist eine offene Teilmenge des \mathbb{R}^n, \tau: U \to  V ist bijektiv, \tau und \tau^{-1} sind stetig differenzierbar mit auf U resp. auf V nirgends verschwindenden Funktionaldeterminanten D\tau resp. D\tau^{-1}. Der n-dimensionale Zufallsvektor Y := \tau\left(X\right) ist dann ebenfalls stetig mit der Dichte f_Y\left(y\right) = 1_V\left(y\right)f_X\left(\tau^{-1}\left(y\right)\right)\left|D\tau^{-1}\left(y\right)\right|, y\in\mathbb{R}^n.

Spezialfall n=1: U, V offene Intervalle, X U-wertige reelle ZV, \tau: U \to  V stetig differenzierbar mit \tau'\left(x\right)\ne 0 \forall X\in U. Ist X stetig verteilt mit der Dichte f_X, so ist Y =\tau\left(X\right) ebenfalls stetig verteilt mit der Dichte f_Y\left(y\right) = 1_V\left(y\right)f_X\left(\tau^{-1}\left(y\right)\right)\left|\left(\tau^{-1}\right)'\left(y\right)\right|, y\in\mathbb{R}.

Bekanntlich ist {\left( {{\tau ^{-1}}} \right)^\prime }\left( y \right) = \frac{1} {{\tau '\left( {{\tau ^{-1}}\left( y \right)} \right)}}