Beispiel: Stichprobenquantil, Ordnungs- und Rangpermutation

 

Ordnungspermutation und Ordnungsstatistik

Sei Z = \left( {X_1 , \ldots ,X_n } \right) eine einfache reellwertige (d.h. \forall X_i  \in \mathbb{R},\quad i = 1, \ldots ,n) Stichprobe vom Umfang n.

Bsp.: n = 6:

\begin{array}{*{20}c}    i &\vline &  1 &\vline &  2 &\vline &  3 &\vline &  4 &\vline &  5 &\vline &  6 &\vline &  {i = 1, \ldots ,n}  \\ \hline    {x_i } &\vline &  3 &\vline &  1 &\vline &  {-2} &\vline &  0 &\vline &  2 &\vline &  {-1} &\vline &  {Z = \left( {X_1 , \ldots ,X_n } \right)}  \\   \end{array}

\mathfrak{S}_n sei die Menge aller Permutationen von \left\{ {1, \ldots ,n} \right\}, also aller „Vertauschungen“ der Reihenfolge der Zufallsvariablen.
Es existiert eine \mathfrak{S}_n-wertige Zufallsgröße o (auf dem zugrunde liegenden W-Raum) derart, dass stets gilt:

X_{o\left( 1 \right)}  \leq  \ldots  \leq X_{o\left( n \right)}

Diese Zufallsgröße o nennt man Ordnungspermutation.

Setze für i = 1, \ldots ,n\quad X_{i:n} : = X_{o\left( i \right)} (die i-te Ordnungsgröße) und O^{\left( n \right)} \left( Z \right): = \left( {X_{i:n} , \ldots ,X_{n:n} } \right).

Der Zufallsvektor O^{\left( n \right)} \left( Z \right) heißt (aufsteigende) Ordnungsstatistik zur Stichprobe Z = \left( {X_1 , \ldots ,X_n } \right).

Im Bsp.:

\begin{array}{*{20}c}    i &\vline &  1 &\vline &  2 &\vline &  3 &\vline &  4 &\vline &  5 &\vline &  6 &\vline &  {i = 1, \ldots ,n}  \\ \hline    {x_i } &\vline &  3 &\vline &  1 &\vline &  {-2} &\vline &  0 &\vline &  2 &\vline &  {-1} &\vline &  {Z = \left( {X_1 , \ldots ,X_n } \right)}  \\ \hline    {x_{o\left( i \right)}  = x_{i:6} } &\vline &  {-2} &\vline &  {-1} &\vline &  0 &\vline &  1 &\vline &  2 &\vline &  3 &\vline &  {O^{\left( n \right)} \left( Z \right): = \left( {X_{i:n} , \ldots ,X_{n:n} } \right)}  \\ \hline    {o\left( i \right)} &\vline &  3 &\vline &  6 &\vline &  4 &\vline &  2 &\vline &  5 &\vline &  1 &\vline &  {X_{o\left( 1 \right)}  \leq  \ldots  \leq X_{o\left( n \right)} }  \\   \end{array}

(o\left( i \right) gibt also an, an welcher Position sich ein bestimmtes Element vor dem Einsortieren befand.)

Rangpermutation

Sei immer noch Z = \left( {X_1 , \ldots ,X_n } \right) eine einfache reellwertige stetig verteilte Stichprobe vom Umfang n und sei o die (f.s.) eindeutig bestimmte Ordnungspermutation.

Für i = 1, \ldots ,n sei R\left( i \right): = \left| {\left\{ {v = 1, \ldots ,n|X_v  \leq X_i } \right\}} \right|: aufsteigender Rang von X_i.

(Also der Betrag der Menge (die Anzahl) aller X_v die kleiner oder gleich X_i sind)

R: = \left( {R\left( 1 \right), \ldots ,R\left( n \right)} \right) ist (f.s.) eine \mathfrak{S}_n-wertige Zufallsgröße und heißt Rangpermutation.

Im Bsp.:

\begin{array}{*{20}c}    i &\vline &  1 &\vline &  2 &\vline &  3 &\vline &  4 &\vline &  5 &\vline &  6 &\vline &  {i = 1, \ldots ,n}  \\ \hline    {x_i } &\vline &  3 &\vline &  1 &\vline &  {-2} &\vline &  0 &\vline &  2 &\vline &  {-1} &\vline &  {Z = \left( {X_1 , \ldots ,X_n } \right)}  \\ \hline    {x_{o\left( i \right)}  = x_{i:6} } &\vline &  {-2} &\vline &  {-1} &\vline &  0 &\vline &  1 &\vline &  2 &\vline &  3 &\vline &  {O^{\left( n \right)} \left( Z \right): = \left( {X_{i:n} , \ldots ,X_{n:n} } \right)}  \\ \hline    {o\left( i \right)} &\vline &  3 &\vline &  6 &\vline &  4 &\vline &  2 &\vline &  5 &\vline &  1 &\vline &  {X_{o\left( 1 \right)}  \leq  \ldots  \leq X_{o\left( n \right)} }  \\ \hline    {R\left( i \right)} &\vline &  6 &\vline &  4 &\vline &  1 &\vline &  3 &\vline &  5 &\vline &  2 &\vline &  {\left| {\left\{ {v = 1, \ldots ,n|X_v  \leq X_i } \right\}} \right|}  \\   \end{array}

Es gilt:

R = o^{-1} (f.s.)

Denn:

R \circ o\left( i \right) = R\left( {o\left( i \right)} \right) = i

Bsp.: R\left( {o\left( 1 \right)} \right) = R\left( 6 \right) = 1

Zudem gilt: R und o sind gleichverteilt auf \mathfrak{S}_n, d.h. für alle \pi  \in \mathfrak{S}_n ist P\left( {R = \pi } \right) = P\left( {o^{-1}  = \pi } \right) = \frac{1} {{n!}}

Deshalb nennt man R und o (rein) zufällige Permutationen.

Ein weiteres Bespiel:

n = 10
Realisierung: X_1 , \ldots ,X_{10}

Ordnungsstatistik: X_{1:10} , \ldots ,X_{10:10}

Ordnungspermutation: \left( {o\left( 1 \right), \ldots ,o\left( {10} \right)} \right)

Grafik

Stichprobenquantile

Sei weiterhin \left( {X_1 , \ldots ,X_n } \right) eine einfache reellwertige Stichprobe vom Umfang n.

Sei F_n die zugehörige empirische Verteilungsfunktion und sei \alpha  \in \left[ {0,1} \right].

Eine Stichprobenfunktion \mu _{\alpha ,n} heißt ein α-Quantil der Stichprobe \left( {X_1 , \ldots ,X_n } \right), falls

F_n \left( {\mu _{\alpha ,n} -} \right) \leq \alpha  \leq F_n \left( {\mu _{\alpha ,n} } \right) P-fast sicher.

Im Folgenden sei \alpha  \in \left[ {0,1} \right] fest vorgegeben.

Es gelten:

1. X_{\left\lfloor {n\alpha } \right\rfloor +1:n} ist ein α-Quantil der Stichprobe \left( {X_1 , \ldots ,X_n } \right)

Die eckigen Klammern entsprechen in diesem Fall den so genannten Gaußklammern:

\left[ x \right] =  \lfloor x \rfloor : = \max _{k \in \mathbb{Z},k \leq x} (k) = Abrundung auf die nächste ganze Zahl.

2. Für jedes α-Stichprobenquantil \mu _{\alpha ,n} gilt: X_{\left\lfloor {n\alpha } \right\rfloor :n}  \leq \mu _{\alpha ,n}  \leq X_{\left\lfloor {n\alpha } \right\rfloor +1:n}

3. Ist n\alpha  \notin \mathbb{Z}, so ist X_{\left\lfloor {n\alpha } \right\rfloor +1:n} das f.s. eindeutig bestimmte α-Stichprobenquantil.

4. Ist n\alpha  \in \mathbb{Z} so ist jede Stichprobenfunktion \mu _{\alpha ,n} mit X_{\left\lfloor {n\alpha } \right\rfloor :n}  \leq \mu _{\alpha ,n}  \leq X_{\left\lfloor {n\alpha } \right\rfloor +1:n} f.s. ein α-Stichprobenquantil.

Speziell für \alpha  = 0,5 gilt:

  • Ist n ungerade, so ist \mu _{0.5\:,\:n}  = X_{\left( {n+1} \right)/2\::\:n} der f.s. eindeutig bestimmte Stichprobenmedian, nämlich das mittlere Element der geordneten Stichprobe X_{1:n} , \ldots ,X_{n:n}.
  • Ist n gerade, so ist jede zwischen X_{n/2\::\:n} und X_{n/2+1\::\:n} gelegene Stichprobenfunktion ein Stichprobenmedian. Häufig wird dann das arithmetische Mittel dieser Größen, also \tilde \mu _{\frac{1} {2}\:,\:n}  = \frac{1} {2}\left( {X_{\frac{n} {2}\::\:n} +X_{\frac{n} {2}+1\::\:n} } \right) als Stichprobenmedian verwendet.

Im Bsp:

Grafik

Stichprobenquantile:

\mu _{\alpha ,n}  = X_{\left\lfloor {n\alpha } \right\rfloor +1\::\:n}

\mu _{0.25\:,\:10}  = X_{\left\lfloor {\frac{{10}} {4}} \right\rfloor +1\::\:10}  = X_{3\::\:10}  = -2

\mu _{0.75\:,\:10}  = X_{\left\lfloor {\frac{{30}} {4}} \right\rfloor +1\::\:10}  = X_{8\::\:10}  = 1

\mu _{0.5\:,\:10}  = \frac{1} {2}\left( {X_{5\::\:10} +X_{6\::\:10} } \right) = \frac{1} {2}\left( {0+1} \right) = \frac{1} {2}

\mathcal{J}\mathcal{K}