U05.3 – Modellierung, Stichprobenmittel, Erwartungstreue, Effizienz

 

Seien n \in \mathbb{N},\quad n \geq 2,\quad \:\Theta  = \left\langle {0,\infty } \right\rangle ,\quad Z = \left( {X_1 , \ldots ,X_n } \right) eine Stichprobe vom Umfang n, wobei X1 gleichverteilt sei auf \left[ {0,2\vartheta } \right],\quad \vartheta  \in \Theta unbekannt.

a) Geben Sie ein statistisches Modell für den beschriebenen Sachverhalt an.

b) Seien M: = \frac{1} {n}\left( {X_1 + \ldots +X_n } \right)das Stichprobenmittel, H: = \frac{{n+1}} {{2n}} \cdot  \max \left( {X_1 , \ldots ,X_n } \right).

Zeigen Sie, dass sowohl M als auch H erwartungstreue Schätzer für \gamma \left( \vartheta  \right) = \vartheta sind, und dass H effizienter als M ist.

Hinweis: V 6, 1.6, Aufgabe 2.

Lösung

a)

Wegen der stetigen Gleichverteilung nehmen wir als Modell:

\Psi  = \mathbb{R}_+^n ,\quad \mathcal{G} = \mathcal{B}\left( {\mathbb{R}_+^n } \right),\quad \mathcal{W}_Z  = \left\{ {w_\vartheta  |\vartheta  \in \Theta } \right\},\quad w_\vartheta   = p_\vartheta  ^{ \otimes n},

wobei p_\vartheta = stetige Gleichverteilung auf \left[ {0,2\vartheta } \right]

Wegen des Intervalls \left[ {0,2\vartheta } \right] benötigen wir nur positive reelle Zahlen. Das hoch n geht aus dem Umfang der Stichprobe hervor.

b)

Es sind gegeben:

M: = \frac{1} {n}\left( {X_1 + \ldots +X_n } \right)

H: = \frac{{n+1}} {{2n}} \cdot  \max \left( {X_1 , \ldots ,X_n } \right)

Sei nun Y: = \max \left( {X_1 , \ldots ,X_n } \right)

Stetig-gleichverteilte Zufallsvariablen:

Wenn X gleichverteilt ist auf dem Intervall [a,b] dann gilt:

f\left( x \right) = \left\{ {\begin{array}{*{20}c}    {\frac{1} {{b-a}}} & {a \leq x \leq b}  \\    0 & {sonst}  \\   \end{array} } \right.

E\left( X \right) = \frac{{a+b}} {2}

\operatorname{var} \left( X \right) = \frac{{\left( {b-a} \right)^2 }} {{12}}

.

Zudem gilt für einfache reellwertige Stichproben:

E_\vartheta  \left( X \right): = \mu  = E_\vartheta  \left( M \right)
\operatorname{var} _\vartheta  \left( {M\left( n \right)} \right) = \frac{{\sigma ^2 }} {n} = \frac{{\operatorname{var} \left( X \right)}} {n}

Damit folgt also:

E_\vartheta  \left( X \right) = \frac{{0+2\vartheta }} {2} = \vartheta \quad  = \mu  = \quad E_\vartheta  \left( M \right) = \vartheta  = \gamma \left( \vartheta  \right),

Damit sind X und M also erwartungstreu.

\operatorname{var} _\vartheta  \left( X \right) = \frac{{\left( {b-a} \right)^2 }} {{12}} = \frac{{\left( {2\vartheta } \right)^2 }} {{12}} = \frac{{\vartheta ^2 }} {3}

\operatorname{var} _\vartheta  \left( {M\left( n \right)} \right) = \frac{{\sigma ^2 }} {n} = \frac{{\operatorname{var} \left( X \right)}} {n} = \underline{\underline {\frac{{\vartheta ^2 }} {{3n}}}}

Rechenregeln zu Erwartungswert und Varianz:

Da der Erwartungswert linear ist (was daraus folgt, dass das Integral ein linearer Operator ist) gilt:

\operatorname{E} (kX+d) = k\operatorname{E} (X)+d\quad ,\quad k,d \in \mathbb{R}

\operatorname{Var} (aX+b) = a^2 \operatorname{Var} (X)

(Siehe auch: dieser Artikel)

E_\vartheta  \left( H \right) = E_\vartheta  \left( {\frac{{n+1}} {{2n}}\max \left( {X_1 , \ldots ,X_n } \right)} \right) = E_\vartheta  \left( {\frac{{n+1}} {{2n}}Y} \right) = \frac{{n+1}} {{2n}}E_\vartheta  \left( Y \right) =  \ldots

Aus der vorherigen Aufgabe übernehmen wir:

\underline{\underline {E\left( Y \right) = \frac{{n\:2\vartheta }} {{n+1}}}} \quad ,\quad \underline{\underline {\operatorname{var} \left( Y \right) = \frac{{n\:4\vartheta ^2 }} {{\left( {n+2} \right)\left( {n+1} \right)^2 }}}}

\Rightarrow \quad E_\vartheta  \left( H \right) = \frac{{n+1}} {{2n}} \cdot  E_\vartheta  \left( Y \right) = \frac{{n+1}} {{2n}} \cdot  \frac{{n\:2\vartheta }} {{n+1}} = \underline{\underline \vartheta }

Damit ist also auch H erwartungstreu.

\operatorname{var} _\vartheta  \left( H \right) = \operatorname{var} _\vartheta  \left( {\frac{{n+1}} {{2n}} \cdot  \max \left( {X_1 , \ldots ,X_n } \right)} \right) = \operatorname{var} _\vartheta  \left( {\frac{{n+1}} {{2n}} \cdot  Y} \right)

= \left( {\frac{{n+1}} {{2n}}} \right)^2  \cdot  \operatorname{var} _\vartheta  \left( Y \right) = \frac{{\left( {n+1} \right)^2 }} {{4n^2 }} \cdot  \frac{{n\:4\vartheta ^2 }} {{\left( {n+2} \right)\left( {n+1} \right)^2 }} = \underline{\underline {\frac{{\vartheta ^2 }} {{n\left( {n+2} \right)}}}}

Für erwartungstreue Schätzer gilt wie in Aufgabe 1:

MSE\left( {\vartheta ,g} \right) = \operatorname{var} _\vartheta  \left( g \right)\quad ,\quad \forall \vartheta  \in \Theta

Also:

MSE\left( {\vartheta ,M} \right) = \operatorname{var} _\vartheta  \left( M \right) = \frac{{\vartheta ^2 }} {{3n}} > \frac{{\vartheta ^2 }} {{n\left( {n+2} \right)}} = \operatorname{var} _\vartheta  \left( H \right) = MSE\left( {\vartheta ,H} \right)

\quad ,\quad \forall n \in \mathbb{N},\quad n \geq 2

Da H den kleineren MSE hat ist H effizienter.

q.e.d.

\mathcal{J}\mathcal{K}