Wie in Aufgabe 4.1 sei
der zu einer einfachen Stichprobe
vom Umfang n aus einer Bernoulli-Verteilung mit unbekanntem Parameter
gehörige statistische
Raum.
bezeichne das Stichprobenmittel (= relative Erfolgshäufigkeit).
Für
betrachten wir die Schätzer T:= M sowie U:= (nM+1)/(n+2).
a) Berechnen Sie MSE(
,U) und MSE(
,T) für beliebige
.
b) Zeigen Sie, dass für alle
mit
gilt: MSE(
,U) < MSE(
,T).
c) Welcher der beiden Schätzer ist der effizientere?
Hinweis zu c): Verwenden Sie das Ergebnis von b) und betrachten Sie MSE(
,U) und
MSE(
,T) für
oder für
.
Lösung

![Rendered by QuickLaTeX.com MSE\left( {\vartheta ,g} \right): = E_\vartheta \left[ {\left( {g\left( Z \right)-\gamma \left( \vartheta \right)} \right)^2 } \right]](http://me-lrt.de/wp-content/ql-cache/quicklatex.com-66deb7830e04994e0c773cb9f11659b6_l3.png)
![Rendered by QuickLaTeX.com : = \operatorname{var} _\vartheta \left( g \right)+\left[ {E_\vartheta \left( g \right)-\gamma \left( \vartheta \right)} \right]^2 \quad ,\quad \forall \vartheta \in \Theta](http://me-lrt.de/wp-content/ql-cache/quicklatex.com-caa7e42110620ec87f42ca0f5aa0bf1f_l3.png)
Ist g erwartungstreu für γ, so gilt:
a)
Wir benötigen also für die MSE-Funktion die Varianz und den Erwartungswert bezüglich ϑ.
Es gilt:

(Nachweis, dass M Maximum-Likelihood-Schätzer für ϑ ist)
Für eine Bernoulli-Stichprobe vom Umfang n gilt:

mit der Wahrscheinlichkeitsfunktion: 
wobei
und 
Siehe hierzu auch Einschub in diesem Artikel.
Wir suchen nun den Wert ϑ, für den die Funktion maximal wird, also für den die Likelihood den maximalen Wert annimmt. Alle anderen Werte seien konstant, womit wir den Vorfaktor
weglassen können:

Mit Definition des Stichprobenmittels:

folgt daraus:

Zur Vereinfachung der Berechnung des Maximums bilden wir nun die Log-Likelihood, leiten diese ab und setzen sie = 0:
![Rendered by QuickLaTeX.com \Rightarrow \quad \mathcal{L}\left( {z,\vartheta } \right) = \ln \left[ {\vartheta ^{nM} \left( {1-\vartheta } \right)^{n-nM} } \right] = \ln \vartheta ^{nM} +\ln \left( {1-\vartheta } \right)^{n-nM}](http://me-lrt.de/wp-content/ql-cache/quicklatex.com-9f7f80654319b64d1771b835e48d2220_l3.png)




Somit ist das Stichprobenmittel M also der Maximum-Likelihood-Schätzer für ϑ.
Im Übrigen ist M auch noch erwartungstreu für ϑ.
Wegen der Erwartungstreue gilt:

Da es sich um einen Bernoulliversuch handelt mit
ist
.
Nun wollen wir den Erwartungswert von U bestimmen.
Da der Erwartungswert linear ist (was daraus folgt, dass das Integral ein linearer Operator ist) gilt:
Daher gilt:

Damit folgt:


Da U nicht erwartungstreu ist, gilt für die MSE:
![Rendered by QuickLaTeX.com MSE\left( {\vartheta ,g} \right): = E_\vartheta \left[ {\left( {g\left( Z \right)-\gamma \left( \vartheta \right)} \right)^2 } \right]](http://me-lrt.de/wp-content/ql-cache/quicklatex.com-66deb7830e04994e0c773cb9f11659b6_l3.png)
![Rendered by QuickLaTeX.com : = \operatorname{var} _\vartheta \left( g \right)+\left[ {E_\vartheta \left( g \right)-\gamma \left( \vartheta \right)} \right]^2 \quad ,\quad \forall \vartheta \in \Theta](http://me-lrt.de/wp-content/ql-cache/quicklatex.com-caa7e42110620ec87f42ca0f5aa0bf1f_l3.png)
![Rendered by QuickLaTeX.com \Rightarrow \quad MSE\left( {\vartheta ,U} \right) = \operatorname{var} _\vartheta \left( U \right)+\left[ {E_\vartheta \left( U \right)-\vartheta } \right]^2](http://me-lrt.de/wp-content/ql-cache/quicklatex.com-99b248d04a1f39d05e515ee7796700fa_l3.png)


b)
Es soll für alle
mit
gelten: MSE(
,U) < MSE(
,T).
Sei also 
Dann folgt daraus:




![Rendered by QuickLaTeX.com \Rightarrow \quad \left( {1-2\vartheta } \right)^2 < \vartheta \left( {1-\vartheta } \right)\left[ {\frac{{\left( {n+2} \right)^2 }} {n}-n} \right]](http://me-lrt.de/wp-content/ql-cache/quicklatex.com-c05b50a66e399fc6f583515f331fa7cb_l3.png)
![Rendered by QuickLaTeX.com \Rightarrow \quad \left( {1-2\vartheta } \right)^2 < \vartheta \left( {1-\vartheta } \right)\left[ {\frac{{4n+4}} {n}} \right]](http://me-lrt.de/wp-content/ql-cache/quicklatex.com-7c51442c9cf5618e7a82d6619d520703_l3.png)
![Rendered by QuickLaTeX.com \Rightarrow \quad \left( {\frac{1} {2}-\vartheta } \right)^2 < \vartheta \left( {1-\vartheta } \right)\left[ {\frac{{n+1}} {n}} \right]](http://me-lrt.de/wp-content/ql-cache/quicklatex.com-01c189eac1d170aa7430352767e37559_l3.png)
![Rendered by QuickLaTeX.com \Rightarrow \quad \left( {\vartheta -\frac{1} {2}} \right)^2 < \vartheta \left( {1-\vartheta } \right)\left[ {1+\frac{1} {n}} \right]](http://me-lrt.de/wp-content/ql-cache/quicklatex.com-463e3acd43745ea448bca6a091e58d1b_l3.png)
Da n Variabel ist und die Gleichung für jedes n gelten soll, folgt:




Das würde also Bedeuten
für 
c)
Die Antwort auf die Frage, welcher der beiden Schätzer der effizientere ist lautet: keiner von beiden.
Es gilt zwar
für
, aber es gilt:
für 
für 
und somit gilt
bei 0 und 1.



