Beispiel: Schätzfunktionen

 

Ein Teich enthält eine unbekannte Zahl N von Fischen. Es werden W = 50 Fische gefangen, mit einem weißen Fleck markiert und wieder ausgesetzt. Man wartet eine Weile, dann werden in einem zweiten Fischzug n = 20 Fische gefangen und die Zahl Z der markierten Fische in diesem zweiten Fischzug ermittelt.
(vgl.: Übung 2.5.2)

N = Anzahl der Fische im Teich
w = 50 markiert
2. Fischzug: 20 Fische fangen
Z = Anzahl der markierten Fische im 2. Fischzug

Modell

Mögliche Beobachtungswerte: \Psi  = \left\{ {0,1, \ldots ,20} \right\}

σ-Algebra zu \Psi: \mathcal{G} = \mathcal{P}\left( \Psi  \right)

Parametermenge: \Theta  = \left\{ {N \in \mathbb{N}|N \geq 50} \right\}

\mathcal{W}_n : = Hyp\left( {20,50,N} \right), also mit der Wahrscheinlichkeitsfunktion (Likelihood):

f_N \left( x \right) = \frac{{\left( {\begin{array}{*{20}c}    {50}  \\    x  \\   \end{array} } \right)\left( {\begin{array}{*{20}c}    {N-50}  \\    {20-x}  \\   \end{array} } \right)}} {{\left( {\begin{array}{*{20}c}    N  \\    {20}  \\   \end{array} } \right)}}\quad ,\:x \in \Psi ,\:N \in \Theta

(Das entspricht dem Ziehen von 20 Kugeln aus einer Urne mir N Kugeln, bei dem x von den 50 „Gewinnkugeln“ gezogen werden.)

Gesucht: Schätzer g für N, also \gamma \left( N \right) = N

Konstruktion (Maximum-Likelihood-Methode)

Wähle zu x \in \Psi denjenigen Wert g\left( x \right) \in \Theta mit: f_{g\left( x \right)}  =  {\max } f_N \left( x \right)\quad , N \in \Theta

Wir ermitteln nun also zu einem Beobachtungswert x den Wert N (aus Θ), für den die Wahrscheinlichkeit des Eintretens von x am größten ist.
(Siehe auch Bild unten)

Für festes x \in \Psi müssen wir also die Funktion \Phi \left( N \right) = \frac{{\left( {\begin{array}{*{20}c}    {N-50}  \\    {20-x}  \\   \end{array} } \right)}} {{\left( {\begin{array}{*{20}c}    N  \\    {20}  \\   \end{array} } \right)}}\quad ,\:N \geq 50 maximieren.
Da der Term \left( {\begin{array}{*{20}c}    {50}  \\    x  \\   \end{array} } \right) unabhängig von N ist, lassen wir ihn bei der zu maximierenden Funktion weg.

Zu beachten ist nun noch, dass nicht gelten darf:

N-50 < 20-x\quad  \Rightarrow \quad N < 70-x\quad  \Rightarrow \quad \Phi \left( N \right) = 0

Sei also N > 70-x

Um nun das Maximum zu finden, nutzen wir die Bedingung: \frac{{\Phi \left( N \right)}} {{\Phi \left( {N-1} \right)}} \geq 1

Dies beschreibt nichts anderes als ein vorausgesetztes Monotonieverhalten bis zum Maximum. D.h. das nachfolgende Element muss immer größer sein, als das vorherige. Ansonsten ist das Maximum überschritten worden.

\frac{{\Phi \left( N \right)}} {{\Phi \left( {N-1} \right)}} = \frac{{\left( {\begin{array}{*{20}{c}}    {N-50}  \\    {20-x}  \\   \end{array} } \right)}} {{\left( {\begin{array}{*{20}{c}}    N  \\    {20}  \\   \end{array} } \right)}} \cdot  \frac{{\left( {\begin{array}{*{20}{c}}    {N-1}  \\    {20}  \\   \end{array} } \right)}} {{\left( {\begin{array}{*{20}{c}}    {N-51}  \\    {20-x}  \\   \end{array} } \right)}}

= \frac{{\frac{{\left( {N-50} \right)!}} {{\left( {20-x} \right)!\left( {\left( {N-50} \right)-\left( {20-x} \right)} \right)!}}}} {{\frac{{N!}} {{20!\left( {N-20} \right)!}}}} \cdot  \frac{{\frac{{\left( {N-1} \right)!}} {{20!\left( {\left( {N-1} \right)-20} \right)!}}}} {{\frac{{\left( {N-51} \right)!}} {{\left( {20-x} \right)!\left( {\left( {N-51} \right)-\left( {20-x} \right)} \right)!}}}}

= \frac{{\frac{{\left( {N-50} \right)!}} {{\left( {20-x} \right)!\left( {N-70+x} \right)!}}}} {{\frac{{N!}} {{20!\left( {N-20} \right)!}}}} \cdot  \frac{{\frac{{\left( {N-1} \right)!}} {{20!\left( {N-21} \right)!}}}} {{\frac{{\left( {N-51} \right)!}} {{\left( {20-x} \right)!\left( {N-71+x} \right)!}}}}

= \frac{{\frac{{\left( {N-51} \right)!\left( {N-50} \right)}} {{\left( {20-x} \right)!\left( {N-71+x} \right)!\left( {N-70+x} \right)}}}} {{\frac{{\left( {N-1} \right)!N}} {{20!\left( {N-21} \right)!\left( {N-20} \right)}}}} \cdot  \frac{{\frac{{\left( {N-1} \right)!}} {{20!\left( {N-21} \right)!}}}} {{\frac{{\left( {N-51} \right)!}} {{\left( {20-x} \right)!\left( {N-71+x} \right)!}}}}

= \frac{{\frac{{\left( {N-50} \right)}} {{\left( {N-70+x} \right)}}}} {{\frac{N} {{\left( {N-20} \right)}}}} = \frac{{\left( {N-50} \right)}} {{\left( {N-70+x} \right)}} \cdot  \frac{{\left( {N-20} \right)}} {N}

\Rightarrow \frac{{\left( {N-50} \right)\left( {N-20} \right)}} {{N\left( {N+x-70} \right)}} \geq 1

\Leftrightarrow N^2 -70N+1000 \geq N^2 -70N+Nx\quad  \Rightarrow \quad Nx \leq 1000

\Phi wird also maximal für N = \left[ {\frac{{1000}} {x}} \right]

Für x = 0:\quad \Phi \left( N \right) > \Phi \left( {N-1} \right)\quad  \Rightarrow \quad \Phi besitzt kein Maximum \Rightarrow Maximum-Likelihood-Methode versagt hier!

Für x \geq 1:\quad \Phi \left( N \right) \geq \Phi \left( {N-1} \right) \Leftrightarrow N \leq \frac{{1000}} {x}\quad  \Rightarrow \quad \Phi wird maximal für N = \left[ {\frac{{1000}} {x}} \right]

Setze also g\left( x \right): = \left\{ {\begin{array}{*{20}c}    {\left[ {\frac{{1000}} {x}} \right]} & {;\:x \geq 1}  \\    {1000} & {;\:x = 0}  \\   \end{array} } \right.

Damit haben wir nun eine Schätzfunktion!

Für x = 6:\quad g\left( 6 \right) = \left[ {\frac{{1000}} {6}} \right] = 166

Das bedeutet für x = 6 also: Wenn aus dem Teich im 2. Fischzug 6 markierte Fische gezogen werden, so lässt dies erwarten, dass sich im Teich 166 Fische befinden.

Grafik

Hier ist für ausgewählte x der entsprechende Funktionsverlauf für f_N \left( x \right) in Abhängigkeit von N dargestellt.

x = 0: Blau: kein Maximum.
x = 1: Grün: Max bei N = 1000
x = 2: Weinrot
x = 3: Türkis
x = 4: Goldgelb
x = 6: Violett: Max bei N = 166
x = 10: Grau
x = 15: Schwarz
x = 20: Rot: Max bei N = 50

\mathcal{J}\mathcal{K}