Skip to Tutorial Content

Poisson-Model

In unserem Beispiel zu den Unfallzahlen von Kindern in Linz hatten wir folgende Posteriori erhalten:

\[ \lambda|x \sim \text{Ga}(0.001+192\cdot1.8385,0.001+192) \sim \text{Ga}(352.993,192.001) \]

Wir hatten drei leicht unterschiedliche Punktschätzer erhalten:

  • \(\hat{\lambda}_{PE}=1.8385\)
  • \(\hat{\lambda}_{MAP}=1.8332\)
  • \(\hat{\lambda}_{med}=1.8368\)

Intervall-Schätzer

Können wir nun einen Intervallschätzer für \(\lambda\) angeben? Das heißt, ein Intervall, in dem \(\lambda\) mit einer vorgegebenen Wahrscheinlichkeit \(\alpha\) liegt.

Nun, wir haben die Posteriori-Verteilung von \(\lambda\) gegeben den Beobachtungen \(x\). Daraus können wir leicht für ein Intervall die Wahrscheinlichkeit angeben. Sei \(I\) ein Intervall:

\[ P(\lambda\in I|x) = \alpha \]

Kredibilitätsintervall

Wir können also angeben, mit welche Wahrscheinlichkeit der wahre Parameter in diesem Intervall liegt. Wir nennen das Intervall daher Kredibilitätsintervall oder Glaubwürdigkeitsintervall.

Im Gegensatz ist das klassische Konfidenzintervall so definiert, dass, wenn man das Zufallsexperiment auf identische Art und Weise wiederholt, ein \(\alpha\)-Konfidenzintervall mit der relativen Häufigkeit \(\alpha\) aller Fälle den unbekannten wahren Parameter überdecken wird.

Die Interpretation des Kredibilitätsintervall ist also sehr viel intuitiver als die des Konfidenzintervalls.

Highest Posterior Density Interval

Nun gibt es unendlich viele Intervalle, die die selbe Wahrscheinlichkeit haben. Sinnvoll ist es, das Intervall zu nehmen, in dem die Posteriori-Dichte am höchsten ist:

Sei \(I\in \Theta\) ein Intervall mit \(P(\theta\in I|x) = \alpha\) und \(p(\theta)>p(\theta^{*})\) für alle \(\theta\in I\) und \(\theta^{*}\not\in I\). Dann nennen wir \(I\) das Highest Posterior Density Credible Interval (HPD-Intervall, Kredibilitätsintervall mit höchster Posteriori-Dichte).

Zur Erinnerung: in unserem Beispiel war \(\lambda|x \sim \text{Ga}(352.993,192.001)\). In diesem Fall ist das 95%-HPD-Intervall \(I_\text{HPD}=[1.648, 2.032]\).

Bemerkungen

  • Das HPD-Intervall ist immer das kürzeste Kredibilitätsintervall (bei gleicher Wahrscheinlichkeit).
  • Bei mehr-modalen Posterioris kann das “HPD-Intervall” auch aus mehreren Intervallen bestehen
  • HPD-Intervalle sind nicht invariant gegenüber Transformationen

R-Code

a=352.993; b=192.001
alpha=0.95
hpd<-function(a,b,alpha)
  {
  laenge<-function(u,a,b,alpha)
    {
    pu<-pgamma(u,a,b)
    o<-qgamma(pu+alpha,a,b)
    return(o-u)
    }
  opt=optimize(laenge,c(1e-10,qgamma(1-alpha,a,b)),a=a,b=b,alpha=alpha)
return(c(opt$minimum,opt$minimum+opt$objective))
}
print(hpd(a, b, alpha))
## [1] 1.648322 2.031567

Wieder benutzen wir die Funktion optimize(), um das kürzeste Intervall zu finden. Die selbst definierte Funktion laenge() berechnet zu einer gegebenen Untergrenze u die Obergrenze für ein 95%-intervall und daraus die Länge des Intervalls.

Symmetrisches Kredibilitätsintervall

In der Praxis kann es schwierig sein, das HPD-Intervall zu bestimmen. Einfach zu berechnen ist ein symmetrisches \(\alpha\)-Kredibilitätsintervall \(I=[u,o]\) mit

\[ P(\theta<u)= P(\theta>o)=1-\alpha/2 \]

Im Beispiel ist das symetrische 95%-Kredibilitätsintervall \(I=[1.652, 2.036]\).

Übrigens: Symmetrische Intervalle sind invariant gegenüber streng monotonen Transformationen.

R-Code

qgamma(c(0.025,0.975),a,b)
## [1] 1.651685 2.035171

qgamma(q,a,b) berechnet die \(q\)-Quantile der Gamma(a,b)-Verteilung; hier also 2,5%- und 97.5%-Quantile.

Visualisierung

  • Beim HPD-Intervall wählt man das Intervall so, dass die Dichte an Unter- und Obergrenze identisch ist.
  • Beim symmetrischen Intervall schneidet man links und rechts jeweils \(1-\alpha/2\)% weg.

Die beiden Intervalle unterscheiden sich hier nur geringfügig, da die Posteriori fast symmetrisch ist.

Posteriori-Unsicherheit

Als Alternative zum Intervallschätzer kann man die Unsicherheit über den Schätzer auch anders aus der Posteriori herleiten. Z.B. in dem man die Varianz oder die Standardabweichung der Posteriori berechnet. Diese lässt sich oft sehr viel leichter bestimmen als der Intervallschätzer.

In unserem Beispiel gilt

  • Var\((\lambda|x) = \frac{352.993}{192.001^2} \approx 0.009575\)
  • sd\((\lambda|x) \approx \sqrt{0.009575} \approx 0.09785\)

Effekt der Priori

Verschiedene Prioris führen zu verschiedenen Schätzern. Die folgende Tabelle stellt den Posteriori-Erwartungswert und das HPD-Intervall in Klammern dar:

\(a\) 0.01 0.1 1 10
\(b=0.01\) 1.839 (1.648, 2.032) 1.839 (1.649, 2.032) 1.844 (1.653, 2.037) 1.890 (1.6978, 2.086)
\(b=0.1\) 1.838 (1.648, 2.031) 1.838 (1.648, 2.031) 1.843 (1.652, 2.036) 1.890 (1.697, 2.085)
\(b=1\) 1.829 (1.640, 2.021) 1.829 (1.640, 2.022) 1.834 (1.645, 2.026) 1.881 (1.689, 2.076)
\(b=10\) 1.748 (1.567, 1.931) 1.748 (1.567, 1.932) 1.752 (1.571, 1.936) 1.797 (1.614, 1.983)

Wir sehen, dass für kleine Werte von \(a\) und \(b\) kaum Unterschiede zwischen den Schätzwerten entstehen. Kleine Priori-Parameter entsprechen hier einen wenig informativen Priori.

Diese Vorgehensweise, den Effekt verschiedener Priori-Parameter auf die Schätzer zu vergleichen, nennt man Sensitivitätsanalyse. Gerade bei komplexeren Modellen bietet sich die Sensitivitätsanalyse an, um diem Priori-Parameter so zu wählen, dass kleine Änderungen der Parameter nicht zu Änderungen in den Schlüssen führen.

Quiz

Sei im Beta-Binomial-Modell \(a=b=1\), \(n=100\) und \(x=13\). Berechnen Sie ein symmetrisches 95%-Kredibilitätsintervall.

Wie lautet die untere Grenze des Intervalls? Sie können das Ergebnis eingeben oder auch direkt R-Code eintippen.

0
Wie lautet die obere Grenze des Intervalls?
1

Weiter

Kredibilitätsintervalle