Skip to Tutorial Content

Bruchpunktmodelle

  • Beim Bruchpunktmodell ändert sich ein Parameter eines Modells an einem Punkt sprungartig
  • In der Regel Anwendung auf Zeitreihen
  • Theoretisch diskrete oder stetige Zeit möglich

Beispiele

  • Aktienkurse
  • Schlafdaten
  • Krankheiten mit Schüben
  • Stärke von Sportmannschaften
  • Zeitreihen von Krankheitsfällen (Bruchpunkt: Ausbruch einer Epidemie)

Beispiel: Unfälle in englischen Kohlebergwerken

Der Datensatz coal.txt enthält die jährliche Anzahl von Unfällen in englischen Kohlebergwerken wärend der Jahre 1851-1962 (insgesamt 112 Jahre). Ein Plot der Daten zeigt einen deutlichen Rückgang der Unfälle ab etwa 1900.

Bruckpunktmodell

Ein Bruchpunktmodell für diese Daten \(\mathbf{y}=(y_1,\ldots, y_{112})\) hat folgende Form:

\[ \begin{aligned} Y_i \sim \left\{ \begin{array}{ll} Po(\lambda_1), & i=1,\ldots,\theta,\\ Po(\lambda_2), & i=\theta+1,\ldots, 112, \end{array} \right. \end{aligned} \]

Das heißt, zum Zeitpuntk \(\theta\) gibt es einen “Bruch” in der Rate.

Prioris

  • Raten: \(\lambda_i\mid\alpha \sim Ga(3,\alpha)\) für \(i=1,2\)
  • Priori-Parameter: \(\alpha \sim Ga(10,10)\)
  • Burchpunkt: \(\theta \sim U\{1,\ldots,112\}\) (diskret!)

Posteriori

Die gemeinsame Posteriori-Dichte ist gegeben durch:

\[ \begin{aligned} p(\lambda_1, \lambda_2, \alpha, \theta \mid \mathbf{y}) &\propto p(\mathbf{y} \mid \lambda_1, \lambda_2, \alpha, \theta)\, p(\lambda_1, \lambda_2, \alpha, \theta) \\ &= p(\mathbf{y} \mid \lambda_1, \lambda_2, \alpha, \theta)\, p(\lambda_1 \mid \lambda_2, \alpha, \theta) \\ & \qquad\cdot p(\lambda_2 \mid \alpha, \theta)\, p(\alpha\mid\theta)\, p(\theta) \\ &= p(\mathbf{y} \mid \lambda_1, \lambda_2, \theta)\, p(\lambda_1 \mid \alpha)\, p(\lambda_2 \mid \alpha)\, p(\alpha) p\, (\theta) \\ &\propto \left( \prod_{i = 1}^\theta \lambda_1^{y_i} \exp(-\lambda_1) \right) \left( \prod_{i = \theta+1}^n \lambda_2^{y_i} \exp(-\lambda_2) \right) \\ &\qquad\cdot \underbrace{\alpha^3 \lambda_1^{3-1} \exp(-\alpha\lambda_1)}_{\lambda_1\mid\alpha \sim Ga(3,\alpha)} \, \underbrace{\alpha^3 \lambda_2^{3-1} \exp(-\alpha\lambda_2)}_{\lambda_2\mid\alpha \sim Ga(3,\alpha)} \\ &\qquad\cdot \underbrace{\alpha^{10-1} \exp(-10\alpha)}_{\alpha \sim Ga(10,10)} \, \underbrace{\text{I}(1\leq \theta \leq 112)}_{\theta \sim \text{U}\{1,\ldots, 112\}}\,. \end{aligned} \]

Full Conditionals

\(\lambda_1\)

\[ \begin{aligned} \lambda_1 \mid \lambda_2, \alpha, \theta, \mathbf{y} &\propto \left( \prod_{i = 1}^\theta \lambda_1^{y_i} \exp(-\lambda_1) \right) \lambda_1^{3-1} \exp(-\alpha\lambda_1)\\ &= \lambda_1^{3+\sum_{i=1}^\theta y_i - 1} \exp\big(-\lambda_1(\theta+\alpha)\big) \end{aligned} \]

Dies ist der Kern einer \(Ga(3+\sum_{i=1}^\theta y_i, \theta+\alpha)\)-Verteilung.

\(\lambda_2\)

\[ \begin{aligned} \lambda_2 \mid \lambda_1, \alpha, \theta, \mathbf{y} &\propto \left( \prod_{i = \theta+1}^n \lambda_2^{y_i} \exp(-\lambda_2) \right) \lambda_2^{3-1} \exp(-\alpha\lambda_2)\\ &= \lambda_2^{3+(\sum_{i=\theta+1}^n y_i) - 1} \exp\big(-\lambda_2(\alpha + [n - \theta])\big) \end{aligned} \]

Dies ist der Kern einer \(Ga(3+\sum_{\theta+1}^{112} y_i, \alpha + 112 - \theta)\), da \(n=112\).

\(\alpha\)

\[ \begin{aligned} \alpha \mid \lambda_1, \lambda_2, \theta, \mathbf{y} &\propto \alpha^3 \exp(-\alpha \lambda_1) \alpha^3 \exp(-\alpha \lambda_2) \alpha^{10-1} \exp(-10\alpha) \\ &= \alpha^{16-1} \exp\big(-\alpha(10+\lambda_1+\lambda_2)\big) \end{aligned} \]

Dies ist der Kern einer \(Ga(16,10+\lambda_1+\lambda_2)\).

\(\theta\)

\[ \begin{aligned} \theta \mid \lambda_1, \lambda_2, \alpha, \mathbf{y} &\propto \left( \prod_{i=1}^\theta \lambda_1^{y_i} \exp(-\lambda_1) \right) \left( \prod_{i=\theta+1}^n \lambda_2^{y_i} \exp(-\lambda_2) \right) \\ & \quad\cdot \text{I}(1\leq \theta \leq 112) \\ &\propto \left( \prod_{i=1}^\theta \lambda_1^{y_i} \exp(-\lambda_1) \right) \left( \prod_{i=\theta+1}^n \lambda_2^{y_i} \exp(-\lambda_2) \right) \\ & \quad\cdot \frac{\left( \prod_{i=1}^\theta \lambda_2^{y_i} \exp(-\lambda_2) \right)} {\left( \prod_{i=1}^\theta \lambda_2^{y_i} \exp(-\lambda_2) \right)} \, \text{I}(1\leq \theta \leq 112) \\ &\propto \left( \prod_{i=1}^\theta \lambda_1^{y_i} \lambda_2^{-y_i} \exp(-\lambda_1) \exp(\lambda_2)\right) \text{I}(1\leq \theta \leq 112) \\ &= \exp\big(\theta(\lambda_2-\lambda_1)\big) \left( \frac{\lambda_1}{\lambda_2} \right)^{\sum_{i=1}^\theta y_i} \text{I}(1\leq \theta \leq 112) \end{aligned} \]

Implementation

Ergebnisse

Visuelle Inspektion der Samples

1000 Realisationen reichen aus, fast kein Burn-in notwendig, kaum Autokorrelation.

Mittelwert und Median für alle Parameter:

##   lambda1   lambda2     alpha     theta 
##  3.115446  0.954744  1.135575 39.862222
##    lambda1    lambda2      alpha      theta 
##  3.1230179  0.9504038  1.1177525 40.0000000

Der Bruch ist also zum Zeitpunkt 40 (Jahr 1890). Davor liegt die Rate bei etwa 3.12, danach bei 0.95.

Median-Modell im Histogramm:

Bruchpunktmodelle