Zum Inhalt

Source: The Signal and the Noise (Silver, 2012)

"Distinguishing the signal from the noise requires both scientific knowledge and self-knowledge." — Silver

Nate Silver (FiveThirtyEight) — systematische Untersuchung von Prognoseversagen in 12 Domänen. Diagnose in Teil 1 (Ch. 1–7), Bayesianische Lösung in Teil 2 (Ch. 8–13).

Kernthese

Das Signal-to-Noise-Verhältnis sinkt im Big-Data-Zeitalter. Die meisten Prognosen scheitern weil: (1) Hedgehog-Denken, (2) Überzeugung ohne Kalibrierung, (3) Fehlendes Bayesian Updating. Lösung: Probabilistisches Denken + explizite Priors + kontinuierliches Lernen.


Ch. 1 — CDO und Finanzkrise 2008

Prognose Realität
S&P: 0.12% CDO-Ausfallrate 28% — 200-facher Fehler
"Niemand hat es gesehen" Shiller (2000), Baker (2002), Economist (2005), Krugman (2005) warnten

Systemfehler: - Ratings-Agenturen: verdienen an Emittenten (perverser Anreiz) - Legal oligopoly: Fitch/S&P/Moody's = einzige NRSRO - Korrelationsannahmen aus ruhiger Periode extrapoliert - "I don't think they wanted the music to stop" (Jules Kroll) - Housing Bubble = Out-of-Sample-Event: kein historisches Vorbild in Trainingsdaten


Ch. 2 — Fox vs. Hedgehog (Tetlock)

Eigenschaft Fuchs Igel
Wissensbreite Multidisziplinär Spezialisiert
Überzeugung Probabilistisch, adaptiv Absolut, ideologisch
Selbstkritik Hoch Niedrig
Prognosegenauigkeit Signifikant besser Schlechter
TV-Attraktivität Weniger Besser
Medienauftritte × Prognosegenauigkeit: NEGATIV korreliert
Igel + mehr Fakten = SCHLECHTERE Prognosen (mehr Bias-Permutationen)
Fuchs + mehr Fakten = BESSERE Prognosen

FiveThirtyEight-Prinzipien: 1. Think Probabilistically (Verteilungen, nicht Punkte) 2. Update Your Forecasts (Bayesian Revision = Stärke) 3. Look for Consensus (Aggregation: 15–20% Fehlerreduktion)


Ch. 8 — Bayes'sches Theorem

Grundformel

P(H|E) = P(E|H) × P(H) / P(E)

Mammogramm-Beispiel (nur 3% rechnen's richtig)

Variable Wert
Prior: Brustkrebs bei Frauen 40er 1.4%
Sensitivity (Test erkennt Krebs) 75%
False Positive Rate 10%
Posterior bei positivem Test ~10%

→ False Positives dominieren wegen niedrigem Prior

September-11-Bayes-Update

Zeitpunkt Terroranschlag-Wahrscheinlichkeit
Morgens vor Angriff 0.005%
Nach erstem Flugzeug 38%
Nach zweitem Flugzeug 99.99%

Big Data Paradox

45.000 US-Wirtschaftsstatistiken → 1 Milliarde mögliche Paare
Echte kausale Beziehungen: wächst NICHT proportional
→ Big Data = mehr False Positives, nicht weniger

Frequentismus vs. Bayes

Aspekt Fisher (Frequentist) Bayes
Unsicherheit Sampling Error Epistemisch (Grenzen unseres Wissens)
Prior Verboten Explizit, obligatorisch
Objektivität Aus Experiment Aus Konvergenz mit Realität
Big Data Mehr Daten = gelöst Mehr Daten + schlechte Priors = mehr Fehler
Fehler Fisher leugnete Tabak→Krebs (paid consultant)

Bob Voulgaris — Der Bayesianer

NBA-Sportwetter, ~$1-4M/Jahr
Gewinnt nur 57% der Wetten (profitabel weil konsequent Edge > Vig)
Mindest-Edge: 54% (Vigorish decken)

Voulgaris ≠ Pattern-Finding: Sucht kausal-logische Erklärungen
Cavaliers-Beispiel: Ricky Davis in Vertragsjahr → spielte Fast-Paced
→ Wette auf "over" war profitabel

Lakers-Bet 1999-2000:
  Market: 13% (6.5:1); Voulgaris: 25%
  Expected Value: +$70.000 bei $80.000 Einsatz
  → Resultat: $520.000 Gewinn

Ch. 11 — Aktienmärkte und EMH

Trading-Volumen

1950er: Ø Haltedauer einer Aktie = 6 Jahre
2000er: Ø Haltedauer = 6 Monate
2009:   $46 Billionen gehandelt = 4× Fortune-500-Umsätze

Efficient Market Hypothesis (Fama)

Drei Formen: - Weak: Chartanalyse scheitert (vergangene Kurse nicht prädiktiv) - Semistrong: Fundamentalanalyse scheitert (öffentliche Info schon eingepreist) - Strong: Insider-Info scheitert (unrealistisch — Kongressmitglieder +5–10% p.a.!)

Manic Momentum Test

DOW 1966–1975: 58% gleiche Tagesrichtung
→ Statistisch hoch signifikant (1 in 7 Quintillionen Zufall)
→ Aber: praktisch unnutzbar

Strategie ohne TC (1976–1985):  $10.000 → $25.000 ✓
Strategie mit TC (0.25%/Trade):  $10.000 → $1.100 ✗
2000er reversed pattern:         $10.000 → $141 ✗

Shiller-CAPE als Bubble-Detector

P/E Erwartete Realrendite (10 Jahre)
10 ~9% p.a.
15 Historische Norm
25 ~2% p.a. ($12.000 aus $10.000)
30+ Negativ erwartet
5 von 8 Zeiten, in denen S&P 500 2× langfristige Wachstumsrate über 5 Jahre:
→ Folgte schwerer Crash (Große Depression, Dot-com, Black Monday 1987)

LIMIT: Greenspan "Irrational Exuberance" Dez. 1996, P/E = 28
→ Bubble-Peak: März 2000 (3+ Jahre! NASDAQ verdreifacht sich noch)
→ Nur 10–20-Jahres-Horizon zuverlässig

Karriere-Herding erklärt Blasen

Trader bewertungsperiode: 90 Tage
P/E > 30 → historisch nur 4% Crash-Chance in 90 Tagen

PAYOFF-MATRIX:
  Kauft + steigt:        Bonus, Lexus (business as usual)
  Verkauft + fällt:      Genius-Status, Buch, Konferenzen
  Kauft + fällt:         80% überlebt (alle im selben Boot)
  Verkauft + steigt:     Gefeuert, Karriere ruiniert ← WORST CASE

→ Rationale Individuen → Irrationales Kollektiv → Inevitable Bubbles
"The answer as to why bubbles form: it's in everybody's interest to keep markets going up" (Blodget)

Overconfidence-Modell (Odean, UC Berkeley): Nur Overconfidence als einzige Marktverzerrung reicht um zu erzeugen: - Exzessives Volumen - Erhöhte Volatilität - Day-to-Day-Korrelationen - Unterdurchschnittliche Renditen aktiver Trader


Ch. 13 — Unknown Unknowns

Rumsfeld-Taxonomie

Known Known:     Frage gestellt, Antwort vorhanden
Known Unknown:   Frage gestellt, Antwort unbekannt (aber bewusst!)
Unknown Unknown: Frage nie gestellt — Hypothesis nicht existiert

Pearl Harbor / 9/11

Schelling (1962): "We confuse the unfamiliar with the improbable.
What looks strange is thought improbable; what seems improbable need not be considered seriously."

Pearl Harbor:
  Dominante Prior-Hypothese: Sabotage durch Japan-Hawaiianer
  → Flugzeuge dicht zusammengestellt!
  → Radio-Stille der Träger → ignoriert

9/11:
  NORAD War-Game "Flugzeug crasht ins Pentagon": "too unrealistic"
  FAA: Hijacking = Geisel-Szenario, kein Selbstmord
  Moussaoui-Arrest: 16. August 2001, 747-Simulator-Wunsch ohne Lizenz
  → Kein Bayesian-Prior: "Terrorists might crash planes into buildings"

Terror-Power-Law

Clauset (U Colorado): Terroranschläge folgen Power-Law-Verteilung
→ Wie Erdbeben (häufig klein, selten groß, aber unvermeidlich groß)
→ 9/11 kein echter Outlier — mathematisch vorhersagbar als Quantil
→ "Finding one needle in a pile of needle parts" (nicht Heuhaufen)

Conclusion — Drei Bayes-Prinzipien

1. THINK PROBABILISTICALLY
   → Verteilungen, nicht Punkt-Prognosen
   → "Stop and smell the data"
   → Training verbessert Kalibrierung (Militär, Ärzte)

2. KNOW WHERE YOU'RE COMING FROM
   → Priors explizit nennen
   → Markt = guter Default-Prior
   → "No priors" = Zeichen für viele hidden priors

3. TRY AND ERR
   → Viele Forecasts → schneller lernen
   → Google: Tausende Experimente/Jahr statt Modell-Entwicklung
   → Trial = einzige Wahrheits-Validierung

Sieben EMH-Annäherungen (Modell für alle Themen):

1. "No investor can beat the market."          [Hedgehog-Statement]
7. "It is hard to tell how many investors 
   beat the market because data is noisy..."   [Foxlike Reality]