Zum Inhalt

Source: Advances in Financial Machine Learning

López de Prado, Marcos. Advances in Financial Machine Learning. Wiley, 2018. — Das technische Standardwerk für Financial ML: Überlegenes Labeling (Triple-Barrier, Meta-Labeling), Backtesting-Statistiken (DSR), ML-basierte Portfoliokonstruktion (HRP) und das Meta-Strategy Paradigm als organisatorisches Grundprinzip.

Einordnung

Dieses Buch ist die technisch anspruchsvollste Quelle in der Bibliothek. Es löst fundamentale Probleme in quantitativen Handelssystemen — nicht durch bessere Strategie-Ideen, sondern durch korrekte Methodik: Wie labelt man Trainingsdaten? Wie validiert man Modelle ohne Look-ahead Bias? Wie allokiert man Kapital, wenn Kovarianzmatrizen instabil sind? Wie misst man Sharpe Ratios korrekt, wenn man viele Strategien probiert hat? Zielgruppe: Teams, nicht Einzelkämpfer.

Key Takeaways

1. Meta-Strategy Paradigm vs. Sisyphus Paradigm — Der kritische Fehler in Financial ML: Einzelne Quants suchen alleine nach Strategien. Jeder findet entweder einen False Positive (Overfit-Backtest) oder ein überfülltes Standard-Factor. Erfolgreiche Firmen bauen Produktionsketten: spezialisierte Teams (Daten, Features, Modelle, Backtesting, Execution) die sequenziell und interdependent arbeiten. Mikro-Alpha (ML-gefunden) existiert in Mengen — aber nur industriell extrahierbar.

2. Triple-Barrier Method — Statt fixem Zeithorizont für Labels: Drei Barrieren definieren den Ausgang einer Position — obere Barriere (Profit-Take), untere Barriere (Stop-Loss), vertikale Barriere (Zeitlimit). Label = welche Barriere zuerst berührt wird. Überlegene Labels weil: (a) dynamisch auf Volatilität angepasst, (b) path-dependent wie reales Trading, (c) Konfiguration [1,1,1] = Standard, andere für spezifische Strategie-Typen.

3. Meta-Labeling — Zweistufiges ML-System: Primärmodell bestimmt die Seite (Long/Short) aus fundamentaler oder regelbasierter Logik. Sekundäres ML-Modell entscheidet ob man handelt und wie groß. Vorteile: ML ist kein Black Box mehr (Richtung = White Box), Overfitting reduziert weil ML nur Size entscheidet, F1-Score steigt durch Filterung von False Positives des Primärmodells. Anwendung für "Quantamental" Firmen: Fundamental-Analyst bleibt für Richtung zuständig, ML für Sizing.

4. Purged K-Fold Cross-Validation — Standard K-Fold CV ist in Finance falsch: Labels überlappen zeitlich (eine Position von t₀ bis t₁ teilt Information mit Nachbar-Labels). Purging entfernt Trainings-Samples, die in den Validierungszeitraum hineinragen. Embargo verhindert dass Validierungs-Features am Ende trainiert werden. Ohne Purging: systematischer Look-ahead Bias in allen CV-Ergebnissen.

5. Deflated Sharpe Ratio (DSR) — Drittes Backtesting-Gesetz: Jeder Backtest muss mit der Anzahl aller Trials berichtet werden, sonst ist der False-Discovery-Wert nicht beurteilbar. Probabilistic Sharpe Ratio (PSR) korrigiert für Non-Normal Returns und Track-Record-Länge. DSR korrigiert zusätzlich für Multiple Testing — je mehr Strategien man ausprobiert, desto höher muss ein Sharpe Ratio sein, um statistisch signifikant zu sein. Praktische Regel: DSR > 0.95.

6. Hierarchical Risk Parity (HRP) — Markowitz scheitert bei korrelierten Assets: Kovarianmatrix-Inversion wird numerisch instabil (Markowitz's Curse). HRP ersetzt Matrixinversion durch hierarchisches Graph-Clustering: (1) Tree Clustering via Single-Linkage, (2) Quasi-Diagonalisierung der Kovarianzmatrix, (3) Rekursive Bisection zur Allokation. Monte Carlo: HRP liefert niedrigere Out-of-Sample-Varianz als CLA, obwohl CLA auf Minimum-Varianz optimiert. Praktisch: HRP funktioniert auch bei singulärer Kovarianzmatrix.

Verbindung zu Johanns System

López de Prado ergänzt Narang's quant_architektur_5_schichten auf der Methodik-Ebene: Wo Narang beschreibt was ein Quant-System braucht (5 Schichten), liefert López de Prado konkrete Algorithmen für jede Schicht. HRP ersetzt klassische Markowitz-Allokation in der Portfolio-Schicht. DSR ist die korrekte Backtesting-Metrik, die Chan's Sharpe Ratio um den Multiple-Testing-Faktor ergänzt. Meta-Labeling ist das Bindeglied zwischen diskretionärem Urteil (Narrativ + Katalysator nach O'Shea) und systematischer Ausführung.