statistical issues with financial market data a: cross-section data:

Download Statistical issues with financial market data A: Cross-Section Data:

If you can't read please download the document

Upload: akiko

Post on 08-Jan-2016

53 views

Category:

Documents


4 download

DESCRIPTION

Statistical issues with financial market data A: Cross-Section Data: - deviations from multivariate normality - “tail dependence” - copulas - default predictions B: Time series data - heavy tails - chaos? - structural change in patterns of dependence - Integration and Cointegration - PowerPoint PPT Presentation

TRANSCRIPT

  • Statistical issues with financial market data A: Cross-Section Data:- deviations from multivariate normality- tail dependence- copulas- default predictions B: Time series data - heavy tails- chaos?- structural change in patterns of dependence - Integration and Cointegration- ARCH- and GARCH-effects- Long memory and structural change

  • Selected bond rating agencies

  • Correspondence between selected S+P-grades and default probabilities(from M. Carey: Some evidence on the consistency of banks internal credit ratings, Federal Reserve Board 2001, Table 1, page 7 )

  • Rated A by S+P, Sept. 9, 2008

    Default, Sep. 15, 2008

  • Filed for bancruptcy Dec. 1. 2001 Was rated investment status by both Moodys and S+P 1 month beforeFormerly Worldcom; defaults on credit payments in July 2002, rated A by S+PIn April 2002.Formerly the world's biggest dairy product producer, had its credit rating cut to junk after missing a payment in Dec. 2003; rated A a couple of months before

  • Evaluating and comparing probability forecasters (=rating agencies) Case 1: Raters A and B rate different obligors at different points in time (skill scores) Case 2: Raters A and B rate identical obligors at identical points in time

  • Credit ratingsRated the same by Moody and S&PSources: Moodys; Federal Reserve Bank of New York

  • Example: Assigning default probabilities to 800 borrowers

    Predicted Default probabilityDistribution of borrowers across default probabilities according to different probability forecastersABCD0,5%00200 (1)1601%400 (4)002001,5%00400 (6)02%0800(16)003%400(12)004404,5%00200 (9)0

  • Default ordering (S. Vardemann and G. Meeden, Journal of the American Statistical Society 1983): A is better than B if its cumulated percentage of defaults (with cumulation starting in the good grades) is nowhere above that of Bs.Likewise for non-defaults

  • Theorem 1 (Vardeman/Meeden 1983): If A and B are both well calibrated, and A dominates B in the default ordering, then A is more refined than B.

  • Theorem 2 (Krmer 2005): Let A and B be both well calibrated. Then A and B cannot be ordered according to the Vardeman/ Meeden default ordering.

  • Lorenz-curve, power curve, cumulative accuracy profile

    overall Defaults

    bad 10%50%medium 70%45%good20%5%

  • Theorem (independently by various authors):Consider all possible pairs of defaults and non-defaults. The accuracy ratio (=area underneath the ROC-curve) is then equal to the probability that in one such randomly chosen pair, the non-default is ranked higher than the default

  • Theorem: Let A and B be (semi-)calibrated probability forecasters. Then we have:

    The converse does not hold

  • California Edison: rated A+ in 1999, default 2001(has recovered in the meantime)

  • W. Krmer: Strukturbruchtests bei RenditekorrelationenGemeinsame Arbeiten mitJonas KaiserDominik WiedMaarten van Kampen

  • Wertentwicklung globaler Aktienmrkte im Jahr 2007

    USA + 6,4 %Japan- 11,1 %Deutschland + 22,3 %GB+ 3,8 %Frankreich+ 1,3 %Spanien+ 7,3 %Italien- 7,0 %China+ 96,7 %Indien+ 47,1 %

  • Wertentwicklung der gleichen Aktienmrkte 2008

    USA (DJIA)- 32,7 %Japan (Nikkei 225)- 29,7 %Deutschland (DAX)- 39,5 %GB (FTSE 100)- 30,9 %Frankreich (CAC40)- 42,0 %Spanien (IBEX 35)- 38,7 %Italien (S+P Mib)- 48,8 %China (Shanghai Comp.)- 65,4 %Indien (Sensex 30)- 52,9 %

  • Modellierung zeitvariabler Abhngigkeiten

    Dynamische bedingte Korrelationen: R. Engle: Dynamic conditional correlation: A simple class of multivariate generalized autoregressive conditional heteroskedasticity models, Journal of Business and Economic Statistics 20, 2002, 339-350. Markov-Switching: D. Pelletier: Regime switching for dynamic correlations, Journal of Econometrics, 2006, 445-473 M. Haas: Covariance forecasts and long-run correlations in a Markov-switching model for dynamic correlations, Finance Research Letters, 7, 2010, 86-97 Dynamische Copulas: A. Patton: Modelling asymmetric exchange rate dependence, International Economic Review 47, 2006, 527-556. D. Totouom: Dynamic Copulas: Applications to finance and economics, Paris 2007. E. Giacomini, W. Hrdle, und V. Spokoiny: Inhomogeneous dependency modelling with time varying copulae, Journal of Business and Economic Statistics 27, 2009, 224-234. D. Guegan und J. Zhang: Change analysis of a dynamic copula for measuring dependende in multivariate data, Quantitative Finance 10, 2010, 421-430.

  • Was ist eine Copula?

    Ausgangspunkt ist folgendes ebenso zentrale wie elementare Resultat der W-Theorie:

    Sei X stetige Zve mit Verteilungsfunktion F. Dann ist die neue Zve U:= F(X) auf [0,1] gleichverteilt

    Def: die gemeinsame Verteilung von U=F(X) und V=G(Y) heit Copula von von X und Y

    Satz: Die gemeinsame Verteilung von X und Y ist durch die Copula und die beiden Randverteilungen eindeutig festgelegt

    ,

  • Randabhngigkeit (tail dependence): Links: 3000 tgliche BMW- und VW-Renditen, Rechts: 3000 bivariat normalverteilte Zufallsvektoren= ?

  • Ausgewhlte Literatur zu Randabhngigkeiten

    Longin/Solnik: Extreme Correlation of international equity markets, Journal of Finance 2001R. Schmidt: Tail dependence for elliptically contoured distributions, Math. Meth. Oper. Research 2002Falk/Michel: Testing for tail dependence in extrem value models, AISM 2006Hsler/Li: Testing asymptotic independence in bivariate extremes, Journal of Statistical Planning and Inference 2009F.Schmid/R.Schmidt/ J.Penzer: Measuring Large Comovements in Financial Markets, erscheint in Quantitative Finance 2010. Bcher/Dette/Volgushev: A new estimator of the Pickands dependence function and a test for extrem-value correlation, Dortmund 2010 (SFB 823 Diskussionspapier).

  • Signifikanztests auf konstante Abhngigkeitsstruktur

    A): endogene Brche: mgliche Muster unter der Alternative sind dateninduziert (truncated correlations, excess correlations)

    B): exogene Brche: Aufspaltung der Stichprobe nach potentiell unterschiedlichen Abhngigkeitsmustern ohne Ansicht der realisierten Werte von (X, Y)

  • bedingte Korrelation von X und Y, gegeben XABei bivariater Normalverteilung gilt (Boyer et al. (1999) Pitfalls in tests for changes in correlations, International Finance Discussion Papers Number 597):

  • Theorem: E(XZ|XA) = 0

  • Gemeinsame Verteilung konstant?

    Copula konstant? Dias/Embrechts 2004 Remaillard/Scaillet 2009 Zweite Momente konstant? Bartlett 1949Aue et al. 2009Copula constant in einem Punkt? Harvey/Busetti 2009 Krmer/v.Kampen 2010Spearman , Kendall konstant? Dobric/Frahm Schmid 2007 Schmid/Gaisser 2010Varianzen konstant? Riesige LiteraturKorrelationen konstant? Kullback 1967 Jennrich 1970 Fischer 2007 Wied 2009 Wied/Krmer/ Dehling 2010

  • Copula von X und Y an der Stelle (, ) =: C(, )

  • Grundidee (Busetti & Harvey 2009): Betrachte empirische Copula C*(, ) und 1 (sowohl Xt wie Yt links vom IT,t(, ) := empirischen -Quantil 0 sonst

    Unter H0:

  • Typische Zeitverlufe der Teststatistik

  • Grundidee: Lehne Ho ab bei extremer Fluktuation vonempirische Korrelation der Datenpaare 2, , tEmp. Korrelation unter Nutzung aller Datenpunke = Approximation fr wahres

  • Fr Details siehe:J. Kaiser, W. Krmer (2010): A cautionary note on computing conditional from unconditional correlations.Erscheint in Economics Letters.W. Krmer, M. van Kampen (2010): A simple nonparametric test for structural change in joint tail probabilities, Erscheint in Economics Letters).Dominik Wied: A generalized functional delta method, Dortmund 2010 (SFB 823 Diskussionspapier).D. Wied, W. Krmer, H. Dehling. "Testing for a change in correlation at an unknown point in time", 2010, zur Verffentlichung eingereicht.M. van Kampen, D. Wied. "A nonparametric constancy test for copulas under mixing conditions", Dortmund 2010 (SFB 823 Diskussionspapier).M. Arnold, N. Bissantz, D. Wied, D. Ziggel. "A new online-test for changes in correlations between assets", Dortmund 2010 (SFB 823 Diskussionspapier).

  • Verallgemeinerungen auf hhere Dimensionen

    Copula-Based Measures of Multivariate Association (with T. Blumentritt, S. Gaier, M. Ruppert, R. Schmidt), In: F. Durante, W. Hrdle, P. Jaworski, T. Rychlik (eds.) Workshop on Copula Theory and its Applications. Springer, 2010. Nonparametric inference on multivariate versions of Blomqvist's beta and related measures of tail-dependence (with R. Schmidt), Metrika, Vol. 66, 323-354, 2007 Multivariate conditional versions of Spearman's rho and related measures of tail dependence (with R. Schmidt), Journal of Multivariate Analysis, Vol. 98, No. 6, 1123-1140, 2007.

    Multivariate Extensions of Spearman's Rho and Related Statistics (with R. Schmidt), Statistics and Probability Letters, Vol. 77, No. 4, 2007.

    Themen, zu den gerade an meinem Lehrstuhl Doktoarbeiten laufen, oder gerade gelaufen sind.Speziell RGS: Pavel Stoimenov zu Copulas< Christoph Hanck zu Cointegration Alesia Khudnizkaja zu KreditausfllenAlle FertigAktuell: Marten van kampen: structural change in patterns of dependence

    Heute. Zwei Themen rausgreifen .

    Fangen wir an mit Kreditausfllen.Um was geht es da?Wahrscheinlichkeitsprognosen.Jeder von Ihnen nach einem Jahr: P(Promotion binnen 3 Jahren) = ?

    Zwei Problemkreise: 1. Wie kommen Prognosen zustande?2. Wie mit man die Qualitt von Prognosen?In zwei Kontexten 1. Privatkreditgeschft bei Geschftsbanken (Credit scoring)2. Ausfallprognosen fr Firmen oder ganze Staaten (Rating) Im weiteren; 2 + 2: Wer ist besser: Moodys oder S+P?

    Warum wichtig?

    Nicht nur MoodysAlle tun mehr oder weniger das gleiche.Wer ist der beste?How to rate the raters?1. Schritt: bersetzen von Buchstaben in Ausfallwahrscheinlichkeiten.

    Wichtig (und oft bersehen): A heit nicht: Kredit ist sicher.4 von10.000 fallen trotzdem aus.

    Prominente Beispiele:

    Damit zur Sache.Zwei ProblemkreiseIm weiteren: 1Ist natrlich nur dann interessant, wenn ein Unternehmen oder ein Staat mehrere Rating hat und die Ratings differieren,Tun sie das?Konkretes Zahlenbeispiel:4 Ratingagenturen bewerten 800 Schuldner.16 Ausflle.Gesamtausfallw.keit = 16/800 = 2%

    B macht sich Leben einfach: alle kriegen Prognose 2%!Kalibiriert! (well calibrated) Aber trivial A schon besser. Ebenfalls kalibriertA besser als B im Sinn der Verfeinerungsordnung (refinement ordering): B-Prognose lt sich aus A-Prognose ableiten.A wiederum lt sich aus C und D ableiten.

    C und D nicht vergleichbar:In normalem Deutsch:A bewertet Ausflle systematisch schlechter als B.Leicht herzustellen.Wie schlage ich S+P?S+P gibt AAA. Ich gebe AAaS+P gibt AAa. Ich gebe A usw.Damit schlage ich S+P im Sinn der Ausfallordnung!Aber: s+p schlgt mich in sSnn der Anti-Ausfallordnung!Bewertet Nicht-Ausflle systematisch besser!!!

    Im weiteren: beides!

    Zusammenhang mit Verfeinerungsordnung?Hat mich einen Monat meines Lebens gekostet!Beispiel?Keins gefunden

    Grund:

    Damit Theorem 1 trivial:Wenn-Teil ist falsch.Wenn A dann B: Falls A falsch ist, kann man fr B einsetzen was man will, der Satz bleibt immer richtig!Neues Theorem: wenn , dann ist 2+2 = 5!

    Also: bei kalibrierten Prognosen Ausfallordnung wenig hilfreich (bei nicht kalibrierten Prognosen aber schon)

    Letzte Halbordnung: Lorenzordnung

    1000 Kreditnehmer; 10% fallen aus.3 Ratingklassen.Grundidee: Sortiere Kreditnehmer auf waagerechter Achse von schlecht nach gut, trage auf senkrechter Achse Anteil an Gesamtausfllen ab, der auf diese Kreditnehmer entfllt.->:Lorenzkurve (power curve)Im Beispiel auf die 10% schlechtesten entfallen 50% aller Ausflle,Auf die 80% schlechtesten entfallen 95% aller Ausflle.Optimale Prognose: Alle Ausflle in die schlechteste Klasse

    Naher Verwandter der Lorenzkurve: ROC-Kurve. Auf waagerechter Achse nur die Nichtausflle. Rckt Ordinatenwerte nach links: 90% Nichtausflle. Wieviel % in der schlechtesten Klasse? 50/900 = 5,6%

    Als nchstes: wie hngen diese Qualittskriterien zusammen?Kalibriert: prognostizierte Ausfallw-keit = E(wahrer Ausfallanteil) Semi-Kalibriert: E(wahrer Ausfallanteil) = monoton steigende Funktion der prognostizierten A-W-keit

    Anwendung:Korrelation steht hier vor allem als pars pro toto fr Abhngigkeitsmae allgemein.Bestens bekannt: Korrelationen im Sinn von Bravais Pearson sind zwar das am weitesten verbreitete, aber trotzdem nur eines von vielen und in vielen Anwendungen noch nicht einmal das beste Ma fr Abhngigkeiten. Speziell bei Kapitalmarktrenditen sind gewhnliche Korrelationen dezidiert suboptimal.Auf der anderen Seite sind natrlich Korrelationen das in der Praxis mit Abstand hufigste Abhngigkeitsma berhaupt; viele Anwender kennen berhaupt nichts anderes, und allein schon deshalb erscheint es durchaus lohnend, auch einmal den statistischen Eigenschaften dieses Maes nher hinterher zu spren.Damit zum Thema. Um was geht es hier?Sehen Sie sich einmal diese Tabelle an:Aktienmrkte 2007Im groen und ganzen bergauf. Aber: Durchaus ungleichmig. Und hier zum Vergleich das Jahr 2008:Aktienmrkte 2008Da braucht man keinen formalen Test: die Abhngigkeit hat zugenommen. Und zu allem berflu auch noch dann, wenn man es am wenigsten braucht: Diversifikationseffekt.Also: dass Abhngigkeitsmuster auf Kapitalmrken im Zeitablauf konstant bleiben, glaubt heute kein Mensch. Darauf kann man im wesentlichen auf zweierlei Weise reagieren:1. Man lt von vornherein in den einschlgigen statistischen Modellen zeitvariable Abhngigkeiten zu2. Man unterstellt zumindest zeitweise Konstanz, und testet auf Strukturbruch.Auf die relativen Meriten dieser Vorgangsweisen will ich hier nicht eingehen. Ich betrachte im weiteren vor allem die Strategie Nr. 2, d.h. Strukturbruchtests.Davor kurze bersicht ber verwandte Themen, als Anregung fr mgliche DissertationenMultivariate ARCH-Garch Modelle. Nicht nur bedingte Varianz, auch bedingte Kovarianzen hngen von der Historie des Prozesses abParameter Ausprgungen eines Markov-ProzessesCopulas ndern sich im Zeitverlauf

    Was ist eine Copula?

    Copulas ndern ich nicht bei monotonen Transformationen.X,Y >0: Copula von ln(X) und ln(Y) gleich wie Copula von X und Y.Damit ideale Basis fr alle Abhngigkeitsmae, die unter monotonen Transformationen invariant sind.Spearman rho, Kendalls tau usw.In diesem Sinn Faktorisierung der gemeinsamen Verteilung

    Weiters Promotionsthema: Randabhngigkeiten.Beispiel: Zwei bivariate Datenstze mit der gleichen Korrelation.Folie RandabhngigkeitKorrelation in beiden Fllen gleich. Aber: gemeinsame Extremereignisse bei realen Daten viel hufiger als bei bivariater Normalitt zu erwarten.Allgemein: Randabhngigkeit bei elliptischen Verteilungen nur dann, wenn die Verteilung der erzeugenden Variablen regulr variierende Rnder hat (Rafael Schmidt 2002). Damit Randabhngigkeit bei Normalverteilung ausgeschlossen.Inzwischen riesige Literatur zum Modellieren, Schtzen und Testen solcher Randabhngigkeiten:Nchstes Thema: Signifikanztests auf konstante Abhngigkeitsstruktur. Zwei Klassen:2 KlassenKlasse A: Beliebte Alternative: Abhngigkeiten sind in Zeiten hoher Volatilitten grer as sonst.Sehr beliebt: truncated correlations. Auch hier fhrt der Korrelationskoeffizient leicht in die Irre:In beiden Fllen die Frage: Wie kann aus solchen bedingten Korrelationen auf die unbedingten K. zurckschlieen?Oder anders ausgedrckt: sind die gestiegenen empirischen Korrelationen Ausdruck eines Strukturbruchs im datenerzeugenden Prozess, oder ein Artefakt der Bedingung?Bei Normalverteilung schne Formel: Auf die Details der Formel will ich nicht eingehen. Was man aber sehr schn sieht: Die bedingte Korrelation ist genau dann grer als die unbedingte Korrelation, wenn die bedingte Varianz grer ist als die unbedingte Varianz. Letzteres ist etwa bei Bedingung auf groe Absolutwerte von X ganz klar der Fall.Problem: Abweichung von Normalverteilung. In Literatur speziell untersucht: bivariate t-Verteilung (Campbell u. a. , Empirical Finance 2008).Als nchstes: exogene Brche in der Korrelation bzw. von Abhngigkeiten ganz allgemein im ZeitverlaufMgliche Nullhypothesen (in absteigender Allgemeinheit.Folie Nullhypothesen.Ganz oben: riesige Literatur zu VerteilungstestsIm weiteren: unten links und unten rechtsUnten rechts:Bisherige Anstze: unter Alternative entweder nur ein und dazu noch ein bekannter Bruchzeitpunkt (Jennrich) oder parametrisch (t-Verteilung und restriktive Fluktuation unter H1 bei Fischer)Neu: Nichtparametrische AlternativeGrundidee die gleiche: betrachte kumulierte Abweichungen sukzessiver geschtzter Korrelationen von der endgltigen Korrelation:Grundidee wie bei den meisten Tests vergleichsweise offensichtlich und trivial;Schwierig dagegen ebenfalls wie bei den meisten Tests - ist die Ableitung der Nullverteilung. Und die hat es tatschlich in sich.war auch das zentrale Resultat der Diss. von Dominik Wied, auf der alles weitere beruht.