mesures de risque - free

72
Mesures de risque Christian GOURIEROUX et Jean-Michel ZAKOIAN

Upload: others

Post on 19-Jun-2022

4 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Mesures de risque - Free

Mesures de risque

Christian GOURIEROUX et Jean-Michel ZAKOIAN

Page 2: Mesures de risque - Free

Contents

1 Introduction 1

1.1 Risque financier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.2 Régulation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

2 Réserves et mesures de risque 4

2.1 Facteurs de risque et distributions de perte . . . . . . . . . . . . . . 4

2.2 VaR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

2.2.1 Définition et interprétations . . . . . . . . . . . . . . . . . . 5

2.2.2 VaR et moments conditionnels . . . . . . . . . . . . . . . . . 7

2.2.3 VaR et queues de distributions . . . . . . . . . . . . . . . . 9

2.3 Agrégation de risques . . . . . . . . . . . . . . . . . . . . . . . . . . 10

2.3.1 Modèle à facteur iid . . . . . . . . . . . . . . . . . . . . . . 10

2.3.2 Modèle à facteur autocorrélé . . . . . . . . . . . . . . . . . . 13

2.4 Autres mesures de risque . . . . . . . . . . . . . . . . . . . . . . . . 14

2.4.1 Volatilité et moments . . . . . . . . . . . . . . . . . . . . . . 14

2.4.2 Expected shortfall . . . . . . . . . . . . . . . . . . . . . . . 14

2.4.3 Mesures de distorsion . . . . . . . . . . . . . . . . . . . . . . 17

2.5 Sensibilité par rapport à la composition de portefeuille . . . . . . . 20

2.6 Mesures de risque cohérentes . . . . . . . . . . . . . . . . . . . . . . 22

3 Estimation 27

3.1 Propriétés de la fonction de répartition empirique . . . . . . . . . . 27

3.2 Fonction quantile empirique . . . . . . . . . . . . . . . . . . . . . . 29

3.2.1 Calcul des quantiles empiriques . . . . . . . . . . . . . . . . 29

3.2.2 Propriétés asymptotiques . . . . . . . . . . . . . . . . . . . . 30

3.3 Méthodes d’estimation des mesures de risque . . . . . . . . . . . . . 34

3.3.1 Estimation non paramétrique . . . . . . . . . . . . . . . . . 34

3.3.2 Modèles dynamiques des moments conditionnels . . . . . . . 36

3.3.3 Régression quantile . . . . . . . . . . . . . . . . . . . . . . . 39

3.3.4 Modèles dynamiques de la VaR . . . . . . . . . . . . . . . . 42

ii

Page 3: Mesures de risque - Free

CONTENTS iii

A Examens 46

B Fonction quantile 61B.1 Fonction quantile . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61B.2 Agrégation de fonctions quantiles . . . . . . . . . . . . . . . . . . . 62B.3 Dérivées du quantile d’une combinaison linéaire . . . . . . . . . . . 63B.4 Variables non absolument continues . . . . . . . . . . . . . . . . . . 63B.5 Théorème central limite pour tableaux triangulaires . . . . . . . . . 65

C Références 66

Page 4: Mesures de risque - Free

iv CONTENTS

Page 5: Mesures de risque - Free

Chapter 1

Introduction

En finance, les investisseurs, banques et autres intervenants des marchés financiersvoient leur capital exposé au risque. Il est donc utile de quantifier le risque de telleou telle position afin de décider s’il est acceptable ou non.

Par ailleurs, de nouvelles régulations sont actuellement mises en place. Pour lesétablissements financiers (Bâle II), pour les compagnies d’assurance (Solvency II)suite à des sous-évaluations des réserves.

Pour ces raisons, diverses classes de mesures de risque ont été introduites. Nouscommençons par préciser les diverses notions de risque rencontrées en finance etassurance avant de donner un bref historique des nouvelles régulations. On seréférera au chapitre 1 de Gouriéroux et Tiomo (2007).

1.1 Risque financier

Les principaux risques rencontrés en finance sont les suivants, sans que la frontièreentre eux soit toujours claire.

• Le risque de marché: risque de changement de la valeur d’une position fi-nancière due aux changements des composantes dont elle dépend (actions,obligations, taux de change, prix de matières premières...)

• Le risque de crédit: risque de ne pas recevoir les paiements prévus à causedu "défaut" de l’emprunteur.

• Les risques opérationnels: risque de pertes liées à des défaillances de proces-sus internes (personnes ou systèmes) ou externes. Exemple: incendie, fraude,risque judiciaire.

1

Page 6: Mesures de risque - Free

2 CHAPTER 1. INTRODUCTION

• Le risque de liquidité: rique lié au fait qu’un investissement peut ne pas êtreeffectué suffisamment rapidement pour éviter une perte.

• Le risque de modèle: risque lié à l’utilisation d’un modèle mal spécifié (ex:Black-Scholes alors que les rendements ne sont pas gaussiens). D’une certainefaçon ce risque est toujours présent, mais à des degrés différents.

La mesure du risque est une question statistique: à partir de données historiques etd’un modèle probabiliste, il s’agit d’évaluer les risques encourus pour une position.La gestion du risque est le métier d’une banque ou compagnie d’assurance.

1.2 Régulation

La régulation des dernières années a été conduite par le Comité de Bâle, créé en1974 par le G-10. La comité n’a pas d’autorité supranationale et ses conclusionsn’ont pas de force légale. Il formule des recommandations que les institutionsnationales sont libres de suivre en les adaptant.

Les étapes de la mise en place de procédures de régulation ont été les suivantes.

• Bâle I: les premières directives, relatives principalement au risque de crédit,datent de 1988. La mesure du risque proposée (ratio Cooke) était trop frusteet insuffisamment différenciée.

• Naissance de la VaR: 1993, dans différents rapports. En 1996, un amende-ment à Bâle I préconise un modèle standard pour le risque de marché maisautorise les banques les plus grosses à opter pour un modèle interne, fondésur la VaR. Le délicat problème du risque de crédit n’est pas résolu et lesbanques se plaignent de ne pas avoir assez d’incitation pour diversifier cerisque.

• Bâle II: le processus consultatif pour un deuxième accord est initié en 2001.L’approbation des dispositions définitives de Bâle II, par les gouverneurs dela banque centrale, date de juin 2004. En 2005: début du délai transitoired’une année. Fin 2006: introduction de Bâle II dans les différents pays.

Une différence importante par rapport à Bâle I est l’introduction dans Bâle II duconcept de trois piliers:

Page 7: Mesures de risque - Free

1.2. RÉGULATION 3

• Pilier I: une exigence minimale de fonds propres. Ces fonds propress’appliquent au risque de marché (déjà dans Bâle I), au risque de crédit(substantiellement révisé par rapport à Bâle I) et, pour la première fois, aurisque opérationnel.

• Pilier II: mise en place et validation des procédures internes de suivi et con-trôle des risques.

• Pilier III: discipline de marché et transparence incluant les questions de dif-fusion et d’échange d’informations.

Deux types d’approches ont été prévues dans un premier temps:

• L’approche avancée repose sur des méthodes relativement sophistiquées decalcul des risques (utilisation de lois conditionnelles)

• L’approche standard repose sur des méthodes plus simples mais requiert desréserves plus importantes.

Les établissements financier ont la possibilité de développer leur propre modèle degestion du risque. la commission bancaire valide le modèle et impose des niveauxde fonds propres fonction de la qualité du modèle proposé.

Page 8: Mesures de risque - Free

Chapter 2

Réserves et mesures de risque

Plusieurs aspects sont importants dans la fixation des réserves. Il faut:

• définir précisément la ligne du "bilan" à laquelle on s’intéresse (incluantl’horizon d’analyse). Ex: pour un portefeuille d’actions faut-il inclure lesdividendes? le risque de liquidité? de crédit?

• déterminer l’incertitude sur cette ligne à partir d’un modèle probabiliste.Le problème est rapidement difficile à cause du grand nombre d’actifs, dumanque de données, de faits stylisés compliqués.

• déterminer à partir de ce modèle un résumé scalaire pour mesurer le risque,puis fixer le montant de réserves en fonction de ce résumé. Il faut égalementexpliquer comment ces réserves apparaîtront dans le bilan.

Avant de définir la VaR, notion centrale dans la mise en place de régulations dansles institutions financières, nous introduisons la notion de distribution de perte.Dans tout ce chapitre, les variables seront considérées comme continues, ce quipermet d’éviter des difficultés dans la définition des quantiles (des extensions auxvariables quelconques sont présentées en annexe).

2.1 Facteurs de risque et distributions de perte

Soit un portefeuille dont la valeur à l’instant t est une v.a. notée Vt. A horizon h,la perte est notée

Lt,t+h = −(Vt+h − Vt).

4

Page 9: Mesures de risque - Free

2.2. VAR 5

La loi de Lt,t+h est appelée distribution de perte (conditionnelle ou non). Cettedistribution permet de calculer des réserves, qui seront insuffisantes pour couvrirtous les risques. En général Vt est modélisé comme une fonction de d facteurs derisque observables.

Considérons par exemple un portefeuille constitué de d actions. Le prix de l’actioni à la date t est noté Si,t et on note ri,t,t+h = log Si,t+h − logSi,t le rendement enlogarithme. En notant ai le nombre d’actions i dans le portefeuille on a

Vt =

d∑

i=1

aiSi,t

et donc, en supposant fixe la composition du portefeuille en les dates t et t+ h,

Lt,t+h = −d∑

i=1

aiSi,t(eri,t,t+h − 1).

La distribution de Vt+h conditionnelle au passé jusqu’à la date t est appelée loi deperte et profit ("Profit and Loss (P&L) distribution").

La fixation du niveau de réserve dépend

• du portefeuille

• de la date t (information) et de l’horizon h

• du niveau de risque jugé admissible (paramétré par le réel α ∈]0, 1[).On notera Rt,h(α) ce niveau de réserves. Avec ces réserves, non rémunérées, laligne du bilan à t + h devient Vt+h + Rt,h(α). On peut fixer les réserves les pluspetites vérifiant

Pt[Vt+h +Rt,h(α) < 0] < α, (2.1)

soitPt[Vt+h < −Rt,h(α)] < α.

En général, −Rt,h(α) est donc le quantile de niveau α de la loi conditionnelle deVt+h, i.e. la loi de perte et profit.

2.2 VaR

2.2.1 Définition et interprétations

Le capital pour couvrir le risque, ou Value at Risk comporte aussi la valeur courantedu portefeuille:

VaRt,h(α) = Vt +Rt,h(α).

Page 10: Mesures de risque - Free

6 CHAPTER 2. RÉSERVES ET MESURES DE RISQUE

La VaR s’interprète donc comme le capital exposé ou "valeur en risque" en cas deruine. Une autre interprétation est la suivante. On a

Pt[Vt+h − Vt < −VaRt,h(α)] < α

ou encore

Pt[VaRt,h(α) < Lt,t+h] < α, i.e. Pt[Lt,t+h ≤ VaRt,h(α)] ≥ 1− α. (2.2)

Nous adopterons la définition suivante.

Définition 2.1 On appelle VaR au niveau α, le quantile d’ordre 1− α de la dis-tribution conditionnelle de perte:

VaRt,h(α) := infx ∈ R | Pt[Lt,t+h ≤ x] ≥ 1− α,

lorsque ce quantile est positif. Par convention VaRt,h(α) = 0 sinon.

En particulier VaRt,h(α) augmente lorsque α décroît.

Remarque 2.1 Pour la gestion du risque de marché, on a typiquement h = 1 jourou 10 jours. Pour le régulateur (risque de crédit ou opérationnel) h = 1 an, α = 5%ou 3%. Dans l’approche dite "standard", la loi conditionnelle est remplacée par laloi marginale.

Remarque 2.2 Un avantage de la VaR, par rapport au niveau de réserve, estqu’elle est un quantile de la loi d’une variation de prix (en générale supposéestationnaire).

Remarque 2.3 On peut également interpréter la VaR comme un capital optimalpour une certaine fonction de coût. Supposons que l’on cherche le capital zt,déterminé à la date t, minimisant l’espérance conditionnelle d’un coût

ct+h = (1− α)(Lt,t+h − zt)+ + α(zt − Lt,t+h)

+.

Ainsi, pour α petit, un coût faible est associé à une réserve sur-évaluée mais uncoût important est associé à des pertes dépassant la réserve. Une valeur de zt quiminimise l’espérance conditionnelle de ce coût est précisément VaRt,h(α).

1 La VaRréalise donc un compromis optimal entre une perte excessive et un capital inutiliséexcessif.

1Pour une v.a. X , de loi F continue et telle que E|X | < ∞, soit

f(z) = (1− α)E(X − z)+ + αE(z −X)+ = (1− α)

∫ ∞

z

(x − z)dF (x) + α

∫ z

−∞

(z − x)dF (x)

Page 11: Mesures de risque - Free

2.2. VAR 7

2.2.2 VaR et moments conditionnels

Introduisons les deux premiers moments conditionnels à l’information disponibleà la date t de Lt,t+h:

mt,t+h = Et(Lt,t+h), σt,t+h = Vt(Lt,t+h).

Supposons que

Lt,t+h = mt,t+h + σt,t+hL∗h (2.3)

où L∗h est une variable aléatoire de fonction de répartition Fh. On a alors d’après(2.2)

1− α = Pt[VaRt,h(α) ≥ mt,t+h + σt,t+hL∗] = Fh

(

VaRt,h(α)−mt,t+h

σt,t+h

)

.

Par suite

VaRt,h(α) = mt,t+h + σt,t+hF←h (1− α). (2.4)

La VaR se décompose donc en une "perte attendue" mt,t+h, la moyenne condition-nelle des pertes, et une "perte inattendue" σt,t+hF

←(1− α), appelée aussi capitaléconomique.

La simplicité apparente de la formule (2.4) cache les difficultés (i) de calcul desmoments conditionnels pour un modèle donné et (ii) de détermination de la loi Fh,supposée indépendante de t, des rendements normalisés à horizon h.

Soit un portefeuille de prix pt = a′Pt, où a, Pt ∈ Rd. On a, en introduisant les

variations de prix ∆Pt = Pt − Pt−1,

Lt,t+h = −(pt+h − pt) = −a′(Pt+h − Pt) = −a′h∑

i=1

∆Pt+i.

Considérons sur plusieurs exemples la structure par terme de la VaR, c’est à direson évolution en fonction de l’horizon.

la fonction à minimiser. Cette fonction est convexe (donc continue) et lim|z|→∞ f(z) = +∞. Leminimum est atteint en en tout point z∗ tel que

0 = f ′(z∗) = −(1− α)

∫ ∞

z∗

dF (x) + α

∫ z∗

−∞

dF (x) = α− 1 + F (z∗).

Le quantile d’ordre 1− α de F est donc solution. Plus précisément, l’ensemble des solutions estle compact [q1−α, q

1−α] des points situés entre les quantiles inférieur et supérieur de X .

Page 12: Mesures de risque - Free

8 CHAPTER 2. RÉSERVES ET MESURES DE RISQUE

Exemple 2.1 Variations de prix iid gaussiennes. Si les ∆Pt+i sont iid deloi N (m,Σ), la loi de Lt,t+h est la loi N (−a′mh, a′Σah). Par suite, d’après (2.4),

VaRt,h(α) = −a′mh +√a′Σa

√hΦ−1(1− α). (2.5)

En particulier, si m = 0, on a VaRt,h(α) =√hVaRt,1(α). Cette règle con-

sistant à multiplier la VaR à horizon 1 par√h pour obtenir la VaR à hori-

zon h est souvent utilisée à tort lorsque les variations de prix ne sont pas iid,centrées et gaussiennes. Par exemple si la suite (a′∆Pt) est iid de loi double-exponentielle de paramètre λ, c’est à dire de densité f(x) = 0.5λ exp−λ|x|, ona VaRt,1(α) = − log(2α)/λ. On vérifie facilement que la loi de Lt,t+2 a pour den-sité g(x) = 0.25λ exp−λ|x|(1 + λ|x|). La VaR à horizon 2 est donc la solutionu de l’équation (2 + λu) exp−λu = 4α. Par exemple, pour λ = 0.1 on obtientVaRt,2(0.01) = 51.92 tandis que

√2VaRt,1(0.01) = 55.32. La VaR est donc sur-

évaluée en appliquant la règle incorrecte mais, pour d’autres valeurs de α on peutavoir sous-évaluation: VaRt,2(0.05) = 32.72 tandis que

√2VaRt,1(0.05) = 32.56.

Exemple 2.2 Variations de prix AR(1). Supposons maintenant que

∆Pt −m = A(∆Pt−1 −m) + Ut, (Ut) iid N (0,Σ)

où A est une matrice dont les valeurs propres sont de module strictement inférieurà 1. Le processus (∆Pt) est alors stationnaire d’espérance m. On a

∆Pt+i −m = Ai(∆Pt −m) + Ut+i + AUt+i−1 + · · ·+ Ai−1Ut+1.

Donc, en posant Ai = (I −Ai)(I − A)−1,

Lt,t+h = −a′h∑

i=1

(

m+ Ai(∆Pt −m) +

i∑

j=1

Ai−jUt+j

)

= −a′mh− a′AAh(∆Pt −m)− a′h∑

j=1

(

h∑

i=j

Ai−j

)

Ut+j

= −a′mh− a′AAh(∆Pt −m)− a′h∑

j=1

Ah−j+1Ut+j .

La loi conditionnelle de Lt,t+h est donc la loi N (a′µt,h, a′Σha) où

µt,h = −mh −AAh(∆Pt −m), Σh =

h∑

j=1

Ah−j+1ΣA′h−j+1.

Page 13: Mesures de risque - Free

2.2. VAR 9

Par suite

VaRt,h(α) = a′µt,h +√

a′ΣhaΦ−1(1− α).

Dans la cas où A = 0, cette formule se réduit à (2.5). En dehors de ce cas, le termeen facteur de Φ−1(1− α) n’est pas proportionnel à

√h.

Exemple 2.3 Variations de prix ARCH(1). Supposons d = 1, a = 1 poursimplifier et

∆Pt =√

ω + α1∆P 2t−1Ut, ω > 0, α1 ≥ 0, (Ut) iid N (0, 1).

La loi conditionnelle de Lt,t+1 est donc la loi N (0, ω + α1∆P 2t ) donc

VaRt,1(α) =√

ω + α1∆P 2t Φ−1(1− α).

Le calcul de la VaR à un horizon plus grand que 1 est ici problématique. En effet,la loi conditionnelle de Lt,t+h n’est pas normale. Par exemple à horizon 2, on a

∆Pt+2 =√

ω + α1∆P 2t+1Ut+2 =

ω + α1(ω + α1∆P 2t )U

2t+1Ut+2.

La loi conditionnelle de ∆Pt+2 n’est pas gaussienne si α1 > 0, car elle a un coeffi-cient de Kurtosis égal à

Et∆P 4t+2

(Et∆P 2t+2)

2= 3

(

1 +2θ2t

(ω + θt)2

)

> 3, θt = α1(ω + α1∆P 2t ).

2.2.3 VaR et queues de distributions

D’après (2.2), la VaR est définie comme un quantile supérieur de la distributionde perte conditionnelle. La figure 2.1 compare les VaR de 3 lois, ayant la mêmevariance mais des queues de distribution plus ou moins épaisses. La loi de Stu-dent S a la queue la plus épaisse, proportionnelle à 1/x4, la loi normale N ala queue la moins épaisse, et la loi double-exponentielle E possède une queue detaille intermédiaire, proportionnelle à e−

√2|x|. Pour un niveau α très petit, les VaR

seront rangées en fonction de l’épaisseur des queues: VaR(N )<VaR(E)<VaR(S).Le graphe de droite de la figure 2.1 montre que ce n’est pas le cas pour les niveauxusuels α = 1% et α = 5%.

Page 14: Mesures de risque - Free

10 CHAPTER 2. RÉSERVES ET MESURES DE RISQUE

-1 1 2 3-0.1

0.1

0.2

0.3

0.4

0.5

0.6

VaR

distribution des pertes

α

0.01 0.02 0.03 0.04 0.05

1.5

2

2.5

VaR

α

Figure 2.1: La VaR est le quantile d’ordre 1 − α de la distribution conditionnelle des pertes

(graphe de gauche). Le graphe de droite représente la VaR en fonction de α ∈ [1%, 5%] pour une

distribution des pertes de loi normale N (trait plein), de loi de Student à 3 dégrés de libertés

S (tirés) et de loi double exponentielle E (trait pointillé fin). Les 3 lois sont normalisées pour

avoir une variance de 1. Pour α = 1% on a VaR(N )<VaR(S)<VaR(E), pour α = 5% on a

VaR(S)<VaR(E)<VaR(N ).

2.3 Agrégation de risques: diversification et con-

tagion2

Il est fréquent de devoir tenir compte de plusieurs sources de risques. Ces risquespeuvent procurer de la diversification mais également de la contagion. Le calculde la VaR dans un tel contexte pose de nombreux problèmes. Nous considéronsplusieurs modèles emboîtés, à facteur inobservable. Pour simplifier, nous nousconsidérerons dans cette partie les risques d’horizon 1.

2.3.1 Modèle à facteur iid

Supposons qu’il y ait N sources de risque. On note L(i)t+1 la perte engendrée par la

source i entre les dates t et t+1. Pour appréhender les problèmes liés à l’agrégationdes divers risques, on considère le modèle suivant:

L(i)t+1 = ai + biZt+1 + u

(i)t+1, i = 1, . . . , N (2.6)

où (Zt) est un processus iid de loi N (0, 1), inobservable, les (u(i)t ) sont des bruits

blancs indépendants entre eux et indépendants de (Zt), de loi N (0, σ2i ), ai et bi

sont des paramètres. Le processus (Zt) s’interprète donc comme un facteur de

risque commun, tandis que les (u(i)t ) sont des risques idiosyncratiques. Dans ce

modèle, les pertes de dates différentes sont indépendantes mais les pertes d’unemême période liées à des risques différents sont corrélées.

2Cette partie est tirée de Monfort (2008).

Page 15: Mesures de risque - Free

2.3. AGRÉGATION DE RISQUES 11

La perte globale est

Lt+1 =

N∑

i=1

L(i)t+1 = a + bZt+1 + ut+1,

où a =∑N

i=1 ai, b =∑N

i=1 bi, ut+1 =∑N

i=1 u(i)t+1. En raison de l’indépendance, VaR

conditionnelle et non conditionnelle coïncident pour ce modèle. En utilisant (2.4),la VaR associée au risque i est

VaR(i)(α) = ai + (b2i + σ2i )

1/2Φ−1(1− α). (2.7)

celle associée à la perte globale est

VaR(α) = a + (b2 + σ2)1/2Φ−1(1− α), (2.8)

où σ2 =∑N

i=1 σ2i . Le coefficient b dépend des corrélations entre les L

(i)t+1 et Zt+1.

Plus |b| est grand plus la VaR(α) est grande. On peut voir b2 comme une mesurede la contagion. En particulier si b =

∑Ni=1 bi = 0, on dit que le champ de risques

est immunisé contre le facteur de risque commun. On a

VaR(α)−N∑

i=1

VaR(i)(α) =

(b2 + σ2)1/2 −N∑

i=1

(b2i + σ2i )

1/2

Φ−1(1− α).

Cette différence est du signe de

i 6=j

bibj − (b2i + σ2i )

1/2(b2j + σ2j )

1/2

≤ 0,

l’égalité n’ayant lieu que si les bruits sont dégénérés (σ2i = 0, ∀i) et si tous les bi

sont de même signe. Sauf dans ce cas, il y a donc diversification partielle (la partienon anticipée du risque est réduite).

Si l’on supposait à tort que les risques sont indépendants on utiliserait la VaRerronée

VaRe(α) = a +

N∑

i=1

(b2i + σ2i )

1/2

Φ−1(1− α),

Cette formule conduit à une sous-estimation si et seulement si b2 = (∑N

i=1 bi)2 >

∑Ni=1 b

2i . La dépendance entre les risques amène donc soit de la diversification

partielle soit de la contagion.

Page 16: Mesures de risque - Free

12 CHAPTER 2. RÉSERVES ET MESURES DE RISQUE

Risques homogènes

Si toutes les sources de risque sont homogènes, c’est-à-dire si ai = a0, bi = b0, σi =σ0 pour tout i, la VaR moyenne vaut

VaR(α) =1

NVaR(α) = a0 + (b20 +N−1σ2

0)1/2Φ−1(1− α)

< a0 + (b20 + σ20)

1/2Φ−1(1− α) = VaR(i)t (α).

Lorsque N tend vers l’infini, la partie de VaRt(α) due à la perte non anticipéetend donc vers b0Φ

−1(1− α). Si b0 6= 0, il y a donc diversification partielle, mêmeasymptotiquement, car la partie due au facteur commun de peut être diversifiée.Si b0 = 0, les risques sont indépendants et il y a diversification totale asympto-tiquement.

Estimation du facteur commun

Le filtre de Kalman permet d’estimer Zt au vu des pertes L(i)j , i = 1, . . . , N ,

j = 1, . . . , t et en supposant les paramètres connus. Introduisons les vecteursLt = (L

(1)t , . . . , L

(N)t )′, a = (a1, . . . , aN)

′, b = (b1, . . . , bN)′, ut = (u

(1)t , . . . , u

(N)t )′.

Le modèle (A.1) s’écrit

Lt = a+ bZt + ut, ut ∼ N (0,Σ := diag(σ21, . . . , σ

2N)).

On obtient, en utilisant la formule de l’espérance conditionnelle pour un vecteurgaussien3,

Zt|t = E(Zt | Lt) = b′(bb′ + Σ)−1(Lt − a).

Or

(bb′ + Σ)−1 = Σ−1 − Σ−1bb′Σ−1

1 + b′Σ−1b

donc

b′(bb′ + Σ)−1 = b

′Σ−1 − b′Σ−1bb′Σ−1

1 + b′Σ−1b=

b′Σ−1

1 + b′Σ−1b

et finalement

Zt|t =

∑Ni=1 bi(L

(i)t − ai)/σ

2i

1 +∑N

i=1 b2i /σ

2i

.

3Si le vecteur (x, y)′ est gaussien, de matrice de variance définie positive, avec µx = E(x), µy =E(y),Σxx = Var(x),Σyy = Var(y),Σxy = Σ′yx = Cov(x, y), la loi de x conditionnelle à y est lagaussienne

N (µx +ΣxyΣ−1yy (y − µy),Σxx − ΣxyΣ

−1yy Σyx)

.

Page 17: Mesures de risque - Free

2.3. AGRÉGATION DE RISQUES 13

La variance de l’erreur vaut

V (Zt − Zt|t) = V (Zt)− V (Zt|t) = 1− b′(bb′ + Σ)−1b = 1− b

′Σ−1b

1 + b′Σ−1b

=1

1 + b′Σ−1b=

1

1 +∑N

i=1 b2i /σ

2i

.

Elle est d’autant plus petite que les ratios de type "signal-bruit" b2i /σ2i sont grands.

2.3.2 Modèle à facteur autocorrélé

Supposons maintenant que le facteur Zt du modèle (A.1) ait une dynamique AR(1)donnée par

Zt = ρZt−1 +√

1− ρ2ǫt, |ρ| < 1, (2.9)

où (ǫt) est une suite iid de loi N (0, 1). Le solution stationnaire (Zt) de ce modèleest également de loi N (0, 1).

A la date t on observe (Lt,Lt−1, . . . ,L1). Conditionnellement à cet ensembled’information, la loi de Lt+1 est la loi normale

N (a+ bZt+1|t,Σ+ ω2t+1|tbb

′)

où Zt+1|t = Et+1(Zt) et ω2t+1|t = Vt+1(Zt) (espérance et variance conditionnelles à

Lt,Lt−1, . . . ,L1). Ces quantité sont obtenues récursivement à partir des équationsdu filtre de Kalman, faisant intervenir le filtrage Zt|t = Et(Zt) de Zt et la variancede l’erreur de filtrage, Vt(Zt) = ω2

t|t:

Zt|t = Zt|t−1 + b′(ω−2t|t−1Σ + bb

′)−1(Lt − a− bZt−1|t)

Zt+1|t = ρZt|t, ω2t|t = ω2

t|t−11− b′(ω−2t|t−1Σ + bb

′)−1bω2t+1|t = ρ2ω2

t|t + 1− ρ2, Z1|0 = 0, ω21|0 = 1.

On en déduit que la loi conditionnelle de la perte totale Lt est la normale

N (a+ bZt+1|t, σ2 + ω2

t+1|tb2)

où a =∑N

i=1 ai, b =∑N

i=1 bi et σ2 =∑N

i=1 σ2i . On en déduit

VaRt+1(α) = a+ bZt+1|t + (ω2t+1|tb

2 + σ2)1/2Φ−1(1− α). (2.10)

On voit que la VaR dépend ici de t sauf lorsque le coefficient de contagion b = 0.Dans ce cas on retrouve la VaR calculée en l’absence d’autocorrélation du facteurZt. Notons qu’il est possible de montrer que la variance conditionnelle ω2

t+1|tconverge vers 1, variance non conditionnelle de Zt. Même asymptotiquement,la formule (2.10) reste cependant différente de (2.8) en raison de la mise à jour del’estimation du facteur Zt.

Page 18: Mesures de risque - Free

14 CHAPTER 2. RÉSERVES ET MESURES DE RISQUE

2.4 Autres mesures de risque standard

Bien que la VaR soit la mesure de risque couramment utilisée, le choix d’unemesure de risque adéquate n’est pas encore tranché.

2.4.1 Volatilité et moments

Dans la théorie du portefeuille de Markowitz (1952), la variance est utilisée commemesure du risque. Dans un cadre dynamique, il pourrait donc sembler naturelde prendre comme mesure de risque la volatilité. Cette notion s’est avérée malcomprise par de nombreux praticiens. De plus, la volatilité ne tient pas comptedu signe des écarts à la moyenne. Enfin, cette mesure ne vérifie pas un certainnombre de propriétés de "cohérence" que nous verrons plus loin (invariance partranslation, sous-additivité).

2.4.2 Expected shortfall

L’expected shortfall (ES), ou perte anticipée, est la mesure de risque standardutilisée en assurance sous l’impulsion de Solvency 2. Cette mesure de risque trèsliée à la VaR, évite certaines de ses difficultés conceptuelles (voir plus loin la sous-additivité). Par ailleurs la VaR ne donne pas d’information sur la perte potentielleencourue lorsqu’elle est dépassée.

Soit Lt,t+h telle que EL+t,t+h < ∞. Dans un premier temps on suppose la loi

conditionnelle de Lt,t+h absolument continue. On définit l’ES au niveau α, ouTailvar, comme l’espérance conditionnelle de la perte sachant que celle-ci dépassela VaR:

ESt,h(α) := Et[Lt,t+h | Lt,t+h > VaRt,h(α)]. (2.11)

On a, en omettant provisoirement les indices,

E[L1L>VaR(α)] = E[L | L > VaR(α)]P [L > VaR(α)].

Or P [L > VaR(α)] = 1 − P [L ≤ VaR(α)] = 1 − (1 − α) = α, l’avant dernièreégalité découlant de la continuité de la fonction de répartition en VaR(α). D’où

ESt,h(α) =1

αEt[Lt,t+h 1Lt,t+h>VaRt,h(α)

]. (2.12)

La définition suivante résume les égalités obtenues pour l’ES et donne une exten-sion.

Page 19: Mesures de risque - Free

2.4. AUTRES MESURES DE RISQUE 15

Définition 2.2 Soit Lt,t+h telle que EL+t,t+h < ∞. Si la loi conditionnelle de

Lt,t+h est absolument continue, on défit l’ES au niveau de confiance α comme

ESt,h(α) = Et[Lt,t+h | Lt,t+h > VaRt,h(α)] =1

αEt[Lt,t+h 1Lt,t+h>VaRt,h(α)

]

Dans le cas général on définit

ESt,h(α)

=1

α

Et[Lt,t+h 1Lt,t+h>VaRt,h(α)] + VaRt,h(α)(α− Pt[Lt,t+h > VaRt,h(α)])

.

L’espérance conditionnelle Et[Lt,t+h | Lt,t+h > VaRt,h(α)], qui coïncide avec l’ESdans le cas continu, est appelé tail-VaR. La propriété suivante donne une carac-térisation utile de l’ES.

Proposition 2.1 Soit Lt,t+h telle que EL+t,t+h < ∞. On a

ESt,h(α) =1

α

∫ α

0

VaRt,h(u)du.

Preuve. Pour simplifier, on omettra les indices dans cette preuve. Remarquonsd’abord que si P [L > VaR(α)] = 0, on a ES(α) = VaR(α) et la propriété estvérifiée car VaR(u) = VaR(α) pour tout u ≤ α. Supposons maintenant P [L >VaR(α)] > 0. En utilisant le fait que L a même loi que F←(U), où U désigneune variable de loi uniforme sur [0, 1] et F la fonction de répartition de L (voir lapropriété B.1), on a,

E[L1L>VaR(α)] = E[F←(U)1F←(U)>F←(1−α)]

Or l’événement [F←(U) > F←(1− α)] s’écrit [U > (1− α)+] où

(1− α)+ = infx ∈]0, 1[ | F←(x) > F←(1− α) = P [L ≤ V aR]. (2.13)

Donc

E[L1L>VaR(α)] =

∫ 1

(1−α)+F←(u)du

=

∫ 1−(1−α)+

0

F←(1− u)du

=

∫ α

0

V aR(u)du−∫ α

1−(1−α)+V aR(u)du

=

∫ 1−(1−α)+

0

F←(1− u)du

=

∫ α

0

V aR(u)du− α− 1 + (1− α)+V aR(α)

Page 20: Mesures de risque - Free

16 CHAPTER 2. RÉSERVES ET MESURES DE RISQUE

En utilisant (2.13) et la définition 2.2 on obtient l’égalité cherchée.

2

Cette mesure de risque s’interprète donc, pour un niveau de confiance α, commela moyenne de la VaR sur tous les niveaux u ≤ α. On a évidemment ESt,h(α) ≥VaRt,h(α).

Par ailleurs, la caractérisation intégrale fait de ESt,h(α) une fonction continue deα, quelle que soit la nature des variables de perte. La VaR ne vérifie pas toujourscette propriété (pour des variables de perte nulles avec probabilité 1 sur certainsintervalles).

Exemple 2.4 (Cas gaussien) Si la distribution conditionnelle de la distributionde perte est la loi N (mt,t+h, σ

2t,t+h) alors, d’après (2.4), VaRt,h(α) = mt,t+h +

σt,t+hΦ−1(1− α) où Φ est la f.r. de la loi N (0, 1). En utilisant (2.11) et en notant

L∗ une variable de loi N (0, 1) et φ sa densité, on a

ESt,h(α) = mt,t+h + σt,t+hE[L∗ | L∗ ≥ Φ−1(1− α)]

= mt,t+h + σt,t+h1

αE[L∗ 1L∗≥Φ−1(1−α)]

= mt,t+h + σt,t+h1

αφΦ−1(1− α).

Par exemple si α = 0.05, l’écart-type conditionnel est multiplié par 1.65 dans laformule de la VaR et par 2.06 dans la formule de l’expected shortfall.

On a plus généralement sous l’hypothèse (2.3), d’après la proposition 2.1 et (2.4),

ESt,h(α) = mt,t+h + σt,t+h1

α

∫ α

0

F←h (1− u)du. (2.14)

Les liens entre VaR et expected shortfall peuvent être étudiés de manière plusdétaillée (voir Gouriéroux et Liu, 2006). Les formules (2.4) et (2.14) diffèrent parle ratio des coefficients en facteur de l’écart-type conditionnel:

L(α) :=1

αF←h (1− α)

∫ α

0

F←h (1− u)du. (2.15)

Le tableau 2.1 présente les valeurs de la VaR et de l’ES pour quatre distibutionsainsi que la valeur de L(α). Ce coefficient est toujours plus grand que 1 mais peutêtre très différent selon les distributions. Il tend vers 1 lorsque α tend vers 0 dansle cas de la loi uniforme et de la loi double-exponentielle (Laplace). En revanche,

Page 21: Mesures de risque - Free

2.4. AUTRES MESURES DE RISQUE 17

1.5 2 2.5 3

1

2

3

4

0.2 0.4 0.6 0.8 1Α

2

4

6

8

ΖΑ

Figure 2.2: Fonctions de densité (à gauche) et fonctions quantiles (à droite) pour les lois de

Pareto de paramètre a = 3, b = 1 (en rouge) et a = 4, b = 1 (en noir).

il est indépendant de α pour la loi de Pareto et on peut montrer que cette loiest la seule, pour des variables positives, avec un coefficient L(α) constant (voirGouriéroux et Liu, Proposition 1, 2006).

La figure 2.2 présente deux exemples de fonctions de densité et quantile pour laloi de Pareto.

2.4.3 Mesures de distorsion

Dans cette partie on suppose pour simplifier que la fonction de répartition Fh deloi de perte est continue et strictement croissante. On supprime les indices t et hpour alléger les notations. D’après la propriété 2.1, l’ES s’écrit (en omettant lesindices)

ES(α) =

∫ 1

0

F−1(1− u)1[0,α](u)1

αdu,

le terme 1[0,α]1α

s’interprétant comme la densité de la loi uniforme sur [0, α]. Plusgénéralement, on appelle mesure de distorsion (DRM, distorsion risk measure) lenombre

r(F ;G) =

∫ 1

0

F−1(1− u)dG(u),

où G est une fonction de répartition sur [0, 1], appelée fonction de distorsion, et Fest la distribution de perte. L’introduction d’une loi de probabilité sur les niveauxde confiance est parfois interprétée en termes d’optimisme ou de pessimisme parrapport au risque. Si G admet une densité g et si g est croissante sur [0, 1], c’est-à-dire si G est convexe, les quantiles F−1(1− u) sont affectés d’un poids d’autantplus grand que u est grand: les grands risques sont donc peu pris en compte. Al’inverse, si g est décroissante, ces risques extrêmes ont la plus forte pondération.

Page 22: Mesures de risque - Free

18 CHAPTER 2. RÉSERVES ET MESURES DE RISQUE

La VaR au niveau de confiance α est une mesure de distorsion, obtenue en prenantpour G la masse de Dirac en α. Comme nous l’avons vu, l’expected shortfallcorrespond à la densité g constante sur [0, α]: il s’agit d’une moyenne sur tous lesniveaux de confiance inférieurs à α.

On a, par intégration par parties, puis changement de variable (u 7→ 1− u)

r(F ;G) =

∫ 1−F (0)

0

F−1(1− u)dG(u) +

∫ 1

1−F (0)

F−1(1− u)d[G(u)− 1]

= −∫ 1−F (0)

0

G(u)dF−1(1− u)−∫ 1

1−F (0)

[G(u)− 1]dF−1(1− u)

=

∫ 1

F (0)

G(1− u)dF−1(u) +

∫ F (0)

0

[G(1− u)− 1]dF−1(u). (2.16)

Par suite, un nouveau changement de variable (u = F (x)) conduit à la formule

r(F ;G) =

∫ +∞

0

GS(x)dx−∫ 0

−∞[1−GS(x)]dx (2.17)

où S(x) = 1−F (x) = P [L > x] (appelée fonction de survie dans la littérature surles modèles de durée). Introduisant la variable aléatoire L∗ = L∗(F ;G) telle queSL∗(x) = GS(x), il vient, d’après une caractérisation de l’espérance 4,

r(F ;G) = E(L∗). (2.18)

L’interprétation est la suivante: la fonction de survie S initiale est remplacée parune fonction de survie G(S) (qui donne plus de poids aux grandes valeurs positiveslorsque G est concave). La mesure de risque est alors calculée comme l’espérancepour cette nouvelle loi.

En particulier, pour une variable positive (F (0) = 0) on a les formules

r(F ;G) =

∫ 1

0

G(1− u)dF−1(u) =

∫ +∞

0

GS(x)dx = E(L∗),

où L∗ est positive. La première égalité montre que F−1 et G jouent des rôlessymétriques.

On construit des familles de mesures de risque en paramétrant la mesure de dis-torsion

rp(F ;G) =

∫ 1

0

F−1(1− u)dGp(u),

où le paramètre reflète le niveau de confiance, c’est-à-dire le plus ou moins grandoptimisme face au risque.

4Pour une variable X intégrable on a E(X) =∫∞

0P (X > x)dx −

∫ 0

−∞P [X < x]dx (voir

Billingsley (1995), Probability and measure, 3rd edition, John Wiley).

Page 23: Mesures de risque - Free

2.4. AUTRES MESURES DE RISQUE 19

Exemple 2.5 (DRM à hasard proportionnel.) On prend Gp(u) = up, où p ∈]0,+∞[. Lorsque p < 1, G est concave, les pertes extrêmes sont donc surpondérées.D’après (2.16) et (2.17),

rp(F ;G) =

∫ 1

0

F−1(1− u)pup−1du

=

∫ 1

F (0)

(1− u)pdF−1(u) +

∫ F (0)

0

[(1− u)p − 1]dF−1(u)

=

∫ +∞

0

1− F (x)pdx−∫ 0

−∞[1− 1− F (x)p]dx

= E(Lp)

où Lp est une variable de fonction de survie

P [Lp > x] = 1− F (x)p = P [L > x]p.

On parle de "hasard proportionnel" car la fonction de hasard, définie commel’opposé de la dérivée du logarithme de la fonction de survie 5, des variables Lp etL sont proportionnelles:

−∂

∂xlogP [Lp > x] = p

−∂

∂xlogP [L > x] =

pf(x)

P [L > x]

en notant f la densité de F .

Exemple 2.6 (DRM exponentielle.) On prend Gp(u) = 1−e−pu

1−e−p , où p ∈]0,+∞[. On a

rp(F ;G) =

∫ 1

0

F−1(1− u)pe−pu

1− e−pdu.

La fonction g est décroissante quel que soit p, ce qui correspond à nouveau à unesurpondération des pertes extrêmes.

Remarque 2.4 Il peut être intéressant d’examiner la sensibilité de la mesurede distorsion par rapport au paramètre p. Lorsque rp(F ;G) est une fonctiondifférentiable de p, il suffit de calculer la dérivée ∂rp(F ;G)/∂p.

Pour l’expected shortfall, on a d’après la proposition 2.1

∂αES(α) =

1

αVaR(α)− ES(α).

5Dans les modèles de durée, la fonction de hasard au point x s’interprète comme la probabilitéde disparaître à la date x sachant que l’on a atteint cette date.

Page 24: Mesures de risque - Free

20 CHAPTER 2. RÉSERVES ET MESURES DE RISQUE

Table 2.1: VaR et ES pour les lois uniforme, double-exponentielle, de Pareto et gaussi-

enne standard, et sensibilités par rapport à α. Le ratio L(α) est défini en (2.15).

U[a,b] N (0, 1) Laplace (λ), λ > 0 Pareto (a, b), a > 1

F (x) x−ab−a 1[a,b](x) Φ(x) 1− 0.5e−λx (1−

(

xb

)−a)1x>b

(pour x > 0)

VaR(α) a+ (b − a)(1− α) Φ−1(1− α) − 1λ log(2α) bα−1/a

∂VaR(α)∂α a− b −1

φΦ−1(1−α) − 1λα

−ba α−(a+1)/a

ES(α) a+ (b− a)(1− α2 )

1αφΦ−1(1− α) 1

λ (1− log(2α)) baa−1α

−1/a

∂ES(α)∂α

a−b2

1αΦ−1(1 − α) − 1

λα−ba−1α

−(a+1)/a

− 1α2φΦ−1(1− α)

L(α) a+(b−a)(1−α/2)a+(b−a)(1−α)

φΦ−1(1−α)αΦ−1(1−α) 1− 1

log(2α)a

a−1

Cette dérivée est négative ce qui confirme que l’ES augmente lorsque α diminue(évident d’après (2.11)). Le tableau 2.1 donne quelques exemples de sensibilités parrapport à p = α, pour la VaR et l’ES, et pour plusieurs lois F , classées pas queuesde distribution croissantes. Notons que lorsque la loi de perte n’est pas continue,la VaR n’est pas continue et a fortiori différentiable pour toute valeur de α. Enrevanche l’ES reste continu en α. Ainsi, quelle que soit la distribution de pertesous-jacente, cette mesure de risque garantit qu’un petit changement du niveau deconfiance ne modifiera pas fortement le niveau de réserves. Il est parfois nécessaired’introduire des lois de perte non continues pour les portefeuilles contenant desdérivés (mélanges de lois discrètes et continues).

2.5 Sensibilité par rapport à la composition de

portefeuille

On examine dans cette partie comment les différents actifs d’un portefeuille influentsur le risque global.

Soit un portefeuille de prix pt = a′Pt, où a, Pt ∈ Rd.

Supposons dans un premier temps les variations de prix iid gaussiennes, ∆Pt ∼iid N (m,Σ). Rappelons que Lt,t+h = −a′

∑hi=1∆Pt+i. D’après la formule (2.5), la

valeur à risque est donnée par

VaRt,h(α) = −a′mh +√a′Σa

√hΦ−1(1− α) := VaRt,h(a, α). (2.19)

Page 25: Mesures de risque - Free

2.5. SENSIBILITÉ PAR RAPPORT À LA COMPOSITION DE PORTEFEUILLE21

On a donc

∂VaRt,h(a, α)

∂a= −mh +

Σa√a′Σa

√hΦ−1(1− α) (2.20)

= −mh +Σa

a′ΣaVaRt,h(a, α) + a′mh

= −E[∆hPt+h | Lt,t+h = VaRt,h(a, α)]

en posant ∆hPt+h = Pt+h−Pt et en utilisant la note de bas de page 3. Notons quela formule (2.20) est brevetée par Garman et appelée delta-VaR. On constate quecette dérivée est une fonction affine et indépendante de α de la valeur à risque.Elle fournit la contribution marginale au risque de chacun des actifs composant leportefeuille.

On a de même

∂2VaRt,h(a, α)

∂a∂a′=

√hΦ−1(1− α)√

a′Σa

(

Σ− Σaa′Σ

a′Σa

)

=Φ−1(1− α)√

h√a′Σa

V [∆hPt+h | Lt,t+h = VaRt,h(a, α)] (2.21)

On constate que la dérivée seconde est semi-définie positive. Ainsi, la fonctiona 7→ VaRt,h(a, α) est convexe dans le cas gaussien. Si a et a∗ caractérisent deuxportefeuilles on a donc

VaRt,h1

2(a+ a∗), α ≤ 1

2VaRt,h(a, α) + VaRt,h(a

∗, α)

ce qui signifie que l’on a intérêt à la diversification.

Ce résultat reste-t-il valable dans le cas général? Nous allons voir que non. Lesformules obtenues pour les dérivées peuvent être étendues au cas de distributionsnon gaussiennes. On a Lt,t+h = −a′∆hPt+h. Supposons que la loi conditionnellede ∆hPt+h soit absolument continue. La VaR au niveau α de ce portefeuille estcaractérisée par la relation

Pt[X + a1Y > VaRt,h(a, α)] = α, X = −d∑

i=2

ai∆hPi,t+h, Y = −∆hP1,t+h.

Le lemme B.1 montre que

∂VaRt,h(a, α)

∂a1= −Et[∆hP1,t+h | Lt,t+h = VaRt,h(a, α)].

Page 26: Mesures de risque - Free

22 CHAPTER 2. RÉSERVES ET MESURES DE RISQUE

Par suite, on obtient la même formule que dans le cas gaussien:

∂VaRt,h(a, α)

∂a= −Et[∆hPt+h | Lt,t+h = VaRt,h(a, α)].

Soit ga la densité conditionnelle de Lt,t+h = −a′∆hPt+h. On montre que les dérivéessecondes sont données par

∂2VaRt,h(a, α)

∂a∂a′= −

(

∂zlog ga(z)

)

z=VaRt,h(a,α)

Vt[∆hPt+h | Lt,t+h = VaRt,h(a, α)]

−(

∂zVt[∆hPt+h | Lt,t+h = z]

)

z=VaRt,h(a,α)

(voir Gouriéroux, Laurent, Scaillet (2000)). La dérivée seconde fait apparaîtredeux effets. Le premier terme est un effet de volatilité, dont l’impact dépend de laqueue de la distribution de perte. Le second terme est un effet d’hétéroscédasticitéqui disparait dans le cas gaussien6.

La forme de la dérivée seconde permet de discuter les propriétés de convexité dela VaR comme fonction de la composition du portefeuille. La convexité est unepropriété souhaitable d’une mesure de risque car elle favorise la diversification.Dans la formule de la dérivée seconde, le premier terme est une matrice définiepositive à condition que la densité ga soit décroissante pour les grandes valeurspositives. Le second terme peut avoir un signe positif ou négatif. Dans le casgaussien il disparait et la convexité est bien respectée.

2.6 Mesures de risque cohérentes

La VaR est souvent critiquée pour ne pas vérifier, pour toute distribution des varia-tions de prix, la propriété de convexité par rapport à la composition de portefeuille.Ceci signifie que le risque d’un portefeuille, lorsqu’il est mesuré par la VaR, peutêtre supérieur au risque de la somme de chacune de ses composantes (même lorsqueces composantes sont indépendantes, à l’exception du cas gaussien). La gestion durisque avec la VaR n’incite donc pas nécessairement à la diversification. De plus,comme nous l’avons vu, la VaR ne mesure pas la sévérité des pertes encourues.

6On retrouve bien (2.21) dans ce cas car

(−∂

∂zlog ga(z)

)

z=VaRt,h(a,α)

=

(

z + a′mh

a′Σah

)

z=VaRt,h(a,α)

=VaRt,h(a, α) + a′mh

a′Σah=

Φ−1(1 − α)

(a′Σah)1/2.

Page 27: Mesures de risque - Free

2.6. MESURES DE RISQUE COHÉRENTES 23

En réponse à ces critiques, des auteurs ont essayé de définir des concepts de mesuresde risque cohérentes. Artzner, Delbaen, Eber et Heath (1999) proposent la défini-tion suivante.

Définition 2.3 Soit L un ensemble de variables aléatoires de pertes réelles définiessur un espace mesurable (Ω,A). On suppose que L contient les constantes etest stable pour l’addition et la multiplication par un scalaire. Une applicationρ : L 7→ R est appelée mesure de risque cohérente si elle est:

1. monotone: ∀L1, L2 ∈ L, L1 ≤ L2 ⇒ ρ(L1) ≤ ρ(L2).

2. sous-additive: ∀L1, L2 ∈ L, ρ(L1 + L2) ≤ ρ(L1) + ρ(L2).

3. positivement homogène: ∀L ∈ L, ∀λ ≥ 0, ρ(λL) = λρ(L).

4. invariante par translation:∀L ∈ L, ∀c ∈ R, ρ(L+ c) = ρ(L) + c.

Remarque 2.5 Cette caractérisation axiomatique a été initialement introduiteavec un espace probabilisé fini par Artzner, Delbaen, Eber et Heath (1999), puisétendue par Delbaen (2002). Dans ce dernier papier il est montré que l’on ne peutprendre un ensemble L trop gros, par exemple l’ensemble de toutes les variablesaléatoires absolument continues, pour qu’il existe des mesures de risque cohérentes.

Remarque 2.6 Cette définition est parfois énoncée pour des variables de profitet non de pertes, c’est-à-dire pour −L au lieu de L; il faut alors prendre garde demodifier la première inégalité dans la propriété 1 et de changer c en −c dans lemembre de droite de la dernière égalité.

Des conséquences immédiates de la définition sont les suivantes:

1. ρ(0) = 0, en écrivant la propriété d’homogénéité avec L = 0. Plus générale-ment ρ(c) = c pour toutes les constantes c (si la perte est c avec certitude, ilfaut provisionner c).

2. Si L ≥ 0, alors ρ(L) ≥ 0. Si la perte est certaine, il faut provisionner.

3. ρ(L− ρ(L)) = 0, i.e. le montant déterministe ρ(L) annule le risque de L.

Page 28: Mesures de risque - Free

24 CHAPTER 2. RÉSERVES ET MESURES DE RISQUE

Ces contraintes sont en défaut pour la plupart des mesures de risque utiliséesen finance. Ainsi la variance, ou plus généralement toute mesure fondée sur lesmoments centrés de la distribution de perte, ne vérifie pas, par exemple, la pro-priété de monotonie. L’espérance définit une mesure de risque cohérente (maispeu intéressante). La VaR vérifie toutes les propriétés à l’exception de celle desous-additivité. Pour des variables gaussiennes (dépendantes ou indépendantes)la propriété est vérifiée mais l’exemple suivant montre que la sous-additivité peutêtre en défaut pour des variables continues et indépendantes.

Exemple 2.7 (Défaut de sous-additivité de la VaR) Soit L1 et L2 deuxvariables indépendantes de loi de Pareto, de densité f(x) = (2 + x)−2 1x>−1 . Lafonction de répartition de cette loi est F (x) = (1− (2 + x)−1)1x>−1 donc la VaRau niveau α est VaR(α) = α−1−2. On vérifie, par exemple avec Mathematica, que

P [L1 + L2 ≤ x] = 1− 2

4 + x− 2 log(3 + x)

(4 + x)2, x > −2.

Donc

P [L1 + L2 ≤ 2VaR(α)] = 1− α− α2

2log

(

2− α

α

)

< 1− α.

Donc V aRL1+L2(α) > V aRL1(α) + V aRL2(α) = 2V aRL1(α), ∀α ∈]0, 1[. Parexemple pour α = 0.01 on trouve V aRL1(0.01) = 98 et, numériquement,V aRL1+L2(0.01) ≈ 203.2.

La propriété suivante montre que l’ES vérifie en particulier la sous-additivité, cequi explique son succès pour la mesure du risque.

Proposition 2.2 L’ES est une mesure de risque cohérente au sens de la définition2.3.

Preuve. Les propriétés de monotonie, d’homogénéité et d’invariance découlent de(2.11) et de ces propriétés pour la VaR. Pour la sous-additivité, on se contenterade donner la preuve pour des variables absolument continues. Pour Li telle queEL+

i < ∞, i = 1, 3, notons V aRi(α) la value at risk au niveau α et ESi(α) =α−1E[Li 1Li≥V aRi(α)] l’ES. Pour L3 = L1 + L2 on a

αES1(α) + ES2(α)−ES3(α)= E[L1(1L1≥V aR1(α) −1L3≥V aR3(α))] + E[L2(1L2≥V aR1(α) −1L3≥V aR3(α))].

Notons que(L1 − V aR1(α))(1L1≥V aR1(α) −1L3≥V aR3(α)) ≥ 0

Page 29: Mesures de risque - Free

2.6. MESURES DE RISQUE COHÉRENTES 25

car les deux parenthèses sont de même signe. Par suite

αES1(α) + ES2(α)−ES3(α) ≥ V aR1(α))E[1L1≥V aR1(α) −1L3≥V aR3(α)]

+V aR2(α))E[1L2≥V aR2(α) −1L3≥V aR3(α)]

= 0.

La propriété est donc démontrée.

2

Remarque 2.7 On peut montrer (voir Kusuoka (2001), Acerbi et Tasche (2002))que l’ES est la plus petite mesure de risque majorant la VaR qui soit cohérente etne dépendant que de la loi de perte.

Remarque 2.8 On peut montrer (voir Wang and Dhaene (1998)) que les mesuresde distorsion de risque avec G concave vérifient la propriété de sous-additivité.

Les axiomes suivants ont été introduits initialement pour l’analyse des risques enassurance (voir Wang, Young et Panjer, 1997).

1. Dépendance par rapport à la loi: ρ(L) ne dépend que de la loi de L.

2. Additivité pour risques comonotones: ∀L1, L2 ∈ L, ρ(L1+L2) = ρ(L1)+ρ(L2)dès que L1 et L2 sont fonctions croissantes d’une même variable Z.

La comonotonicité peut s’interpréter de la manière suivante: si L1 et L2 sont despertes comonotones, elles évoluent simultanément. Plus précisément on montrequ’elles sont comonotones si et seulement si

[L1(ω)− L1(ω∗)][L2(ω)− L2(ω

∗)] ≥ 0, pour presque tout (ω, ω∗) ∈ Ω2.

Il n’y a donc pas de possibilité de diversification lorsqu’on agrège les portefeuillescorrespondant à ces pertes.

Proposition 2.3 La VaR et l’ES sont des mesures de risque (i) monotones, (ii)positivement homogènes, (iii) invariantes par translation, (iv) dépendantes de laloi et (v) additives pour risques comonotones.

Page 30: Mesures de risque - Free

26 CHAPTER 2. RÉSERVES ET MESURES DE RISQUE

Preuve. Les propriétés (i)-(iv) sont évidentes. Nous nous contenterons de vérifier(v) dans le cas où Li = fi(Z) avec fi strictement croissante, pour i = 1, 2 et ensupposant la fonction de répartition de Z strictement croissante. La fonction derépartition des variables Li est alors FL = FZ f−1i . Donc la VaR de la variable Li

au niveau α est VaRi(α) = F−1Li(1− α) = fi F−1Z (1− α). Par suite

VaR1(α) + VaR2(α) = (f1 + f2) F−1Z (1− α)

qui n’est autre que le quantile de L1+L2 = (f1+f2)(Z). La propriété (v) est doncmontrée, dans ce cas, pour la VaR et elle en découle pour l’ES.

2

Notons que la VaR ne dépend que d’une partie de la distribution de perte: deuxlois très différentes peuvent conduire à la même VaR pour un niveau α donné (voirla figure 2.1). Ce point, avec l’absence de la propriété de sous-additivité, fait dela VaR une mesure de risque très critiquée (voir par exemple Tasche, 2002).

Page 31: Mesures de risque - Free

Chapter 3

Estimation

La littérature statistique sur les mesures de risque (VaR, Expected shortfall...)s’est longtemps cantonnée à l’estimation des mesures non conditionnelles. Denombreuses approches existent, dépendant fortement des hypothèses et modèlesretenus (dépendance ou indépendance des observations, méthodes paramétriquesvs non paramétriques).

Nous commençons par considérer l’estimation de la fonction de répartition dans lecas iid.

3.1 Propriétés de la fonction de répartition em-

pirique

Soit X1, . . . , Xn un échantillon de variables iid de loi F .

Pour estimer F (x) on peut utiliser la fonction de répartition empirique Fn(x)définie par

Fn(x) =1

n

n∑

i=1

1Xi≤x .

On a les propriétés suivantes.

1. Pour x fixé, nFn(x) suit la loi binomiale d’espérance nF (x) et de variancenF (x)(1− F (x)).

2. Par la loi forte des grands nombres

Fn(x) → F (x) p.s. quand n → ∞.

27

Page 32: Mesures de risque - Free

28 CHAPTER 3. ESTIMATION

Le théorème de Glivenko-Cantelli montre que la convergence est uniforme:

supx∈R

|Fn(x)− F (x)| → 0 p.s. quand n → ∞.

3. Pour x fixé, le TCL donne

√nFn(x)− F (x) d→ N (0, F (x)(1− F (x))). (3.1)

4. Pour x1 < x2 fixés, on a Cov(1Xi≤x1 ,1Xi≤x2) = F (x1)(1− F (x2)). Donc parle TCL

√n

(

Fn(x1)− F (x1)Fn(x2)− F (x2)

)

⇒ N((

00

)

,

(

F (x1)(1− F (x1)) F (x1)(1− F (x2))F (x1)(1− F (x2)) F (x2)(1− F (x2))

))

.

Soit (G(x))x∈R un processus gaussien centré de fonction de covariance

Cov(G(x1), G(x2)) = F (x1)(1− F (x2)), x1 < x2.

Une extension du résultat précédent montre qu’au sens des distributions fini-dimensionnelles √

n(Fn(x)− F (x)) ⇒ G(x). (3.2)

Soit W (t), t ≥ 0 le mouvement Brownien standard et soit le processusB(t), t ∈ [0, 1], appelé pont Brownien, défini par

B(t) = W (t)− tW (1), 0 ≤ t ≤ 1.

Alors B est un processus gaussien tel que B(0) = B(1) = 0 et E(B(t)) = 0.De plus, puisque Cov(W (t1),W (t2)) = t1 ∧ t2,

Cov(B(t1), B(t2)) = t1(1− t2), 0 ≤ t1 < t2 ≤ 1.

Par suite, si F est la fonction de répartition de la loi uniforme sur [0, 1],G défini en (3.2) est le pont Brownien. De plus, G peut s’exprimer enfonction du pont Brownien. En effet les processus G(x) et B(F (x)) ontla même fonction d’autocovariance. Par suite, au sens de la convergence desdistributions fini-dimensionnelles,

√n(Fn(x)− F (x)) ⇒ B(F (x)). (3.3)

On peut montrer que cette convergence est en fait une convergence faible(Billingsley, 1968).

Page 33: Mesures de risque - Free

3.2. FONCTION QUANTILE EMPIRIQUE 29

Ce résultat peut être utilisé pour tester que la loi des observations est F . onintroduit la statistique de Kolmogorov-Smirnov

Dn = supx∈R

|Fn(x)− F (x)|

et sous l’hypothèse nulle (loi F ) et si F est continue, on montre que

√nDn ⇒ sup

x∈[0,1]|B(x)|.

(voir par exemple Resnik, 19941). Ce résultat est très intéressant car la loiasymptotique est indépendante de la distribution des observations.

3.2 Fonction quantile empirique

Ayant défini la fonction de répartition empirique Fn(x), on appelle fonction quan-tile empirique la fonction F←n définie par

F←n (α) = infx ∈ R | Fn(x) ≥ α, 0 < α < 1.

Pour simplifier les notations on posera, lorsqu’il n’y a pas de doute sur la loiconsidérée,

ξα = F←(α) et ξn,α = F←n (α).

3.2.1 Calcul des quantiles empiriques

Il existe plusieurs façons d’obtenir la fonction quantile empirique.

Calcul par classification

On définit l’échantillon ordonné

X1,n = min(X1, . . . , Xn) ≤ X2,n ≤ . . . ≤ Xn,n = max(X1, . . . , Xn).

Lorsque F est continue, les égalités surviennent avec une probabilité nulle et peu-vent être négligées. On peut donc supposer dans ce cas X1,n < . . . < Xn,n et on aalors

ξn,α = Xk,n, pourk − 1

n< α ≤ k

n. (3.4)

1Adventures in Stochastic Processes, Birkhäuser, Berlin.

Page 34: Mesures de risque - Free

30 CHAPTER 3. ESTIMATION

Calcul par minimisation

La méthode suivante paraît moins directe mais elle fournit une généralisation in-téressante, la régression quantile, que nous verrons plus loin. On sait que lamoyenne empirique est l’estimateur des MCO dans la régression des Xi sur laconstante 1. Elle vérifie

X = argminz∈R

1

n

n∑

i=1

(Xi − z)2.

On obtient de même le quantile empirique de niveau α ∈]0, 1[ comme solution de

ξn,α = argminz∈R

1

n

n∑

i=1

ρα(Xi − z) := argminz∈R

fn,α(z) (3.5)

oùρα(u) = αu+ + (1− α)(−u)+ = u(α− 1u<0).

La fonction fn,α est positive, linéaire par morceaux, convexe, comme somme defonctions convexes, donc continue, et tend vers +∞ lorsque z tend vers ±∞. Ilexiste en général une unique solution à (3.5), sauf lorsque nα est entier où ilexiste deux solutions: le quantile empirique correspond alors à la plus petite desdeux. En remarquant que ∂ρα(u)/∂u

− = α 1u>0+(α − 1)1u≤0 et ∂ρα(u)/∂u+ =

α1u≥0+(α− 1)1u<0, on voit que la fonction fn,α admet en tout point une dérivéeà droite et une dérivée à gauche (qui coïncident sauf aux points Xi) données par:

∂fn,α∂z+

(z) =−1

n

n∑

i=1

α 1Xi−z>0+(α− 1)1Xi−z≤0 =1

n

n∑

i=1

1Xi≤z −α, (3.6)

∂fn,α∂z−

(z) =−1

n

n∑

i=1

α 1Xi−z≥0+(α− 1)1Xi−z<0 =1

n

n∑

i=1

1Xi<z −α, . (3.7)

Le minimum ξn,α est caractérisé par les conditions

∂fn,α∂z+

(ξn,α) ≥ 0,∂fn,α∂z−

(ξn,α) < 0. (3.8)

Il est facile de voir que l’on retrouve la caractérisation (3.4).

3.2.2 Propriétés asymptotiques

La convergence forte de F←n (α) vers F←(α) résulte directement de la convergenceuniforme de la fonction de répartition empirique (théorème de Glivenko-Cantelli).

La loi asymptotique des quantiles empiriques dans le cas iid est donnée par lerésultat suivant.

Page 35: Mesures de risque - Free

3.2. FONCTION QUANTILE EMPIRIQUE 31

Théorème 3.1 Soit X1, . . . , Xn un échantillon de variables iid de loi absolumentcontinue de densité f . Alors, si α ∈]0, 1[ et f(ξα) > 0,

√n(ξn,α − ξα)

d→ N(

0, ω2α

)

, ω2α =

α(1− α)

f 2(ξα).

Preuve: On utilise la caractérisation des quantiles (3.5), comme minimum d’unefonction convexe. La dérivée de fn,α est donc strictement négative en tout z < ξn,α(ou les dérivées à gauche et à droite si z coïncide avec l’un des Xi) et positive ounulle pour les z ≥ ξn,α. On a donc, d’après (3.6)-(3.7), pour tout réel ǫ

P [√n(ξn,α − ξα) > ǫ] = P [f ′n,α(ξα + ǫ/

√n) < 0]

= P

[

1

n

n∑

i=1

1Xi<ξα+ǫ/√n < α

]

. (3.9)

Soit pn = E(1Xi<ξα+ǫ/√n) = P [Xi < ξα + ǫ/

√n]. La suite (Yni), où Yni =

1Xi<ξα+ǫ/√n−pn, forme un tableau triangulaire de variables centrées et iid pour n

fixé. On aE(Yni) = 0, E(Y 2

ni) = pn(1− pn).

De plus, avec s2n = npn(1 − pn) on a pour tout ǫ > 0, en utilisant le fait que|Yni| < 1,

n∑

i=1

1

s2nE(Y 2

ni 1|Yni|>ǫsn) ≤ 1

pn(1− pn)P [|Yn1| > ǫsn] = 0

pour n suffisamment grand car sn → ∞.

Par suite, d’après un théorème central limite pour tableaux triangulaires (voirAnnexe),

Zn :=

∑ni=1 Yni

npn(1− pn)

d→ N (0, 1) . (3.10)

Or, d’après (3.9), en notant que α < pn,

P [√n(ξn,α − ξα) > ǫ] = P

[

Zn <

√n(α− pn)

pn(1− pn)

]

= P

[

Zn

ǫ√

pn(1− pn)√n(α− pn)

> ǫ

]

.

De plus√n(α− pn) → −ǫf(ξα) quand n → ∞. Donc d’après (3.10),

Un = Zn

ǫ√

pn(1− pn)√n(α− pn)

d→ N(

0, ω2α

)

,

ce qui prouve le résultat.

Page 36: Mesures de risque - Free

32 CHAPTER 3. ESTIMATION

0.2 0.4 0.6 0.8 1Α

5

10

15

20

25

30

ΩΑ2

Figure 3.1: Variance asymptotique pour le quantile empirique d’une loi N (0, 1).

0.1 0.2 0.3 0.4 0.5 0.6Α

0.05

0.1

0.15

0.2

0.25

0.3

ΩΑ2

0.2 0.4 0.6 0.8 1Α

10

20

30

40

50

60

70

ΩΑ2

Figure 3.2: Variances asymptotiques pour les quantiles empiriques des lois de Pareto de la

figure 2.2.

2

Remarquons que la variance asymptotique dépend de α et de la densité en ξα.Le terme α(1− α) est petit pour les α correspondant aux queues de distribution,mais cet effet est contrebalancé par celui du dénominateur, qui rend l’estimationdes quantiles moins précis dans les régions à faible densité. La figure 3.1 montrecomment la précision asymptotique dépend de α dans le cas de la loi N (0, 1).L’effet du dénominateur l’emporte sur celui du numérateur, la précision devenanttrès faible dans les zones à faible densité. La figure 3.2 présente un comportementsimilaire (mais ici il n’y a des queues de distribution que du côté positif) pour deslois de Pareto.

Une extension de la preuve précédente fournit la loi asymptotique d’un vecteur dequantiles. Soit ξn = (ξn,α1, . . . , ξn,αp

)′ et soit ξ = (ξα1 , . . . , ξαp)′ des vecteurs de p

quantiles empiriques et théoriques.

Proposition 3.1 Soit X1, . . . , Xn un échantillon de variables iid de loi absolument

Page 37: Mesures de risque - Free

3.2. FONCTION QUANTILE EMPIRIQUE 33

continue de densité f . Alors, si αi ∈]0, 1[ et f(ξαi) > 0 pour i = 1, . . . , p,

√n(ξn − ξ)

d→ N (0,Ω) , Ω = (ωij), ωij =αi ∧ αj − αiαj

f(ξαi)f(ξαj

).

Notons que la matrice de variance asymptotique Ω peut être estimée par

Ω = (ωij), ωij =αi ∧ αj − αiαj

f(ξn,αi)f(ξn,αj

)

où f est un estimateur non paramétrique (obtenu par exemple par la méthode dunoyau) de la densité f .

Un résultat plus précis concernant le comportement asymptotique des quantilesempiriques est connu sous le nom de représentation de Bahadur. Pour un échan-tillon de variables iid, de densité f telle que f(α) > 0, Bahadur (1966) a montréque: pour 0 < α < 1,

ξn,α = ξα +α− Fn(ξα)

f(ξα)+Rn (3.11)

où Rn est un terme aléatoire de l’ordre de (log log n/n)3/4 lorsque n tend versl’infini. La convergence (3.1) permet de retrouver la loi limite du quantile em-pirique. Depuis, ce résultat a été étendu à des processus plus généraux. L’extensionsuivante concerne les processus linéaires. Elle précise également le comportementuniforme de ξn,α − ξα au voisinage de α.

Proposition 3.2 (Wu, 2005) Si Xt =∑∞

i=0 aiǫt−i où (ǫt) est une suite de vari-ables iid de variance finie et de densité fǫ et la suite (ai) vérifie

∑∞i=0 |ai| < ∞,

sisupx(fǫ(x) + |f ′ǫ(x)|) < ∞, f(ξα) > 0,

alors on a la représentation (3.11) avec Rn = Op.s.

(

(

lognn

)3/4log log n

)

2.

Si de plus, pour 0 < α0 < α1 < 1,

supx

|f ′′ǫ (x)| < ∞, infα0<α<α1

f(ξα) > 0,

alors

supα0<α<α1

ξn,α − ξα − α− Fn(ξα)

f(ξα)

= Op.s.

(

n−3/4 log5/4 n log log n)

.

2La notation Zn = Op.s.(rn) signifie que Zn/rn est p.s. bornée.

Page 38: Mesures de risque - Free

34 CHAPTER 3. ESTIMATION

On a également l’extension suivante, qui concerne les processus non linéaires.

Proposition 3.3 (Wu, 2005) Si Xt = G(Xt−1, ǫt) où (ǫt) est une suite de vari-ables iid et Lǫ = supx 6=x′ |G(x, ǫ)−G(x′, ǫ)|/|x− x′| ≤ ∞ vérifie

E(logLǫ) < 0, E|Lrǫ + |x0 −G(x0, ǫ)|r|| < ∞

pour un r > 0 et un x0 et si, pour 0 < α0 < α1 < 1,

supx(f(x) + |f ′(x)|) < ∞, inf

α0<α<α1

f(ξα) > 0,

alors

supα0<α<α1

ξn,α − ξα − α− Fn(ξα)

f(ξα)

= Op.s.

(

n−3/4 log3/2 n)

. (3.12)

Cette propriété peut en particulier s’appliquer au processus ARCH(1) sous deshypothèses appropriées sur les coefficients. Toutefois, la loi limite des quantilesempiriques ne sera pas obtenue explicitement dans ce cas car la densité marginaledes observations est inconnue (même lorsque la loi conditionnelle est gaussienne).

La majoration uniforme (3.12) permet, en utilisant (3.3), d’obtenir la convergencefaible suivante √

nf(ξα)(ξn,α − ξα) ⇒ B(α), α ∈]α0, α1[ (3.13)

où B(t), t ∈ [0, 1] est un pont Brownien.

3.3 Méthodes d’estimation des mesures de risque

Les propriétés statistiques "non standard" des séries financières (présence etregroupement de volatilité, lois marginales leptokurtiques, asymétries) rendentl’estimation de la VaR, et plus généralement des mesures de risque, probléma-tique. Il faut par exemple distinguer VaR conditionnelle et non conditionnelle.Les méthodes d’estimation de quantiles développées dans le cadre iid gaussiensont ici inadaptées.

3.3.1 Estimation non paramétrique

Les résultats de la partie précédente s’appliquent à l’estimation de la VaR nonconditionnelle, définie comme le quantile de niveau 1 − α de la distribution deperte. La méthode dite de "simulation historique" consiste simplement à estimerla VaR par le quantile empirique de la distribution inconditionnelle de Lt,t+h (elle

Page 39: Mesures de risque - Free

3.3. MÉTHODES D’ESTIMATION DES MESURES DE RISQUE 35

ne comporte donc pas de simulations au sens statistique du terme). En notant Fn

cette distribution, supposée indépendante de t et de h, on a donc l’estimateur

ˆVaRn,h(α) = F←n (1− α).

Au lieu de considérer tout l’échantillon, on peut se limiter à une fenêtre mobile lim-itée aux n0 dernières observations. Par exemple, si n0 = 1000 la VaR estimée pourun niveau de confiance α = 5% est simplement le 50ième plus grande observation.

Cette méthode fondée sur les quantiles empiriques a l’avantage de la simplicitéet de ne faire aucune hypothèse sur les distributions des variables de perte. Elleprésente cependant des inconvénients importants: (i) la VaR estimée est une VaRnon conditionnelle; (ii) la loi asymptotique utilisée pour évaluer la précision del’estimateur dépend, elle, d’hypothèses précises (par exemple l’indépendance etl’équidistribution); (iii) les exemples illustrant le théorème 3.1 montrent que lesquantiles correspondant aux queues de distribution sont estimés avec une préci-sion asymptotique très faible; or ce sont précisément ces quantiles auxquels ons’intéresse; (iv) la méthode ne permet pas de prendre en compte l’influence devariables explicatives (présente ou passées) dans la mesure du risque.

Des estimateurs non paramétriques peuvent également être construits pourl’expected shortfall (voir Scaillet, 2005). Plus généralement, un estimateur nonparamétrique de la mesure de distorsion de risque

r(F ;G) =

∫ 1

0

F−1(1− u)dG(u),

où G est une fonction de répartition sur [0, 1] et F est la distribution de perte,supposée strictement croissante et continue, est

r(Fn;G) =

∫ 1

0

F←n (1− u)dG(u).

La fonction quantile empirique étant en escalier, il est facile d’exprimer cette in-tégrale en fonction des observations:

r(Fn;G) =n−1∑

i=0

G

(

i+ 1

n

)

−G

(

i

n

)

Xn,n−i.

Cet estimateur, appelé L-estimateur dans la littérature statistique, apparaîtcomme une combinaison linéaire des observations ordonnées avec une pondéra-tion dépendant des variations de G. On voit en particulier que si G est concave,les grandes observations seront surpondérées.

Page 40: Mesures de risque - Free

36 CHAPTER 3. ESTIMATION

Dans le cas d’observations iid, la loi asymptotique de l’estimateur r(Fn;G) peutêtre obtenue à partir de la convergence faible (3.37) du processus quantile ξn,α versle processus quantile théorique. On a

√nr(Fn;G)− r(F ;G) ⇒

∫ 1

0

B(1− u)

f(ξ1−u)dG(u), (3.14)

où B(t), t ∈ [0, 1] est un pont Brownien. La loi limite est centrée, de variancedonnée par

Varas[√nr(Fn;G)− r(F ;G)] =

∫ 1

0

∫ 1

0

u1 ∧ u2 − u1u2

f(ξ1−u1)f(ξ1−u2)dG(u1)dG(u2).

Si G admet une densité g on obtient, en notant que 1/f(ξα) est la dérivée deF−1(α), puis par le changement de variable u = F (x) = 1− S(x),

Varas[√nr(Fn;G)− r(F ;G)]

=

∫ 1

0

∫ 1

0

(u1 ∧ u2 − u1u2)g(u1)g(u2)dF−1(u1)dF

−1(u2)

=

∫ 1

0

∫ 1

0

F (x1) ∧ F (x2)− F (x1)F (x2)gS(x1)gS(x2)dx1dx2.

Exemple 3.1 Dans le cas de l’expected shortfall, qui correspond à g(u) =

1[0,α](u), l’estimateur s’écrit

ESn(α) =1

[nα]−1∑

i=0

Xn−i,n +

(

1− [nα]

)

Xn−[nα],n.

Ainsi si nα = k, l’estimateur n’est autre que la moyenne des k plus grandesobservations.

On montre (voir Gouriéroux et Liu, 2007) que la variance asymptotique del’estimateur dépend de la variance de la perte lorsqu’elle dépasse la VaR et del’écart entre l’ES et la VaR:

Varas[√nESn(α)−ES(α)] = (V [L | L > VaR(α)] + (1− α)ES(α)− VaR(α)2)

α

3.3.2 Modèles dynamiques des moments conditionnels

Une approche paramétrique de la VaR consiste à spécifier les moments condition-nels de la variable de perte. Un modèle classique, en notant Lt la variable de perteentre les dates t− 1 et t, est

Lt = mt(θ) + σt(θ)ǫt

Page 41: Mesures de risque - Free

3.3. MÉTHODES D’ESTIMATION DES MESURES DE RISQUE 37

où mt(θ) et σ2t (θ) sont, respectivement, l’espérance et la variance conditionnelles

au passé de Lt et θ est un vecteur de paramètres. Si l’on suppose la suite (ǫt) iid,de loi F , la VaR (à horizon 1) prend la forme

VaRt,1(α) = mt(θ) + σt(θ)F←(1− α). (3.15)

Si la loi des termes d’erreur est supposée connue, un estimateur θ de θ permetd’obtenir un estimateur paramétrique de la VaR défini par

ˆVaR(1)

t,1 (α) = mt(θ) + σt(θ)F←(1− α). (3.16)

Dans le cas, plus réaliste, où la loi des termes d’erreur n’est pas connue un esti-mateur semi-paramétrique de la VaR peut être défini par

ˆVaR(2)

t,1 (α) = mt(θ) + σt(θ)F←(1− α) (3.17)

où F←ǫ (1 − α) est un quantile empirique obtenu à partir des résidus ǫt =(Lt − mt(θ))/σt(θ). Une solution intermédiaire consiste à supposer que la loi deǫt appartient à une famille paramétrée, Fβ. A partir d’un estimateur β duparamètre de cette loi on définit

ˆVaR(3)

t,1 (α) = mt(θ) + σt(θ)F←β(1− α). (3.18)

Un autre estimateur est obtenu en utilisant l’estimateur du quasi-maximum devraisemblance gaussien

ˆVaRQMV (α) = mt(θQMV ) + σt(θQMV )Φ−1(1− α). (3.19)

Les spécifications les plus utilisées pour le calcul des moments conditionnels sontcelles des modèles ARMA et GARCH.

Remarquons que ces diverses méthodes ont l’avantage de fournir toutes des estima-teurs de la VaR fonctions décroissantes de α. Cette propriété ne sera pas assuréepour d’autres estimateurs vus par la suite.

Modèle Riskmetrics

La méthode RiskMetricsTM a été développée par J.P. Morgan pour calculer laVaR. Elle repose sur le modèle suivant, écrit pour une série de rendements enlogarithme, rt = log(pt/pt−1),

rt+1 = σt+1ηt+1, (ηt) iid N (0, 1)

σ2t+1 = λσ2

t + (1− λ)r2t

(3.20)

Page 42: Mesures de risque - Free

38 CHAPTER 3. ESTIMATION

où λ ∈]0, 1[ est un paramètre de lissage (arbitrairement fixé à 0.94 pour les sériesjournalières). Ainsi σ2

t+1 est simplement la prévision de r2t+1 obtenue par lissageexponentiel simple.

Ce modèle peut également s’interpréter comme un IGARCH(1,1)3 sans terme con-stant. Il est cependant important de remarquer que (A.1) ne constitue pas vérita-blement un modèle: pour toute valeur r0 initiale, rt tend presque sûrement vers 0lorsque t tend vers l’infini. Il est donc clair que (A.1) ne peut être le DGP (pro-cessus générateur de données) d’aucune série financière usuelle. Ce modèle peutnéanmoins être utilisé comme moyen de calcul de la VaR.

La VaR à horizon 1 au niveau α de la variable de perte Lt,t+1 = −rt+1 est, puisquela loi conditionnelle de Lt,t+1 est la loi N (0, σ2

t+1),

VaRt+1,1(α) = σt+1Φ−1(1− α). (3.21)

Aux horizons supérieurs, le calcul de la VaR est problématique. La formule suiv-ante est couramment utilisée

VaRt+1,h(α) = σt+1

√hΦ−1(1− α), (3.22)

mais nous allons voir qu’elle est fausse. En effet, la perte à horizon h pour leslogarithmes de prix est

Lt,t+h = −(log pt+h − log pt) = −h∑

i=1

rt+i

et sa variance conditionnelle est

Vt(Lt,t+h) =

h∑

i=1

Vt(rt+i) =

h∑

i=1

Et(r2t+i) =

h∑

i=1

Et(σ2t+i).

Pour la première égalité nous avons utilisé la relation Et(rt+irt+j) = 0 pour i 6= j.Or on peut écrire, en posant a(ηt) = λ+ (1− λ)η2t , pour i ≥ 1

σ2t+i = a(ηt+i−1)σ

2t+i−1 = a(ηt+i−1) . . . a(ηt+1)σ

2t+1, (3.23)

donc, puisque Ea(ηt) = 1,

Etσ2t+i = Ea(ηt+i) . . . Ea(ηt+2)σ2

t+1 = σ2t+1.

Finalement,Vt(Lt,t+h) = hσ2

t+1,

3GARCH intégré, car la somme des coefficients de σ2t et r2t vaut 1.

Page 43: Mesures de risque - Free

3.3. MÉTHODES D’ESTIMATION DES MESURES DE RISQUE 39

ce qui explique la forme utilisée pour VaRt+1,h(α). Cependant la formule (3.22)est incorrecte car la loi conditionnelle de Lt,t+h n’est pas gaussienne4. La formulecorrecte est

VaRt+1,h(α) = σt+1

√hF−1h (1− α), (3.24)

où Fh est la fonction de répartition de Lt,t+h/σt+1

√h. Cette loi peut être estimée

non paramétriquement à partir des −∑hi=1 rt+i/σt+1

√h où σ2

t+1 = λσ2t+(1−λ)r2t

et λ désigne un estimateur de λ.

Des calculs analogues peuvent évidemment être effectués pour un modèleGARCH(1,1) plus général, mais on perd la forme en

√h donnée par la for-

mule (3.24). En effet, (3.23) n’est alors plus valide, les σ2t+i étant de la forme

α(ηt+i, . . . , ηt+2) + β(ηt+i, . . . , ηt+2)σ2t+1.

3.3.3 Régression quantile

La régression quantile (voir le livre de Koenker, 2005) peut s’interpréter à partirde la régression linéaire classique. Rappelons que celle-ci spécifie l’espérance d’unvecteur Y = (Y1, . . . , Yn)

′, conditionnellement à une matrice n × k de variablesexogènes X sous la forme

E(Yi | X) = X ′iβ, i = 1, . . . , n (3.25)

où les X ′i sont les lignes de X et β ∈ Rk est le paramètre inconnu. De manière

équivalente, on peut considérer le modèle

Yi = X ′iβ + ǫi, E(ǫi | X) = 0, i = 1, . . . , n. (3.26)

D’autres hypothèses sont évidemment nécessaires sur les termes d’erreur ǫi et surla matrice X pour estimer β.

Soit α ∈]0, 1[ et soit F←W (α | X) la fonction quantile associée à la loi d’une variableW sachant X. La régression quantile remplace les équations précédentes par

F←Yi(α | X) = X ′iβ(α), i = 1, . . . , n (3.27)

et, de manière équivalente étant donnée l’additivité par rapport aux constantes dela fonction quantile

Yi = X ′iβ(α) + ǫi, F←ǫi (α | X) = 0, i = 1, . . . , n (3.28)

4Par exemple pour h = 2 on a Lt,t+2 = −σt+1ηt+1 +√

a(ηt+1)ηt+2 et le Kurtosis de la loiconditionnelle vaut

3

(

(1− λ)(3 − λ)

2+ 1

)

6= 3.

Page 44: Mesures de risque - Free

40 CHAPTER 3. ESTIMATION

où β(α) ∈ Rk est un paramètre. Lorsque X est une colonne de 1, β(α) ∈ R n’est

autre que le quantile d’ordre α des Yi.

Remarque 3.1 L’analogie entre les modèles (3.26) et (3.27) est trompeuse carcette dernière équation est en réalité une égalité fonctionnelle (en α). Il est rareque l’on cherche à modéliser le quantile correspondant à un α particulier. Plusgénéralement, on s’intéresse aux valeurs de α appartenant à un intervalle inclusdans ]0, 1[. Dans cette optique, des contraintes sont nécessaires pour assurer queX ′iβ(α) soit une fonction quantile. Le modèle de base (location-scale shift model)s’écrit

F←Yi(α | X) = X ′iθ +X ′iγF

←0 (α), i = 1, . . . , n (3.29)

où θ ∈ Rk et γ ∈ R

k sont des paramètres et F←0 (·) une fonction quantile donnée.Afin d’assurer la croissance de la fonction F←Yi

(· | X) il faut contraindre les variablesexogènes et l’espace des paramètres pour avoir

X ′iγ ≥ 0, i = 1, . . . , n.

Remarquons que la spécification (3.29) équivaut au modèle

Yi = X ′iθ + (X ′iγ)ǫi, i = 1, . . . , n (3.30)

où les "termes d’erreur"5 ǫi sont de distribution F0.

Remarque 3.2 Le modèle (3.27), si on le considère valable pour tout α ∈]0, 1[,caractérise entièrement la loi des Yi (conditionnellement à X). Une façon trèssimple de simuler les Yi consiste à simuler des variables Ui de loi U [0, 1] et àprendre

Yi = X ′iβ(Ui), i = 1, . . . , n. (3.31)

On sait en effet qu’une variable de loi F est obtenue en posant Y = F←(U) oùU ∼ U [0, 1]. Par exemple des simulations du modèle (3.29) sont obtenues à partirde

Yi = X ′iθ +X ′iγF←0 (Ui), i = 1, . . . , n. (3.32)

Si l’on raisonne à α fixé, un estimateur de β(α) dans le modèle (3.27) découlenaturellement de la formule (3.5) pour les quantiles empiriques. On pose

β(α) = arg minβ∈Rk

1

n

n∑

i=1

ρα(Yi −X ′iβ) := arg minβ∈Rk

fn,α(β). (3.33)

5l’interprétation usuelle ne fonctionne pas toujours car ces termes ne sont pas nécessairementcentrés.

Page 45: Mesures de risque - Free

3.3. MÉTHODES D’ESTIMATION DES MESURES DE RISQUE 41

La loi limite de l’estimateur peut être obtenue sous diverses hypothèses concernantles variables Yi et Xi. Pour simplifier nous supposerons que les variables Yi sontindépendantes, de loi FYi

conditionnellement à X. On note ξi(α) = F←Yi(α). Nous

admettrons le résultat suivant.

Proposition 3.4 On suppose que les Fi sont absolument continues, de densité fistrictement positives en ξi(α). Supposons de plus qu’il existe des matrices Ω0 etΩ1(α) définies positives telles que presque sûrement

1. 1n

∑ni=1XiX

′i → Ω0,

2. 1n

∑ni=1 fi(ξi(α))XiX

′i → Ω1(α),

3. maxi=1,...,n ‖Xi‖/√n → 0.

Alors √nβ(α)− β(α) d→ N

(

0, α(1− α)Ω−11 (α)Ω0Ω−11 (α)

)

Remarque 3.3 Les résultats précédents sont valables pour un α donné mais sion considère plusieurs niveaux α, rien n’assure de la cohérence (monotonie) desestimateurs obtenus. Autrement dit, dans le plan, les droites de régression quan-tiles estimées pour des α différents peuvent se croiser. Il est cependant possiblede montrer que au centre du nuage de points, la monotonie est respectée. Plusprécisément, en notant X la moyenne empirique des Xi, on a

α1 ≥ α2 ⇒ X′β(α1) ≥ X

′β(α2)

(voir Koenker, 2005, Theorem 2.5).

Reprenant les notations utilisées pour les variables de perte, un estimateur de laVaR, conditionnelle à l’information représentée par le vecteur xt, est donc

ˆVaRt(α) = x′tβ(α).

Il est ici naturel d’introduire dans le vecteur xt des variables retardées. Les ré-sultats asymptotiques sont alors à reconsidérer. Cette approche peut évidem-ment être étendue au cadre non linéaire en spécifiant la VaR comme une fonc-tion de la forme g(xt, β, α). L’estimateur obtenu est convergent (vers β0 tel queVaRt(α) = g(xt, β0, α)) et asymptotiquement normal sous diverses conditionsde dépendance (voir Portnoy (1991)) incluant en particulier le cas ARCH (voirKoenker et Zhao (1996)). Une généralisation introduite par Engle et Manganelli(2004), que nous verrons plus loin, spécifie un modèle dynamique pour la VaR. Re-marquons qu’un inconvénient de cette méthode, menée séparément pour diversesvaleurs de α, est que rien n’assure la monotonie de ˆVaR(α) comme fonction de α.

Page 46: Mesures de risque - Free

42 CHAPTER 3. ESTIMATION

3.3.4 Modèles dynamiques de la VaR

Il existe plusieurs façons de modéliser les lois conditionnelles. La plus usuelle, enéconométrie, consiste à modéliser les densités conditionnelles. C’est par exemplece qu’on fait lorsqu’on spécifie un modèle ARCH avec bruit iid gaussien. Un autretype de modélisation consiste à spécifier les transformées de Laplace condition-nelles. Cette approche est couramment utilisée en finance (voir par exemple lesmodèles affines, les modèles CAR (Compound Autoregressive)). Une troisièmeméthode, qui semble plus naturelle pour l’évaluation du risque, consiste à spécifierles quantiles conditionnels.

Comme nous l’avons remarqué, une des difficultés est de spécifier un modèle pourles quantiles conditionnels prenant en compte la monotonie de la fonction α 7→VaRt(α).

Modèles QAR (Quantile AuroRegressive)

La formule (3.31) fournit une méthode de simulation du modèle de régressionquantile (3.28). Elle s’interprète également comme la spécification à coefficientsaléatoires d’un modèle à variables exogènes. Une généralisation naturelle au cadreautorégressif, introduite par Koenker et Xiao (2006), s’écrit

Yt = a0(Ut) + a1(Ut)Yt−1 + · · ·+ ap(Ut)Yt−p, (3.34)

où (Ut) est une suite iid de variables de loi U(0, 1], les ai(·) sont des fonctions[0, 1] 7→ R à estimer. Ce modèle peut être appelé autorégression quantile d’ordrep ou QAR(p). A condition que le membre de droite de l’égalité (3.34) soit unefonction croissante de Ut, la fonction quantile conditionnelle de yt s’écrit6

F←Yt(α | Yt−1, . . . , Yt−p) = a0(α) + a1(α)Yt−1 + · · ·ap(α)Yt−p, ∀α ∈]0, 1[. (3.35)

Cette restriction est importante car la monotonie doit avoir lieu quelles que soientles valeurs prises par les variables Yt−i. Elle est cependant facile à vérifier lorsqueles Yi sont des variables positives et les ai(·) des fonctions quantiles.

Des contraintes sont également nécessaires pour assurer la stationnarité des solu-tions (Yt) du modèle (3.34). Dans le cas p = 1 on voit en déroulant le modèleque

Yt = a0(Ut) +

∞∑

i=0

a1(Ut) . . . a1(Ut−i)a0(Ut−i−1)

6car pour toute fonction croissante g et toute variable U ∼ U [0, 1] on a F←g(U)(α) =

g(F←U (α)) = g(α).

Page 47: Mesures de risque - Free

3.3. MÉTHODES D’ESTIMATION DES MESURES DE RISQUE 43

à condition que la somme infinie converge. Par la règle de Cauchy, on obtient unecondition de convergence absolue de cette sommme, et donc de stricte stationnaritéde Yt:

E log |a1(Ut)| < 0, E log |a0(Ut)| < +∞.

De même, une condition de stationnarité au second-ordre (et au sens strict) est

Ea21(Ut) < 1, Ea20(Ut) < +∞.

Notons que ces conditions n’imposent pas que la fonction a1(·) soit majorée par 1.Des conditions peuvent être établies dans le cas général à partir d’une représenta-tion vectorielle du modèle (3.34).

Pour α fixé, on obtient un estimateur du vecteur des paramètres a(α) =(a0(α), . . . , ap(α))

′ comme solution de

a(α) = arg mina∈Rp+1

1

n

n∑

i=1

ρα(Yt − a0 − a1Yt−1 − · · · − apYt−p) (3.36)

où ρα(u) = αu+ + (α− 1)(−u)+ = u(α− 1u<0). Sous des conditions de régularitésur les fonctions ai (impliquant la stationnarité au second ordre), Koenker et Xiao(2006, Theorem 2) montrent la convergence faible

Σ−1/2(α)√na(α)− a(α) ⇒ B(α), (3.37)

où Bp+1(t), t ∈ [0, 1] est un pont Brownien de dimension p + 1 et Σ(α) est unematrice non aléatoire.

La remarque effectuée pour la régression quantile est toujours valable dans le cadreautorégressif: l’inconvénient principal de cette approche est qu’elle ne garantit pasla monotonie de la fonction quantile estimée.

Modèles CAViaR (Conditional Auroregressive VaR)

Ces modèles, introduits par Engle et Manganelli (2004), se distinguent des précé-dents par l’introduction de quantiles passés dans la spécification du quantile de ladate courante. Un modèle général de cette forme s’écrit donc, ∀α ∈]0, 1[

qt(α) := F←Yt(α | Yt−1, Yt−2, . . .)

= a0(α) +

p∑

i=1

ai(α)g(Yt−i) +r∑

j=1

bjqt−j(α) (3.38)

où g : R 7→ R+. Des exemples de fonctions g sont g(y) = y2, g(y) = |y| mais égale-

ment des fonctions permettant de prendre en compte des effets d’asymétrie dans

Page 48: Mesures de risque - Free

44 CHAPTER 3. ESTIMATION

le quantile conditionnel, comme par exemple g(y) = β1y+ + β2(−y)+ (la fonction

g pouvant donc comporter des paramètres à estimer). Dans cette spécification,les observations passées positives et négatives de même module auront un im-pact différent sur le quantile conditionnel (par analogie avec les modèles GARCHasymétriques pour la variance conditionnelle).

Si le polynôme b(z) = 1 −∑rj=1 bjz

j a toutes ses racines à l’extérieur du disque

unité, il est inversible. En notant aα(z) =∑p

i=1 ai(α)zi et L l’opérateur retard on

a

qt(α) = β−1(1)a0(α) + b−1(L)

p∑

i=1

ai(α)g(Yt−i)

:= a∗0(α) +

∞∑

i=1

a∗i (α)g(Yt−i). (3.39)

La positivité de g, celle des coefficients bj et la croissance des fonctions ai assurentdonc la croissance de qt(·) (car les coefficients du polynôme b−1(z) sont alors posi-tifs).

L’existence de processus (Yt) admettant les quantiles conditionnels définis par(3.38) est problématique. Sous les conditions précédentes, il suffit de chercherdes processus (Yt) solution de

Yt = a∗0(Ut) +∞∑

i=1

a∗i (Ut)g(Yt−i)

où (Ut) est une suite iid de variables de loi U(0, 1].

Modèles DAQ (Dynamic Additive Quantile)

Ces modèles, introduits par Gouriéroux et Jasiak (2007), s’écrivent, avec les nota-tions précédentes,

qt(α) := F←Yt(α | Yt−1, Yt−2, . . .)

= g0(Yt−1, Yt−2, . . .) +

p∑

i=1

ai(α)gi(Yt−1, Yt−2, . . .) (3.40)

où les ai sont des fonctions quantiles, les gi sont des fonctions positives ou nulles(avec par exemple g0 > 0) des variables passées. Toutes ces fonctions sontparamétrées.

La représentation (3.39) montre que les modèles CAViAR sont des cas particuliersde modèle DAQ. D’autres spécifications des fonctions ai et gi permettent de faire

Page 49: Mesures de risque - Free

3.3. MÉTHODES D’ESTIMATION DES MESURES DE RISQUE 45

apparaître des effets ARCH. Par exemple on peut prendre, en utilisant les fonctionsquantiles des lois normale et de Cauchy standard,

qt(α) = m0 +m1|Yt−1 − µ|+ σ0,0 + σ0,1Y2t−11/2Φ−1(α)

+σ1,0 + σ1,1Y2t−11/2 tanπ(α− 1/2). (3.41)

Le membre de droite de l’équation (3.40) étant une fonction croissante de α, il estpossible de simuler le processus (Yt) à partir du modèle à coefficients aléatoires

Yt = g0(Yt−1, Yt−2, . . .) +

p∑

i=1

ai(Ut)gi(Yt−1, Yt−2, . . .)

où (Ut) iid ∼ U [0, 1]. Par exemple, dans le cas du modèle (3.41) avec σ1,0 = σ1,1 = 0,on obtient

Yt = m0 +m1|Yt−1 − µ|+ σ0,0 + σ0,1Y2t−11/2ǫt

où (ǫt) iid ∼ N (0, 1).

Le modèle DAQ peut aussi être utilisé pour spécifier d’autres mesures de risquedynamiques. Par exemple, du modèle (3.41) on tire la DRM dynamique

r(Ft;G) = m0 +m1|Yt−1 − µ|+ σ0,0 + σ0,1Y2t−11/2

∫ 1

0

Φ−1(u)dG(u)

+σ1,0 + σ1,1Y2t−11/2

∫ 1

0

tanπ(u− 1/2)dG(u). (3.42)

Comme pour les modèles QAR, l’estimation des modèles DAQ peut être menéepar la méthode de régression quantile. Des méthodes plus efficaces, fondées surle critère d’information de Kullback-Leibler, peuvent également être utilisées (voirGouriéroux et Jasiak, 2007).

Page 50: Mesures de risque - Free

Appendix A

Examens

46

Page 51: Mesures de risque - Free

47

ENSAE - 3ème année, Master MASEF

Juin 2008

Mesures de risqueExamen

Durée: 2 heures. Sans document.

Les exercices sont indépendants.

Exercice 1: Soit L est une variable de perte, de fonction de répartition supposéecontinue et strictement croissante et telle que E|L| < ∞. On définit la valeur àrisque (non conditionnelle) de niveau α par VaR(α) = infx ∈ R | P [L ≤ x] ≥1− α et l’expected shortfall de niveau α ∈]0, 1[ par ES(α) = E[L | L > VaR(α)].

1. La fonction α 7→ VaR(α) est-elle continue? est-elle strictement monotone?

2. Montrer que ES(α) = 1αE[L1L>VaR(α)

].

3. Montrer que α 7→ ES(α) est continue.

4. Montrer que pour tout ǫ > 0 tel que α + ǫ < 1 on a

α1L>VaR(α+ǫ)−(α + ǫ)1L>VaR(α)

≤ 0, si L > VaR(α)≥ 0, si L ≤ VaR(α)

En déduire

E[Lα 1L>VaR(α+ǫ)−(α+ǫ)1L>VaR(α)

] ≤ E[VaR(α)α1L>VaR(α+ǫ)−(α+ǫ)1L>VaR(α)

].

En déduire queES(α + ǫ) ≤ ES(α).

5. On dit qu’une loi F vérifie la propriété (P) si pour L1 et L2 de loi F on a,pour tout α ∈]0, 1[,

VaRL1+L2(α) ≤ 2VaRL1(α),

où VaRL(α) désigne la VaR au niveau α d’une variable de perte L.

(a) Quelle est l’interprétation financière de cette propriété?

(b) Est-elle vérifiée pour la loi exponentielle de fonction de répartitionF (x) = (1− e−x)1x>0?

Page 52: Mesures de risque - Free

48 APPENDIX A. EXAMENS

Exercice 2:

Notations et rappels: Soit X1, . . . , Xn un échantillon de variables iid de loiabsolument continue de densité f et de fonction de répartition F . Si α ∈]0, 1[ onnote ξα = F←(α) le quantile d’ordre α de la loi des Xi. Pour des observationsX1, . . . , Xn, on note Fn la fonction de répartition empirique et ξn,α = F←n (α) lequantile empirique d’ordre α.

Si f(ξα) > 0, on a la convergence en loi

√n(ξn,α − ξα)

d→ N(

0, ω2α

)

, ω2α =

α(1− α)

f 2(ξα). (A.1)

On appelle loi de Pareto de paramètre (a, b), avec a > 1 et b > 0, la loi de fonction

de répartition F (x) = (1−(

xb

)−a)1x>b où 1x>b = 1 si x > b, 0 sinon. La fonction

de répartition de la loi N (0, 1) est notée Φ. On pose u+ = max(u, 0).

On note Lt une variable de perte entre les dates t−1 et t. On dispose d’observationsL1, . . . , Ln de cette variable. Soit α ∈]0, 1[.

1. Donner un estimateur ˆVaRn(α) de la valeur à risque au niveau α de la dis-tribution (non conditionnelle) de perte.

2. On suppose dans cette question que les variables Li sont iid de loi de Paretode paramètre (2, 1). Quelle est la loi asymptotique de l’estimateur ˆVaRn(α)?Comment se comporte la variance asymptotique lorsque α tend vers zér0?est-ce étonnant?

3. On suppose maintenant que l’on dispose d’observations X1, . . . , Xn d’unevariable explicative réelle. On a le modèle

Li = Xiβ(α) + ǫi, F←ǫi (α | Xi) = 0, i = 1, . . . , n.

La dernière égalité signifie que le quantile d’ordre α de ǫi sachant Xi est nul.On note

β(α) = argminβ∈R

1

n

n∑

i=1

ρα(Li −Xiβ), ρα(u) = αu+ + (1− α)(−u)+.

(a) A partir des dérivées à gauche et à droite de la fonction ρα, écrire lesconditions du premier ordre caractérisant β(α).

(b) Comment s’interprète Xiβ(1 − α)? Dans quel cas retrouve-t-onl’estimateur de la question 1?

Page 53: Mesures de risque - Free

49

(c) Lorsque α varie quel est le défaut de cette méthode?

(d) Ayant estimé le modèle, on dispose des résidus ǫi = Li − Xiβ(1 − α).Proposer une ou plusieurs méthodes pour valider le modèle à partir deces résidus.

Page 54: Mesures de risque - Free

50 APPENDIX A. EXAMENS

Eléments de corrigé

Exercice 1:

1. La fonction de répartition de L étant strictement croissante, sa fonction quan-tile est continue. Par suite α 7→ VaR(α) est continue. Elle est strictementcroissante car la fonction de répartition est continue.

2. Voir cours.

3. La continuité de ES(α) découle de celle de VaR(α) et de la formule précé-dente.

4. Si L > VaR(α) les deux indicatrices valent 1, donc la quantité étudiée vautα− (α+ ǫ) = −ǫ < 0. Si L ≤ VaR(α), la deuxième indicatrice est nulle doncla quantité est positive ou nulle.

Par suite

(L− VaR(α))α1L>VaR(α+ǫ)−(α + ǫ)1L>VaR(α)

] ≤ 0.

On obtient l’inégalité cherchée en prenant l’espérance.

On remarque ensuite que

E[VaR(α)α1L>VaR(α+ǫ)−(α+ǫ)1L>VaR(α)

] = VaR(α)α(α+ǫ)−(α+ǫ)α = 0.

Par suiteE[Lα 1L>VaR(α+ǫ)

−(α + ǫ)1L>VaR(α)] ≤ 0,

ce qui s’écrit ES(α + ǫ) ≤ ES(α).

5. (a) La propriété traduit l’intérêt de la diversification: la somme nécessairepour couvrir le risque d’un portefeuille constitué de deux titres est inférieureà la somme totale requise pour couvrir les deux titres séparément.

(b) Pour cette loi, on a VaRL1(α) = − logα. La fonction de répartition deL1 + L2 est F (x) = (1 − e−x − xe−x)1x>0. Par suite VaRL1+L2(α) est lasolution de l’équation

e−x(1 + x) = α.

La fonction G(x) = 1−F (x) est évidemment décroissante et on vérifie facile-ment que G(2VaRL1(α)) < α. Par suite, la propriété (P) es vérifiée pour cetteloi.

Page 55: Mesures de risque - Free

51

Exercice 2:

1. Un estimateur est le quantile empirique d’ordre 1 − α de la distribution deperte.

2. Pour cette loi, la fonction de répartition est F (x) = (1 − x−2)1x>1 . Enrésolvant F (x) = 1 − α on trouve le quantile ξ1−α = α−1/2. Par suite,f(ξ1−α) = 2α3/2 et la loi asymptotique de l’estimateur de la VaR est laN(

0, ω21−α)

, avec

ω21−α =

α(1− α)

4α3=

1− α

4α2.

Lorsque α tend vers zéro, la variance asymptotique tend vers l’infini. Cecitraduit la difficulte d’estimer la VaR avec précision pour des valeurs de αtrop petites.

3. (a) Voir cours.

(b) Xiβ(1−α) s’interprète comme la VaR estimée de la perte Li sachant Xi.On retrouve la VaR non conditionnelle lorsque Xi = 1 pour tout i.

(c) Lorsque α décroit, la VaR devrait augmenter. Cette propriété n’est pasgarantie pour les estimateurs obtenus par cette méthode.

(d) Dans une régression classique, on teste parfois l’indépendance entre lestermes d’erreurs et les régresseurs, Xi, en régressant les résidus sur une fonc-tion non linéaire des Xi (par exemple X2

i ). Des méthodes similaires peuventêtre envisagées pour la régression quantile.

Page 56: Mesures de risque - Free

52 APPENDIX A. EXAMENS

ENSAE - 3ème année, Master MASEF

Février 2009

Mesures de risqueExamen

Durée: 2 heures. Sans document.

Les exercices sont indépendants.

Exercice 1: Soit L une variable de perte de fonction de répartition FL supposéecontinue et strictement croissante. Soit α ∈]0, 1[ et X une variable à valeurs dans[1− α, 1]. On pose

r(L) = EF−1(X) =

∫ 1

1−αF−1(u)dG(u),

où G est la fonction de répartition de X.

1. Expliquer en quoi r définit une mesure de risque et comment elle se compareà la VaR.

2. Pour quelle loi de X obtient-on l’expected shortfall au niveau α?

3. Ecrire r(L) en fonction de Φ lorsque L s’écrit L = m + σǫ où ǫ suit la loiN (0, 1) de fonction de répartition Φ.

4. Montrer que r est une mesure de risque monotone, positivement homogène etinvariante par translation. Quelle(s) propriété(s) supplémentaire(s) faudrait-il vérifier pour avoir une mesure de risque cohérente?

5. Soient U1, . . . , Un des variables indépendantes de même loi uniforme sur [1−α, 1]. Soit Vn = max1≤i≤n(Ui). On définit une suite de mesures de risque enposant

rn(L) = EF−1(Vn).Exprimer rn(L) sous forme intégrale. Etudier l’effet d’une augmentation den sur la pondération des risques.

6. Soient W,W1, . . . ,Wn des variables indépendantes de même loi, tellesmin1≤i≤n(Wi) ait une loi uniforme sur [1 − α, 1]. On définit une suite demesures de risque en posant

r∗n(L) = EF−1(W ).

Page 57: Mesures de risque - Free

53

Exprimer r∗n(L) sous forme intégrale. Intuitivement ou par le calcul, aug-menter n correspond-il à une optique plus ou moins prudente dans le calculdes réserves?

7. A partir de n observations de L proposer une estimation de r(L).

Exercice 2: On suppose que pour une série de rendements en logarithmes, rt =log(pt/pt−1), on a le modèle

rt = φrt−1 + σtηt, |φ| < 1, (ηt) iid N (0, 1)

σ2t = ω + λσ2

t−1 + (1− λ)r2t−1, ω ≥ 0, λ ∈ [0, 1].(A.1)

On suppose que ηt est indépendante de σt. La VaR, conditionnelle au passé jusqu’àla date t, au niveau α, de la variable de perte Lt,t+h = −(rt+1 + · · · + rt+h) estnotée VaRt,h(α). L’expected shortfall est noté ESt,h(α).

1. Pour h = 1, justifier la formule

VaRt,1(α) = −φrt + σt+1Φ−1(1− α)

et établir une formule analogue pour ESt,1(α).

2. Dans le cas où φ = ω = 0 la formule

VaRt,h(α) = σt+1

√hΦ−1(1− α),

est souvent utilisée. Pourquoi est-elle généralement erronée? pour quellevaleur de λ est-elle correcte?

3. On définit une variable de perte Lt,t+h = −(pt+h − pt), correspondant auxvariations de prix (plutôt qu’au variations des logarithmes des prix commedans ce qui précède). On note ˜VaRt,h(α), la VaR de cette variable de perte.Etablir la formule reliant VaRt,h(α) et ˜VaRt,h(α).

4. Supposons que l’on ait un portefeuille constitué, à proportions égales, de deuxtitres indépendants, dont les rendements vérifient tous les deux le modèle(A.1). Est-il correct d’utiliser comme réserves (en euros) pour couvrir lerisque au niveau α le double de ce qu’on utiliserait pour l’un des deux titres?

5. On dispose d’observations r1, . . . , rT . On ne suppose plus que la loi des ηt estconnue. Ayant estimé les paramètres φ, ω, λ comment estimer VaRT,1(α)?quelles procédures peut-on utiliser pour évaluer les performances de la VaRsi l’on dispose d’observations supplémentaires rT+1, . . . , rT+n?

Page 58: Mesures de risque - Free

54 APPENDIX A. EXAMENS

Eléments de corrigé

Exercice 1:

1. Puisque F est continue et strictement croissante, elle est inversible d’inversela fonction quantile. En particulier, la VaR au niveau α est VaR(α) =F−1(1− α). La quantité r(L) s’interprète comme une mesure de distorsion,obtenue en pondérant les quantiles d’ordres supérieurs à 1 − α. La Var estobtenue en prenant pour loi de X la masse de Dirac en 1− α. Puisque F−1

est strictement croissante (F étant continue), on a VaR(α) < r(L).

2. L’expected shortfall correspond à une loi uniforme sur [1− α, 1]:

ES(α) =1

α

∫ 1

1−αF−1(u)du =

1

α

∫ α

0

F−1(1− u)du.

3. On a F−1(u) = m+ σΦ−1(u), ∀u ∈ [0, 1]. Donc

r(L) = m

∫ 1

1−αdG(u) + σ

∫ 1

1−αΦ−1(u)dG(u) = m+ σ

∫ 1

1−αΦ−1(u)dG(u)

puisque G est une loi de probabilité sur [1− α, 1].

4. Soit L1 ≤ L2. On sait que la VaR étant monotone, on a F−1L1(u) ≤ F−1L2

(u)pour tout u. Donc r(L1) ≤ r(L2), ce qui montre que r est monotone. Demême, r est positivement homogène et invariante par translation. Il faut deplus la sous-additivité pour avoir une mesure cohérente, c’est-à-dire r(L1 +L2) ≤ r(L1) + r(L2), ∀L1, L2.

5. La fonction de répartition de Vn est donnée, pour x ∈ [0, 1], par

FVn(x) = P [Vn ≤ x] = P (Ui ≤ x)n =

x− (1− α)

α

n

1x∈[1−α,1] .

Par suite

rn(L) =

∫ 1

1−αF−1(u)

n

α

u− (1− α)

α

n−1du.

Quand n augmente, la masse de la loi de Vn tend à se concentrer autour de1. Par suite les gros risques seront de plus en plus pondérés.

Page 59: Mesures de risque - Free

55

6. Soit FW la fonction de répartition (dépendant de n) des variables Wi. On a,pour x ∈ [1− α, 1],

P [ min1≤i≤n

Wi ≥ x] = [1− FW (x)]n =1− x

α.

Par suite

FW (x) = 1−

1− x

α

1/n

et

r∗n(L) =

∫ 1

1−αF−1(u)

1

1− u

α

1/n−1du.

Lorsque n augmente, W tend à prendre des valeurs de plus en plus grandes(à se concentrer autour de 1). Donc les réserves tendent à augmenter.

7. Soit Fn est la fonction de répartition empirique des Li: Fn(x) =1n

∑ni=1 1Li≤x . Soit i0 tel que 1 − α ∈](i0 − 1)/n, i0/n]. Un estimateur de

r(L) est

∫ 1

1−αF−1n (u)dG(u) =

n∑

i=1

Li,n

∫ 1

1−α1](i−1)/n,i/n](u)dG(u)

= Li0,n

∫ i0/n

1−αdG(u) +

n∑

i=i0+1

Li,n

∫ i/n

(i−1)/ndG(u)

= Li0,n

G

(

i0n

)

−G(1− α)

+n∑

i=i0+1

G

(

i

n

)

−G

(

i− 1

n

)

Li,n.

Exercice 2:

1. La variable Lt,t+1 = −rt+1 est d’espérance conditionnelle −φrt et de varianceconditionnelle σ2

t+1. D’où la formule. De même

ESt,1(α) = −φrt +σt+1

α

∫ α

0

Φ−1(1− u)du = −φrt +σt+1

αϕΦ−1(1− α)

où ϕ est la densité de la N (0, 1).

Page 60: Mesures de risque - Free

56 APPENDIX A. EXAMENS

2. Voir cours. La formule est correcte pour λ = 1 car dans ce cas les rt sont iidde loi N (0, σ2).

3. On a

P (Lt,t+h ≤ x) = P (pt+h ≥ pt − x) = P

(

pt+h

pt≥ pt − x

pt

)

= P

(

logpt+h

pt≥ log

pt − x

pt

)

= P

(

Lt,t+h ≤ − logpt − x

pt

)

.

Donc

VaRt,h(α) = − log

(

1−˜VaRt,h(α)

pt

)

.

4. En notant r1t et r2t les deux rendements, la somme vérifie

r1t + r2t = φ(r1,t−1 + r2,t−1) + (σ1t + σ2t)ηt

donc la formule correcte est, à horizon 1,

VaRt,1(α) = −φ(r1,t−1 + r2,t−1) + (σ1t + σ2t)Φ−1(1− α)

ce qui ne correspond pas au double.

5. Si les ηt ont pour fonction de répartition F , on a

VaRt,1(α) = −φrt + σt+1F−1(1− α).

On peut estimer F−1 par la fonction quantile empirique des ηt =rt−φrt−1

σt.

A partir d’observations supplémentaires, on peut considérer le nombre dedépassements des VaR estimées sur l’échantillon et effectuer des tests devalidation.

Page 61: Mesures de risque - Free

57

ENSAE - 3ème année, Master MASEF

février 2010

Mesures de risqueExamen

Durée: 2 heures. Sans document.

Les exercices sont indépendants.

Exercice 1: Supposons qu’il y ait N sources de risque. On note L(i)t+1 la perte

engendrée par l’actif i entre les dates t et t+ 1. On considère le modèle suivant:

L(i)t+1 = (a+ bZ2

t+1)1/2u

(i)t+1, i = 1, . . . , N (A.1)

où (Zt) est un processus iid, inobservable, de densité f ; les (u(i)t ) sont des bruits

blancs indépendants entre eux et indépendants de (Zt), de loi N (0, σ2i ); a et b sont

des paramètres strictement positifs.

On définit la perte globale par

Lt+1 =N∑

i=1

L(i)t+1 = (a + bZ2

t+1)1/2ut+1,

où ut+1 =∑N

i=1 u(i)t+1. On note Φ la fonction de répartition de la loi N (0, 1).

1. Comment s’interprète le processus (Zt) dans ce modèle?

2. Les variables de perte L(i)t+1 sont-elles corrélées (à t fixé lorsque i varie)?

indépendantes?

3. Expliquer pourquoi VaR conditionnelle et non conditionnelle de l’actif i coïn-cident pour ce modèle.

4. Montrer que la VaR au niveau α et à horizon 1 de l’actif i, notée VaR(i)(α),est solution de l’équation

∫ +∞

−∞Φ

(

VaR(i)(α)

(a+ bz2)1/2σi

)

f(z)dz = c

où c est une constante que l’on exprimera en fonction de α.

Page 62: Mesures de risque - Free

58 APPENDIX A. EXAMENS

5. Déterminer de même l’équation caractérisant la VaR de la perte globale àhorizon 1, notée VaR(α).

6. Résoudre ces équations dans le cas où b = 0. Comparer dans ce cas VaR(α)et∑N

i=1 VaR(i)(α). Ce résultat est-il étonnant?

7. Exprimer l’expected shortfall de l’actif i sous la forme

ES(i)(α) = K

∫ +∞

−∞(a+ bz2)1/2φ

(

VaR(i)(α)

(a+ bz2)1/2σi

)

f(z)dz

où φ est la densité de la loi N (0, 1) et K est une constante que l’on précisera.

Exercice 2: Soit L une variable de perte de fonction de répartition F supposéecontinue et strictement croissante.

1. Expliquer pourquoi on définit une mesure de risque en posant

r(L) = ν

∫ 1

0

F−1(1− u)(1− u)ν−1du, ν > 0.

2. Ecrire r(L) en fonction de Φ lorsque L s’écrit L = m + σǫ où ǫ suit la loiN (0, 1) de fonction de répartition Φ.

3. Etudier l’effet du choix de ν sur la pondération des risques.

4. Vérifier que r(L) est une mesure de risque monotone, positivement homogèneet invariante en translation. Cela suffit-il pour en faire une mesure cohérente?

5. Vérifier que r(L) = νE[LF (L)ν−1]. En déduire que pour ν = 1 la mesurede risque vérifie la propriété de sous-additivité. Cela est-il étonnant?

6. Si L et L′ sont des variables comonotones, c’est-à-dire fonctions croissantesd’une même variable Z, vérifier que r(L + L′) = r(L) + r(L′). Quelle estl’interprétation financière de cette propriété?

7. A partir de n observations L1, . . . , Ln de L proposer une estimationrn(L) de r(L). On exprimera rn(L) en fonction de la suite décroissante(Ln,n−i)i=0,...,n−1 construite à partir des observations.

Page 63: Mesures de risque - Free

59

Eléments de corrigé

Exercice 1:

1. Zt s’interprète comme un facteur de risque commun. Ce risque intervientdans la volatilité des variables de perte et non dans la moyenne comme dansle modèle vu en cours.

2. Les variables de perte L(i)t+1 ne sont pas corrélées mais leurs carrés le sont:

EL(i)t+1 = E((a+ bZ2

t+1)1/2)E(u

(i)t+1) = 0,

cov(L(i)t+1, L

(j)t+1) = EL

(i)t+1L

(j)t+1 = E(a+ bZ2

t+1)E(u(i)t+1)E(u

(j)t+1) = 0,

E(L(i)t+1)

2 = E(a+ bZ2t+1)σ

2i ,

E(L(i)t+1L

(j)t+1)

2 = E(a+ bZ2t+1)

2σ2i σ

2j ,

cov((L(i)t+1)

2, (L(j)t+1)

2) = var(a + bZ2t+1)σ

2i σ

2j 6= 0.

3. Les variables de perte L(i)t+1 étant indépendantes temporellement, Var condi-

tionnelle et inconditionnelle coïncident.

4. VaR(i)(α) est solution de l’équation

P ((a+ bZ2t+1)

1/2u(i)t+1 ≤ VaR(i)(α)) = 1− α.

En conditionnant par rapport à Zt+1 on obtient c = 1− α, car

1− α = E[P ((a+ bZ2t+1)

1/2u(i)t+1 ≤ VaR(i)(α) | Zt+1)]

= E[Φ(a+ bZ2t+1)

−1/2VaR(i)(α)]

=

∫ +∞

−∞Φ

(

VaR(i)(α)

(a + bz2)1/2σi

)

f(z)dz.

5. En posant σ2 =∑N

i=1 σ2i , on obtient

∫ +∞

−∞Φ

(

VaR(α)

(a+ bz2)1/2σ

)

f(z)dz = 1− α (A.2)

6. Lorsque b = 0, on a VaR(i)(α) = aσiΦ−1(1− α) et VaR(α) = aσΦ−1(1− α).

Donc, puisque σ ≤∑Ni=1 σi, on a VaR(α) ≤∑N

i=1 VaR(i)(α). Cette propriétéde sous-additivité n’est en général pas vérifiée pour la VaR, mais on saitqu’elle l’est dans le cas gaussien (c’est le cas ici puisque b = 0).

Page 64: Mesures de risque - Free

60 APPENDIX A. EXAMENS

7. On sait que ES(i)(α) = 1αE(L

(i)t+1 1L

(i)t+1>VaR(i)

(α)). On trouve K = σi

α, en

utilisant le fait que E(U 1U>c) = φ(c) où U suit la loi normale standard.

Exercice 2:

1. r(L) est de la forme∫ 1

0F−1(1 − u)dG(u), avec G(u) = 1 − (1 − u)ν une

fonction de répartition sur [0, 1]. Il s’agit donc d’une mesure de distorsion.

2. On a F−1(1− u) = m+ σΦ−1(1− u) et par suite

r(L) = m+ σν

∫ 1

0

Φ−1(1− u)(1− u)ν−1du.

3. On a G′′(u) = −ν(ν−1)(1−u)ν−2. Par suite G est concave pour ν(ν−1) ≥ 0,c’est-à-dire pour ν ≥ 1. Pour de tels ν, les quantiles F−1(1−u) sont affectésd’un poids d’autant plus grand que u est proche de 0: les grands risques sontdonc fortement pris en compte. A l’inverse, si ν < 1, ces risques extrêmesont la plus petite pondération.

4. Les propriétés de monotonie, d’homogénéité et d’invariance découlent de cespropriétés pour la VaR, en utilisant les propriétés de l’intégrale. Il manquela sous-additivité pour avoir une mesure cohérente. Celle-ci peut être vérifiéelorsque G est concave.

5. Il suffit de faire le changement de variable u = 1 − F (p) dans l’intégrale.Pour ν = 1 on obtient l’espérance de la variable de perte et la propriété desous-additivité (même d’additivité) est vérifiée. Dans ce cas r(L) peut êtrevu comme l’ES au niveau α = 1. Or on sait que l’ES est sous-additive.

6. La vérification se fait comme pour l’ES (voir cours). Des pertes comonotonesévoluent simultanément. Il n’y a donc pas de possibilité de diversificationlorsqu’on agrège les portefeuilles correspondant à ces pertes.

7. Un estimateur de r(L) peut être défini à partir de la fonction quantile em-pirique:

rn(L) =

∫ 1

0

F←n (1− u)dG(u),

soit, sous forme plus explicite,

rn(L) =n−1∑

i=0

G

(

i+ 1

n

)

−G

(

i

n

)

Ln,n−i.

Page 65: Mesures de risque - Free

Appendix B

Quantile

B.1 Fonction quantile

Pour une v.a.r. X, la fonction de répartition est définie par

F : x 7→ F (x) = P [X ≤ x].

Elle est croissante, continue à droite, avec une limite à gauche en tout point. SiX admet une densité, F est continue. Si cette densité est positive sur R, F eststrictement croissante.

On définit l’inverse généralisée d’une fonction T croissante sur R par

T←(y) = infx ∈ R | T (x) ≥ y,avec la convention que l’inf d’un ensemble vide est +∞. Ainsi T← est continue àgauche.

Définition B.1 L’inverse généralisée d’une fonction de répartition F

F←(α) = infx ∈ R | F (x) ≥ α, 0 < α < 1

est appelée fonction quantile. La quantité x(α) = F←(α) définit le α-quantile de F .

Si F est continue et strictement croissante, on a simplement F←(α) = F−1(α).On a la caractérisation suivantes:

x0 = F←(α) ⇔ F (x0) ≥ α et F (x) < α, ∀ x < x0.

Pour une loi à densité positive sur R, le quantile d’ordre α est caractérisé parP [X < F←(α)] = α. On définit de même la fonction (décroissante) quantile àdroite qd par P [X > qd(α)] = α. C’est l’inverse de la fonction de survie.

61

Page 66: Mesures de risque - Free

62 APPENDIX B. FONCTION QUANTILE

Exemple B.1 Si X ∼ N (µ, σ2) alors x(α) = m + σΦ−1(1 − α) où Φ est la f.r.de la loi N (0, 1). Si X est une perte m s’interprète comme la perte anticipée etσΦ−1(1− α) comme la perte non anticipée.

On a les propriétés suivantes, immédiates à démontrer: pout tout 0 < α < 1

• si X = c p.s. où c est une constante, F←X (α) = c,

• si Y = X + c où c est une constante, F←Y (α) = F←X (α) + c,

• si Y = λX où λ ≥ 0 est une constante, F←Y (α) = λF←X (α).

En utilisant la propriété: F (x) ≥ α ⇔ x ≥ F←(α), on montre le résultat suivant.

Proposition B.1 Soit U une v.a. de loi uniforme sur [0, 1] et X une v.a. de loiF . Alors

(i) P [F←(U) ≤ x] = F (x), i.e. F←(U) a même loi que X.

(ii) Si F est continue, alors F (X) a même loi que U .

B.2 Agrégation de fonctions quantiles

Les fonctions quantiles (et plus généralement les mesures de risque) s’agrègent mal.On dispose rarement de formules explicites (d’où le recours aux simulations). Cecipose la question de la réallocation des réserves entre les services.

Plaçons nous dans le cas gaussien. Si(

XY

)

∼((

µX

µY

)

,

(

σ2X ρσXσY

ρσXσY σ2Y

))

,

on a

F←X (α) = mX + σXΦ−1(1− α),

F←Y (α) = mY + σYΦ−1(1− α),

F←X+Y (α) = mX +mY + (σ2X + σ2

Y + 2ρσXσY )1/2Φ−1(1− α).

Il n’y a donc pas de relation analytique entre le quantile de la somme et ceux deX et Y (sauf si ρ = 1 mais alors X et Y sont proportionnelles). On a toujours

F←X+Y (α) ≤ F←X (α) + F←Y (α).

Pour des variables gaussiennes, la VaR vérifie donc la propriété de sous-additivité(voir la définition 2.3). Il est facile de construire un exemple de variables discrètesoù cette propriété est en défaut.

Page 67: Mesures de risque - Free

B.3. DÉRIVÉES DU QUANTILE D’UNE COMBINAISON LINÉAIRE 63

Exemple B.2 Soit X, Y deux v.a. indépendantes de même loi:

P [X = 0] = 1− p, P [X = 1] = p, 0 < p < 1.

Pour (1− p)2 < α ≤ 1− p on a F←X (α) = F←Y (α) = 0 et F←X+Y (α) ≥ 1.

B.3 Dérivées du quantile d’une combinaison

linéaire

Lemme B.1 (Gouriéroux, Laurent, Scaillet, 2000) Soit (X, Y ) ∈ R2 un

vecteur aléatoire de loi absolument continue de densité f et tel que E|Y | < ∞.Soit Q(ǫ, α) le quantile défini par

P [X + ǫY > Q(ǫ, α)] = α.

Alors∂Q(ǫ, α)

∂ǫ= E[Y | X + ǫY = Q(ǫ, α)].

Preuve: On a

α =

∫(∫ +∞

Q(ǫ,α)−ǫyf(x, y)dx

)

dy.

En dérivant cette égalité par rapport à ǫ on obtient

0 =

f(Q(ǫ, α)− ǫy, y)

(

∂Q(ǫ, α)

∂ǫ− y

)

dy.

D’où

∂Q(ǫ, α)

∂ǫ=

yf(Q(ǫ, α)− ǫy, y)dy∫

f(Q(ǫ, α)− ǫy, y)dy= E[Y | X + ǫY = Q(ǫ, α)].

B.4 VaR et expected shortfall pour variables non

absolument continues

Dans le cas de variables de perte dont la loi n’est pas absolument continue parrapport à la mesure de Lebesgue, ou pour des variables continues dont la densitén’est pas partout strictement positive, il peut être nécessaire de distinguer plusieursquantiles.

Page 68: Mesures de risque - Free

64 APPENDIX B. FONCTION QUANTILE

On appelle, α-quantile inférieur de X

qα = F←(α) = infx ∈ R | F (x) ≥ α

et α-quantile supérieur de X

qα = infx ∈ R | F (x) > α.

On a bien sûr qα ≤ qα, avec égalité si et seulement si F (x) = α pour au plus un x.

On définit de même deux notions de VaR pour une perte X:

VaRα = q1−α, VaRα = q1−α.

On définit les "tail conditional expectations" (TCE) d’une variable X telle queE(X+) < ∞ par

TCEα = E[X | X ≥ VaRα], TCEα = E[X | X ≥ VaRα].

On a bien sûr TCEα ≤ TCEα. Il est possible de construire des exemples simplesmontrant que TCEα n’est pas une mesure de risque sous-additive (voir Acerbiet Tasche, 2002). Sous certaines conditions de régularité, on montre que la pluspetite mesure de risque qui soit cohérente et plus grande que la VaR est la "worstconditional expectation" (WCE) définie par

WCEα = infE[X | A];P (A) > α

(voir Delbaen, 2002).

Finalement, on définit l’expected shortfall, pour X telle que E(X+) ≤ +∞, par

ESα =1

αE(X 1X≥s) + s(α− P [X ≥ s]) , s ∈ [q1−α, q

1−α] (B.1)

en notant que la définition est indépendante du choix de s. On a la propriétésuivante.

Proposition B.2 Soit X telle que E(X+) < +∞. Alors

ESα =1

α

∫ α

0

VaRudu. (B.2)

Page 69: Mesures de risque - Free

B.5. THÉORÈME CENTRAL LIMITE POUR TABLEAUX TRIANGULAIRES65

Preuve: d’après (B.1), si U ∼ U[0,1], en posant Z =

αESα = E(X 1X≥VaRα) + VaRα(α− P [X ≥ VaRα])

= E(X 1X≥VaRα) + VaRαE(1U≤α−1X≥VaRα

)

= E(X 1X≥VaRα)− VaRαE(1q1−U≥q1−α

−11−U≥1−α)

= E(X 1X≥VaRα)− q1−αE(1(1−U<1−α)∩(q1−U≥q1−α))

= E(q1−U 1q1−U≥q1−α)− E(q1−U 1(1−U<1−α)∩(q1−U≥q1−α))

= E(q1−U 1U≤α)

car F←(1− U) = q1−U a même loi que X (voir la proposition B.1).

2

B.5 Théorème central limite pour tableaux trian-

gulaires

Soit Xn1, . . . , Xnrn une suite de variables centrées, appelée tableau triangulaire(car en général rn ≤ n). On pose, pour tout n et k = 1, . . . , rn,

E(Xnk) = 0, E(X2nk) = σ2

nk, s2n =

rn∑

k=1

σ2nk (B.3)

et on suppose que sn > 0 pour tout n. On a la condition dite de Lindeberg

∀ǫ > 0, limn→∞

rn∑

k=1

1

s2nE(X2

nk 1|Xnk|>ǫsn) = 0. (B.4)

Le théorème suivant est démontré dans Billingsley (1995)1 et généralise le TCLclassique pour variables iid.

Théorème B.1 Supposons que pour tout n la suite Xn1, . . . , Xnrn soit indépen-dante et vérifie (B.3) et (B.4). Alors

(Xn1 + · · ·+Xnrn)/snd→ N (0, 1) .

1Probability and measure, 3rd edition, John Wiley.

Page 70: Mesures de risque - Free

Appendix C

Références

Ouvrages généraux:

Gouriéroux, C. et J. Jasiak (2001) Financial Econometrics, Princeton Uni-versity Press.

Gouriéroux, C. et A. Tiomo (2007) Risque de crédit, Economica.

Koenker, R. (2005) Quantile regression, Cambridge University Press.

McNeil, A.J., Frey, R. et P. Embrechts (2005) Quantitative risk Manage-ment, Princeton University Press.

Références du chapitre 2:

Acerbi, C. et D. Tasche (2002) On the coherence of expected shortfall. Jour-nal of Banking and Finance 26, 1487-1503.

Artzner, P., Delbaen, F., Eber, J-M. et D. Heath (1999) Coherent mea-sures of risk. Mathematical Finance 9, 203-228.

Delbaen, F. (2002) Coherent measures of risk on general probability spaces. In: Advances in Finance and Stochastics, essays in Honor of D. Sondermann,Springer, 1-37.

Gouriéroux, C., Laurent, J-P et O. Scaillet (2000) Sensitivity Analysisof VaR, Journal of Empirical Finance, 7, 225-246.

Gouriéroux, C. et W. Liu (2006) Sensitivity analysis of distorsion risk mea-sures, unpublished document.

66

Page 71: Mesures de risque - Free

67

Kusuoka, S. (2001) On law invariant coherent risk measures. In : Advances inMathematical Economics, 83-95 vol. 3, Springer, Tokyo.

Monfort, A. (2008) Une modélisation séquentielle de la VaR. Document nonpublié.

Tasche, D. (2002) Expected shortfall and beyond. Journal of Banking andFinance 26, 1519-1533.

Wang S. et J. Dhaene (1998) Comonotonicity, correlation order and premiumprinciples. Insurance: Mathematics and Economics 22, 235-242.

Wang S., Young V. and H. Panjer (1997) Axiomatic Characterization ofInsurance Prices. Insurance: Mathematics and Economics 21, 173-183.

Références du chapitre 3:

Bahadur, R.R. (1966) A note on quantiles in large samples. Annals of Mathe-matical Statistics 37, 577–580.

De Rossi G. and A. Harvey (2006) Time-varying quantiles. Discussion paperCWPE 0649.

Engle, R.F. et S. Manganelli (2004) CAViaR: Conditional AutoregressiveValue at Risk by regression quantiles. Journal of Business and EconomicStatistics, 22, 367-381.

Gouriéroux, C. and J. Jasiak (2007) Dynamic quantile models. A paraîtredans Journal of Econometrics.

Gouriéroux, C. and W. Liu (2007) Converting Tail-VaR to VaR: an econo-metric study. Unpublished document.

Koenker R. and Z. Xiao (2002) Inference on the quantile regression process.Econometrica, 70, 1583-1612.

Koenker R. and Z. Xiao (2006) Quantile autoregression. Journal of the Amer-ican Statistical Society, 101, 980-990.

Koenker R. and Q. Zhao (1996) Conditional quantile estimation for andinference for ARCH models. Econometric Theory, 12, 793-813.

Kuester, K., Mittnik, S. et M.S. Paolella (2006) Value at Risk prediction:a comparison of alternative strategies. Journal of Financial Econometrics,4, 53-89.

Page 72: Mesures de risque - Free

68 APPENDIX C. RÉFÉRENCES

Martin, R. and T. Wilde (2002) Unsystematic Credit Risk, Risk Magazine,15, 123-128.

Scaillet, O. Nonparametric estimation of conditional expected shortfall. In-surance and risk management journal, 74, 639-660.

Wilde, T. (2001) Probing Granularity. Risk, 14, 103-106.

Wu, W.B. (2005) On the Bahadur representation of sample quantiles for de-pendent sequences. The Annals of Statistics, 33, 1934-1963.