modulome

19
Réunion MODULOME 15/10/2007 Christine ROUSSEAU Recherche des CRISPRs : Résultats MODULOME

Upload: jana-barlow

Post on 31-Dec-2015

36 views

Category:

Documents


1 download

DESCRIPTION

MODULOME. Recherche des CRISPRs : Résultats. Christine ROUSSEAU. Recherche des CRISPR. Observés chez les archéas et les bactéries Rôle supposé : mémoire immunitaire. Clustered Regularly Interspaced Short Palindromic Repeat. CRISPR : vers un modèle. Unités régulièrement espacées - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: MODULOME

Réunion MODULOME 15/10/2007

Christine ROUSSEAU

Recherche des CRISPRs : Résultats

MODULOME

Page 2: MODULOME

Réunion MODULOME 15/10/2007

Recherche des CRISPR

Observés chez les archéas et les bactéries

Rôle supposé : mémoire immunitaire

Clustered Regularly Interspaced Short Palindromic Repeat

Page 3: MODULOME

Réunion MODULOME 15/10/2007

CRISPR : vers un modèle

✔ Unités régulièrement espacées

✔ Présence d'un leader en amont ou aval du CRISPR à une

distance variable

✔ Présence d'un gène CAS

Gène CAS

Page 4: MODULOME

Réunion MODULOME 15/10/2007

Méthode

✔Extraire les λµ local maximal repeat✔Recherche des λµ local maximal repeat chevauchants et régulièrement espacés✔Alignement multiple pour déterminer le consensus.✔Etude des régions flanquantes

Page 5: MODULOME

Réunion MODULOME 15/10/2007

Etape 1 : Extraction des λµ local maximal repeat

Position min = 25 Position max = 189

Objectif : n'extraire que les répétitions localement répétées.

λ = scope = position max – position min = 164

Page 6: MODULOME

Réunion MODULOME 15/10/2007

Etape 1 : Extraction des λµ local maximal repeat

µ partitions contenant au moins 2 éléments

µ=2, scope = moyenne des scopes locales = 44,5

scope1= 81 scope2= 8

Page 7: MODULOME

Réunion MODULOME 15/10/2007

Etape 1 : Extraction des λµ local maximal repeat

µ partitions contenant au moins 2 éléments

µ=2, scope = moyenne des scopes locales = 44,5

scope1= 4 scope3= 8

µ=3, scope = 13

scope2 = 27

Page 8: MODULOME

Réunion MODULOME 15/10/2007

Etape 1 : Extraction des λµ local maximal repeat

µ partitions contenant au moins 2 éléments

µ=2, scope = moyenne des scopes locales = 44,5

scope1= 4 scope3= 2

µ=3, scope = 13

scope2 = 27

µ=∞, scope = 9

scope4= 4

Page 9: MODULOME

Réunion MODULOME 15/10/2007

Etape 1 : Extraction des λµ local maximal repeat

Et pour les CRISPRs ?

μ = ∞ = 50

λ = 500

Page 10: MODULOME

Réunion MODULOME 15/10/2007

Etape 2 : rechercher les λµ LMR régulièrement espacés

Calcul de la période dans une fenêtre de taille = nombre minimum d’occurrences.

On augmente la taille de la fenêtre tant que l'on a la même période.

Page 11: MODULOME

Réunion MODULOME 15/10/2007

Etape 2 : rechercher les λµ LMR régulièrement espacés

Calcul de la période dans la fenêtre :

P = médiane des distances entre 2 unités

Toutes les distances entre unités = P +/- 25%

Si vrai,

on augmente la taille de la fenêtre

Sinon

on recalcule la période en supposant la présence d’un parasite.

Page 12: MODULOME

Réunion MODULOME 15/10/2007

Etape 3 : alignement multiple des unités

Page 13: MODULOME

Réunion MODULOME 15/10/2007

Pyrococcus abyssi GE5

Page 14: MODULOME

Réunion MODULOME 15/10/2007

Détection des CRISPRs chez les thermococcales : résultats

✔ Pyrococcus abyssi : 3 CRISPRs

✔ Pyrococcus horikoshii : 6 CRISPRs

✔ Pyrococcus furiosus : 7 CRISPRs

✔ Thermococcus kodakarensis : 3 CRISPRs

Page 15: MODULOME

Réunion MODULOME 15/10/2007

Détection des CRISPRs chez les thermococcales : Analyse des spacers

Query= spacer 37 from 149230 to 149266 (37 letters)

Score ESequences producing significant alignments: (bits) Value

pGE2 74 3e-13AM419040 AM419040.1 23-AUG-2007 34 0.23 AE008690 AE008690.1 27-MAY-2004 34 0.23 AE007871 AE007871.2 18-JUL-2002 34 0.23 ref| NC_003308.1| Agrobacterium tumefaciens str. C58 plasmid Ti, ... 34 0.23 ref| NC_003065.2| Agrobacterium tumefaciens str. C58 plasmid Ti, ... 34 0.23

>pGE2 Length = 23976

Score = 73.8 bits (37), Expect = 3e-13 Identities = 37/ 37 (100%) Strand = Plus / Minus

Query: 1 caacaagctccgtgtggagcttttcaactattctcaa 37 |||||||||||||||||||||||||||||||||||||Sbjct: 10480 caacaagctccgtgtggagcttttcaactattctcaa 10444

Blast contre banques virales et plasmids

Page 16: MODULOME

Réunion MODULOME 15/10/2007

Détection des CRISPRs chez les thermococcales :

Comparaison des résultats avec les autres méthodes

Pyrococcus furiosus

0

0,2

0,4

0,6

0,8

1

1,2

Région1

Région2

Région3

Région4

Région5

Région6

Régions identifiées

PilerCr

CRT

CrisprFinder

Pygram

Région 1 Région 2 Région 3

0

0.2

0.4

0.6

0.8

1

1.2

Pyrococcus abyssi

PilerCr

CRT

CrisprFinder

Pygram

Régions identifiées Région 1

Région 2

Région 3

Région 4

Région 4bis

Région 5

Région 6

0

0.2

0.4

0.6

0.8

1

1.2

Pyrococcus horikoshii

PilerCr

CRT

CrisprFinder

Pygram

Régions identifiées

Thermococcus kodakarensis

0

0,2

0,4

0,6

0,8

1

1,2

Région 1 Région 2 Région 3

Régions identifi ées

PilerCr

CRT

CrisprFinder

Pygram

Page 17: MODULOME

Réunion MODULOME 15/10/2007

Etape 4 : leader et gène CAS ?

Propriétés connues :

Emplacement +/- 1.000 Bp d’un CRISPR

Domaines conservés

Idée :

Rechercher les maximal repeat au voisinage des

régions CRISPR isolées et présents seulement

dans ce voisinage (δ neighbour)

Page 18: MODULOME

Réunion MODULOME 15/10/2007

Pyrococcus horikoshii

Page 19: MODULOME

Réunion MODULOME 15/10/2007

Vers une base de données CRISPR

génome

coordonnées

séquence consensus + logo

unités / spacers

image Pygram

gènes CAS si connus