modulome
DESCRIPTION
MODULOME. Recherche des CRISPRs : Résultats. Christine ROUSSEAU. Recherche des CRISPR. Observés chez les archéas et les bactéries Rôle supposé : mémoire immunitaire. Clustered Regularly Interspaced Short Palindromic Repeat. CRISPR : vers un modèle. Unités régulièrement espacées - PowerPoint PPT PresentationTRANSCRIPT
Réunion MODULOME 15/10/2007
Christine ROUSSEAU
Recherche des CRISPRs : Résultats
MODULOME
Réunion MODULOME 15/10/2007
Recherche des CRISPR
Observés chez les archéas et les bactéries
Rôle supposé : mémoire immunitaire
Clustered Regularly Interspaced Short Palindromic Repeat
Réunion MODULOME 15/10/2007
CRISPR : vers un modèle
✔ Unités régulièrement espacées
✔ Présence d'un leader en amont ou aval du CRISPR à une
distance variable
✔ Présence d'un gène CAS
Gène CAS
Réunion MODULOME 15/10/2007
Méthode
✔Extraire les λµ local maximal repeat✔Recherche des λµ local maximal repeat chevauchants et régulièrement espacés✔Alignement multiple pour déterminer le consensus.✔Etude des régions flanquantes
Réunion MODULOME 15/10/2007
Etape 1 : Extraction des λµ local maximal repeat
Position min = 25 Position max = 189
Objectif : n'extraire que les répétitions localement répétées.
λ = scope = position max – position min = 164
Réunion MODULOME 15/10/2007
Etape 1 : Extraction des λµ local maximal repeat
µ partitions contenant au moins 2 éléments
µ=2, scope = moyenne des scopes locales = 44,5
scope1= 81 scope2= 8
Réunion MODULOME 15/10/2007
Etape 1 : Extraction des λµ local maximal repeat
µ partitions contenant au moins 2 éléments
µ=2, scope = moyenne des scopes locales = 44,5
scope1= 4 scope3= 8
µ=3, scope = 13
scope2 = 27
Réunion MODULOME 15/10/2007
Etape 1 : Extraction des λµ local maximal repeat
µ partitions contenant au moins 2 éléments
µ=2, scope = moyenne des scopes locales = 44,5
scope1= 4 scope3= 2
µ=3, scope = 13
scope2 = 27
µ=∞, scope = 9
scope4= 4
Réunion MODULOME 15/10/2007
Etape 1 : Extraction des λµ local maximal repeat
Et pour les CRISPRs ?
μ = ∞ = 50
λ = 500
Réunion MODULOME 15/10/2007
Etape 2 : rechercher les λµ LMR régulièrement espacés
Calcul de la période dans une fenêtre de taille = nombre minimum d’occurrences.
On augmente la taille de la fenêtre tant que l'on a la même période.
Réunion MODULOME 15/10/2007
Etape 2 : rechercher les λµ LMR régulièrement espacés
Calcul de la période dans la fenêtre :
P = médiane des distances entre 2 unités
Toutes les distances entre unités = P +/- 25%
Si vrai,
on augmente la taille de la fenêtre
Sinon
on recalcule la période en supposant la présence d’un parasite.
Réunion MODULOME 15/10/2007
Etape 3 : alignement multiple des unités
Réunion MODULOME 15/10/2007
Pyrococcus abyssi GE5
Réunion MODULOME 15/10/2007
Détection des CRISPRs chez les thermococcales : résultats
✔ Pyrococcus abyssi : 3 CRISPRs
✔ Pyrococcus horikoshii : 6 CRISPRs
✔ Pyrococcus furiosus : 7 CRISPRs
✔ Thermococcus kodakarensis : 3 CRISPRs
Réunion MODULOME 15/10/2007
Détection des CRISPRs chez les thermococcales : Analyse des spacers
Query= spacer 37 from 149230 to 149266 (37 letters)
Score ESequences producing significant alignments: (bits) Value
pGE2 74 3e-13AM419040 AM419040.1 23-AUG-2007 34 0.23 AE008690 AE008690.1 27-MAY-2004 34 0.23 AE007871 AE007871.2 18-JUL-2002 34 0.23 ref| NC_003308.1| Agrobacterium tumefaciens str. C58 plasmid Ti, ... 34 0.23 ref| NC_003065.2| Agrobacterium tumefaciens str. C58 plasmid Ti, ... 34 0.23
>pGE2 Length = 23976
Score = 73.8 bits (37), Expect = 3e-13 Identities = 37/ 37 (100%) Strand = Plus / Minus
Query: 1 caacaagctccgtgtggagcttttcaactattctcaa 37 |||||||||||||||||||||||||||||||||||||Sbjct: 10480 caacaagctccgtgtggagcttttcaactattctcaa 10444
Blast contre banques virales et plasmids
Réunion MODULOME 15/10/2007
Détection des CRISPRs chez les thermococcales :
Comparaison des résultats avec les autres méthodes
Pyrococcus furiosus
0
0,2
0,4
0,6
0,8
1
1,2
Région1
Région2
Région3
Région4
Région5
Région6
Régions identifiées
PilerCr
CRT
CrisprFinder
Pygram
Région 1 Région 2 Région 3
0
0.2
0.4
0.6
0.8
1
1.2
Pyrococcus abyssi
PilerCr
CRT
CrisprFinder
Pygram
Régions identifiées Région 1
Région 2
Région 3
Région 4
Région 4bis
Région 5
Région 6
0
0.2
0.4
0.6
0.8
1
1.2
Pyrococcus horikoshii
PilerCr
CRT
CrisprFinder
Pygram
Régions identifiées
Thermococcus kodakarensis
0
0,2
0,4
0,6
0,8
1
1,2
Région 1 Région 2 Région 3
Régions identifi ées
PilerCr
CRT
CrisprFinder
Pygram
Réunion MODULOME 15/10/2007
Etape 4 : leader et gène CAS ?
Propriétés connues :
Emplacement +/- 1.000 Bp d’un CRISPR
Domaines conservés
Idée :
Rechercher les maximal repeat au voisinage des
régions CRISPR isolées et présents seulement
dans ce voisinage (δ neighbour)
Réunion MODULOME 15/10/2007
Pyrococcus horikoshii
Réunion MODULOME 15/10/2007
Vers une base de données CRISPR
génome
coordonnées
séquence consensus + logo
unités / spacers
image Pygram
gènes CAS si connus