le genome browser cadre de lecture et - université de ...dbcm1501/bcm1501_a16...premier cadre de...
TRANSCRIPT
@HWI-M03555:10:000000000-ACGCE:1:1101:17116:1057 1:N:0:TTAGGCNGGTTTCTTTTTCTTCAGTCGTGTAAGTGACGATCATGTCCGGAGACGGGAAAATCCCNCGNTNCNNGNNNNCCTGGAGNNANNNNTTCATCCGTTTGACGNCNNNCGTGTCATNNNCTTNAAAGNTTCCCATAATGTGCGTNNNNNNNAGGGNNATGACGTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNTNNNNNNNNNNANCGGNNNGNNNTTTTTCTCNAGATTGAGNNNNNNNNNNNNGTTGGGCGTCT+#8BCCGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGEGGGGGGGGGGGG#:C#:#:##:####::DFGGG##:####::DFGGGGGGGGGGG#:###::FGGGGG###::D#:AF7#:AFGGGGGGGGGGGGG#######38@F##8@DFGGB##########################################################################################################################################@HWI-M03555:10:000000000-ACGCE:1:1101:15352:1057 1:N:0:TTAGGCNGCAAGCCGTTTACGATAACATCAAACGGACTGAAGCGATGCTTGAACAATATGAAGANAANCNGNNCNNNNTTAAAAANNTNNNNGAGCGTAAAGAAATGNTNNNAAAGCTGANNNAGCNTGCTNCCGGGTTGCAGGAAGANNNNNNNATGANNGCTCTGATNNNNGNGNNNGNNNNNTNANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGANNNNNNNNNNANACCNNNGNNNAGGAAAAGNCAGCGAACNNNNNNNNNNNNAGATGATGCGT+#8ACCGGCFFGGGGGGGGGGGGGFEFGGGGGGGGGGGGGGGG9EF@FGGGGGGGGGGF#:C#:#9##:####:69CFFG##9####:9CFFCEGGGGFGGG#:###::BDEGGG###4::#:AFF#:=DDFG:CCFBFG=F@#######88@D##68DFGGGC#########################################################################################################################################@HWI-M03555:10:000000000-ACGCE:1:1101:16821:1057 1:N:0:TTAGGCNCCCAATATCTGCGCTATCTCTTCGAATGACATGTTTTGCACAGCGTGCATCATGAAANTGNCNTNNTNNNNTTCGGTANNCNNNNATAGGGCATCAGCGANTNNNTCCTTATCNNNATCNCTTANCTCTCCCTCAGCCTCTNNNNNNNTTGCNNATTCTTCNNNNNGNGNNNCNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGNNNNNNNNNNGNCTTNNNTNNNGCAGCCATNCAAGAGTGNNNNNNNNNNNNCTGATCATACT+#8ACCGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGG#:C#:#:##:####::DFGGE##:####::,CFFGFFCGFGG7#:###::AFGGGA###::9#:9A<#:ADCFG,AFCFGGGGF#######88@+##88@FGGD##########################################################################################################################################
@HWI-M03555:10:000000000-ACGCE:1:1101:17116:1057 1:N:0:TTAGGCNGGTTTCTTTTTCTTCAGTCGTGTAAGTGACGATCATGTCCGGAGACGGGAAAATCCCNCGNTNCNNGNNNNCCTGGAGNNANNNNTTCATCCGTTTGACGNCNNNCGTGTCATNNNCTTNAAAGNTTCCCATAATGTGCGTNNNNNNNAGGGNNATGACGTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNTNNNNNNNNNNANCGGNNNGNNNTTTTTCTCNAGATTGAGNNNNNNNNNNNNGTTGGGCGTCT+#8BCCGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGEGGGGGGGGGGGG#:C#:#:##:####::DFGGG##:####::DFGGGGGGGGGGG#:###::FGGGGG###::D#:AF7#:AFGGGGGGGGGGGGG#######38@F##8@DFGGB##########################################################################################################################################@HWI-M03555:10:000000000-ACGCE:1:1101:15352:1057 1:N:0:TTAGGCNGCAAGCCGTTTACGATAACATCAAACGGACTGAAGCGATGCTTGAACAATATGAAGANAANCNGNNCNNNNTTAAAAANNTNNNNGAGCGTAAAGAAATGNTNNNAAAGCTGANNNAGCNTGCTNCCGGGTTGCAGGAAGANNNNNNNATGANNGCTCTGATNNNNGNGNNNGNNNNNTNANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGANNNNNNNNNNANACCNNNGNNNAGGAAAAGNCAGCGAACNNNNNNNNNNNNAGATGATGCGT+#8ACCGGCFFGGGGGGGGGGGGGFEFGGGGGGGGGGGGGGGG9EF@FGGGGGGGGGGF#:C#:#9##:####:69CFFG##9####:9CFFCEGGGGFGGG#:###::BDEGGG###4::#:AFF#:=DDFG:CCFBFG=F@#######88@D##68DFGGGC#########################################################################################################################################@HWI-M03555:10:000000000-ACGCE:1:1101:16821:1057 1:N:0:TTAGGCNCCCAATATCTGCGCTATCTCTTCGAATGACATGTTTTGCACAGCGTGCATCATGAAANTGNCNTNNTNNNNTTCGGTANNCNNNNATAGGGCATCAGCGANTNNNTCCTTATCNNNATCNCTTANCTCTCCCTCAGCCTCTNNNNNNNTTGCNNATTCTTCNNNNNGNGNNNCNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGNNNNNNNNNNGNCTTNNNTNNNGCAGCCATNCAAGAGTGNNNNNNNNNNNNCTGATCATACT+#8ACCGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGG#:C#:#:##:####::DFGGE##:####::,CFFGFFCGFGG7#:###::AFGGGA###::9#:9A<#:ADCFG,AFCFGGGGF#######88@+##88@FGGD##########################################################################################################################################
Le Dogme CentraleTTTTCTTATATGTACCATCAACAGGGGCTGGTTCADN
UUUUCUUAUAUGUACCAUCAACAGGGGCUGGUUCARN
Protéines ? ? ? ? ? ? ? ? ? ? ?
Transcription
Traduction
Cadre de lectures● Façon de diviser une séquence d’ADN/ARN en groupes de trois nucléotides
consécutifs de façon à former des codons.
UUUUCUUAUAUGUACCAUCAACAGGGGCUGGUUCAUGUCCAACAACAGGGGCUGGUUUACCAUCAAUAGGG
GCUGGUUUACCAUCAACAGGUGAGUUACCAUCAACAGGGGCUGGUU
Premier cadre de lecture
Cadre de lecture 1; 5’ – 3’UUU UCU UAU AUG UAC CAU CAA CAG GGG CUG GUU CAU GUC CAA CAA CAG GGG CUG Phe Ser Tyr Met Tyr His Gln Gln Gly Leu Val His Val Gln Gln Gln Gly Leu
GUU UAC CAU CAA UAG GGG CUG GUU UAC CAU CAA CAG GUG AGU UAC CAU CAA CAG Val Tyr His Gln ∗ Gly Leu Val Tyr His Gln Gln Val Ser Tyr His Gln Gln
GGG CUG GUU Gly Leu Val
Deuxieme cadre de lectureCadre de lecture 2; 5’ – 3’U UUU CUU AUA UGU ACC AUC AAC AGG GGC UGG UUC AUG UCC AAC AAC AGG GGC UGA Phe Leu Ile Cys Thr Ile Asn Arg Gly Trp Phe Met Phe Asn Asn Arg Gly ∗
UUU ACC AUC AAU AGG GGC UGG UUU ACC AUC AAC AGG UGG GUU ACC AUC AAC AG Phe Thr Ile Asn Arg Gly Trp Phe Thr Ile Asn Arg Trp Val Thr Ile Asn Arg
G GGC UGG UU Gly Trp
Troisième cadre de lectureCadre de lecture 3; 5’ – 3’UU UUC UUA UAU GUA CCA UCA ACA GGG GCU GGU UCA UGU CCA ACA ACA GGG GCU GGU Phe Leu Tyr Val Pro Ser Thr Arg Ala Gly Ser Cys Pro Thr Thr Arg Ala Gly
UUA CCA UCA AUA GGG GCU GGU UUA CCA UCA ACA GGU GGG UUA CCA UCA ACA GGGLeu Pro Ser Ile Arg Ala Gly Leu Pro Ser Thr Gly Gly Leu Pro Ser Thr Gly
GCU GGU UAla Gly
Quatrieme cadre de lecture?Cadre de lecture 1; 5’ – 3’UUU UCU UAU AUG UAC CAU CAA CAG GGG CUG GUU CAU GUC CAA CAA CAG GGG CUG Ser Tyr Met Tyr His Gln Gln Gly Leu Val His Val Gln Gln Gln Gly Leu
GUU UAC CAU CAA UAG GGG CUG GUU UAC CAU CAA CAG GUG AGU UAC CAU CAA CAG Val Tyr His Gln ∗ Gly Leu Val Tyr His Gln Gln Val Ser Tyr His Gln Gln
GGG CUG GUU Gly Leu Val
Comme le premier!!
Il existe cependant les cadres de lectures appeler -1, -2 et -3 pour le brin complémentaire d’un ADN double brins.
Cadre de lecture ouvert● Open Reading Frame (ORF)
● Séquence d’ARN débutant par le codon d’initiation (AUG) et se terminant par un codon stop (UAA, UAG, UGA)
● Entre ces deux codons se trouve une succession de codons qui forme, potentiellement, une protéine
Cadre de lecture 1; 5’ – 3’
UUU UCU UAU AUG UAC CAU CAA CAG GGG CUG GUU CAU GUC CAA CAA CAG GGG CUG Phe Ser Tyr Met Tyr His Gln Gln Gly Leu Val His Val Gln Gln Gln Gly Leu
GUU UAC CAU CAA UAG GGG CUG GUU UAC CAU CAA CAG GUG AGU UAC CAU CAA CAG Val Tyr His Gln ∗ Gly Leu Val Tyr His Gln Gln Val Ser Tyr His Gln Gln
GGG CUG GUU Gly Leu Val
Cadre de lecture 2; 5’ – 3’
U UUU CUU AUA UGU ACC AUC AAC AGG GGC UGG UUC AUG UCC AAC AAC AGG GGC UGA Phe Leu Ile Cys Thr Ile Asn Arg Gly Trp Phe Met Phe Asn Asn Arg Gly ∗
UUU ACC AUC AAU AGG GGC UGG UUU ACC AUC AAC AGG UGG GUU ACC AUC AAC AG Phe Thr Ile Asn Arg Gly Trp Phe Thr Ile Asn Arg Trp Val Thr Ile Asn Arg
G GGC UGG UU Gly Trp
Le Genome Browser● Le genome browser permet de mieux visualiser l’information sur la region
demander.
● Regroupe multiple information sur la région.
Les formats de fichiers - FASTA>Identifiant CommentaireXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
>gi|373251181|ref|NG_001742.2| Mus musculus olfactory receptor GA_x5J8B7W2GLP-600-794 (LOC257854) pseudogène on chromosome 2AGCCTGCCAAGCAAACTTCACTGGAGTGTGCGTAGCATGCTAGTAACTGCATCTGAATCTTTCAGCTGCTTGTTGGGCCTCTCACAAGGCAGAGTGTCTTCATGGGACTTTGATATTTATTTTTGTACAACCTAAGAGGAACAAATCCTTTGACACTGACAAATTGGCTTCCATATTTTATACCTTAATCATCTCCATGTTGAATTCATTGATCAACAGTTTAAGAAAAAAAGATGTAAAAATGCTTTTAGAAAGAGAGGCAAAGTTATGCACAATAACTTCTCATGAAGTCACAGTTTGTTAAAAGTTGCCTTAGTTCACAATAAATAATTATGTATGCTCTATAATTTCAGTGA
Se connecter1- Connectez vous sur windows (pXXXXXX et mot de passe)
2- Connectez vous sur linux (pXXXXX et mot de passe choisi)
3-Bienvenue sur linux!!!
Quelques commandes à connaître
-List → ls-Make Directory → mkdir-Change Directory → cd + nom
répertoire
-Print Working Directory → pwd
1. Dans votre console, créez un répertoire de travail pour le cours BCM1501 (cela permet de mieux organiser vos données)
2. Vérifiez que votre dossier a bien été crée
Important▪ Faites attention aux Majuscules et minuscules
▪ Linux n’aime pas les espaces
▫ ➔ écrire “nom_de_fichier” ou “NomDeFichier” au lieu de “nom de fichier”
▪ Quand vous travaillez sous Linux, n’essayez pas de télécharger quoique ce soit à partir de Windows… Il s’agit de 2 systèmes indépendants!
▪ Assurez-vous d’être invités par Linux avant de taper vos commandes → “/usagers_bac/p0xxxxxx>”