apresentação do powerpoint · 1 bioinformatica. 2 do dna para o genoma watson and crick modelo do...
TRANSCRIPT
1
Bioinformatica
2
Do DNA para o genoma
Watson and Crick
Modelo do DNA
Sequências de
Sanger - insulina
Sequenciação
Sanger de
didesoxi DNA
PCR (Polymerase
Chain Reaction)
1955
1960
1965
1970
1975
1980
1985
ARPANET
(Internet)
PDB (BD de
proteinas)
Alinhamento de
sequências
BD - GenBank
Atlas de Dayhoff’s
3
1995
1990
2000
SWISS-PROT
database
NCBI - National Center for
Biotechnology Information
World Wide Web
BLAST - Basic Local
Alignment Search Tool
FASTA
EBI – European
bioinformatics institute
Human Genome
Initiative
Primeiro rascunho
do genoma
humano
Primeiro genoma
bacterianoGenoma de
fermentos
4
A primeira proteina sequenciada foi a
albumina bovina em 1956 e continha 51
resíduos
Origem da bioinformática e das bases
de dados biológicas
Uma década depois foi sequenciado o
primeiro ácido nucleico de um fermento -
tRNAalanine com 77 bases.
5
Em 1965, Dayhoff coletou toda a informação sobre
sequências e criou a primeira base de dados para
bioinformática - Atlas of Protein Sequence and
Structure.
Em 1972 apareceu a base de dados de proteinas que
incluia 10 estruturas determinadas com raio X.
A SWISSPROT, uma base de dados de proteinas
apareceu em 1987.
6
Nucleotideos
7
Agosto de 2011:
Eucariotas 37
Procariotes 1708
Total 1745
Genomas completos
8
Anotação
Zonas de leitura abertas
Locais funcionais
Estrutura, função
9
CCTGACAAATTCGACGTGCGGCATTGCATGCAGACGTGCATG
CGTGCAAATAATCAATGTGGACTTTTCTGCGATTATGGAAGAA
CTTTGTTACGCGTTTTTGTCATGGCTTTGGTCCCGCTTTGTTC
AGAATGCTTTTAATAAGCGGGGTTACCGGTTTGGTTAGCGAGA
AGAGCCAGTAAAAGACGCAGTGACGGAGATGTCTGATG CAA
TAT GGA CAA TTG GTT TCT TCT CTG AAT ......
.............. TGAAAAACGTA
10
CCTGACAAATTCGACGTGCGGCATTGCATGCAGACGTGCATG
CGTGCAAATAATCAATGTGGACTTTTCTGCGATTATGGAAGAA
CTTTGTTACGCGTTTTTGTCATGGCTTTGGTCCCGCTTTGTTC
AGAATGCTTTTAATAAGCGGGGTTACCGGTTTGGTTAGCGAGA
AGAGCCAGTAAAAGACGCAGTGACGGAGATGTCTGATG CAA
TAT GGA CAA TTG GTT TCT TCT CTG AAT .................................
.............. TGAAAAACGTA
Local de ligação do TFpromotor
Zona de ligação do Ribossoma
ORF = zona de leitura aberta
CDS = Sequência de código
Local de início
da Transcriçã
11
Genómica
comparativa
Compação dos ORFs (entre o codão de iníciação e de
finalização)
Identificando orthologs (tipos de genes
homólogos)
Inferencias na estrutura e função
Comparando zonas funcionais
Interferência na rede reguladora
12
Perfís semelhantes
13
Xenopus MALWMQCLP-LVLVLLFSTPNTEALANQHL
Bos MALWTRLRPLLALLALWPPPPARAFVNQHL
**** : * *.*: *:..* :. *:****
Xenopus CGSHLVEALYLVCGDRGFFYYPKIKRDIEQ
Bos CGSHLVEALYLVCGERGFFYTPKARREVEG
***************:***** ** :*::*
Xenopus AQVNGPQDNELDG-MQFQPQEYQKMKRGIV
Bos PQVG---ALELAGGPGAGGLEGPPQKRGIV
.**. ** * * *****
Xenopus EQCCHSTCSLFQLENYCN
Bos EQCCASVCSLYQLENYCN
**** *.***:*******
Alinhamento da preproinsulin
14
15
Elementos ultraconservados do genoma humanoGill Bejerano, Michael Pheasant, Igor Makunin, Stuart Stephen, W. James Kent, John S. Mattick, & David Haussler (Science 2004. 304:1321-1325)
“There are 481 segments longer than 200 base pairs (bp) that are absolutely conserved (100% identity with no insertions or deletions) between orthologous regions of the human, rat, and mouse genomes. Nearly all of these segments are also conserved in the chicken and dog genomes, with an average of 95 and 99% identity, respectively. Many are also significantly conserved in fish. These ultraconserved elements of the human genome are most often located either overlapping exons in genes involved in RNA processing or in introns or nearby genes involved in the regulation of transcription and development. “
Existem 156 segmentos intergenicos, nãotranscritos e ultraconservados
16
Genómica
funcional
Perfis de genoma completo de:
• níveis de mRNA
• níveis de protein
Co-expressão de genes e/ou
proteinas
Identificação de interações
proteina-proteina
Rede interações
17
Genómica
estrutural
Atribuir estuturas a todas
As proteinas codificadas num genoma