apresentação do powerpoint · 1 bioinformatica. 2 do dna para o genoma watson and crick modelo do...

1

Bioinformatica

2

Do DNA para o genoma

Watson and Crick

Modelo do DNA

Sequências de

Sanger - insulina

Sequenciação

Sanger de

didesoxi DNA

PCR (Polymerase

Chain Reaction)

1955

1960

1965

1970

1975

1980

1985

ARPANET

(Internet)

PDB (BD de

proteinas)

Alinhamento de

sequências

BD - GenBank

Atlas de Dayhoff’s

3

1995

1990

2000

SWISS-PROT

database

NCBI - National Center for

Biotechnology Information

World Wide Web

BLAST - Basic Local

Alignment Search Tool

FASTA

EBI – European

bioinformatics institute

Human Genome

Initiative

Primeiro rascunho

do genoma

humano

Primeiro genoma

bacterianoGenoma de

fermentos

https://www.ncbi.nlm.nih.gov/

4

A primeira proteina sequenciada foi a

albumina bovina em 1956 e continha 51

resíduos

Origem da bioinformática e das bases

de dados biológicas

Uma década depois foi sequenciado o

primeiro ácido nucleico de um fermento -

tRNAalanine com 77 bases.

5

Em 1965, Dayhoff coletou toda a informação sobre

sequências e criou a primeira base de dados para

bioinformática - Atlas of Protein Sequence and

Structure.

Em 1972 apareceu a base de dados de proteinas que

incluia 10 estruturas determinadas com raio X.

A SWISSPROT, uma base de dados de proteinas

apareceu em 1987.

6

Nucleotideos

7

Agosto de 2011:

Eucariotas 37

Procariotes 1708

Total 1745

Genomas completos

8

Anotação

Zonas de leitura abertas

Locais funcionais

Estrutura, função

9

CCTGACAAATTCGACGTGCGGCATTGCATGCAGACGTGCATG

CGTGCAAATAATCAATGTGGACTTTTCTGCGATTATGGAAGAA

CTTTGTTACGCGTTTTTGTCATGGCTTTGGTCCCGCTTTGTTC

AGAATGCTTTTAATAAGCGGGGTTACCGGTTTGGTTAGCGAGA

AGAGCCAGTAAAAGACGCAGTGACGGAGATGTCTGATG CAA

TAT GGA CAA TTG GTT TCT TCT CTG AAT ......

.............. TGAAAAACGTA

10

CCTGACAAATTCGACGTGCGGCATTGCATGCAGACGTGCATG

CGTGCAAATAATCAATGTGGACTTTTCTGCGATTATGGAAGAA

CTTTGTTACGCGTTTTTGTCATGGCTTTGGTCCCGCTTTGTTC

AGAATGCTTTTAATAAGCGGGGTTACCGGTTTGGTTAGCGAGA

AGAGCCAGTAAAAGACGCAGTGACGGAGATGTCTGATG CAA

TAT GGA CAA TTG GTT TCT TCT CTG AAT .................................

.............. TGAAAAACGTA

Local de ligação do TFpromotor

Zona de ligação do Ribossoma

ORF = zona de leitura aberta

CDS = Sequência de código

Local de início

da Transcriçã

11

Genómica

comparativa

Compação dos ORFs (entre o codão de iníciação e de

finalização)

Identificando orthologs (tipos de genes

homólogos)

Inferencias na estrutura e função

Comparando zonas funcionais

Interferência na rede reguladora

12

Perfís semelhantes

13

Xenopus MALWMQCLP-LVLVLLFSTPNTEALANQHL

Bos MALWTRLRPLLALLALWPPPPARAFVNQHL

**** : * *.*: *:..* :. *:****

Xenopus CGSHLVEALYLVCGDRGFFYYPKIKRDIEQ

Bos CGSHLVEALYLVCGERGFFYTPKARREVEG

***************:***** ** :*::*

Xenopus AQVNGPQDNELDG-MQFQPQEYQKMKRGIV

Bos PQVG---ALELAGGPGAGGLEGPPQKRGIV

.**. ** * * *****

Xenopus EQCCHSTCSLFQLENYCN

Bos EQCCASVCSLYQLENYCN

**** *.***:*******

Alinhamento da preproinsulin

15

Elementos ultraconservados do genoma humanoGill Bejerano, Michael Pheasant, Igor Makunin, Stuart Stephen, W. James Kent, John S. Mattick, & David Haussler (Science 2004. 304:1321-1325)

“There are 481 segments longer than 200 base pairs (bp) that are absolutely conserved (100% identity with no insertions or deletions) between orthologous regions of the human, rat, and mouse genomes. Nearly all of these segments are also conserved in the chicken and dog genomes, with an average of 95 and 99% identity, respectively. Many are also significantly conserved in fish. These ultraconserved elements of the human genome are most often located either overlapping exons in genes involved in RNA processing or in introns or nearby genes involved in the regulation of transcription and development. “

Existem 156 segmentos intergenicos, nãotranscritos e ultraconservados

16

Genómica

funcional

Perfis de genoma completo de:

• níveis de mRNA

• níveis de protein

Co-expressão de genes e/ou

proteinas

Identificação de interações

proteina-proteina

Rede interações

17

Genómica

estrutural

Atribuir estuturas a todas

As proteinas codificadas num genoma

apresentação do powerpoint · 1 bioinformatica. 2 do dna para o genoma watson and crick modelo do...

Documents