specie dimensione genoma (mb) n. geni approx refer. arabidopsis thaliana 125 25.500 (2000)...

26
Specie Dimensione Genoma (Mb) N. Geni approx Refer. Arabidopsis thaliana 125 25.500 (2000) Caenorhabditis elegans 97 19.000 (1998) Drosophila melanogaster 180 13.600 (2000) Homo sapiens 3200 30.000/40.000 (2001) S. Cerevisiae 12,1 5.800 (1996) Escherichia coli 4,64 4.400 (1987) M.tubercolosis 4,41 4.000 (1998) Archaeoglobus fulgidus 2,18 2.500 (1997) Methanococcus jannaschii 1,66 1.750 (1996)

Upload: giustina-massa

Post on 01-May-2015

221 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: Specie Dimensione Genoma (Mb) N. Geni approx Refer. Arabidopsis thaliana 125 25.500 (2000) Caenorhabditis elegans 97 19.000 (1998) Drosophila melanogaster

Specie Dimensione Genoma (Mb)

N. Geni approx Refer.

Arabidopsis thaliana 125 25.500 (2000)

Caenorhabditis elegans 97 19.000 (1998)

Drosophila melanogaster 180 13.600

(2000)

Homo sapiens 3200 30.000/40.000 (2001)

S. Cerevisiae 12,1 5.800 (1996)

Escherichia coli 4,64 4.400

(1987)

M.tubercolosis 4,41 4.000 (1998)

Archaeoglobus fulgidus 2,18 2.500 (1997)

Methanococcus jannaschii 1,66 1.750

(1996)

Page 2: Specie Dimensione Genoma (Mb) N. Geni approx Refer. Arabidopsis thaliana 125 25.500 (2000) Caenorhabditis elegans 97 19.000 (1998) Drosophila melanogaster

densità genicamatch ESTsdensitàtrasposoni

Page 3: Specie Dimensione Genoma (Mb) N. Geni approx Refer. Arabidopsis thaliana 125 25.500 (2000) Caenorhabditis elegans 97 19.000 (1998) Drosophila melanogaster

The Arabidopsis genome

I

II

III

IV

V

• 60% genoma duplicato• 60% genoma in forma 2X e non 3X• Segmenti duplicati in orientamento diretto o invertito• Centromeri in nero

Page 4: Specie Dimensione Genoma (Mb) N. Geni approx Refer. Arabidopsis thaliana 125 25.500 (2000) Caenorhabditis elegans 97 19.000 (1998) Drosophila melanogaster

Dimensione 29.105 19.646 23.172 17.549 25.953

DNA

1dominio TM 35.7% 32.8% 30.9% 36.7% 33.0%

Proteoma

Con signal peptidePathway secrez. 17.5% 15.7% 15.7% 16.5% 16.4%

Cloroplasto 9.2% 7.2% 8.1% 7.8% 8.1%

Mitocondrio 1.7% 1.2% 1.2% 1.5% 1.1%

1 2 3 4 5

Cromosomi

N. geni 6.543 4.036 5.220 3.825 5.874

Dimens.media geni 2.078 1.949 1.925 2.138 1.974

Geni con EST 60.8% 56.9% 59.8% 61.4% 61.4%

Esoni/gene 5.4 4.9 5.1 5.2 5.3

Taglia Esoni 247bp 259 250 256 242

Taglia Introni 168bp 177 159 166 159

Page 5: Specie Dimensione Genoma (Mb) N. Geni approx Refer. Arabidopsis thaliana 125 25.500 (2000) Caenorhabditis elegans 97 19.000 (1998) Drosophila melanogaster

Caratteristiche dei 3 genomi di Arabidopsis

nucleo/citoplasma plastidio mitocondrio Taglia 125Mb 154Kb 367Kbn.genoma/cellula 2 560 26

Duplicaz.genica 60% 17% 10%

n.geni x prot. 25.498 79 58

ordine genico variabile conservato variabileDensità(Kb/gene) 45 1.2 6.25

Lung.genica media 1.9 0.9 0.86

Trasposoni 14% 0% 4%

Page 6: Specie Dimensione Genoma (Mb) N. Geni approx Refer. Arabidopsis thaliana 125 25.500 (2000) Caenorhabditis elegans 97 19.000 (1998) Drosophila melanogaster

2000: The genome has ben sequenced,The papers published,

The champagne polished off,......... Now WHAT???

1996: Consorzio Internazionale(AGI:Arabidopsis Genome Initiative) x il sequenziamento di Arabidopsis

Functional GenOMICS

Page 7: Specie Dimensione Genoma (Mb) N. Geni approx Refer. Arabidopsis thaliana 125 25.500 (2000) Caenorhabditis elegans 97 19.000 (1998) Drosophila melanogaster

Arabidopsis Functional GenOMICS

•Transcriptomics:analisi dei profili d’espressione, regolazione trascrizionale

•ORFeomics:analisi di cDNA, regolazione post-trascrizionale

•Proteomics:analisi dei profili proteici, 2° messaggeri, regolazione post-traduzionale

•Metabolomics:analisi dei metaboliti secondari

Page 8: Specie Dimensione Genoma (Mb) N. Geni approx Refer. Arabidopsis thaliana 125 25.500 (2000) Caenorhabditis elegans 97 19.000 (1998) Drosophila melanogaster

Transcription

Cellular biogenesis

Ionic homeostasis

Cell death, ageingCell rescue

Cell growth, divisionDNA synth.

Protein destination

Protein synthesis

Energy

Intracellular transport

Signal transduction

Transport facilitation

Metabolism

Unclassified 30%

Functional Genomics

Page 9: Specie Dimensione Genoma (Mb) N. Geni approx Refer. Arabidopsis thaliana 125 25.500 (2000) Caenorhabditis elegans 97 19.000 (1998) Drosophila melanogaster

S.cerevisiae

A..thaliana

C.elegans

Drosophila

H.sapiens

Proc

essi cel

lula

ri

Met

abol

ism

o

Replic

az.D

NA/M

odif.

Tras

crizio

ne/T

radu

zion

e

Segn

ali i

ntra

cellu

lari

Com

unicaz

ione

cel

l-cel

l

Fold

ing

prot

eine

Deg

rada

zion

eTr

aspo

rto

Prot

eine

mul

tifu

nzio

n.

Cito

sche

l./st

ruttur

.

Dife

sà e

Imm

unità

Funz

ioni

misce

llane

e

Categorie geniche x funzioneN

um

ero

di g

en

i

Page 10: Specie Dimensione Genoma (Mb) N. Geni approx Refer. Arabidopsis thaliana 125 25.500 (2000) Caenorhabditis elegans 97 19.000 (1998) Drosophila melanogaster

Cel

lula

r b

ioge

nes

is

Ion

ic h

omeo

stas

is

Cel

l dea

th, a

gein

gC

ell r

escu

e

Cel

l gro

wth

, d

ivis

ion

DN

A s

ynth

.

Pro

tein

des

tin

atio

n

En

ergy

Intr

acel

lula

r t

ran

spor

t

Sig

nal

tra

nsd

uct

ion

Tra

nsp

ort

fac

ilit

atio

n

Met

abol

ism

Un

clas

sifi

ed 3

0%

not

yet

cle

ar-c

ut

Tra

nsc

rip

tion

• Solo 8/23% TFs hanno geni correlati in yeast-human• Evoluzione indipendente dei TFs?• In Arabidopsis 2-3X TFs rispetto a Drosophila, C. elegans

Pro

tein

syn

thes

is

• 48/60&% dei geni coinvolti nella sintesi proteica sono conservati rispetto agli altri genomi eucariotici, sottolineando funzioni geniche altamente conservate

%p

rote

ine A

.t.

di u

na c

lasse c

on

Bla

stP

+

Page 11: Specie Dimensione Genoma (Mb) N. Geni approx Refer. Arabidopsis thaliana 125 25.500 (2000) Caenorhabditis elegans 97 19.000 (1998) Drosophila melanogaster

Multinational Arabidopsis Steering Committee MASC

Programma di 10 anni, iniziato nel 2001Gli obiettivi:. Determinare la funzione di ogni gene di Arabidopsis. Ottenere una comprensione chiara e dettagliata dei processi molecolari che regolano lo sviluppo di Arabidopsis le conoscenze ottenute su questo organismo modello serviranno come riferimento per lo studio di altre piante

Page 12: Specie Dimensione Genoma (Mb) N. Geni approx Refer. Arabidopsis thaliana 125 25.500 (2000) Caenorhabditis elegans 97 19.000 (1998) Drosophila melanogaster

• Il programma presenta obiettivi a corto-medio e lungo termine • Di quelli short-term molti sono già stati realizzati:

• Le annotazioni sul genoma sono incredibilmente aumentate attraverso l’uso di informazioni sulle sequenze espresse• Un ampio repertorio di mutanti sequenziati è stato creato ed è largamente utilizzato per la determinazione della funzione genica• Collezioni largamente rappresentative di sonde gene-specifiche sono state create e sono utilizzate per analisi d’espressione • Sequenze full-size di cDNA sono state definite per più del 60% di tutti i geni di Arabidopsis • Metodi per studi di metabolomica sono stati stabiliti• Le banche dati sono state largamente ampliate

Page 13: Specie Dimensione Genoma (Mb) N. Geni approx Refer. Arabidopsis thaliana 125 25.500 (2000) Caenorhabditis elegans 97 19.000 (1998) Drosophila melanogaster

• Dei 26.207 geni annotati, 16.138 sono rappresentati da un full-size cDNA, e per 20.901 (~80%) è stata studiata l’espressione. • Le risorse per studi di genomica funzionale sono aumentate: le database per mutanti inserzionali attualmente coprono inserzioni per 22.400 geni (~85% dei geni) che probabilmente corrispondono ad alleli KO per il 70% dei geni.

Page 14: Specie Dimensione Genoma (Mb) N. Geni approx Refer. Arabidopsis thaliana 125 25.500 (2000) Caenorhabditis elegans 97 19.000 (1998) Drosophila melanogaster

MASC 2004: update sulle funzioni geniche

Categorie: Per geni che codificano una proteina

attività della proteina/funzione molecolare Struttura terziaria

Dati di modificazioni post-traduzionaliProfilo di espressione proteico a livello

cellulare/tissutaleLocalizzazione subcellulareDati di interazione proteina/proteinaFenotipi di KO o alleli loss of functionProcessi biologici

Page 15: Specie Dimensione Genoma (Mb) N. Geni approx Refer. Arabidopsis thaliana 125 25.500 (2000) Caenorhabditis elegans 97 19.000 (1998) Drosophila melanogaster

Per geni che NON codificano una proteinaattività dell’RNA/prodotto genicoProfilo di espressione genico a livello

cellulare/tissutaleStruttura dell’RNA/prodotto genicoLocalizzazione subcellulare dell’RNA/ prodotto

genico Fenotipi di KO o alleli perdita di funzione (loss of

function)Dati di interazione

Il Gold Standard della caratterizzazione funzionale di un gene è raggiunto quando si hanno infos su tutti questi punti………….

Page 16: Specie Dimensione Genoma (Mb) N. Geni approx Refer. Arabidopsis thaliana 125 25.500 (2000) Caenorhabditis elegans 97 19.000 (1998) Drosophila melanogaster

Per vedere questa immagineoccorre QuickTime™ e un

decompressore Photo - JPEG.

13.000

26.207

20.901

Geni Identificati da dati Affy

Geni identificati da MPSS o

SAGE

Geni con ESTs

Geni con cDNAFull-length

Espressione

Dati d’espressione disponibili per circa l’80% di tutti i geni

Page 17: Specie Dimensione Genoma (Mb) N. Geni approx Refer. Arabidopsis thaliana 125 25.500 (2000) Caenorhabditis elegans 97 19.000 (1998) Drosophila melanogaster

Per vedere questa immagineoccorre QuickTime™ e un

decompressore Photo - JPEG.

12.750

20.498

26.207

ORFs

Geni con cloni ORFs già noti

Geni con cloni ORFs identificati

Page 18: Specie Dimensione Genoma (Mb) N. Geni approx Refer. Arabidopsis thaliana 125 25.500 (2000) Caenorhabditis elegans 97 19.000 (1998) Drosophila melanogaster

Per vedere questa immagineoccorre QuickTime™ e un

decompressore Photo - JPEG.

1.000

9.614

26.207

Funzione

Fenotipo mutante

Interazione genetica

Assay diretto

Interazione fisica

Funzione dedotta da:……….

Community Input di classe 3,2, & 1

Page 19: Specie Dimensione Genoma (Mb) N. Geni approx Refer. Arabidopsis thaliana 125 25.500 (2000) Caenorhabditis elegans 97 19.000 (1998) Drosophila melanogaster

Geni di cui:No omologie di sequenzaNo espressione dell’ORF

No isolamento cDNASolo predizione “We don’t know

anything about it”

Per vedere questa immagineoccorre QuickTime™ e un

decompressore Photo - JPEG.

1.976

26.207

Page 20: Specie Dimensione Genoma (Mb) N. Geni approx Refer. Arabidopsis thaliana 125 25.500 (2000) Caenorhabditis elegans 97 19.000 (1998) Drosophila melanogaster

• Il ruolo di Arabidopsis nel portare innovazione nella

biologia vegetale applicata, non va sottovalutato• Diversi geni di Arabidopsis, infatti, sono stati caratterizzati

funzionalmente e ne è stata poi dimostrata conservazione

funzionale in piante da raccolto mediante espressione

eterologa

Testare geni di Arabidopsis in piante da raccolto……..

Gigantea (GI): coinvolto nel controllo del flowering

mediante il fotoperiodo e nel controllo del ciclo circadiano.

La fioritura precoce è un problema per il “radish”:

espressione dell’antisenso di GI di Arabidopsis riduce i livelli

di GI endogeno, causando un ritardo di fioritura.

Page 21: Specie Dimensione Genoma (Mb) N. Geni approx Refer. Arabidopsis thaliana 125 25.500 (2000) Caenorhabditis elegans 97 19.000 (1998) Drosophila melanogaster

C-repeat/dehidration response element Binding Factor

(CBF1): Fattore di trascrizione di Arabidopsis che conferisce

tolleranza al freddo e allo stress ossidativo. Il pomodoro è

una pianta molto sensibile al freddo, viene resa resistente a

questo stress mediante espressione eterologa di CBF1.

Page 22: Specie Dimensione Genoma (Mb) N. Geni approx Refer. Arabidopsis thaliana 125 25.500 (2000) Caenorhabditis elegans 97 19.000 (1998) Drosophila melanogaster

Lo studio genetico del fotoperiodo nella pianta modello Arabidopsis fornisce una conoscenza fondamentale anche per le possibili applicazioni su piante da raccolto

La luce del giorno è un importante input ambientale per segnalare le condizioni favorevoli per la fioritura:

in Arabidopsis la fioritura è indotta da SDin riso la fioritura è indotta da LD

La chiave di volta di ciò è l’attività del FT CONSTANSIl valore adattativo del controllo del tempo di fioritura rivela un tratto importante da un punto di vista agronomicoLa possibilità di modificare il tempo di fioritura è la caratteristica più importante che regola la distribuzione geografica delle piante da raccolto

Transfer di conoscenze da Arabidopsis a piante da raccolto……..

Page 23: Specie Dimensione Genoma (Mb) N. Geni approx Refer. Arabidopsis thaliana 125 25.500 (2000) Caenorhabditis elegans 97 19.000 (1998) Drosophila melanogaster

Zea mays

Il genoma di mais è molto diverso da quello del suo antenato teosinte, e quindi è un interessante modello di evoluzione.3 linee di ricerca indipendenti cercano di far luce sulle basi molecolari di questa spettacolare trasformazione:

determinando la struttura del genoma di mais chiarendo il ruolo dei trasposoni nell’evoluzione di questo genoma investigando sulle basi molecolari delle differenze morfologiche fra mais e teosinte

Page 24: Specie Dimensione Genoma (Mb) N. Geni approx Refer. Arabidopsis thaliana 125 25.500 (2000) Caenorhabditis elegans 97 19.000 (1998) Drosophila melanogaster

Finanziata nel ’98

Identificazione dei geni di mais usando due approcci complementari:

• ESTs• Sequencing le FS delle inserzioni del trasposone Mutator

GOALS:

Obiettivo finale:Sequencing di 150.000 segmenti di DNA genomico da inserzioni MuSe il mais ha 50.000 geni

probabilità 95% di sequenza ogni gene 1X<

Maize Genetics and Genomics Database

Page 25: Specie Dimensione Genoma (Mb) N. Geni approx Refer. Arabidopsis thaliana 125 25.500 (2000) Caenorhabditis elegans 97 19.000 (1998) Drosophila melanogaster

Oryza sativaPianta modello per i cereali

Di alto interesse agronomico

IRGSP: International Rice Genome Sequencing ProjectConsorzio di laboratori di:Asia, Europa, Nord e Sud AmericaGenoma completamente sequenziato nel 2002Comparazione strutturale e funzionale con il genoma di mais

Page 26: Specie Dimensione Genoma (Mb) N. Geni approx Refer. Arabidopsis thaliana 125 25.500 (2000) Caenorhabditis elegans 97 19.000 (1998) Drosophila melanogaster

The Golden Rice ProjectNegli anni ‘90 finanziato dalla Fondazione Rockefeller (Rockefeller Biotechnology Program) un progetto per “ingegnerizzare il pathway della provitamina-A nell’ endosperma di riso”. Il progetto fu giudicato a bassa probabilità di successo ma meritevole in quanto potenzialmente di grande utilitàIl progetto è stato svolto e realizzato COMPLETAMENTE in strutture Accademiche:

I. Potrykus, Inst. of Plant Sciences, Swiss Fed.Inst.of Technology, ETH-Zurich,Switz.

P. Beyer, University of Freiburg, Germany

This rice could save a million

kids a year