tema 12: dna: mutación y reparaciónbioinformatica.uab.es/base/documents/mastergp/tema... ·...
TRANSCRIPT
1
Antonio Barbadilla Bioinformatics of Genetic Diversity Research Genomics, Bioinformatics and Evolution group
Departament de Genètica i Microbiologia Universitat Autònoma de Barcelona
POPULATION GENOMICS
2
•El paradigma poblacional.
•Medida de la variación genética y genómica
•Desequilibrio de ligamiento
•Visualización de la variación a lo largo del genoma
•Teoría neutralista
•Selección en el nivel molecular
•Test de selección
2
The golden age of the study of genetic variation
Genetic variation is the cornerstone of biological evolution
R. C. Lewontin
La diversidad genética intraespecífica
3
A G A G T T C T G C T C G
A G G G T T C T G C G C G A G T G T T C T G C G C G
Evolución
Origen y sustitución de
variantes genéticas
4
Naturaleza variación genética
mutación
Polimorfismo
vs
Evolución: origen y substitución de variantes genéticas
Mutación
=
Individuo
Substitución
=
Población
La problemática de la genética de poblaciones es la
descripción y explicación de la variación genética dentro y
entre poblaciones
Theodosious Dobzhansky
La genética poblaciones
5
9
1
3 2
La medida de la variación genética
10
Population Genomics
Drosophila melanogaster
one-dimensional
Adh
6
Distribución heterocigosidad Cromosoma 6 humano
(2001 Nature 409: 928-941)
SNPs
HLA
Tipos de polimorfismos del DNA: secuenciación
7
Medidas de la variabilidad nucleotídica
• Si obtenemos una muestra de n secuencias de una región dada del genoma de una especie, podemos medir la variación nucleotídica mediante dos estimadores:
• Proporción de sitios segregantes:
S = número de sitios segregantes/número total de sitios.
• Diversidad nucleotídica o heterocigosis esperada a nivel nucleotídico:
p = número promedio de diferencias por sitio entre secuencias tomadas a pares.
Variabilidad nucleotídica en el gen Rhodopsin 3 de Drosophila simulans
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
1 T C T A C C T C C T C G G T T A
2 T C C T A C C T C C T G G T T T
3 C T C C C C C T C T T T G C T A
4 C T C C C C C T T C T G A C T T
5 C T C C C T C T T T T G G C C A
6 6 4 7 4 4 4 4 6 6 4 4 4 6 4 6
Muestra = 5 secuencias. Tamaño = 500 nucleótidos.
Proporción de sitios segregantes: S = 16/500 = 0,0320
Diversidad nucleotídica: p = 79/(500 x 10) = 0,0158
8
9
17
Population Genomics
Drosophila melanogaster
one-dimensional multi-dimensional
Adh
Estructura multidimensional de la variabilidad genética en el
genoma humano
A G A G T T C T G C T C G
A G G G T T C T G C G C G A G G G T T A T G C G C G
A G A G T T C T G C T C G A G A G T T C T G C T C G
A G A G T T C T G C T C G
A G A G T T C T G C T C G A G A G T T C T G C T C G
A G G G T T A T G C G C G A G G G T T A T G C G C G A G G G T T A T G C G C G
A G G G T T A T G C G C G
A G G G T T A T G C G C G
SNPs
10
Desequilibrio de ligamiento (D’ Lewontin)
B1 B2 Total
A1 p11 = p1q1 + D p12 = p1q2 - D p1
A2 p21 = p2q1 - D p22 = p2q2 + D p2
Total q1 q2 1
D’ = D / Dmax
SNPs
DAB = pAB - pApB
rAB = D2/ [pA(1-pA) pB(1-pB)]
SNPs
Desequilibrio de ligamiento
B1 B2 Total
A1 9 1 10
A2 2 4 6
Total 11 5 16
D = 0,5625 – 0,625 x 0,6875 = 0,1328
p1 ^ = n1. /2n = 10 / 16 = 0,625
q1 = n.1 /2n = 11 / 16 = 0,6875 ^
11
Recombinación y
Desequilibrio de
ligamiento
Estructura multidimensional de la variabilidad genética en el
genoma humano
SNPs
DAB (t + 1) = (1 – c) DAB (t )
Desequilibrio de ligamiento
Distribución del DL a lo largo del gen de la lipasa lipotroteína
humana (LPL). 66 SNPs en apr. 10 kb de 142 cromosomas
Bloques de
ligamiento o
Tag SNPs
SNPs
12
23
Population Genomics
Drosophila melanogaster
one-dimensional multi-dimensional
Adh
Population genetics studies have been based on
fragmentary and non-random samples of the
genome, providing a partial view, often biased, of
the population genetic processes
Data visualization: The Population Drosophila Browser (PopDrowser)
13
Teoría Neutralista
Evolución Molecular
Ronald Fisher J. B. S. Haldane S. Wright
Fundadores
Genética de
Poblaciones
Motoo Kimura
La genética poblaciones: la explicación
Ley del equilibrio de Hardy-Weinberg:
Dada la variación genética existente en una población mendeliana en una generación t, ¿qué pasará con esta variación en las subsiguientes generaciones bajo ciertos supuestos
?
Considera como se relacionan las frecuencias alélicas y genotípicas en una población mendeliana bajo una serie de supuestos ideales •Generaciones discretas y no solapantes •Apareamiento aleatorio •Tamaño de población infinito •No mutación, no migración entre poblaciones •No diferencias en eficacia biológica (selectivas) entre los distintos genotipos
• La distribución de frecuencias genotípicas y alélicas permanecen invariables en el tiempo.
• La constancia o equilibro de las frecuencias se debe al carácter conservativo y regular de la transmisión mendeliana.
14
Teoría neutralista de la evolución molecular
Dos fuerzas determinan la evolución en el
nivel molecular:
La deriva genética aleatoria (determinada por
2N, el censo o tamaño efectivo de la población)
La tasa de generación de mutaciones neutras,
La ley de Hardy-Weinberg parte de una variación dada. No explica por qué existe esa variación. La teoría neutralista de la evolución molecular de Kimura es una hipótesis mínima para dar
cuenta de la variación existente en las poblaciones.
•Tasa de substitución k de mutaciones neutras
k = 2N 1/(2N) =
•Tiempo esperado hasta la fijación de una nueva mutación es 4N generaciones
Teoría neutralista de la evolución molecular
15
Dinámica de sustituciones de mutaciones neutras
Frecuencia
Alélica
Tiempo
1
0
gen.4Nt
1
1/
Reloj molecular
Tiempo
1 2 3 4 5 Taxón
Reloj molecular
16
El polimorfismo es un estado transitorio en el proceso de fijación de
alelos neutros
Motoo Kimura
Teoría neutralista de la evolución molecular
II: Mutaciones selectivamente ventajosas
gen. )2ln(2
Ns
t
Tiempo
Frecuencia
Alélica
1
0
1
μ4Ns
Dinámica de sustituciones de mutaciones
II: Mutaciones selectivamente ventajosas
17
34
Teoría neutralista de la evolución molecular
•El polimorfismo genético es transitorio (El polimorfismo es un
estado transitorio en el proceso de fijación de alelos neutros) •Heterocigosidad en el equilibrio
H = /(1+ ) = 4N •Divergencia y polimorfismo se encuentran acoplados •La selección es principalmente purificadora y muy ocasionalmente direccional positiva
Tiempo
Pasado
Presente
T(2)
T(3)
T(4)
T(5)
Teoría de la coalescencia:
la genealogía de los genes
Supuesto Básico: Todos los alelos de una población provienen de un ancestro común
Watterson, G. A. 1975; Kingman, J. F. C. 1980;
Tajima, F. 1989; Hudson, R. R. 1990.
Supuesto Básico: Todos los alelos de una muestra provienen de un ancestro común
18
Test neutralismo
Test de Tajima (1989)
Si la teoría neutralista aplica a una serie de
secuencias, entonces
p =
Estadístico
de
Desviación, D
D sigue una distribución con
media 0 y var. 1
D 0 no neutralismo
D < 0 Selec. Purificadora
D > 0 Selec. equilibradora
d = π - Θ
Test de McDonald y Kreitman
¿Es la evolución adaptativa responsable de la fijación de
diferencias entre las especies en los polimorfismos no
sinónimos?
•Hipótesis neutralista: En las mutaciones neutras
hay correlación entre divergencia y polimorfismo
•Hipótesis adaptativa: las fijaciones adaptativas
pueden dar lugar a un desacoplamiento entre
divergencia y polimorfismo
McDonald, J. H. Y M. Kreitman. 1991. Adaptative protein evolution at
the Adh locus in Drosophila. Nature 351: 652-654.
19
Test de McDonald y Kreitman (MKT)
MKT compares the amount of variation within a species to the
divergence between species at two types of sites, one of which
is putatively neutral and used as the reference to detect
selection at the other type of site.
Example: sites synonymous (putatively neutral) and non-
synonymous sites in a coding region.
McDonald, J. H. Y M. Kreitman. 1991. Adaptative protein evolution at
the Adh locus in Drosophila. Nature 351: 652-654.
Test de McDonald y Kreitman
•Hipótesis nula: la proporción de mutaciones
sinónimas y no sinónimas es la misma tanto
para las variantes fijadas como para las
polimórficas
Di /D0 > Pi /P0
Di /D0 < Pi /P0
20
Test de McDonald y Kreitman
•Hipótesis nula: la proporción de mutaciones
sinónimas y no sinónimas es la misma tanto
para las variantes fijadas como para las
polimórficas
•Test de G o 2: las mutaciones se clasifican
bien en (1) fijadas, o polimórficas; o bien (2)
sinónimas o no sinónimas)
Estructura del gen Adh (256 codones)
Exón 1 Exón 2 Exón 3 Exón 4
3’ 5’
El gen Adh de Drosophila
melanogaster Kreitman, M. 1983. Nucleotide polymorphism at the alcohol
dehydrogenase locus of Drosophila melanogaster. Nature 304:
412-417.
•13 polimorfismos sinónimos (Se
espera 1/4 mutaciones en región
codificante sean sinónimas)
•1 polimorfismo no sinónimo
21
Test de McDonald y Kreitman
Fijada Polimórfica
No sinónima 7 (3,2) 2 (5,8)
Sinónima 17 (20,8) 42 (38,2)
Polimorfismo y divergencia en locus Adh de especies próximas
Drosophila melanogaster, simulans y yakuba
G = 7,43 ó X2
= 8,1
Efecto de la recombinación local sobre
la variación genética Begun, D. J. Y C. F. Aquadro. 1992. Levels of naturally ocurring DNA
polymorphism correlate with recombination rates in D. melanogaster.
Nature 356: 519-520.
Coeficiente de intercambio
Div
ersi
da
d n
ucle
otí
dic
a
20 genes de Drosophila melanogaster
22
Double cost of sex (Maynard-Smith 1978)
Advantage of sex (Crow & Kimura 1965)
Recombination and Hill-
Robertson effect (1966)
Tiempo
Pasado
Presente
T(2)
T(3)
T(4)
T(5)
Teoría de la coalescencia:
la genealogía de los genes
Supuesto Básico: Todos los alelos de una población provienen de un ancestro común
Watterson, G. A. 1975; Kingman, J. F. C. 1980;
Tajima, F. 1989; Hudson, R. R. 1990.
Supuesto Básico: Todos los alelos de una muestra provienen de un ancestro común
23
Genealogía de alelos http://bioinformatica.uab.es/divulgacio/animaciones/coalescencia.swf
•SNPs, CNVs, and SNP chip (basic definitions, nucleotide
diversity measures and linkage disequilibrium)
•PDA (Pipeline diversity analysis) (Servicio Web para la
estimación de la variación nucleotídica para cualquier taxón y
gene)
•DnaSP software (software más utilizado para la estimación
de la variación nucleotídica)
•PopDrowser (navegador de genómica de poblaciones)
Direcciónes útiles