matrices de sustitución
DESCRIPTION
Matrices de sustitución. Matrices PAM (Point-Accepted Mutation). Esta familia de matrices lista el cambio probable de un aminoácido por otro en secuencia de proteínas homologas durante la evolución. Cada matriz da el cambio esperado por un periodo dado. - PowerPoint PPT PresentationTRANSCRIPT
Matrices de sustitución
Matrices PAM (Point-Accepted Mutation).
Esta familia de matrices lista el cambio probable de un aminoácido por otro en secuencia de proteínas homologas durante la evolución.
Cada matriz da el cambio esperado por un periodo dado.
Una unidad PAM es una medida arbitraria de divergencia evolutiva en la que se asume que el 1% de los aminoácidos han cambiado entre dos proteínas.
Los cambios que se observan entre proteínas homólogas son aquellos que no alteran seriamente la función de la proteína, es decir, son "aceptados" por la evolución.
Matrices PAM
Dayhoff et al. (1978) uso multiples alineamientos (sin gaps) de ciertas regiones conservadas de proteinas cercanamente relacionadas (71 groups of proteins, all in all 1572 changes.)
71 trees with 1572 accepted mutations, sequences with >85% identity
Matriz PAM
Estas secuencias similares fueron primero organizados en arboles filogeneticos.
Matriz PAMEl numero de cambios de cada aminoácido en cada otro aminoácido fueron luego contados.
Calculo para obtener el Log odds score por cambios entre Phe y Try en una
PAM 250
• Calculamos la frecuencia de cambio de F x Y 0.0021.
• Calculamos los valores de PAM250.• En PAM250 el valor de frecuencia de F x Y es 0.15.• Para construir nuestra MDM. • 0.15/0.04 =3.75 Log(3.75) = 0.57• 0.57 x 10 =5.7
• De la misma forma para Y x F.• 0.20/0.03 = 6.7 Log(6.7) = 0.83• 0.83 x 10 = 8.3
Calculamos el promedio de 5.7 y 8.3 = 7
MDM Mutation Data Matrix
Selección de PAMObjetivo.Detectar similaridad de secuencias.Premisa: El score de alineamiento sin gaps puede ser más alto, cuando se usa una matríz correcta
Base. Homología de proteínas (Distancia evolutiva)
PAM 1: 1 mutación cada 100aa
PAM 200 : 25% similaridadPAM120 : 40% similaridadPAM80 : 50% similaridadPAM60 : 60% similaridad
• BLOSUM (Blocks Amino Acid Substitution Matrices)Henikoff & Henikoff, 1992Basada en bloques de más de 2000 patrones de
aminoácidos conservados en aprox. 500proteínas.
Matríz: Ferecuencia de cambio observada en un grando y diverso número de proteínas.
Diferencias• PAM: Modelo evolutivo
– Basado en la extrapolación a partir de un corto periodo evolutivo.– Errores en la PAM 1 son magnificados hacia la PAM 250.– Asume que la tasa evolutiva es constante.– Todos los residuos son iguales.
• BLOSUM: basado en secuencias conservadas cortas (bloques)– Basado en run rango de periodos evolutivos– Cada matríz es construida separadamente
Similaridades
• Derivadas de pequeños grupos de secuencias al azar.
• Requiren secuencias alineadas para su construcción.
• Dependen del alineamiento global sin gaps.