aktuelle themen der bioinformatik juniorprof. dr. dirk metzler johann wolfgang goethe-universität...
TRANSCRIPT
![Page 1: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/1.jpg)
01.06.2005 1
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
1. A probabilistic model for the evolution of RNA structure
– Holmes
2. RNA secondary structure prediction with simple pseudoknots
– Deogun, Donis, Komina, Ma
![Page 2: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/2.jpg)
01.06.2005 2
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
Gliederung
• Einführung
• Das TKF91 Modell
• Der TKF91 Structure Tree
• Vorstellung der durchgeführten Tests
• Interpretation der Ergebnisse
![Page 3: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/3.jpg)
01.06.2005 3
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
Ergebnis des Humangenomprojekts:
„Gut DREI Prozent brauchbares Material und jede Menge Schrott.“
![Page 4: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/4.jpg)
01.06.2005 4
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
• snRNA Splicing von pre-mRNA
• guideRNA RNA-Editing in Mitchondrien
• Ribonukleasen Regulation der Biosynthese von tRNA
• tRNA Proteinbiosynthese
• rRNA Proteinbiosynthese
• Telomerase RNA DNA Synthese an chromsomalen Enden
• snoRNA Methylierung von rRNA
![Page 5: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/5.jpg)
01.06.2005 5
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
Ziel:
• Identifikation funktioneller Signale in einer Gensequenz.
Idee:
• Funktionelle Signale sind evolutionär konserviert.
Vorgehensweise:
• Fitten der Daten an probabilistische Modelle, die den evolutionären Prozessdarstellen.
![Page 6: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/6.jpg)
01.06.2005 6
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
• Es existieren verschiedene Arten von konservierten Elementen x, y, z…
• Für jedes Szenario kann man ein probabilistisches Modell Mx, My, Mz erstellen.
• Die Likelihood der beobachteten Daten unter jedem dieser Modelle werden verglichen.
• Modell mit der besten Anpassung zeigt den Typ des funktionellen Elements.
![Page 7: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/7.jpg)
01.06.2005 7
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
Es existieren zwei Vorgehensweisen zur Verwendung von evolutionärer Distanz:
1. Trainingsalignments werden eingeteilt nach ihrer prozentualen Sequenz-identität. Alignments, die gleich eingeteilt wurden, repräsentieren dann Sequenzen mit äquivalenten Distanzen. (siehe BLOSUM)
2. Evolutionäre Distanz wird als Zeitmessung betrachet. Man legt einen stochastischen Prozess zugrunde, mit konstanten Mutationsparametern.
(siehe PAM)
![Page 8: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/8.jpg)
01.06.2005 8
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
Bisherige Ansätze zur Identifikation von funktioneller non-coding RNAbetrachten Sekundärstruktur nicht.
Aber:
• Funktion und Struktur sind eng miteinander verknüpft• In der Biologie ist Funktion immer bedingt durch Struktur
Daher:
• Neues Modell betrachtet evolutionäre Entwicklung von Sekundärstruktur
![Page 9: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/9.jpg)
01.06.2005 9
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
Gliederung
• Einführung
• Das TKF91 Modell
• Der TKF91 Structure Tree
• Vorstellung der durchgeführten Tests
• Interpretation der Ergebnisse
![Page 10: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/10.jpg)
01.06.2005 10
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
TKF91-Modell beschreibt die Evolution einer einzelnen Sequenz unter dem Einfluss von 2 Arten von Mutations-Ereignissen:
1. Punkt-Substitutionen
2. InDel-Ereignisse
Die Raten der Mutations-Ereignisse sind unabhängig von benachbarten Ereignissen.
![Page 11: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/11.jpg)
01.06.2005 11
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
Das Modell ist zeit-reversibel
Es kann oBdA davon ausgegangen werden, dass eine der beiden Sequenzen die Ursequenz der anderen ist.
0,
)()()()(
tundCAfür
ACPAPCAPCP tt
![Page 12: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/12.jpg)
01.06.2005 12
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
Punkt - Substitutionen
• Positionen evolvieren unabhängig voneinander
• Zugrunde liegendes Substitionsmodell
jBasefürWSj
srateSubstitions
stj
stj
st
ijjie
jieetf
)1(
)1()(
![Page 13: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/13.jpg)
01.06.2005 13
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
A G C U U A C C G A
immortal link mortal links
Insertionen - Deletionen
• N+1 Positionen, an denen eingefügt werden kann- mit Rate
• N Positionen, an denen gelöscht werden kann- mit Rate
< vorrausgesetzt kein Ungleichgewicht
![Page 14: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/14.jpg)
01.06.2005 14
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
Folgende Wahrscheinlichkeiten ergeben sich aus Raten n und n:
n = Wahrscheinlichkeit einer Nicht-Deletionn = Wahrscheinlichkeit einer Insertionn = Wahrscheinlichkeit einer Insertion nach einer Deletionn = Wahrscheinlichkeit die Sequenz fortzuführen
Außerdem ist Mn(i,j) die Substitutionswahrscheinlichkeit von Base i durch j
![Page 15: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/15.jpg)
01.06.2005 15
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
Die Sequenzlänge im Gleichgewicht ist geometrisch verteilt,mit Parameter.
![Page 16: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/16.jpg)
01.06.2005 16
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
![Page 17: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/17.jpg)
01.06.2005 17
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
Gliederung
• Einführung
• Das TKF91 Modell
• Der TKF91 Structure Tree
• Vorstellung der durchgeführten Tests
• Interpretation der Ergebnisse
![Page 18: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/18.jpg)
01.06.2005 18
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
• Gewurzelter Baum, indem jeder Knoten einen Grad 3 besitzt.
• Beschreibt die Sekundärstruktur einer RNA-Sequenz
• 4 Arten von Knoten:
1. singlet:2. paired:3. loop:4. stem:
• Struktur wird vom Auftreten von Loop- und Stem-Knoten bestimmt
unabhängig evolvierende Nukleotidekovariante BasenpaareAnfang einer LoopsequenzAnfang einer Stemsequenz
![Page 19: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/19.jpg)
01.06.2005 19
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
Knotenbeschriftungen:
= { L, S }
= { A, C, G, U }
² = { AA, AC, AG, AU, CA, CC, CG, CU, GA, GC, GG, GU, UA, UG, UC, UU }
![Page 20: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/20.jpg)
01.06.2005 20
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
![Page 21: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/21.jpg)
01.06.2005 21
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
![Page 22: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/22.jpg)
01.06.2005 22
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
![Page 23: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/23.jpg)
01.06.2005 23
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
![Page 24: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/24.jpg)
01.06.2005 24
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
Implementierung der Grammatik-Parser setzt eine Umgestaltung der Grammatik voraus.
Problemstellen:
• Null-Zykel - können durch Loop-/Stemlängen = 0 entstehen
• Silent Bulges - S S
• Loop Bifurcation - L LL
![Page 25: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/25.jpg)
01.06.2005 25
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
Null-Zykel(4, 7, 11)
Silent Bulge(32, 29, 30)
Loop Bifurcation(24, 27)
![Page 26: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/26.jpg)
01.06.2005 26
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
![Page 27: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/27.jpg)
01.06.2005 27
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
Komplexität der Algorithmen:
single sequence SCFG:
Zeit: (L³) Platz: (L²)
pairwise SCFG:
Zeit: (L³M³) Platz: (L²M²)
=> Finden des wahrscheinlichsten Parse-Baums mit Hilfe des CYK-Algorithmus
![Page 28: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/28.jpg)
01.06.2005 28
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
Gliederung
• Einführung
• Das TKF91 Modell
• Der TKF91 Structure Tree
•Vorstellung der durchgeführten Tests
• Interpretation der Ergebnisse
![Page 29: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/29.jpg)
01.06.2005 29
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
Implementierung eines Alignment-Tool auf Basis der SCFG‘s
Basierend auf dynamischen Programmieren mit beschleunigenden Heuristiken
Als Test der Leistungsfähigkeit des Modells werden Paare von RNA-Sequenzenmiteinander aligniert und deren Struktur vorhergesagt.
4 verschiedene Familien mit variierender Homologie im Bereich der Sekundärstruktur wurden ausgewählt.
![Page 30: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/30.jpg)
01.06.2005 30
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
Strukturvorhersagefür einzelne Sequenz
Alignment mit demTKF91-Modell
Strukturvorhersagesummiert über alle Alignments mit der anderen Sequenz
Alignment mit demTKF91-Structure Tree
![Page 31: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/31.jpg)
01.06.2005 31
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
• Identische Sekundärstruktur
• Primärsequenz weicht voneinander ab
Purine Riboswitch
![Page 32: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/32.jpg)
01.06.2005 32
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
![Page 33: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/33.jpg)
01.06.2005 33
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
• Deletion des äußeren Stems
Nano translational control element
![Page 34: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/34.jpg)
01.06.2005 34
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
![Page 35: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/35.jpg)
01.06.2005 35
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
• Deletion von Stem 4, 5 und 6• sehr ähnliche Primärsequenz
U2 splicing factors
![Page 36: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/36.jpg)
01.06.2005 36
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
![Page 37: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/37.jpg)
01.06.2005 37
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
• Starker Unterschied in der Sekundärstruktur
• variabelste Familie in RFAM
RNase P Genes
![Page 38: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/38.jpg)
01.06.2005 38
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
![Page 39: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/39.jpg)
01.06.2005 39
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
RNA Sequenzen
Strukturvorhersage
StructureTree singlet
Strukturvorhersage
StructureTree pairedpairHMM
AlignmentpairSCFG Alignment
Purine Riboswitches
schlecht korrekt korrekt korrekt
Nano translational control element
schlecht gutProbleme in den Rand-bereichen
wesentlich besser
U2 splicing factors
schlecht korrekt schlecht korrekt
RNase P schlecht schlecht schlecht schlecht
![Page 40: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/40.jpg)
01.06.2005 40
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
Gliederung
• Einführung
• Das TKF91 Modell
• Der TKF91 Structure Tree
• Vorstellung der durchgeführten Tests
• Interpretation der Ergebnisse
![Page 41: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/41.jpg)
01.06.2005 41
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
Stärken des Modells:
• streng konservierte Struktur und wenige InDels führen zu guter Struktur-Vorhersage und Alignment
• Bei vielen InDels in Loops und Stems oder bei geringfügigen Änderungen der Sekundärstruktur arbeitet der StructureTree auch gut
Schwächen des Modells:
• Ab einem bestimmten Grad der strukturellen Unterschiede zwischen Sequenzen versagt das Modell (RNase P)
![Page 42: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/42.jpg)
01.06.2005 42
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
Mögliche Verbesserungen:
• Hinzunahme von „long indels“ und affiner Gap-Penalty
• zusätzliche Modellierung von Thermodynamik-Effekten (Basepair Stacking, Nearst Neighbour Interaktion)
• Verbessertes Einfügen von Bulges (Zulassen von L-Knoten in Stems)
• Annahme das Stems und Loops alle mit der gleichen Rate evolvieren ist empirisch nicht belegt
• Triloops, Tetraloops, U-Turns u.ä. werden nicht speziell behandelt, obwohl oft evolutionär konserviert
• Einführung spezieller InDel-Raten für Stems/MultiStems (bislang gleiche Raten)
• Verbesserung der Stem-Deletion, äußer Stems sollten nicht zwangsläufig zu Löschung von inneren führen. Belegt durch empirische Studien in RFAM.
![Page 43: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/43.jpg)
01.06.2005 43
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
1. A probabilistic model for the evolution of RNA structure
– Holmes
2. RNA secondary structure prediction with simple pseudoknots
– Deogun, Donis, Komina, Ma
![Page 44: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/44.jpg)
01.06.2005 44
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
Gliederung
• Einleitung
• Algorithmus von Akutsu
• Nearest Neighbour Thermodynamik Regeln
• Berechnung minimaler Energien von RNA-Substrukturen
• Optimale Energie eines Pseudoknots
• Analyse des Algorithmus
![Page 45: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/45.jpg)
01.06.2005 45
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
• Wie bereits gesehen, ist die Pseudoknoten-Vorhersage kein triviales Problem.
• Die Möglichkeit zur Vorhersage ist aber wichtig, da Pseudoknoten verbreitete Strukturen sind, die eine wichtige Rolle in funktionell wichtiger RNA spielen.
• In diesem Algorithmus werden nur einfache Pseudoknoten betrachtet.
• Algorithmus wurde entwickelt, um Sequenzen mit Länge >100 betrachten zu können.
Laufzeitverbesserung im Gegensatz zu Eddy/Rivas:
ER = (n6) Zeit, (n4) Platz DK = (n4) Zeit, (n3) Platz
![Page 46: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/46.jpg)
01.06.2005 46
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
Neuer Algorithmus zur Vorhersage von Pseudoknots
Nearest Neighbour Thermodynamik Regeln
Akutsu-Algorithmus zur Vorhersage von Pseudoknots
unter Maximierung von Basenpaaren
mfold-Algorithmus
![Page 47: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/47.jpg)
01.06.2005 47
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
Definition:
Eine Sekundärstruktur S einer RNA-Sequenz A = a1a2…an ist eine Menge von Basenpaaren.
Ein Basenpaar zwischen ai und aj ( i < j ) wird notiert als ( i – j )
M = { (i j) | 1 i < j n, (ai aj) ist Basenpaar und jedes i und j taucht max 1 mal auf }
![Page 48: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/48.jpg)
01.06.2005 48
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
Eine Menge von Basenpaaren wird RNA-Sekundärstruktur ohne Pseudoknotengenannt, wenn folgende Bedingung erfüllt ist:
Es existieren keine Basenpaare (ai aj), (ah ak) M, die i h j k erfüllen.
![Page 49: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/49.jpg)
01.06.2005 49
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
Eine Menge von Basenpaaren wird RNA-Sekundärstruktur mit Pseudoknoten genannt, wenn folgende Bedingung erfüllt ist:
Es existieren Positionen j‘ und j‘‘ für I < j‘ < j‘‘ < K, so dass für jedes Paar (i j) MI,K gilt:
I i < j‘ < j < j‘‘ oder j‘ < i < j‘‘ j K
![Page 50: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/50.jpg)
01.06.2005 50
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
Gliederung
• Einleitung
• Algorithmus von Akutsu
• Nearest Neighbour Thermodynamik Regeln
• Berechnung minimaler Energien von RNA-Substrukturen
• Optimale Energie eines Pseudoknots
• Analyse des Algorithmus
![Page 51: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/51.jpg)
01.06.2005 51
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
Der Algorithmus von Akutsu bewertet RNA-Strukturen anhand der Anzahlihrer Basenpaare.
Idee:
Basenpaarungen tragen zu einer erhöhten Ordnung im Molekül bei und erniedrigen dadurch die freie Energie der Struktur.
Strukturen mit hoher Anzahl Basenpaaren werden daher in der Natur bevorzugt und durch den Algorithmus besser bewertet.
![Page 52: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/52.jpg)
01.06.2005 52
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
Zur Berechnung des optimalen Pseudoknots werden 4 Matrizen benötigt:
1. SL(i, j, k) enthält Score des besten Foldings zwischen I und i, und j und k. Unter der Bedingung das i mit j paart.
2. SR(i, j ,k) enthält Score des besten Foldings zwischen I und i, und j und k. Unter der Bedingung das j mit k paart.
3. SM(i, j, k) enthält Score des besten Foldings zwischen I und i, undj und k. Unter der Bedingung das weder i mit j, noch j mitk paart.
4. PS(i, j) enthält Score des besten Pseudoknot mit Anfangspunkt iund Endpunkt j
![Page 53: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/53.jpg)
01.06.2005 53
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
Um einen Pseudoknot mit Anfangspunkt I und Endpunkt K zu finden, muss der Algorithmus drei Typen von Triplets berechnen:
SL(i, j, k), SR(i, j, k) und SM(i, j, k) für jedes i, j, k für das gilt (I i < j < k K)
Berechnung von SL(i, j, k):
sonstpaarenjundifallsji
kjiSR
kjiSM
kjiSL
jikjiSL
0,1),(
),1,1(
),1,1(
),1,1(
max),(),,(
![Page 54: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/54.jpg)
01.06.2005 54
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
Berechnung von SR(i, j, k):
sonstpaarenkundjfallskj
kjiSR
kjiSM
kjiSL
kjkjiSR
0,1),(
)1,1,(
)1,1,(
)1,1,(
max),(),,(
Berechnung von SM(i, j, k):
)1,,(),1,,(
)1,1,(),1,1,(),1,1,(
),,1(),,,1(
max),,(
kjiSMkjiSR
kjiSMkjiSRkjiSL
kjiSMkjiSL
kjiSM
![Page 55: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/55.jpg)
01.06.2005 55
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
Für jedes Paar (I, K), wobei I < K, werden die SL, SM und SR Matrizenberechnet.
),1,(
),1,(
),1,(
max),(
KiiSR
KiiSM
KiiSL
KIPS KiI
}),1(),({max
)1,1(),(
),(
max),(
jmSmiS
jiSji
jiPS
jiS
jmi
Optimaler Score für jedes Paar (i, j) kann durch folgende Rekursion berechnet werden:
![Page 56: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/56.jpg)
01.06.2005 56
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
Gliederung
• Einleitung
• Algorithmus von Akutsu
• Nearest Neighbour Thermodynamik Regeln
• Berechnung minimaler Energien von RNA-Substrukturen
• Optimale Energie eines Pseudoknots
• Analyse des Algorithmus
![Page 57: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/57.jpg)
01.06.2005 57
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
Die Nearest Neighbour Energy Rules sind weit verbreitet in der RNASekundärstrukturvorhersage.
Problem ist so definiert:
Berechnung von RNA-Strukturen mit minimaler freier Energie (-G)
![Page 58: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/58.jpg)
01.06.2005 58
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
Problem:
Es existiert keine systematische Studie über die Thermodynamik von Pseudoknots.
In den Nearest Neighbour Energy Rules sind Pseudoknots „verboten“.
Annahme:
Freie Energie eines Pseudoknots ist die Summe der stabilisierenden Werte beider Stämme und die der destabilisierenden Loops.
![Page 59: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/59.jpg)
01.06.2005 59
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
Gliederung
• Einleitung
• Algorithmus von Akutsu
• Nearest Neighbour Thermodynamik Regeln
• Berechnung minimaler Energien von RNA-Substrukturen
• Optimale Energie eines Pseudoknots
• Analyse des Algorithmus
![Page 60: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/60.jpg)
01.06.2005 60
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
Zur Berechnung der minimalen Energie von RNA-Substrukturen werden 3 N x N Matrizen benötigt:
1. V(i,j) enthält Score des besten Foldings zwischen i und j, unterder Bedingung das i und j paart.
2. W(i,j) enthält Score des besten Foldings zwischen i und j, egalob i und j paaren oder nicht.
3. PS(i,j) enthält Score der besten Pseudoknot-Konfiguration zwischenden Positionen i und j.
![Page 61: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/61.jpg)
01.06.2005 61
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
)}1,1(),1({min
)},,,(),({min
),(
min),(
21 jmWkiW
jpipjiloopjpipV
jihairpin
jiV
jki
jjpipi
V(i, j) = , wenn i und j nicht paaren können
),(
)},()1,({min
)1,,1,1(
)2,,1,1()1,1(
)1,,1,()1,(
)2,,,1(),1(
),(
min),(
jiPS
jmWmiW
jjidangle
ijidanglejiW
jjidanglejiW
ijidanglejiW
jiV
jiW
jki
![Page 62: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/62.jpg)
01.06.2005 62
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
Algorithmus nimmt immer ein Nukleotid dazu und beobachtet, was die besteStruktur in jedem Schritt ist.
Im letzten Schritt wird W(1, n) berechnet und enthält die minimale Energie der gesamten Sequenz.
Über ein Traceback durch die Matrizen werden die Strukturen der Sequenzbestimmt.
![Page 63: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/63.jpg)
01.06.2005 63
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
![Page 64: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/64.jpg)
01.06.2005 64
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
Gliederung
• Einleitung
• Algorithmus von Akutsu
• Nearest Neighbour Thermodynamik Regeln
• Berechnung minimaler Energien von RNA-Substrukturen
• Optimale Energie eines Pseudoknots
• Analyse des Algorithmus
![Page 65: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/65.jpg)
01.06.2005 65
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
Optimale Energie eines Pseudoknots
Folgende Matrizen werden zur Berechnung benötigt:
1. SL(i, j, k) Enthält Score des besten Folding zwischen Positionen I und i, und j und k. Enthält Energie des Loops der von i und j
geschlossen wird. Setzt Paarung von i und j vorraus.
2. SR(i, j, k) Enthält Score des besten Folding zwischen Positionen I und i, und j und k. Enthält Energie des Loops der von i und j+1
geschlossen wird. Setzt Paarung von j und k vorraus.
3. SM(i, j, k) Enthält Score des besten Folding zwischen Positionen I und i, und j und k. Enthält Energie des Loops der von i und j+1
geschlossen wird. Setzt vorraus, dass weder i mit j paart, noch j mit k.
![Page 66: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/66.jpg)
01.06.2005 66
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
4. stem1(i, j) Enthält Energie von S1, die in SL(i, j, k) gespeichert ist, fallsi mit j paart und in SM(i, j, k) falls i nicht mit j paart.
5. stem2(j, k) Enthält Energie von S2, die in SR(i, j, k) gespeichert ist, fallsj mit k paart und in SM(i, j, k) falls j nicht mit k paart.
• stem1 und stem2 werden zur Berechnung von SL, SR und SM benötigt.
• stem1 und stem2 erhalten die Werte, die als minimale Energien für SL, SR oder SM gewählt wurden.
• stem1 und stem2 enthalten zusammen die Energie einer Struktur (i, j, k).
![Page 67: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/67.jpg)
01.06.2005 67
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
![Page 68: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/68.jpg)
01.06.2005 68
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
Initialisierung
SL(i, j, k) = SR(i, j, k) = SM(i, j, k) = für alle i, j, k
außer:
SL(i, k-1, k) = hairpin(i, k-1) + penalty wenn i und k-1 paaren können
stem1(i, j) = hairpin(i, j) falls i und j paaren könnenstem1(i, j) = sonst
stem2(i, j) = für alle i, j
![Page 69: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/69.jpg)
01.06.2005 69
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
Berechnung der SL Matrix
Wenn i und j paaren, kann der Wert in SL(i, j, k) auf drei Artenzustandekommen:
1. Das Paar (i – j) schließt einen Hairpin Loop
2. Das Paar (i – j) stackt auf einem Paar (i-1 – j+1)
3. Das Paar (i – j) schließt zusammen mit einem Paar (ip – jp) einen Bulge oder einen Internal Loop
![Page 70: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/70.jpg)
01.06.2005 70
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
SL(i, j, k) = min { E1, E2 }
E1 = hairpin(i, j) + stem2(j+1, k)
E2 = minIi, i+4 j<jp<k { hairpin(i,j) – hairpin(ip, jp) + loop(ip, jp, i, j) + SL(ip, jp, k) }
![Page 71: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/71.jpg)
01.06.2005 71
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
sonstjpipstemjijpiploopjpiphairpinjihairpin
EEjihairpinjistem
,),(1),,,(),(),(
,),(),(1 21
![Page 72: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/72.jpg)
01.06.2005 72
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
Spezialfall:
Ist stem2(j+1, k) = ( Substruktur enthält nur einen Hairpin-Loop), dann folgt:
E1 = hairpin(i,j) + penalty
)1,(1
),1(1min),(1
),1,1(
),1,1(
),1,1(
min),,(
jistem
jistemjistem
kjiSR
kjiSM
kjiSL
kjiSL
Paaren i und j nicht, werden SL(i, j, k) und stem1(i, j) wie folgt berechnet:
![Page 73: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/73.jpg)
01.06.2005 73
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
Berechnung der SR Matrix
Wenn j und k paaren, kann der Wert in SL(i, j, k) auf drei Artenzustandekommen:
1. Das Paar (j – k) schließt einen Hairpin Loop
2. Das Paar (j – k) stackt auf einem Paar (j+1 – k-1)
3. Das Paar (j – k) schließt zusammen mit einem Paar (jp – kp) einen Bulge oder einen Internal Loop
![Page 74: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/74.jpg)
01.06.2005 74
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
SR(i, j, k) = min { E3, E4 }
E3 = hairpin(j, k) + stem1(i, j+1)
E4 = minj<jp, jp+4kp<k { loop(j, k, jp, kp) + SL(i, jp, kp) }
![Page 75: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/75.jpg)
01.06.2005 75
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
sonstkpjpkjloopkpjpstem
EEkjhairpinkjstem
,),,,(),(2
,),(),(2 43
![Page 76: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/76.jpg)
01.06.2005 76
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
Spezialfall:
Ist stem1(i, j+1) = ( Substruktur enthält nur einen Hairpin-Loop), dann folgt:
E3 = hairpin(j, k) + penalty
)1,(2
),1(2min),(2
)1,1,(
)1,1,(
)1,1,(
min),,(
kjstem
kjstemkjstem
kjiSR
kjiSM
kjiSL
kjiSR
Paaren j und k nicht, werden SR(i, j, k) und stem2(j, k) wie folgt berechnet:
![Page 77: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/77.jpg)
01.06.2005 77
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
Berechnung der SM Matrix
In der SM Matrix geht man davon aus, dass weder i mit j, noch j mit kpaaren, auch wenn sie dazu in der Lage wären.
)1,,(),1,,(
),1,(),,1,(),,1,(
),,1(),,,1(
min),,(
kjiSMkjiSR
kjiSMkjiSLkjiSR
kjiSMkjiSL
kjiSM
Bei Fall 1.) stem1(i, j) = stem1(i-1, j)
Bei Fall 2.) stem1(i, j) = stem1(i, j+1), stem2(j, k) = stem2(j+1, k)
Bei Fall 3.) stem2(j, k)= stem2(j, k-1)
![Page 78: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/78.jpg)
01.06.2005 78
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
Komplexität:
Für jedes Paar (I, K) müssen Scores für (n³) Triplets berechnet werden.
Der Score eines Triplets hängt nur von I ab nicht von K.
Es müssen (n³) Scores für jedes I berechnet werden
Zeit: (n4)
Der Speicherplatzbedarf resultiert aus den NxNxN-Matrizen
Speicherplatz: (n³)
![Page 79: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/79.jpg)
01.06.2005 79
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
Gliederung
• Einleitung
• Algorithmus von Akutsu
• Nearest Neighbour Thermodynamik Regeln
• Berechnung minimaler Energien von RNA-Substrukturen
• Optimale Energie eines Pseudoknots
• Analyse des Algorithmus
![Page 80: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/80.jpg)
01.06.2005 80
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
Ergebnisse:
• Test mit einer Menge von simplen Pseudoknots aus PseudoBase
• 169 Sequenzen, mit einer Länge zwischen 19 und 114 Nukleotiden
• Algorithmus faltet 163 Pseudoknots und 6 einfache Strukturen
• 131/163 sind korrekt oder fast korrekt gefaltet worden
• Für 3 der 6 einfachen Strukturen kann die Vorhersage, durch Erhöhen der penalty verbessert werden
• Bei einer der simplen Strukturen ist im Pseudoknot der Datenbank ein A-G bp enthalten
![Page 81: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/81.jpg)
01.06.2005 81
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
• Vergleich mit dem Eddy/Rivas Programm:
Eddy/Rivas Deogun/Komina
50 % der Pseudoknots erkannt 95 % der Pseudoknots erkannt
Davon 78 % mit korrekter oder fast-korrekter Struktur
Berechnungszeiten:
75 Nukleotide 55 Sekunden
114 Nukleotide 8 Minuten
![Page 82: Aktuelle Themen der Bioinformatik Juniorprof. Dr. Dirk Metzler Johann Wolfgang Goethe-Universität Fachbereich Biologie und Informatik Institut für Informatik](https://reader036.vdocuments.us/reader036/viewer/2022081518/55204d6649795902118bb9a8/html5/thumbnails/82.jpg)
01.06.2005 82
Aktuelle Themen der Bioinformatik
Juniorprof. Dr. Dirk MetzlerJohann Wolfgang Goethe-UniversitätFachbereich Biologie und InformatikInstitut für Informatik
- Matthias Wirth -
Quellen:
Akutsu (2000): Dynamic programming algorithm for RNA secondary structure prediction with pseudoknots, Discrete Apllied Mathematics
Deogun, Komina et al. (2004): RNA Secondary Structure Prediction with Simple Pseudoknots, APBC2004
Holmes (2004): A probabilistic model for the evolution of RNA structure, BMC Bioinformatics
Mattick (2005): Das verkannte Genom-Programm, Spektrum der Wissenschaft (März 05)
Thorne, Kishino, Felsenstein (1991): An evolutionary model for maximum likelihood alignment of DNA sequences, J Mol Evol
Zuker et al.: Algorithms and thermodynamics for RNA secondary structure prediction: A practical guide, NATO ASI Series