Download - Review 1. NGS, RNAseq, ChiPseq
Київський національний університет імені ТарасаШевченка
ННЦ “Інститут біології”
Відеододатки до презентації Ви можетезавантажити на:
www.ex.ua/213724430783
Де я?
Навіщо?
Що нового?
Де я?
● Цикл розповідей з ілюстраціями про те, яклюдям було цікаво побачити і зрозуміти те, чого ніколи не побачити неозброєним окомі до чого це призвело:)
Навіщо?● Допомогти людям, що тільки йдуть до
лабораторії зрозуміти, а що взагалі можливозробити в лабораторії і наскільки це цікаво
● Показати і описати сучасні техніки, що вжевикористовують чи будуть використовуватисяу тих лабораторіях, куди ви прийшли чиприйдете.
● Використовуючи симульовані чи реальнідатасети показати функціонування певнихлабораторних технік на прикладі
● Розділити з іншими здивування і задоволеннявинахідливістю людини, якщо ну дуже-дужецікаво, що всередині шкарлупки:)
Що нового?
● Відкритий проект без кафедральноїналежності (особлива подяка за допомогукафедрі вірусології!)
● Біоінформатичне спрямування
● Регулярність (сподіваємось):)
● Відкритість до співпраці, зворотньогозв'язку
Секвенування- як прочитати текст, який формує
нас
1927, Nikolai Koltsov
● inherited traits would be inherited via a "giant hereditary molecule" made up of "two mirror strands that would replicate in a semi-conservative fashion using each strand as a template"
1953 рік – ось коли все почалося!
1977
Лютий – Maxam AM, Gilbert W. "A new method for sequencing DNA". Proc. Natl. Acad. Sci. U.S.A. 74 (2): 560–4.
● Грудень - Sanger F, Nicklen S, Coulson AR. "DNA sequencing with chain-terminating inhibitors". Proc. Natl. Acad. Sci. U.S.A. 74 (12): 5463–7
Пурини↑ Піримідини↓
Пройшло десять місяців...
1mg вашої геномної ДНК
5000$
Бажання дослідити специфічніоднонуклеотидні мутації (SNP), що відповідають за…ЗДАТНІСТЬ ВИМОВИТИ “НІКОТИНАМІДАДЕНІНДИНУКЛЕОТИДФОСФАТ” без жодноїзапинки
NGS-cеквенування
Обробка NGS-даних тавиявлення SNP, з якимипов’язані певніознаки
Експериментальнаперевіркаотриманих даних
Quick start guide :)
Центральна догмасеквенування:)
Підготовкагеномної
бібліотекиАмпліфікація
Власнесеквенування
ВиділенняДНК
ФрагментаціяДНК
Лігування з адаптером
Ампліфікація
Лігування з лінкером
Циклізаціяфрагменту
Лінеаризаціяфрагменту
Ампліфікація
Бібліотеканепарних рідів
Бібліотекаспарених (Mate-
pair) рідів
Фрагментація ДНК
● Рестриктазний метод
● Небулізація
● Сонікація
Рестриктазний метод
Небулізація
Зразок ДНК
Газ під високимтиском
Сонікація
Бібліотеки рідів
Парні
Власнепарні
Cпарені(mate-pair)
Непарні
Власне парні ріди
Спарені (mate-pair) ріди
Центральна догмасеквенування:)
Підготовкагеномної
бібліотекиАмпліфікація
Власнесеквенування
ДНК вжепідготовлене для
ампліфікації
Ампліфікація – емульсійна ПЛР
Ампліфікація - bridgePCR
Центральна догмасеквенування:)
Підготовкагеномної
бібліотекиАмпліфікація
Власнесеквенування
ДНК вжепідготовлене для
ампліфікації
Збільшеннякількості копій ДНК
проведено
SOLiD – піонер NGS
FinishedVideo/SOLID.mp4
Roche 454(Pyrosequencing)
FinishedVideo/Pyrosequencing.mp4
Завантаження на субстрат
Flowgramm(454)
Характеристики
• Час рану – 8 год
• Вихід за ран – 120Mb
• Довжина ріду – 300-400п.н.
• Якість секвенування - 99,7%
Illumina – галузевий стандарт
Все просте - геніальне
FinishedVideo/Illumina.mp4
Характеристики
• Якість секвенування – 99,9%
• Час рану 8 діб
• Вихід за ран – 250Gb
• Довжина рідів – 100-250п.о.
IonTorrent-NGS із запасом намайбутнє
IonTorrent Chip
FinishedVideo/IonTOrrentNew.mp4
Характеристики чіпів
PacBio2- Гості з майбутнього
FinishedVideo/Intruduction to SMRT Sequencing.mp4
Епігенетичне секвенування
Статистика
• Точність – 83% (13% помилок!!!!!!!!)
Статистика
• Точність – 83% (13% помилок!!!!!!!!)
• Для ампліфікації використовуєтьсяEmulsionPCR (як і в 454) НЕ ВИКОРИСТОВУЄТЬСЯ АМПЛІФІКАЦІЯ
• Вихід за ран - 217Mb
• Довжина рідів – 17000 п.н.
• Час рану – 30хв-2год. (залежить відпослідовності та довжини рідів)
Найсолодше… :)
Чим довелось пожертвувати?
● Довжина рідів (у перших модифікаціяхSOLiD – від 5 пар основ)
● Якість секвенування (відсоток помилок)
● Дороговизна обладнання
● Патентовані реактиви чи субстрат(неможливість випуску сумісних реактивів)
● Проблеми з розв'язуванням повторів
NGS - р(ЕВОЛЮЦІЯ)
● Паралелізація
● Ущільнення
● ВІДСУТНІСТЬ ЕТАПУ ЕЛЕКТРОФОРЕЗУ
● Скорочення використання реактивів
● Швидка підготовка бібліотек
● Мала кількість необхідної ДНК
MDA Sequencing
`
• Вступ: Біологічна проблематика>
Наявні методи>
RNA-seq, визначення>
• Метод: Протокол>
Платформи для RNA-seq>
Обробка данних>
?..Дослідження та виявлення новихтипів РНК
Альтернативний сплайсинг, місця стику екзонів
РНК – модифікації
Мутації (SNP)
Профіль генної експресії
Біологічна проблематика
Яким чином вирішуються ці питання?
Огляд методів
• кДНК, EST секвенування
• Мікроаррей
• RNA- seq
• Direct RNA-seq
Принцип секвенуванняза Сенгером
зразок: кДНК
стик екзонів,
сплайс варіанти,
SNP(single nucleotide polymorphysm)
Огляд методів
• кДНК, EST секвенування
• Мікроаррей
• RNA- seq
• Direct RNA-seq
Огляд методів
зразок : кДНК
аналіз експресії генів
комплементарна гібридизація з олігопослідовностями на чіпі
потребує знання послідовності транкрипту
• кДНК, EST секвенування
• Мікроаррей
• RNA- seq
• Direct RNA-seq
RNA- seqПряме визначення послідовності РНК повного
траскриптому>
сплайс-варіанти
SNP
профіль експресії генів
ідентифікація нових типів РНК
1 день:)
• Вступ:
Біологічна проблематика>
Огляд методів>
RNA-seq, визначення>
• Метод:
Платформи для RNA-seq>
Протокол>
Обробка данних>
IlluminaRNA-seq платформи
SOLIDRNA-seq платформи
Roche 454RNA-seq платформи
Порівняння платформ
Як же працюєRNA-seq?
Приготування бібліотеки:
Фрагментація РНК>
лігування з адаптерами>
cинтез кДНК>
ампліфікація>
- платформи використовуютьрізні принципи
Illumina SOLID Roche 454
Illumina – bridge amplification>
Roche 454, SOLID – emulsion PCR>
Секвенування
Секвенування
>мільйони коротких рідів – залежно від платформи
Накладання рідів на геном(транскриптом)
Збирання транскрипту de novo
Збірка послідовності
Накладання транкрипту на геном
>дозволяє виявлення нових та альтернативних транскриптів
Виявлення двох ізоформтранскрипту
• Вступ:
Біологічна проблематика>
Огляд методів>
RNA-seq, визначення>
• Метод:
Платформи для RNA-seq>
Протокол>
Обробка данних>
Обробка данних
Накладання рідів (сірим к.) на геном(транскриптом)/збірка de novo
Конструкція варіантів транкрипту
Аналіз графу
Готові ізоформи
Збірка послідовності
програми-збиральники:
> Bowtie – накладання на геном
Проблема: а нові транскрипти??
√ TopHat, splicemap,
mapsplice,
rum, star –
De novo – Trinity,
EBARDenovo..
Обробка данних
Накладання рідів (сірим к.) на геном(транскриптом)/збірка de novo
Конструкція варіантів транкрипту
Аналіз графу
>Готові ізоформи
Визначення профілю експресії(кількості транскрипту)
Кількість послідовностей, що збігаються з геномом залежить від:
Кількості транкрипту>
Його довжини
Наявності в ньому послідовностей, що часто зустрічаються в геномі
Данні нормалізують>
Обробка данних
RPKM (Reads Per Kilobase of exon model per
Million mapped reads)
FPKM (Fragments Per Kilobase of exon model per Million mapped reads (paired-end sequencing)
І тд…
Обробка данних
І на цьому все ще не закінчується..
>Chip-seqІмунопреципітація хроматину + секвенування
Chip-seq
ДНК – білок : транскрипційний фактор, тощо
В якій ділянці зв’ язуєтьсябілок?
Секвенування – NGS
білок
антитіло
Ампліфікація зв’язаних фрагментів
Фіксація в метанолі + формальдегід
База даних функціональних елементів в геномі людини
>Сайти зв’язування ТФ
>Модифікації гістонів
>Позиції нуклеосом
>ДНК-метилювання
>ДНКаза-чутливі елементи
Caenorhabditis elegans,Drosophila melanogaster