Download - bmb2010_g86
![Page 1: bmb2010_g86](https://reader033.vdocuments.us/reader033/viewer/2022060107/554948fab4c905054d8b5706/html5/thumbnails/1.jpg)
新型DNAシーケンサーからの
データ解析で
統合データベースを
実際に使い倒してみた。
![Page 2: bmb2010_g86](https://reader033.vdocuments.us/reader033/viewer/2022060107/554948fab4c905054d8b5706/html5/thumbnails/2.jpg)
注意
![Page 3: bmb2010_g86](https://reader033.vdocuments.us/reader033/viewer/2022060107/554948fab4c905054d8b5706/html5/thumbnails/3.jpg)
これからお話することはスライド含め全て
http://g86.dbcls.jp/このURLにアップロードされます
資料等はありませんがメモを取る必要もありません宜しくお願いします。
![Page 4: bmb2010_g86](https://reader033.vdocuments.us/reader033/viewer/2022060107/554948fab4c905054d8b5706/html5/thumbnails/4.jpg)
自己紹介
photo by http://www.photoxpress.com/stock-photos/man/blank/card/2694628
![Page 5: bmb2010_g86](https://reader033.vdocuments.us/reader033/viewer/2022060107/554948fab4c905054d8b5706/html5/thumbnails/5.jpg)
大学共同利用機関法人情報·システム研究機構ライフサイエンス統合データベースセンター「統合牧場」技術開発部第一課リサーチアシスタント
![Page 6: bmb2010_g86](https://reader033.vdocuments.us/reader033/viewer/2022060107/554948fab4c905054d8b5706/html5/thumbnails/6.jpg)
時間がないので省略します。
![Page 8: bmb2010_g86](https://reader033.vdocuments.us/reader033/viewer/2022060107/554948fab4c905054d8b5706/html5/thumbnails/8.jpg)
新型DNAシーケンサーからの
データ解析で
統合データベースを
実際に使い倒してみた。
![Page 9: bmb2010_g86](https://reader033.vdocuments.us/reader033/viewer/2022060107/554948fab4c905054d8b5706/html5/thumbnails/9.jpg)
公共RNA-Seqデータ 解析パイプライン
NCBI SRAgenomeDB
TopHatCufflinks
genomesequence NG-Seq data
genomeへのmapping発現量の計算
解析 / 可視化
![Page 10: bmb2010_g86](https://reader033.vdocuments.us/reader033/viewer/2022060107/554948fab4c905054d8b5706/html5/thumbnails/10.jpg)
公共RNA-Seqデータ 解析パイプライン
NCBI SRAgenomeDB
TopHatCufflinks
genomesequence NG-Seq data
genomeへのmapping発現量の計算
解析 / 可視化
検索性が悪い
![Page 11: bmb2010_g86](https://reader033.vdocuments.us/reader033/viewer/2022060107/554948fab4c905054d8b5706/html5/thumbnails/11.jpg)
公共RNA-Seqデータ 解析パイプライン
NCBI SRAgenomeDB
TopHatCufflinks
genomesequence NG-Seq data
genomeへのmapping発現量の計算
解析 / 可視化
検索性が悪い
計算が重い
![Page 12: bmb2010_g86](https://reader033.vdocuments.us/reader033/viewer/2022060107/554948fab4c905054d8b5706/html5/thumbnails/12.jpg)
公共RNA-Seqデータ 解析パイプライン
NCBI SRAgenomeDB
TopHatCufflinks
genomesequence NG-Seq data
genomeへのmapping発現量の計算
解析 / 可視化
検索性が悪い
計算が重い
良いツールがない
![Page 13: bmb2010_g86](https://reader033.vdocuments.us/reader033/viewer/2022060107/554948fab4c905054d8b5706/html5/thumbnails/13.jpg)
公共NGSデータを有効活用するために
我々が作った使い倒しツール。
公共NGSデータアーカイブSRAをもっと便利に!
RNA-seqデータのマッピングを高速に!
解析結果の解釈に便利な可視化ツールを!
![Page 14: bmb2010_g86](https://reader033.vdocuments.us/reader033/viewer/2022060107/554948fab4c905054d8b5706/html5/thumbnails/14.jpg)
公共NGSデータを有効活用するために
我々が作った使い倒しツール。
公共NGSデータアーカイブSRAをもっと便利に!
RNA-seqデータのマッピングを高速に!
解析結果の解釈に便利な可視化ツールを!
SRAs:
Surveys of Read Archives
![Page 15: bmb2010_g86](https://reader033.vdocuments.us/reader033/viewer/2022060107/554948fab4c905054d8b5706/html5/thumbnails/15.jpg)
公共NGSデータを有効活用するために
我々が作った使い倒しツール。
公共NGSデータアーカイブSRAをもっと便利に!
RNA-seqデータのマッピングを高速に!
解析結果の解釈に便利な可視化ツールを!
SRAs:
Surveys of Read Archives
gmap:
mapping分散ツール
![Page 16: bmb2010_g86](https://reader033.vdocuments.us/reader033/viewer/2022060107/554948fab4c905054d8b5706/html5/thumbnails/16.jpg)
公共NGSデータを有効活用するために
我々が作った使い倒しツール。
公共NGSデータアーカイブSRAをもっと便利に!
RNA-seqデータのマッピングを高速に!
解析結果の解釈に便利な可視化ツールを!
SRAs:
Surveys of Read Archives
gmap:
mapping分散ツール
HTML I/F “dancehall”
高機能web I/F “mtblm”
![Page 17: bmb2010_g86](https://reader033.vdocuments.us/reader033/viewer/2022060107/554948fab4c905054d8b5706/html5/thumbnails/17.jpg)
NCBI SRA indexSRAs: Survey of Read Archiveshttp://sra.dbcls.jp/
NCBI SRAのNGSデータ目次キーワード検索に加え文献検索が可能
![Page 18: bmb2010_g86](https://reader033.vdocuments.us/reader033/viewer/2022060107/554948fab4c905054d8b5706/html5/thumbnails/18.jpg)
NCBI SRA indexSRAs: Survey of Read Archiveshttp://sra.dbcls.jp/
NCBI SRAのNGSデータ目次キーワード検索に加え文献検索が可能
![Page 19: bmb2010_g86](https://reader033.vdocuments.us/reader033/viewer/2022060107/554948fab4c905054d8b5706/html5/thumbnails/19.jpg)
gmap : RNA-Seq マッピング分散ツール
http://github.com/mickey24/gmap
並列処理で高速化ファイルの入出力をより簡便に
複数ツール対応(bowtie, tophat, soap2)
1CPU multi CPU
![Page 20: bmb2010_g86](https://reader033.vdocuments.us/reader033/viewer/2022060107/554948fab4c905054d8b5706/html5/thumbnails/20.jpg)
gmap : RNA-Seq マッピング分散ツール
http://github.com/mickey24/gmap
並列処理で高速化ファイルの入出力をより簡便に
複数ツール対応(bowtie, tophat, soap2)
1CPU multi CPU計算時間は1/CP
U数!
![Page 21: bmb2010_g86](https://reader033.vdocuments.us/reader033/viewer/2022060107/554948fab4c905054d8b5706/html5/thumbnails/21.jpg)
gmap : RNA-Seq マッピング分散ツール
http://github.com/mickey24/gmap
並列処理で高速化ファイルの入出力をより簡便に
複数ツール対応(bowtie, tophat, soap2)
1CPU multi CPU計算時間は1/CP
U数!
※理論値です。
![Page 22: bmb2010_g86](https://reader033.vdocuments.us/reader033/viewer/2022060107/554948fab4c905054d8b5706/html5/thumbnails/22.jpg)
$ sort -k 6 -nr transcript.expr |\ head -100 >> result.txt
解析結果可視化ツールの開発
HTMLインターフェース“dancehall”
http://g86.dbcls.jp/~iNut/dancehall
簡単なShellScriptとHTMLだけ発現量でソート、ゲノムブラウザで確認
![Page 23: bmb2010_g86](https://reader033.vdocuments.us/reader033/viewer/2022060107/554948fab4c905054d8b5706/html5/thumbnails/23.jpg)
$ sort -k 6 -nr transcript.expr |\ head -100 >> result.txt
解析結果可視化ツールの開発
HTMLインターフェース“dancehall”
http://g86.dbcls.jp/~iNut/dancehall
簡単なShellScriptとHTMLだけ発現量でソート、ゲノムブラウザで確認
![Page 24: bmb2010_g86](https://reader033.vdocuments.us/reader033/viewer/2022060107/554948fab4c905054d8b5706/html5/thumbnails/24.jpg)
$ sort -k 6 -nr transcript.expr |\ head -100 >> result.txt
解析結果可視化ツールの開発
HTMLインターフェース“dancehall”
http://g86.dbcls.jp/~iNut/dancehall
簡単なShellScriptとHTMLだけ発現量でソート、ゲノムブラウザで確認
プログラム知識ゼロで作れます
。
![Page 25: bmb2010_g86](https://reader033.vdocuments.us/reader033/viewer/2022060107/554948fab4c905054d8b5706/html5/thumbnails/25.jpg)
簡単だけど⋯
photo by http://www.photoxpress.com/stock-photos/woman/pretty/handsome/997736
![Page 26: bmb2010_g86](https://reader033.vdocuments.us/reader033/viewer/2022060107/554948fab4c905054d8b5706/html5/thumbnails/26.jpg)
もっといいものが欲しいですよね?
photo by http://www.photoxpress.com/stock-photos/man/blank/card/2694628
![Page 27: bmb2010_g86](https://reader033.vdocuments.us/reader033/viewer/2022060107/554948fab4c905054d8b5706/html5/thumbnails/27.jpg)
解析結果をもっと見やすく!!
![Page 29: bmb2010_g86](https://reader033.vdocuments.us/reader033/viewer/2022060107/554948fab4c905054d8b5706/html5/thumbnails/29.jpg)
Ruby on Railsでウェブアプリケーション
解析結果
![Page 30: bmb2010_g86](https://reader033.vdocuments.us/reader033/viewer/2022060107/554948fab4c905054d8b5706/html5/thumbnails/30.jpg)
加工してデータベース化
Ruby on Railsでウェブアプリケーション
解析結果
![Page 31: bmb2010_g86](https://reader033.vdocuments.us/reader033/viewer/2022060107/554948fab4c905054d8b5706/html5/thumbnails/31.jpg)
加工してデータベース化
Ruby on Railsでウェブアプリケーション
解析結果
ウェブで表示可視化
![Page 32: bmb2010_g86](https://reader033.vdocuments.us/reader033/viewer/2022060107/554948fab4c905054d8b5706/html5/thumbnails/32.jpg)
実験区2
実験区3
実験区1
Project
複数の実験区それぞれの結果
![Page 33: bmb2010_g86](https://reader033.vdocuments.us/reader033/viewer/2022060107/554948fab4c905054d8b5706/html5/thumbnails/33.jpg)
実験区2
実験区3
実験区1
Project
複数の実験区それぞれの結果
DB
一つのデータベースに集約する
遺伝子IDの関連付け
![Page 34: bmb2010_g86](https://reader033.vdocuments.us/reader033/viewer/2022060107/554948fab4c905054d8b5706/html5/thumbnails/34.jpg)
実験区ごとの発現量情報の一覧
発現量の高い順に遺伝子ID 発現量 各項目の詳細
![Page 35: bmb2010_g86](https://reader033.vdocuments.us/reader033/viewer/2022060107/554948fab4c905054d8b5706/html5/thumbnails/35.jpg)
遺伝子IDごとの詳細画面例)NM_013456
http://g86.dbcls.jp/mtblm/m/NM_013456
![Page 36: bmb2010_g86](https://reader033.vdocuments.us/reader033/viewer/2022060107/554948fab4c905054d8b5706/html5/thumbnails/36.jpg)
発現量の比較
遺伝子IDごとの詳細画面例)NM_013456
http://g86.dbcls.jp/mtblm/m/NM_013456
![Page 37: bmb2010_g86](https://reader033.vdocuments.us/reader033/viewer/2022060107/554948fab4c905054d8b5706/html5/thumbnails/37.jpg)
発現量の比較
ゲノムブラウザー
遺伝子IDごとの詳細画面例)NM_013456
http://g86.dbcls.jp/mtblm/m/NM_013456
![Page 38: bmb2010_g86](https://reader033.vdocuments.us/reader033/viewer/2022060107/554948fab4c905054d8b5706/html5/thumbnails/38.jpg)
発現量の比較
ゲノムブラウザー
外部データベースのリンク
遺伝子IDごとの詳細画面例)NM_013456
http://g86.dbcls.jp/mtblm/m/NM_013456
![Page 39: bmb2010_g86](https://reader033.vdocuments.us/reader033/viewer/2022060107/554948fab4c905054d8b5706/html5/thumbnails/39.jpg)
外部データベースの利用
![Page 40: bmb2010_g86](https://reader033.vdocuments.us/reader033/viewer/2022060107/554948fab4c905054d8b5706/html5/thumbnails/40.jpg)
外部データベースの利用
MGI UCSCGenome BrowserMouse Genome Informatics
http://www.informatics.jax.org/javawi2/servlet/WIFetch?page=sequenceDetail&id=NM_013456
![Page 41: bmb2010_g86](https://reader033.vdocuments.us/reader033/viewer/2022060107/554948fab4c905054d8b5706/html5/thumbnails/41.jpg)
解析パイプラインの結果 からウェブアプリケーションを作成して可視化
複数の解析データを統合 遺伝子IDで関連付けて表示
今後パイプラインに組込予定
![Page 42: bmb2010_g86](https://reader033.vdocuments.us/reader033/viewer/2022060107/554948fab4c905054d8b5706/html5/thumbnails/42.jpg)
統合DB使い倒しの舞台裏。
http://www.flickr.com/photos/mikebabcock/279607814/
![Page 43: bmb2010_g86](https://reader033.vdocuments.us/reader033/viewer/2022060107/554948fab4c905054d8b5706/html5/thumbnails/43.jpg)
生物情報系の学生ではないので
前提知識ゼロマニュアルを読んでwe
bで検索して
悪戦苦闘次世代シークエンサーの
情報は
まだ少ない
![Page 44: bmb2010_g86](https://reader033.vdocuments.us/reader033/viewer/2022060107/554948fab4c905054d8b5706/html5/thumbnails/44.jpg)
もっと情報を共有したい!私達はこれまでの過程を全てWebで公開しています。
![Page 45: bmb2010_g86](https://reader033.vdocuments.us/reader033/viewer/2022060107/554948fab4c905054d8b5706/html5/thumbnails/45.jpg)
もっと情報を共有したい!私達はこれまでの過程を全てWebで公開しています。
g86.dbcls.jp
![Page 46: bmb2010_g86](https://reader033.vdocuments.us/reader033/viewer/2022060107/554948fab4c905054d8b5706/html5/thumbnails/46.jpg)
情報共有に役立つ
DBCLSでのプロジェクト。
ツール·サービス解説動画サイト「統合TV」
ライフサイエンス系Q&Aサイト
「ライフサイエンスQA」http://qa.lifesciencedb.jp/
http://togotv.dbcls.jp/
![Page 47: bmb2010_g86](https://reader033.vdocuments.us/reader033/viewer/2022060107/554948fab4c905054d8b5706/html5/thumbnails/47.jpg)
情報共有に役立つ
DBCLSでのプロジェクト。
ツール·サービス解説動画サイト「統合TV」
ライフサイエンス系Q&Aサイト
「ライフサイエンスQA」
ご意見ご要望お待ちしてます
http://qa.lifesciencedb.jp/
http://togotv.dbcls.jp/
![Page 48: bmb2010_g86](https://reader033.vdocuments.us/reader033/viewer/2022060107/554948fab4c905054d8b5706/html5/thumbnails/48.jpg)
詳しくはWeb もしくは ライフサイエンス統合データベー
スセンター
ブースまたはポスター会場で!
ご清聴ありがとうございました。
1P-0721配列としての遺伝子発現データの解析とその可視化
2P-1202次世代シーケンサデータを活用するための目次サイトの構築