bmb2010_g86
DESCRIPTION
Presentation at BMB 20107. Nov 2010 at Kobe Port Island by yag_ays and inutano.TRANSCRIPT
新型DNAシーケンサーからの
データ解析で
統合データベースを
実際に使い倒してみた。
注意
これからお話することはスライド含め全て
http://g86.dbcls.jp/このURLにアップロードされます
資料等はありませんがメモを取る必要もありません宜しくお願いします。
自己紹介
photo by http://www.photoxpress.com/stock-photos/man/blank/card/2694628
大学共同利用機関法人情報·システム研究機構ライフサイエンス統合データベースセンター「統合牧場」技術開発部第一課リサーチアシスタント
時間がないので省略します。
新型DNAシーケンサーからの
データ解析で
統合データベースを
実際に使い倒してみた。
公共RNA-Seqデータ 解析パイプライン
NCBI SRAgenomeDB
TopHatCufflinks
genomesequence NG-Seq data
genomeへのmapping発現量の計算
解析 / 可視化
公共RNA-Seqデータ 解析パイプライン
NCBI SRAgenomeDB
TopHatCufflinks
genomesequence NG-Seq data
genomeへのmapping発現量の計算
解析 / 可視化
検索性が悪い
公共RNA-Seqデータ 解析パイプライン
NCBI SRAgenomeDB
TopHatCufflinks
genomesequence NG-Seq data
genomeへのmapping発現量の計算
解析 / 可視化
検索性が悪い
計算が重い
公共RNA-Seqデータ 解析パイプライン
NCBI SRAgenomeDB
TopHatCufflinks
genomesequence NG-Seq data
genomeへのmapping発現量の計算
解析 / 可視化
検索性が悪い
計算が重い
良いツールがない
公共NGSデータを有効活用するために
我々が作った使い倒しツール。
公共NGSデータアーカイブSRAをもっと便利に!
RNA-seqデータのマッピングを高速に!
解析結果の解釈に便利な可視化ツールを!
公共NGSデータを有効活用するために
我々が作った使い倒しツール。
公共NGSデータアーカイブSRAをもっと便利に!
RNA-seqデータのマッピングを高速に!
解析結果の解釈に便利な可視化ツールを!
SRAs:
Surveys of Read Archives
公共NGSデータを有効活用するために
我々が作った使い倒しツール。
公共NGSデータアーカイブSRAをもっと便利に!
RNA-seqデータのマッピングを高速に!
解析結果の解釈に便利な可視化ツールを!
SRAs:
Surveys of Read Archives
gmap:
mapping分散ツール
公共NGSデータを有効活用するために
我々が作った使い倒しツール。
公共NGSデータアーカイブSRAをもっと便利に!
RNA-seqデータのマッピングを高速に!
解析結果の解釈に便利な可視化ツールを!
SRAs:
Surveys of Read Archives
gmap:
mapping分散ツール
HTML I/F “dancehall”
高機能web I/F “mtblm”
NCBI SRA indexSRAs: Survey of Read Archiveshttp://sra.dbcls.jp/
NCBI SRAのNGSデータ目次キーワード検索に加え文献検索が可能
NCBI SRA indexSRAs: Survey of Read Archiveshttp://sra.dbcls.jp/
NCBI SRAのNGSデータ目次キーワード検索に加え文献検索が可能
gmap : RNA-Seq マッピング分散ツール
http://github.com/mickey24/gmap
並列処理で高速化ファイルの入出力をより簡便に
複数ツール対応(bowtie, tophat, soap2)
1CPU multi CPU
gmap : RNA-Seq マッピング分散ツール
http://github.com/mickey24/gmap
並列処理で高速化ファイルの入出力をより簡便に
複数ツール対応(bowtie, tophat, soap2)
1CPU multi CPU計算時間は1/CP
U数!
gmap : RNA-Seq マッピング分散ツール
http://github.com/mickey24/gmap
並列処理で高速化ファイルの入出力をより簡便に
複数ツール対応(bowtie, tophat, soap2)
1CPU multi CPU計算時間は1/CP
U数!
※理論値です。
$ sort -k 6 -nr transcript.expr |\ head -100 >> result.txt
解析結果可視化ツールの開発
HTMLインターフェース“dancehall”
http://g86.dbcls.jp/~iNut/dancehall
簡単なShellScriptとHTMLだけ発現量でソート、ゲノムブラウザで確認
$ sort -k 6 -nr transcript.expr |\ head -100 >> result.txt
解析結果可視化ツールの開発
HTMLインターフェース“dancehall”
http://g86.dbcls.jp/~iNut/dancehall
簡単なShellScriptとHTMLだけ発現量でソート、ゲノムブラウザで確認
$ sort -k 6 -nr transcript.expr |\ head -100 >> result.txt
解析結果可視化ツールの開発
HTMLインターフェース“dancehall”
http://g86.dbcls.jp/~iNut/dancehall
簡単なShellScriptとHTMLだけ発現量でソート、ゲノムブラウザで確認
プログラム知識ゼロで作れます
。
簡単だけど⋯
photo by http://www.photoxpress.com/stock-photos/woman/pretty/handsome/997736
もっといいものが欲しいですよね?
photo by http://www.photoxpress.com/stock-photos/man/blank/card/2694628
解析結果をもっと見やすく!!
Ruby on Railsでウェブアプリケーション
解析結果
加工してデータベース化
Ruby on Railsでウェブアプリケーション
解析結果
加工してデータベース化
Ruby on Railsでウェブアプリケーション
解析結果
ウェブで表示可視化
実験区2
実験区3
実験区1
Project
複数の実験区それぞれの結果
実験区2
実験区3
実験区1
Project
複数の実験区それぞれの結果
DB
一つのデータベースに集約する
遺伝子IDの関連付け
実験区ごとの発現量情報の一覧
発現量の高い順に遺伝子ID 発現量 各項目の詳細
遺伝子IDごとの詳細画面例)NM_013456
http://g86.dbcls.jp/mtblm/m/NM_013456
発現量の比較
遺伝子IDごとの詳細画面例)NM_013456
http://g86.dbcls.jp/mtblm/m/NM_013456
発現量の比較
ゲノムブラウザー
遺伝子IDごとの詳細画面例)NM_013456
http://g86.dbcls.jp/mtblm/m/NM_013456
発現量の比較
ゲノムブラウザー
外部データベースのリンク
遺伝子IDごとの詳細画面例)NM_013456
http://g86.dbcls.jp/mtblm/m/NM_013456
外部データベースの利用
外部データベースの利用
MGI UCSCGenome BrowserMouse Genome Informatics
http://www.informatics.jax.org/javawi2/servlet/WIFetch?page=sequenceDetail&id=NM_013456
解析パイプラインの結果 からウェブアプリケーションを作成して可視化
複数の解析データを統合 遺伝子IDで関連付けて表示
今後パイプラインに組込予定
統合DB使い倒しの舞台裏。
http://www.flickr.com/photos/mikebabcock/279607814/
生物情報系の学生ではないので
前提知識ゼロマニュアルを読んでwe
bで検索して
悪戦苦闘次世代シークエンサーの
情報は
まだ少ない
もっと情報を共有したい!私達はこれまでの過程を全てWebで公開しています。
もっと情報を共有したい!私達はこれまでの過程を全てWebで公開しています。
g86.dbcls.jp
情報共有に役立つ
DBCLSでのプロジェクト。
ツール·サービス解説動画サイト「統合TV」
ライフサイエンス系Q&Aサイト
「ライフサイエンスQA」http://qa.lifesciencedb.jp/
http://togotv.dbcls.jp/
情報共有に役立つ
DBCLSでのプロジェクト。
ツール·サービス解説動画サイト「統合TV」
ライフサイエンス系Q&Aサイト
「ライフサイエンスQA」
ご意見ご要望お待ちしてます
http://qa.lifesciencedb.jp/
http://togotv.dbcls.jp/
詳しくはWeb もしくは ライフサイエンス統合データベー
スセンター
ブースまたはポスター会場で!
ご清聴ありがとうございました。
1P-0721配列としての遺伝子発現データの解析とその可視化
2P-1202次世代シーケンサデータを活用するための目次サイトの構築