bmb2010_g86

48
新型DNAシーケンサーからの データ解析で 統合データベースを 実際に使い倒してみた。

Upload: yag-ays

Post on 06-May-2015

2.077 views

Category:

Education


2 download

DESCRIPTION

Presentation at BMB 20107. Nov 2010 at Kobe Port Island by yag_ays and inutano.

TRANSCRIPT

Page 1: bmb2010_g86

新型DNAシーケンサーからの

データ解析で

統合データベースを

実際に使い倒してみた。

Page 2: bmb2010_g86

注意

Page 3: bmb2010_g86

これからお話することはスライド含め全て

http://g86.dbcls.jp/このURLにアップロードされます

資料等はありませんがメモを取る必要もありません宜しくお願いします。

Page 4: bmb2010_g86

自己紹介

photo by http://www.photoxpress.com/stock-photos/man/blank/card/2694628

Page 5: bmb2010_g86

大学共同利用機関法人情報·システム研究機構ライフサイエンス統合データベースセンター「統合牧場」技術開発部第一課リサーチアシスタント

Page 6: bmb2010_g86

時間がないので省略します。

Page 7: bmb2010_g86

http://g86.dbcls.jp/詳しくはこちら。

Page 8: bmb2010_g86

新型DNAシーケンサーからの

データ解析で

統合データベースを

実際に使い倒してみた。

Page 9: bmb2010_g86

  公共RNA-Seqデータ 解析パイプライン

NCBI SRAgenomeDB

TopHatCufflinks

genomesequence NG-Seq data

genomeへのmapping発現量の計算

解析 / 可視化

Page 10: bmb2010_g86

  公共RNA-Seqデータ 解析パイプライン

NCBI SRAgenomeDB

TopHatCufflinks

genomesequence NG-Seq data

genomeへのmapping発現量の計算

解析 / 可視化

検索性が悪い

Page 11: bmb2010_g86

  公共RNA-Seqデータ 解析パイプライン

NCBI SRAgenomeDB

TopHatCufflinks

genomesequence NG-Seq data

genomeへのmapping発現量の計算

解析 / 可視化

検索性が悪い

計算が重い

Page 12: bmb2010_g86

  公共RNA-Seqデータ 解析パイプライン

NCBI SRAgenomeDB

TopHatCufflinks

genomesequence NG-Seq data

genomeへのmapping発現量の計算

解析 / 可視化

検索性が悪い

計算が重い

良いツールがない

Page 13: bmb2010_g86

公共NGSデータを有効活用するために

我々が作った使い倒しツール。

公共NGSデータアーカイブSRAをもっと便利に!

RNA-seqデータのマッピングを高速に!

解析結果の解釈に便利な可視化ツールを!

Page 14: bmb2010_g86

公共NGSデータを有効活用するために

我々が作った使い倒しツール。

公共NGSデータアーカイブSRAをもっと便利に!

RNA-seqデータのマッピングを高速に!

解析結果の解釈に便利な可視化ツールを!

SRAs:

Surveys of Read Archives

Page 15: bmb2010_g86

公共NGSデータを有効活用するために

我々が作った使い倒しツール。

公共NGSデータアーカイブSRAをもっと便利に!

RNA-seqデータのマッピングを高速に!

解析結果の解釈に便利な可視化ツールを!

SRAs:

Surveys of Read Archives

gmap:

mapping分散ツール

Page 16: bmb2010_g86

公共NGSデータを有効活用するために

我々が作った使い倒しツール。

公共NGSデータアーカイブSRAをもっと便利に!

RNA-seqデータのマッピングを高速に!

解析結果の解釈に便利な可視化ツールを!

SRAs:

Surveys of Read Archives

gmap:

mapping分散ツール

HTML I/F “dancehall”

高機能web I/F “mtblm”

Page 25: bmb2010_g86

簡単だけど⋯

photo by http://www.photoxpress.com/stock-photos/woman/pretty/handsome/997736

Page 26: bmb2010_g86

もっといいものが欲しいですよね?

photo by http://www.photoxpress.com/stock-photos/man/blank/card/2694628

Page 27: bmb2010_g86

解析結果をもっと見やすく!!

Page 28: bmb2010_g86

解析結果をもっと見やすく!!

http://g86.dbcls.jp/mtblm

Page 29: bmb2010_g86

Ruby on Railsでウェブアプリケーション

解析結果

Page 30: bmb2010_g86

加工してデータベース化

Ruby on Railsでウェブアプリケーション

解析結果

Page 31: bmb2010_g86

加工してデータベース化

Ruby on Railsでウェブアプリケーション

解析結果

ウェブで表示可視化

Page 32: bmb2010_g86

実験区2

実験区3

実験区1

Project

複数の実験区それぞれの結果

Page 33: bmb2010_g86

実験区2

実験区3

実験区1

Project

複数の実験区それぞれの結果

DB

一つのデータベースに集約する

遺伝子IDの関連付け

Page 34: bmb2010_g86

実験区ごとの発現量情報の一覧

発現量の高い順に遺伝子ID 発現量 各項目の詳細

Page 35: bmb2010_g86

遺伝子IDごとの詳細画面例)NM_013456

http://g86.dbcls.jp/mtblm/m/NM_013456

Page 36: bmb2010_g86

発現量の比較

遺伝子IDごとの詳細画面例)NM_013456

http://g86.dbcls.jp/mtblm/m/NM_013456

Page 37: bmb2010_g86

発現量の比較

ゲノムブラウザー

遺伝子IDごとの詳細画面例)NM_013456

http://g86.dbcls.jp/mtblm/m/NM_013456

Page 38: bmb2010_g86

発現量の比較

ゲノムブラウザー

外部データベースのリンク

遺伝子IDごとの詳細画面例)NM_013456

http://g86.dbcls.jp/mtblm/m/NM_013456

Page 39: bmb2010_g86

外部データベースの利用

Page 41: bmb2010_g86

解析パイプラインの結果  からウェブアプリケーションを作成して可視化

複数の解析データを統合  遺伝子IDで関連付けて表示

今後パイプラインに組込予定

Page 42: bmb2010_g86

統合DB使い倒しの舞台裏。

http://www.flickr.com/photos/mikebabcock/279607814/

Page 43: bmb2010_g86

生物情報系の学生ではないので

前提知識ゼロマニュアルを読んでwe

bで検索して

悪戦苦闘次世代シークエンサーの

情報は

まだ少ない

Page 44: bmb2010_g86

もっと情報を共有したい!私達はこれまでの過程を全てWebで公開しています。

Page 45: bmb2010_g86

もっと情報を共有したい!私達はこれまでの過程を全てWebで公開しています。

g86.dbcls.jp

Page 46: bmb2010_g86

情報共有に役立つ

DBCLSでのプロジェクト。

ツール·サービス解説動画サイト「統合TV」

ライフサイエンス系Q&Aサイト

「ライフサイエンスQA」http://qa.lifesciencedb.jp/

http://togotv.dbcls.jp/

Page 47: bmb2010_g86

情報共有に役立つ

DBCLSでのプロジェクト。

ツール·サービス解説動画サイト「統合TV」

ライフサイエンス系Q&Aサイト

「ライフサイエンスQA」

ご意見ご要望お待ちしてます

http://qa.lifesciencedb.jp/

http://togotv.dbcls.jp/

Page 48: bmb2010_g86

詳しくはWeb もしくは ライフサイエンス統合データベー

スセンター

ブースまたはポスター会場で!

ご清聴ありがとうございました。

1P-0721配列としての遺伝子発現データの解析とその可視化

2P-1202次世代シーケンサデータを活用するための目次サイトの構築