バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · rasmol...

80
バイオインフォマティクス基礎講座 分子系統解析とタンパク質立体構造解析 川端 奈良先端科学技術大学院大学・情報科 学研究科・准教授 2009.9.12

Upload: others

Post on 01-Sep-2019

3 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

バイオインフォマティクス基礎講座分子系統解析とタンパク質立体構造解析

川端 猛

奈良先端科学技術大学院大学情報科学研究科准教授

2009912

「配列解析」のキーワード(蛋白質機能予測)

bull タンパク質機能予測(膜貫通部位予測細胞内局在予測)

bull RNA二次構造予測

タンパク質の構造性質による大きな分類タンパク質の例 配列上の特徴

水溶性タンパク質soluble protein

球状タンパク質globular protein

多くの酵素抗体転写因子など

疎水性親水性のアミノ酸がバランスよく含まれている

不定形タンパク質Intrinsically disordered protein

真核生物の転写因子の非ドメイン領域など

親水性アミノ酸が多い特にEPQSRKが多い

膜タンパク質membraneprotein

レセプタートランスポーターなど

疎水性アミノ酸が多く連続する疎水性アミノ酸領域(膜貫通へリックス)が観察されることが多い

球状タンパク質の疎水性アミノ酸

1mbdAMyoglobin

疎水性相互作用(hydrophobic interaction) 水分子と親和性の少ない非極性(non-polar疎水性)基が水溶液中で互いに集まろうとする

相互作用電気や磁気と異なり符号はなく疎水性どうしのものは相手を問わず集合する

5p21rasp21

7pcyAplastocyanin

1timATriose phosphate isomerase

疎水基ACILMFWV親水基RNDEQGHKPSTY

球状タンパク質では分子内部に疎水性アミノ酸分子表面に親水性アミノ酸が分布する傾向にある

疎水性指標による内外予測

summinus=

++

=w

wk

wiSeqKDw

iV ][12

1][

I 45 V 42 L 38 F 28 C 25 M 19 A 18 G -04 T -07 S -08 W -09 Y -13 P -16 H -32 Q -35N -35 E -35 D -35 K -39 R -45

Kyte and Doolittle(1982)の疎水性指標

方法 配列を横軸にとって縦軸に

対応する疎水性指標をプロット 前後数残基でスムージング

httpkrexpasyorgtoolsprotscalehtml

予測結果と実際の埋もれ度との比較1mbdMyoglobin

不定形タンパク質intrinsically disordered protein

親水性アミノ酸が多く疎水性アミノ酸が少ないため天然状態でもコンパクトに折たたまらない

球状タンパク質ドメインをつなぐ領域としてよく見られる

親水性アミノ酸の中でもEPQSRK

真核生物に多く原核生物には少ない

転写因子に特に多くみられる

生物学的な機能はよくわかっていないがタンパク質間相互作用に重要な働きをするといわれている

膜タンパク質

膜タンパク質脂質二重膜に埋没して機能するタンパク質

脂質頭部(親水性)

脂質尾部(疎水性)

性質(1)疎水的な脂質尾部と相互作用するためタンパク質表面には疎水性アミノ酸が多い

(2)水に溶けにくく凝集しやすい

(3)多くは膜貫通へリックスを持つ

(4)膜貫通へリックスの長さは15-30アミノ酸ぐらいアミノ酸配列からも連続した疎水性アミノ酸領域としてある程度予測可能

膜タンパク質

アミノ酸配列から膜貫通へリックスを予測するサーバSOSUIサーバhttpbpnuapnagoya-uacjpsosui

他にTMHMM Tmpredなどがある

H19 問71

1 一般に表面ではアミノ酸の挿入欠失や置換が起こりやすく内部では起こりにくい

2 生物種間で比較した時に保存されているアミノ酸がタンパク質表面で集中している領域は他のタンパク質やリガンドとの結合に関与していると予測できる

3 DNAと相互作用するタンパク質の場合DNAとの結合面は負

電荷を持つアミノ酸が集中することから容易に予測できる4 一般に表面には溶媒との相互作用のため極性基をもつアミノ

酸が多く内部は疎水性アミノ酸による疎水コアを形成していることが多い

次に示した球状タンパク質の性質に関する記述の中で不適切なものを一つ選べ

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問71

1 一般に表面ではアミノ酸の挿入欠失や置換が起こりやすく内部では起こりにくい

2 生物種間で比較した時に保存されているアミノ酸がタンパク質表面で集中している領域は他のタンパク質やリガンドとの結合に関与していると予測できる

3 DNAと相互作用するタンパク質の場合DNAとの結合面は負

電荷を持つアミノ酸が集中することから容易に予測できる4 一般に表面には溶媒との相互作用のため極性基をもつアミノ

酸が多く内部は疎水性アミノ酸による疎水コアを形成していることが多い

次に示した球状タンパク質の性質に関する記述の中で不適切なものを一つ選べ

DNAやRNAなどの核酸はリン酸基にマイナスの電荷を持っているよって核酸に

結合する蛋白質は表面にプラスの電荷を持っているものが多い平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

「タンパク質構造解析」のキーワード(構造比較)

bull 立体構造表現(コンタクトマップラマチャンドランマップ)

bull 構造比較

bull 重ね合わせbull RMSDbull 構造アライメント

bull 構造モチーフ

bull 構造分類

立体構造の決定法X線結晶解析

NMR(核磁気共鳴法)

大量発現精製結晶化

X線回折強度の測定

原子モデルの構築

原子モデルの精密化

核磁気共鳴解析(NOE解析帰属と距離拘束の抽出)

3次元電子密度マップ

原子間距離拘束

(1)多数分子の平均構造の観察(精製が重要 大きな分子複合体はより難しくなる)(2)発現精製結晶化のステップで各タンパク質によって実験条件の調整が必須(3)実験データの収集原子モデル構築の段階で計算機の支援が不可欠

大量発現精製

原子モデルの構築

原子モデルの精密化

MET 1

GLN 2

1

2

34

56

7 8

9

10

11

12

13

14

15

1617

18 19 20

21

HEADER UBIQUITIN 17-APR-92 1AAR COMPND DI-UBIQUITINSOURCE BOVINE (BOS TAURUS) ERYTHROCYTESAUTHOR WJCOOKLCJEFFREYMCARSONZCHENCMPICKART

原子番号 残基名 鎖識別子原子名 残基番号 X座標 Y座標 Z座標 占有率 温度因子

ATOM 1 N MET A 1 15493 30088 14694 100 836ATOM 2 CA MET A 1 14600 29031 15110 100 815ATOM 3 C MET A 1 15476 27793 15419 100 930ATOM 4 O MET A 1 16571 27561 14871 100 896ATOM 5 CB MET A 1 13500 28837 14105 100 989ATOM 6 CG MET A 1 13823 27997 12931 100 1021ATOM 7 SD MET A 1 12312 27711 11891 100 1033ATOM 8 CE MET A 1 13174 26595 10726 100 730ATOM 9 N GLN A 2 14968 27014 16326 100 975ATOM 10 CA GLN A 2 15552 25806 16852 100 1192ATOM 11 C GLN A 2 15000 24553 16168 100 1171ATOM 12 O GLN A 2 13787 24387 16086 100 1000 ATOM 13 CB GLN A 2 15368 25715 18386 100 1239ATOM 14 CG GLN A 2 15858 24413 19051 100 1400ATOM 15 CD GLN A 2 15676 24587 20561 100 1559ATOM 16 OE1 GLN A 2 16525 25209 21205 100 1867ATOM 17 NE2 GLN A 2 14564 24203 21152 100 1539ATOM 18 N ILE A 3 15960 23745 15687 100 1179 ATOM 19 CA ILE A 3 15593 22437 15130 100 1214ATOM 20 C ILE A 3 16491 21342 15720 100 1199ATOM 21 O ILE A 3 17701 21540 15767 100 1291

PDB ID

wwPDB(World Wide Protein Data Bank) 立体構造データの収集するデータバンク

RCSB PDB httpwwwrcsborgpdbPDBフォーマット MSD EBI httpwwwebiacukmsd

PDBj httpwwwpdbjorg

PDBは1971年に設立

立体構造描画のフリーウエアシェアウエアソフト名 WebSite 対応機種 特徴

RasMol wwwopenrasmolorg Win Mac Linux(ソース公開)

独自の高速描画アルゴリズムを用い非力なハードでも同様に高速描画が可能コマンド言語は強力で多機能基本的な描画法をカバーするが分子表面の描画はできない描画の質はやや低い

Chime wwwmdlchimecom Win Mac RasMolをベースにしたWEBブラウザ内で動作するプラグイン分子表面表示など描画機能はRasMolより拡張分子描画機能を持ったWEBページを作れる

Jmol jmolsourceforgenet Win Mac Linux(ソース公開)

Java Applet によりWEBブラウザ内で動作Chimeと同様に分子描画機能を持ったWEBページを作れるJREをインストールする必要

PyMOL pymolsourceforgenet

Win Mac Linux

OpenGLを用いた質の高い描画Python言語で開発されておりソースも公開Python言語を用いた機能

拡張も可能

CHIMERA wwwcglucsfeduchimera

Win Mac Linux

OpenGLを用いた質の高い描画電顕画像などの多

様なデータの取り込みドッキング静電計算などのインタフェース有りPython言語を用いた機能拡張

VMD wwwksuiuceduResearchvmd

Win Mac Linux

OpenGLを用いた質の高い描画Tcl言語を用いた機

能拡張が可能分子動力学の可視化を主要目的として幅広い機能

MolScript wwwavatarsemolscrit

Linux(ソース公開)

主にリボン図の描画用のソフトGUIを持たずコマンドラインでPDBファイルをPSファイル等に変換

Swiss PDB Viewer

auexpasyorgspdbv Win Mac Linux

OpenGLを用いた質の高い描画幅広い機能をサ

ポートしているがアップデートは活発でない

H19 問51

タンパク質などの生体高分子をコンピュータで表示するためのソフトウェア名として適切でないものを選択肢の中から一つ選べ

1RasMol2Chime3TMHMM4Swiss-PdbViewer

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問51

タンパク質などの生体高分子をコンピュータで表示するためのソフトウェア名として適切でないものを選択肢の中から一つ選べ

1RasMol2Chime3TMHMM4Swiss-PdbViewer

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問59

タンパク質の立体構造のグラフィックス表示プログラムではないものを選択肢の中から一つ選べ

1Chime2PyMol3MEGA4MolScript

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問59

タンパク質の立体構造のグラフィックス表示プログラムではないものを選択肢の中から一つ選べ

1Chime2PyMol3MEGA4MolScript

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

PDBコード1fxd(ferredoxin II) Rasmol Chimeプラグインで描画

立体構造の描画スタイル

ワイアフレーム ボールスティック 空間充填

バックボーン リボン 分子表面

1 234

N

H C

O

Ala(A)(疎水性)

Phe(F)(疎水性)

Cys(C)(親水性)

Asp(D)(親水性)

Val(V)(疎水性)

Thr(親水性)

様々な物理化学的な性質を持った側鎖が主鎖のペプチド結合で連なる

Leu(L)(疎水性)

蛋白質ペプチド結合したアミノ酸群

アミノ酸は全部で20種類

I VL

M FYW H

KR

D E

P NSA Q

CG T

疎水性 親水性

脂肪族

芳香族正荷電

負荷電

N末

C末

変性状態(D) 天然状態(N)

フォールディング(折り畳み)という現象

非常に多種の構造の集合大きく広がっている

ほとんど唯一の構造小さくコンパクトに折りたたまっている

温度や変性剤濃度によって可逆に変化

折り畳みは原則としてその蛋白質以外の分子の介助を必要としない

アミノ酸配列の情報だけで天然状態の立体構造が決定される

どうやってコンパクトになるか rarr (1)主鎖の水素結合(2)側鎖間の疎水性相互作用

あるアミノ酸配列がどうやって一つの構造を決めるのか

3次元座標の差のスコア(RMSD)

並進ベクトルt を引いたあと回転行列R をかける

t 二つの分子の重心をあわせるように決めるR 2つの原子群の相関を 大化する行列rarr(1)特異値分解で導出

(2)四元数表現により 適な回転をLagrange未定乗数法で決定

sum=

minusminus=N

iiiN

RMSD1

2)](R[1 tyx

21

20

1

2

3

4

5

1xdaA

1

23

4

21

20

5

yi

)(R ty minusi

xi

1

23

4

21

20

5

原子の対応付けがわかっているとする

RMSD 適に重ね合わせたときのXYZ座標の差(Root Mean Square Deviation)

1benA

WKabsch Acta CrystA 32922-923(1976) 34827-828(1978)ADMclachlan JMolBiol 12874-77 (1979)Charles FF Karney ldquoQuaternions in molecular modelingrdquo E-print arXivphysics0506177

xi分子Xのi番目の原子の位置ベクトル yi分子Yのi番目の原子の位置ベクトル

距離の差のスコア (DRMS)

( )sumsum= ge

minusminus

=N

i

N

ij

Yij

Xij DD

NNDRMS

1

2

)1(2

21

20

1

2

3

4

5

YijD

XijD

1

23

4

21

20

5

yixi

DRMS 対応する原子ペアの距離の差(Distance-based RMSD)

原子の対応付けがわかっているとする

重ね合わせは不要なので計算は簡単

3次元によらない2次元や結合情報にも拡張できる

鏡像の区別はできない

1benA

計算が簡単なので高速な構造比較のアルゴリズムの基盤として使われる

1xdaA

H19 問73立体構造の似ている2つのタンパク質間で対応関係にある原子が分かっている場合にはRMSD(Root Mean Square Deviation)と呼ばれる数値を計算することにより立体構造の重なり合いの程度を数値化することができるRMSDは全ての対応する原子間の距離を

2乗した値の平均値(相加平均)にルートをとったものとして定義されるあるタンパク質における6つの原子ABCDEFと別のタンパク質の6つの原子

ArsquoBrsquoCrsquoDrsquoErsquoFrsquoについて対応関係が分かっており互いにもっともよく重なるように回転して重ねた時の対応原子間の距離は以下の表のようになったこの表からB-Brsquo C-Crsquo D-Drsquo E-Ersquoは正確に重なったが他の原子間ではずれが見られることがわかるここで6つの原子に対するRMSD値はいくらになるか選択肢の中からもっとも適切な値を一つ選べただ

し原子間距離の単位は考慮しないものとする

対応原子 距離

原子A―原子Arsquo 20

原子B―原子Brsquo 00

原子C―原子Crsquo 00

原子D―原子Crsquo 10

原子E―原子Crsquo 00

原子F―原子Crsquo 10

1 052 0663 104 133

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問73立体構造の似ている2つのタンパク質間で対応関係にある原子が分かっている場合にはRMSD(Root Mean Square Deviation)と呼ばれる数値を計算することにより立体構造の重なり合いの程度を数値化することができるRMSDは全ての対応する原子間の距離を

2乗した値の平均値(相加平均)にルートをとったものとして定義されるあるタンパク質における6つの原子ABCDEFと別のタンパク質の6つの原子

ArsquoBrsquoCrsquoDrsquoErsquoFrsquoについて対応関係が分かっており互いにもっともよく重なるように回転して重ねた時の対応原子間の距離は以下の表のようになったこの表からB-Brsquo C-Crsquo D-Drsquo E-Ersquoは正確に重なったが他の原子間ではずれが見られることがわかるここで6つの原子に対するRMSD値はいくらになるか選択肢の中からもっとも適切な値を一つ選べただ

し原子間距離の単位は考慮しないものとする

対応原子 距離

原子A―原子Arsquo 20

原子B―原子Brsquo 00

原子C―原子Crsquo 00

原子D―原子Crsquo 10

原子E―原子Crsquo 00

原子F―原子Crsquo 10

1 052 0663 104 133

RMSDは 適に重ね合わせたときの

「ずれの二乗の平均のルート」であるしたがってずれの二乗平均は

(22+0+0+1+0+1)6=66=1これのルートをとるとradic1=1

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

1

2

3

4

56

7

8

9

10

11

主鎖の水素結合αへリックス

1

2

34

56

78

9

10

11

O

N

CHN

N

H

H

CO Cα

i

i+3

i+4

HN O C

Cαi-1

i番目のCOがi+4番目のNHと水素結合を形成

36残基が1周期の右巻きらせん

NHO=Cが同じ向きに並ぶため

へリックス全体に電気双極子が発生

N末C末

ー +

主鎖の水素結合逆平行βシート

βターン

βターン

βヘアピン

βヘアピン

伸びた構造の1本1本をβストランドと呼ぶ二本以上のβストランドがシート状に並んだ構造をβシートと呼ぶ

βストランド

βストランド

βストランド

主鎖の水素結合平行βシート

βminusαminusβモチーフ

平行βシートがαへリックスで接続された構造モチーフ

βストランド

βストランド

βストランド

伸びた構造の1本1本をβストランドと呼ぶ二本以上のβストランドがシート状に並んだ構造をβシートと呼ぶ

Cαi

Cαi+1Cα

i-1φ ψ

ペプチド結合の平面性とφψの定義

主鎖の原子のXYZ座標はφψの2つ

の角度でほとんど記述できる

φψの角度を2次元にプロットしたものをラマチャンドランプロット(Ramachandran plot)という点が集中する領域は2次構造とよく対応

点が現れない領域は主鎖の原子が衝突する

βシート

αへリックス

左巻きへリックス

平面平面

φ

ψ

H19 問74タンパク質の主鎖に添って定義される二面角のうちφ(窒素原子と炭素原子の間の二面角)とψ(α炭素原子とカルボニル基の炭素原子の間の二面角)の値を各残

基ごとに計算して二次元にプロットしたものをラマチャンドランプロットと呼ぶ以下に示したラマチャンドランプロットに対する説明文の中でもっとも適切なものを一つ選べ

1 (a)(b)はともにαへリックスの領域である2 (a)(b)はともにβストランドの領域である3 (a)はαへリックス(b)はβストランドの領

域である4 (a)はβストランド(b)はαへリックスの領

域である

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問74タンパク質の主鎖に添って定義される二面角のうちφ(窒素原子と炭素原子の間の二面角)とψ(α炭素原子とカルボニル基の炭素原子の間の二面角)の値を各残

基ごとに計算して二次元にプロットしたものをラマチャンドランプロットと呼ぶ以下に示したラマチャンドランプロットに対する説明文の中でもっとも適切なものを一つ選べ

1 (a)(b)はともにαへリックスの領域である2 (a)(b)はともにβストランドの領域である3 (a)はαへリックス(b)はβストランドの領

域である4 (a)はβストランド(b)はαへリックスの領

域である

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

トポロジー図によるβシートの表現

4 23

N

C

1

1ubq (UbiquitinHumand151)

N

C123 4 5 6

1n8k (Alchol dehydrogenase E chain Horse c21)

ロスマンフォールド

βターン

βターン

1cauA1rhdA domain2

TOPSプログラムによる表示httpwwwtopsleedsacuk

1timA

はαへリックスはβストランドとなりあうの向きで平行逆平行を示す

コンタクトマップ

1ubq

C

4 23

N

1

縦横に残基を配置しある残基ペアのCα原子間の距離が10Å以下であれば対応するピクセルに色を塗る

分子描画ソフトVMDを用いて作成

平行のストランド間は方向逆平行ストランド間は方向に線分が観察される

N

C

N C

逆平行

逆平行

平行

αへリックスは太めの対角上の線分

へリックス

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから1か3コンタクトマップから平行シートしかないことがわかるため1であることがわかる

αβ5

αβ3

α

β4α

β1αβ2 β2

β1β3β4

β5

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから2か4コンタクトマップから平行シートしかないことがわかるため2であることがわかる

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

配列比較によるタンパク質分類1970年代から配列の一致度(sequence identity)に基づいてグループを作る作業が

行われてきた

どのくらいの類似性で一つにまとめるかは様々な考えがあるが少なくとも「相同なタンパク質群」を一つのグループにまとめるべき

ファミリー(family 族)

進化的に関係のある(相同な)タンパク質グループのこと

複数のファミリーがあつまった大きなグループ スーパーファミリー(superfamily clan)

一つのファミリーの中の小さなグループ サブファミリー(subfamily)

family

subfamily superfamily

ドメイン単位による分類

A2 B2

B3 C3

A1

配列1

配列2

配列3

配列の部分どうしだけが類似していた場合 部分一致を重視するとすべて一つのグループになるがhellip

配列1

配列2 配列3

Aを共有

Bを共有

1と2が類似2と3が類似していても1と3は類似していない

ドメインに分割すると

A1

A2

B2

B3

C3

A2 B2

B3 C3

A1

きれいに分類することができる

Pfam 蛋白質ファミリのデータベース各蛋白質ファミリのマルチプル

アライメント HMMなどを集めたデータベース

httppfamsangeracuk

Pkinase_Tyrドメインをもつタンパク質の例

ABL_HUMAN

BTK_HUMAN

ILK_HUMAN

MERTK_HUMAN

PGFRB_HUMAN

HCK_HUMAN

Family Pkinase_Tyr (PF07714) Protein tyrosine kinase

Pfamデータベース(httppfamsangeracukSoftwarePfam)からの引用

ドメイン構造と疎水性の関係Tyrosine protein kinase HCK (1ad5A HCK_HUMAN)

SH3 domain

SH2 domain

Tyrosine-kinase domain

3つの分断された疎水性コアrarr ドメイン構造

大きなタンパク質はいくつかの構造上のまとまり(ドメイン)を持つことが多い

立体構造によるタンパク質の分類

bull 配列による分類の延長ドメイン単位の分類進化的に関係のある(相同な)タンパク質を群にする(ファミリー)という考え方は同じ

bull 立体構造の類似性からより遠縁の相同性を見つけより大きな群を作る(スーパーファミリー)

bull スーパーファミリーをまとめたさらに大きなグループ(フォールドクラス)

bull 主にアミノ酸(Cαレベル)のラフな構造の類似性に

着目

bull 分類対象は主に球状タンパク質

立体構造分類データベースSCOPhttpscopmrc-lmbcamacukscop

4階層で分類Class(クラス)

Fold(フォールド)

Superfamily(スーパーファミリー)

Family(ファミリー)

どの階層に分類するかは配列の類似性立体構造の類似性分子機能の類似性機能部位の類似性

を専門家が総合的に判断して決める

1akr

ltホモロジーgt

ltアナロジーgt

他の構造分類データベースとしてCATHが有名

同様に階層的な分類体系を持つがその詳細はSCOPとは異なる

クラス

1mbd

1mqkH

1n55A 1pqwA

1fxd 1a2p

all-α (a)

all-β (b)

αβ (c)

α+β (d)

α-へリックスが中心

β-シートが中心

逆平行が多い

α-へリックスとβ-シートが配列上交互に現れる平行β-シートが中心

α-へリックスとβ-シートが混在配列上の並びの規則はない逆平行と平行のβ-シートが混在

アミノ酸配列と立体構造の関係ピロリ菌と大腸菌のフラボドキシン (同一残基率 SeqID 44)

ピロリ菌(1fueA) 大腸菌(1ag9A)

配列が似ていれば立体構造も似ている

SeqID = 44

RMSD = 12 Å

1fueA 2GKIGIFFGTDSGNAEAIAEKISKAIG--NAEVVDVAKASKEQFNGFTKVILVAPTAGAGD59

1ag9A 2AITGIFFGSDTGNTENIAKMIQKQLGKDVADVHDIAKSSKEDLEAYDILLLGIPTWYYGE61

1fueA 60LQTDWEDFLGTLEASD-FANKTIGLVGLGDQDTYSETFAEGIFHIYEKAK--AGKVVGQT116

1ag9A 62AQCDWDDFFPTLE-EIDFNGKLVALFGCGDQEDYAEYFCDALGTIRDIIEPRGATIVGHW120

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C 14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

BLAST

PSI-BLAST 構造比較

構造比較

アミノ酸配列がほとんど似ていなくても立体構造は似ている場合がある

構造は配列より進化的に保存がよい 構造比較から新たなホモログが発見できる可能性

立体

構造

の変

アミノ酸配列の変化と立体構造の変化の相関(グロビン族)

立体構造の変化はアミノ酸配列の変化と相関配列が30以上一致していればRMSDは2Å以下

アミノ酸配列の類似度

2つの構造の類似性

ホモロジー (homology 相同)進化的起源を共有することによる類似多くの場合分子機能なども類似している

アナロジー (analogy 相似)進化的起源とは無関係な類似多くの場合分子機能など他の属性は似ていない物理化学的な構造の偏好が原因とされる

イルカの胸びれ サルの前足

チョウの羽 トリの翼

ネコの前足

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C

ldquoFlavodoxin-likerdquo fold (c23)

ldquoFlavoproteinsrdquo superfamily (c235)

ldquoCheY-likerdquosuperfamily(c231)

14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

AnalogyHomology

HomologyHomolo

gy

多く現れるフォールド(出現ドメイン数順)

太字はスーパーフォールド多くのスーパーファミリーを含むフォールド

d58

c1

g3

c23 b34

b1

a4フォールド名 (SCOP173によるクラスfhijkは除く) ドメイ

ンの数

スーパーファミリーの数

a4 DNARNA-binding 3-helical bundle 292 14c1 TIM betaalpha-barrel 269 33d58 Ferredoxin-like 248 55b1 Immunoglobulin-like beta sandwich 246 27c37 P-loop nucleoside triphosphate hydrolase 235 1c2 NAD(P)-binding Rossmann-fold domains 168 1g3 Knottins 154 19d15 Beta-Grasp(ubiquitin-like) 131 13c23 Flavodoxin-like 118 15b34 SH3-like barrel 117 18b40 OB-fold 100 12c66 SAM-dependent methyltransferases 95 1

c37 c2

d15

b40 c66

スーパーフォールド(Superfold)

フォールド名 (SCOP173によるクラスfhijkは除く) その下のスーパーファミリーの数

d58 Ferredoxin-like 55c1 TIM betaalpha-barrel 33b1 Immunoglobulin-like beta sandwich 27a24 Four-helical up-and-down bundle 27a118 Alpha-alpha superhelix 23g3 Knottins 19b34 SH3-like barrel 18g41 Rubredoxin-like 16c23 Flavodoxin-like 15a60 SAM(sterile alpha motif) domain-like 15b69 7-bladed beta-propeller 14a4 DNARNA-binding 3-helical bundle 14

スーパーフォールド多くのスーパーファミリーを含むフォールド

スーパーフォールドは「構造の類似と機能の類似が対応しにくいフォールド」ともいえる

d58

c1

g3a118

c23

a24

a60

b34

b1

g41

b69 a4

三本へリックスバンドルDNARNA‐binding 3‐helical bundle(a4)

Mating type protein A2 yeast(1k61Aa411)

(1gvdAa413)(1wh5Aa411)

三本のへリックスが束になった構造DNAやRNAに結合する蛋白質が多い

DNAと

結合した構造(1k61)

TIMバレルTIM betaalpha barrel (c1)

Triosephosphate isomerase1n55A(c111)

全般に解糖系の酵素が多い基質酵素反応は極めて多彩

八本のβストランドとαへリックスが交互に組み合わさり対称的な樽(barrel)構造を形成す

る中央の樽構造は平行のβシートからなる

Imidazole glycerol phosphate synthasesubunit hisF1thfD(c121)

KHGKDPG aldolase1euaA(c1101)

フェレドキシン様Ferredoxin‐like (d58)

4Fe-4S Ferredoxin(1fxdd581)

1 234 4本の逆平行のβストランドと2本のαへリックスからな

分子機能は極めて多彩

CheY binding domain of CheA(1eayCd5824)

U1A RNA binding domain(1nu4Ad5871)

免疫グロブリン様Immunoglobulin‐like beta sandwich(b1)

Immunoglobulin Heavy chain variabledomain 1mjuH1(b111)

Immunoglobulin Heavy chain constantdomain 1mjuH2(b112)

Macromomycin1noaA (b171)

免疫グロブリン分子はH鎖とL鎖から

なりそれぞれ免疫グロブリン様ドメインからできている

V

C

V

C

C

C

V

CV

CC

C

L鎖

H鎖H鎖 L鎖

細胞表面あるいは分泌蛋白質が多い免疫や分子認識に関する機能を担うことが多い

4本のβストランドからなるβシートが二枚サンドイッチ状に重なった構造をとる逆平行のβシートが主

P‐loop スーパーファミリーP‐loop nucleoside triphosphate hydrolase(c37)

Ras-related protein RAB-5A1r2qA(c3718)

Guanylate kinase1gkyA(c3711)

RecA proteinDomain1 1xmsA1(c37111)

平行のβシートが主トポロジーには様々な変異あり

シグナル伝達DNA結合

モーター機能など多彩な分子機能を担うがATP GTPなどのヌクレオシド

の加水分解を行う点は共通

N C

132 4 5 6

ヌクレオシド結合部GxxxxGKTの

配列モチーフ(P-loop)を持つ

ロスマン フォールドNAD(P)‐binding Rossmann‐fold domains (c2)

Alcohol dehydrogenase gamma chaindomain2 1u3wA(c211)

Aspartate beta-semialdehydedehydrogenase2gz1A1(c213)

L-alanine dehydrogenase1pjcA1(c214)

補酵素を利用したNAD(P)を脱水素酵素を持つ基質を認識するドメインは別に存在する

NC

123 4 5 6

平行のβシートが主

7枚羽 βプロペラ7‐bladed beta‐propeller (b69)

Garactose oxydasedomain3 1k3iA3(b6911)

Guanine nucleotide-bindingprotein subunit beta-11gotB(b6941)

細胞膜付近のシグナル伝達や糖結合に関わることが多い

Influenza Neuraminidase 1f8dA(b6811)

6枚羽 βプロペラ

N C

321 4

のユニットが7回円環状に繰り返しされたフォールド

立体構造比較プログラム1990年ごろから多くの構造比較プログラムが開発されている

WEBアドレス スコア アライメント

DALI httpwwwebiacukdali

距離の差を独自の関数で変換したスコア

局所アライメントをモンテカルロ法でつなぎ合わせる

CE httpclsdsceducehtml

局所的なRMSD 局所アライメントを積み上げていく

MATRAS httpbiunitnaistjpmatras

距離の変化が相同相似で起こる確率の比をスコアとする

SSEで仮アライメント

を生成残基アライメントを収束するまで反復する

タンパク質の相同性の判断基準

100

同一残基率30以上

BLASTのE-value lt 00001

PSI-BLASTのE-value lt 00001

0102030407025 15 535

同一残基率(Sequence Identity)()

立体構造比較が必要

(1)立体構造の類似性が高い(DALIのZスコアMATRASのRdisスコア)(2)同一残基率がそこそこ高い(PSI-BLASTでヒットするSeqIDgt=15ぐらい)

(3)分子機能に類似性がある(補酵素酵素反応基質代謝経路等の共通性等)(4)基質補酵素の結合部位が類似しておりそのアミノ酸が保存(モチーフ)(5)ドメイン構成の共通性(6)スーパーフォールドの場合は特別な注意が必要

配列解析

同一残基率が25以下の場合の相同性の判断基準

50608090

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 2: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

「配列解析」のキーワード(蛋白質機能予測)

bull タンパク質機能予測(膜貫通部位予測細胞内局在予測)

bull RNA二次構造予測

タンパク質の構造性質による大きな分類タンパク質の例 配列上の特徴

水溶性タンパク質soluble protein

球状タンパク質globular protein

多くの酵素抗体転写因子など

疎水性親水性のアミノ酸がバランスよく含まれている

不定形タンパク質Intrinsically disordered protein

真核生物の転写因子の非ドメイン領域など

親水性アミノ酸が多い特にEPQSRKが多い

膜タンパク質membraneprotein

レセプタートランスポーターなど

疎水性アミノ酸が多く連続する疎水性アミノ酸領域(膜貫通へリックス)が観察されることが多い

球状タンパク質の疎水性アミノ酸

1mbdAMyoglobin

疎水性相互作用(hydrophobic interaction) 水分子と親和性の少ない非極性(non-polar疎水性)基が水溶液中で互いに集まろうとする

相互作用電気や磁気と異なり符号はなく疎水性どうしのものは相手を問わず集合する

5p21rasp21

7pcyAplastocyanin

1timATriose phosphate isomerase

疎水基ACILMFWV親水基RNDEQGHKPSTY

球状タンパク質では分子内部に疎水性アミノ酸分子表面に親水性アミノ酸が分布する傾向にある

疎水性指標による内外予測

summinus=

++

=w

wk

wiSeqKDw

iV ][12

1][

I 45 V 42 L 38 F 28 C 25 M 19 A 18 G -04 T -07 S -08 W -09 Y -13 P -16 H -32 Q -35N -35 E -35 D -35 K -39 R -45

Kyte and Doolittle(1982)の疎水性指標

方法 配列を横軸にとって縦軸に

対応する疎水性指標をプロット 前後数残基でスムージング

httpkrexpasyorgtoolsprotscalehtml

予測結果と実際の埋もれ度との比較1mbdMyoglobin

不定形タンパク質intrinsically disordered protein

親水性アミノ酸が多く疎水性アミノ酸が少ないため天然状態でもコンパクトに折たたまらない

球状タンパク質ドメインをつなぐ領域としてよく見られる

親水性アミノ酸の中でもEPQSRK

真核生物に多く原核生物には少ない

転写因子に特に多くみられる

生物学的な機能はよくわかっていないがタンパク質間相互作用に重要な働きをするといわれている

膜タンパク質

膜タンパク質脂質二重膜に埋没して機能するタンパク質

脂質頭部(親水性)

脂質尾部(疎水性)

性質(1)疎水的な脂質尾部と相互作用するためタンパク質表面には疎水性アミノ酸が多い

(2)水に溶けにくく凝集しやすい

(3)多くは膜貫通へリックスを持つ

(4)膜貫通へリックスの長さは15-30アミノ酸ぐらいアミノ酸配列からも連続した疎水性アミノ酸領域としてある程度予測可能

膜タンパク質

アミノ酸配列から膜貫通へリックスを予測するサーバSOSUIサーバhttpbpnuapnagoya-uacjpsosui

他にTMHMM Tmpredなどがある

H19 問71

1 一般に表面ではアミノ酸の挿入欠失や置換が起こりやすく内部では起こりにくい

2 生物種間で比較した時に保存されているアミノ酸がタンパク質表面で集中している領域は他のタンパク質やリガンドとの結合に関与していると予測できる

3 DNAと相互作用するタンパク質の場合DNAとの結合面は負

電荷を持つアミノ酸が集中することから容易に予測できる4 一般に表面には溶媒との相互作用のため極性基をもつアミノ

酸が多く内部は疎水性アミノ酸による疎水コアを形成していることが多い

次に示した球状タンパク質の性質に関する記述の中で不適切なものを一つ選べ

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問71

1 一般に表面ではアミノ酸の挿入欠失や置換が起こりやすく内部では起こりにくい

2 生物種間で比較した時に保存されているアミノ酸がタンパク質表面で集中している領域は他のタンパク質やリガンドとの結合に関与していると予測できる

3 DNAと相互作用するタンパク質の場合DNAとの結合面は負

電荷を持つアミノ酸が集中することから容易に予測できる4 一般に表面には溶媒との相互作用のため極性基をもつアミノ

酸が多く内部は疎水性アミノ酸による疎水コアを形成していることが多い

次に示した球状タンパク質の性質に関する記述の中で不適切なものを一つ選べ

DNAやRNAなどの核酸はリン酸基にマイナスの電荷を持っているよって核酸に

結合する蛋白質は表面にプラスの電荷を持っているものが多い平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

「タンパク質構造解析」のキーワード(構造比較)

bull 立体構造表現(コンタクトマップラマチャンドランマップ)

bull 構造比較

bull 重ね合わせbull RMSDbull 構造アライメント

bull 構造モチーフ

bull 構造分類

立体構造の決定法X線結晶解析

NMR(核磁気共鳴法)

大量発現精製結晶化

X線回折強度の測定

原子モデルの構築

原子モデルの精密化

核磁気共鳴解析(NOE解析帰属と距離拘束の抽出)

3次元電子密度マップ

原子間距離拘束

(1)多数分子の平均構造の観察(精製が重要 大きな分子複合体はより難しくなる)(2)発現精製結晶化のステップで各タンパク質によって実験条件の調整が必須(3)実験データの収集原子モデル構築の段階で計算機の支援が不可欠

大量発現精製

原子モデルの構築

原子モデルの精密化

MET 1

GLN 2

1

2

34

56

7 8

9

10

11

12

13

14

15

1617

18 19 20

21

HEADER UBIQUITIN 17-APR-92 1AAR COMPND DI-UBIQUITINSOURCE BOVINE (BOS TAURUS) ERYTHROCYTESAUTHOR WJCOOKLCJEFFREYMCARSONZCHENCMPICKART

原子番号 残基名 鎖識別子原子名 残基番号 X座標 Y座標 Z座標 占有率 温度因子

ATOM 1 N MET A 1 15493 30088 14694 100 836ATOM 2 CA MET A 1 14600 29031 15110 100 815ATOM 3 C MET A 1 15476 27793 15419 100 930ATOM 4 O MET A 1 16571 27561 14871 100 896ATOM 5 CB MET A 1 13500 28837 14105 100 989ATOM 6 CG MET A 1 13823 27997 12931 100 1021ATOM 7 SD MET A 1 12312 27711 11891 100 1033ATOM 8 CE MET A 1 13174 26595 10726 100 730ATOM 9 N GLN A 2 14968 27014 16326 100 975ATOM 10 CA GLN A 2 15552 25806 16852 100 1192ATOM 11 C GLN A 2 15000 24553 16168 100 1171ATOM 12 O GLN A 2 13787 24387 16086 100 1000 ATOM 13 CB GLN A 2 15368 25715 18386 100 1239ATOM 14 CG GLN A 2 15858 24413 19051 100 1400ATOM 15 CD GLN A 2 15676 24587 20561 100 1559ATOM 16 OE1 GLN A 2 16525 25209 21205 100 1867ATOM 17 NE2 GLN A 2 14564 24203 21152 100 1539ATOM 18 N ILE A 3 15960 23745 15687 100 1179 ATOM 19 CA ILE A 3 15593 22437 15130 100 1214ATOM 20 C ILE A 3 16491 21342 15720 100 1199ATOM 21 O ILE A 3 17701 21540 15767 100 1291

PDB ID

wwPDB(World Wide Protein Data Bank) 立体構造データの収集するデータバンク

RCSB PDB httpwwwrcsborgpdbPDBフォーマット MSD EBI httpwwwebiacukmsd

PDBj httpwwwpdbjorg

PDBは1971年に設立

立体構造描画のフリーウエアシェアウエアソフト名 WebSite 対応機種 特徴

RasMol wwwopenrasmolorg Win Mac Linux(ソース公開)

独自の高速描画アルゴリズムを用い非力なハードでも同様に高速描画が可能コマンド言語は強力で多機能基本的な描画法をカバーするが分子表面の描画はできない描画の質はやや低い

Chime wwwmdlchimecom Win Mac RasMolをベースにしたWEBブラウザ内で動作するプラグイン分子表面表示など描画機能はRasMolより拡張分子描画機能を持ったWEBページを作れる

Jmol jmolsourceforgenet Win Mac Linux(ソース公開)

Java Applet によりWEBブラウザ内で動作Chimeと同様に分子描画機能を持ったWEBページを作れるJREをインストールする必要

PyMOL pymolsourceforgenet

Win Mac Linux

OpenGLを用いた質の高い描画Python言語で開発されておりソースも公開Python言語を用いた機能

拡張も可能

CHIMERA wwwcglucsfeduchimera

Win Mac Linux

OpenGLを用いた質の高い描画電顕画像などの多

様なデータの取り込みドッキング静電計算などのインタフェース有りPython言語を用いた機能拡張

VMD wwwksuiuceduResearchvmd

Win Mac Linux

OpenGLを用いた質の高い描画Tcl言語を用いた機

能拡張が可能分子動力学の可視化を主要目的として幅広い機能

MolScript wwwavatarsemolscrit

Linux(ソース公開)

主にリボン図の描画用のソフトGUIを持たずコマンドラインでPDBファイルをPSファイル等に変換

Swiss PDB Viewer

auexpasyorgspdbv Win Mac Linux

OpenGLを用いた質の高い描画幅広い機能をサ

ポートしているがアップデートは活発でない

H19 問51

タンパク質などの生体高分子をコンピュータで表示するためのソフトウェア名として適切でないものを選択肢の中から一つ選べ

1RasMol2Chime3TMHMM4Swiss-PdbViewer

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問51

タンパク質などの生体高分子をコンピュータで表示するためのソフトウェア名として適切でないものを選択肢の中から一つ選べ

1RasMol2Chime3TMHMM4Swiss-PdbViewer

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問59

タンパク質の立体構造のグラフィックス表示プログラムではないものを選択肢の中から一つ選べ

1Chime2PyMol3MEGA4MolScript

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問59

タンパク質の立体構造のグラフィックス表示プログラムではないものを選択肢の中から一つ選べ

1Chime2PyMol3MEGA4MolScript

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

PDBコード1fxd(ferredoxin II) Rasmol Chimeプラグインで描画

立体構造の描画スタイル

ワイアフレーム ボールスティック 空間充填

バックボーン リボン 分子表面

1 234

N

H C

O

Ala(A)(疎水性)

Phe(F)(疎水性)

Cys(C)(親水性)

Asp(D)(親水性)

Val(V)(疎水性)

Thr(親水性)

様々な物理化学的な性質を持った側鎖が主鎖のペプチド結合で連なる

Leu(L)(疎水性)

蛋白質ペプチド結合したアミノ酸群

アミノ酸は全部で20種類

I VL

M FYW H

KR

D E

P NSA Q

CG T

疎水性 親水性

脂肪族

芳香族正荷電

負荷電

N末

C末

変性状態(D) 天然状態(N)

フォールディング(折り畳み)という現象

非常に多種の構造の集合大きく広がっている

ほとんど唯一の構造小さくコンパクトに折りたたまっている

温度や変性剤濃度によって可逆に変化

折り畳みは原則としてその蛋白質以外の分子の介助を必要としない

アミノ酸配列の情報だけで天然状態の立体構造が決定される

どうやってコンパクトになるか rarr (1)主鎖の水素結合(2)側鎖間の疎水性相互作用

あるアミノ酸配列がどうやって一つの構造を決めるのか

3次元座標の差のスコア(RMSD)

並進ベクトルt を引いたあと回転行列R をかける

t 二つの分子の重心をあわせるように決めるR 2つの原子群の相関を 大化する行列rarr(1)特異値分解で導出

(2)四元数表現により 適な回転をLagrange未定乗数法で決定

sum=

minusminus=N

iiiN

RMSD1

2)](R[1 tyx

21

20

1

2

3

4

5

1xdaA

1

23

4

21

20

5

yi

)(R ty minusi

xi

1

23

4

21

20

5

原子の対応付けがわかっているとする

RMSD 適に重ね合わせたときのXYZ座標の差(Root Mean Square Deviation)

1benA

WKabsch Acta CrystA 32922-923(1976) 34827-828(1978)ADMclachlan JMolBiol 12874-77 (1979)Charles FF Karney ldquoQuaternions in molecular modelingrdquo E-print arXivphysics0506177

xi分子Xのi番目の原子の位置ベクトル yi分子Yのi番目の原子の位置ベクトル

距離の差のスコア (DRMS)

( )sumsum= ge

minusminus

=N

i

N

ij

Yij

Xij DD

NNDRMS

1

2

)1(2

21

20

1

2

3

4

5

YijD

XijD

1

23

4

21

20

5

yixi

DRMS 対応する原子ペアの距離の差(Distance-based RMSD)

原子の対応付けがわかっているとする

重ね合わせは不要なので計算は簡単

3次元によらない2次元や結合情報にも拡張できる

鏡像の区別はできない

1benA

計算が簡単なので高速な構造比較のアルゴリズムの基盤として使われる

1xdaA

H19 問73立体構造の似ている2つのタンパク質間で対応関係にある原子が分かっている場合にはRMSD(Root Mean Square Deviation)と呼ばれる数値を計算することにより立体構造の重なり合いの程度を数値化することができるRMSDは全ての対応する原子間の距離を

2乗した値の平均値(相加平均)にルートをとったものとして定義されるあるタンパク質における6つの原子ABCDEFと別のタンパク質の6つの原子

ArsquoBrsquoCrsquoDrsquoErsquoFrsquoについて対応関係が分かっており互いにもっともよく重なるように回転して重ねた時の対応原子間の距離は以下の表のようになったこの表からB-Brsquo C-Crsquo D-Drsquo E-Ersquoは正確に重なったが他の原子間ではずれが見られることがわかるここで6つの原子に対するRMSD値はいくらになるか選択肢の中からもっとも適切な値を一つ選べただ

し原子間距離の単位は考慮しないものとする

対応原子 距離

原子A―原子Arsquo 20

原子B―原子Brsquo 00

原子C―原子Crsquo 00

原子D―原子Crsquo 10

原子E―原子Crsquo 00

原子F―原子Crsquo 10

1 052 0663 104 133

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問73立体構造の似ている2つのタンパク質間で対応関係にある原子が分かっている場合にはRMSD(Root Mean Square Deviation)と呼ばれる数値を計算することにより立体構造の重なり合いの程度を数値化することができるRMSDは全ての対応する原子間の距離を

2乗した値の平均値(相加平均)にルートをとったものとして定義されるあるタンパク質における6つの原子ABCDEFと別のタンパク質の6つの原子

ArsquoBrsquoCrsquoDrsquoErsquoFrsquoについて対応関係が分かっており互いにもっともよく重なるように回転して重ねた時の対応原子間の距離は以下の表のようになったこの表からB-Brsquo C-Crsquo D-Drsquo E-Ersquoは正確に重なったが他の原子間ではずれが見られることがわかるここで6つの原子に対するRMSD値はいくらになるか選択肢の中からもっとも適切な値を一つ選べただ

し原子間距離の単位は考慮しないものとする

対応原子 距離

原子A―原子Arsquo 20

原子B―原子Brsquo 00

原子C―原子Crsquo 00

原子D―原子Crsquo 10

原子E―原子Crsquo 00

原子F―原子Crsquo 10

1 052 0663 104 133

RMSDは 適に重ね合わせたときの

「ずれの二乗の平均のルート」であるしたがってずれの二乗平均は

(22+0+0+1+0+1)6=66=1これのルートをとるとradic1=1

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

1

2

3

4

56

7

8

9

10

11

主鎖の水素結合αへリックス

1

2

34

56

78

9

10

11

O

N

CHN

N

H

H

CO Cα

i

i+3

i+4

HN O C

Cαi-1

i番目のCOがi+4番目のNHと水素結合を形成

36残基が1周期の右巻きらせん

NHO=Cが同じ向きに並ぶため

へリックス全体に電気双極子が発生

N末C末

ー +

主鎖の水素結合逆平行βシート

βターン

βターン

βヘアピン

βヘアピン

伸びた構造の1本1本をβストランドと呼ぶ二本以上のβストランドがシート状に並んだ構造をβシートと呼ぶ

βストランド

βストランド

βストランド

主鎖の水素結合平行βシート

βminusαminusβモチーフ

平行βシートがαへリックスで接続された構造モチーフ

βストランド

βストランド

βストランド

伸びた構造の1本1本をβストランドと呼ぶ二本以上のβストランドがシート状に並んだ構造をβシートと呼ぶ

Cαi

Cαi+1Cα

i-1φ ψ

ペプチド結合の平面性とφψの定義

主鎖の原子のXYZ座標はφψの2つ

の角度でほとんど記述できる

φψの角度を2次元にプロットしたものをラマチャンドランプロット(Ramachandran plot)という点が集中する領域は2次構造とよく対応

点が現れない領域は主鎖の原子が衝突する

βシート

αへリックス

左巻きへリックス

平面平面

φ

ψ

H19 問74タンパク質の主鎖に添って定義される二面角のうちφ(窒素原子と炭素原子の間の二面角)とψ(α炭素原子とカルボニル基の炭素原子の間の二面角)の値を各残

基ごとに計算して二次元にプロットしたものをラマチャンドランプロットと呼ぶ以下に示したラマチャンドランプロットに対する説明文の中でもっとも適切なものを一つ選べ

1 (a)(b)はともにαへリックスの領域である2 (a)(b)はともにβストランドの領域である3 (a)はαへリックス(b)はβストランドの領

域である4 (a)はβストランド(b)はαへリックスの領

域である

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問74タンパク質の主鎖に添って定義される二面角のうちφ(窒素原子と炭素原子の間の二面角)とψ(α炭素原子とカルボニル基の炭素原子の間の二面角)の値を各残

基ごとに計算して二次元にプロットしたものをラマチャンドランプロットと呼ぶ以下に示したラマチャンドランプロットに対する説明文の中でもっとも適切なものを一つ選べ

1 (a)(b)はともにαへリックスの領域である2 (a)(b)はともにβストランドの領域である3 (a)はαへリックス(b)はβストランドの領

域である4 (a)はβストランド(b)はαへリックスの領

域である

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

トポロジー図によるβシートの表現

4 23

N

C

1

1ubq (UbiquitinHumand151)

N

C123 4 5 6

1n8k (Alchol dehydrogenase E chain Horse c21)

ロスマンフォールド

βターン

βターン

1cauA1rhdA domain2

TOPSプログラムによる表示httpwwwtopsleedsacuk

1timA

はαへリックスはβストランドとなりあうの向きで平行逆平行を示す

コンタクトマップ

1ubq

C

4 23

N

1

縦横に残基を配置しある残基ペアのCα原子間の距離が10Å以下であれば対応するピクセルに色を塗る

分子描画ソフトVMDを用いて作成

平行のストランド間は方向逆平行ストランド間は方向に線分が観察される

N

C

N C

逆平行

逆平行

平行

αへリックスは太めの対角上の線分

へリックス

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから1か3コンタクトマップから平行シートしかないことがわかるため1であることがわかる

αβ5

αβ3

α

β4α

β1αβ2 β2

β1β3β4

β5

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから2か4コンタクトマップから平行シートしかないことがわかるため2であることがわかる

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

配列比較によるタンパク質分類1970年代から配列の一致度(sequence identity)に基づいてグループを作る作業が

行われてきた

どのくらいの類似性で一つにまとめるかは様々な考えがあるが少なくとも「相同なタンパク質群」を一つのグループにまとめるべき

ファミリー(family 族)

進化的に関係のある(相同な)タンパク質グループのこと

複数のファミリーがあつまった大きなグループ スーパーファミリー(superfamily clan)

一つのファミリーの中の小さなグループ サブファミリー(subfamily)

family

subfamily superfamily

ドメイン単位による分類

A2 B2

B3 C3

A1

配列1

配列2

配列3

配列の部分どうしだけが類似していた場合 部分一致を重視するとすべて一つのグループになるがhellip

配列1

配列2 配列3

Aを共有

Bを共有

1と2が類似2と3が類似していても1と3は類似していない

ドメインに分割すると

A1

A2

B2

B3

C3

A2 B2

B3 C3

A1

きれいに分類することができる

Pfam 蛋白質ファミリのデータベース各蛋白質ファミリのマルチプル

アライメント HMMなどを集めたデータベース

httppfamsangeracuk

Pkinase_Tyrドメインをもつタンパク質の例

ABL_HUMAN

BTK_HUMAN

ILK_HUMAN

MERTK_HUMAN

PGFRB_HUMAN

HCK_HUMAN

Family Pkinase_Tyr (PF07714) Protein tyrosine kinase

Pfamデータベース(httppfamsangeracukSoftwarePfam)からの引用

ドメイン構造と疎水性の関係Tyrosine protein kinase HCK (1ad5A HCK_HUMAN)

SH3 domain

SH2 domain

Tyrosine-kinase domain

3つの分断された疎水性コアrarr ドメイン構造

大きなタンパク質はいくつかの構造上のまとまり(ドメイン)を持つことが多い

立体構造によるタンパク質の分類

bull 配列による分類の延長ドメイン単位の分類進化的に関係のある(相同な)タンパク質を群にする(ファミリー)という考え方は同じ

bull 立体構造の類似性からより遠縁の相同性を見つけより大きな群を作る(スーパーファミリー)

bull スーパーファミリーをまとめたさらに大きなグループ(フォールドクラス)

bull 主にアミノ酸(Cαレベル)のラフな構造の類似性に

着目

bull 分類対象は主に球状タンパク質

立体構造分類データベースSCOPhttpscopmrc-lmbcamacukscop

4階層で分類Class(クラス)

Fold(フォールド)

Superfamily(スーパーファミリー)

Family(ファミリー)

どの階層に分類するかは配列の類似性立体構造の類似性分子機能の類似性機能部位の類似性

を専門家が総合的に判断して決める

1akr

ltホモロジーgt

ltアナロジーgt

他の構造分類データベースとしてCATHが有名

同様に階層的な分類体系を持つがその詳細はSCOPとは異なる

クラス

1mbd

1mqkH

1n55A 1pqwA

1fxd 1a2p

all-α (a)

all-β (b)

αβ (c)

α+β (d)

α-へリックスが中心

β-シートが中心

逆平行が多い

α-へリックスとβ-シートが配列上交互に現れる平行β-シートが中心

α-へリックスとβ-シートが混在配列上の並びの規則はない逆平行と平行のβ-シートが混在

アミノ酸配列と立体構造の関係ピロリ菌と大腸菌のフラボドキシン (同一残基率 SeqID 44)

ピロリ菌(1fueA) 大腸菌(1ag9A)

配列が似ていれば立体構造も似ている

SeqID = 44

RMSD = 12 Å

1fueA 2GKIGIFFGTDSGNAEAIAEKISKAIG--NAEVVDVAKASKEQFNGFTKVILVAPTAGAGD59

1ag9A 2AITGIFFGSDTGNTENIAKMIQKQLGKDVADVHDIAKSSKEDLEAYDILLLGIPTWYYGE61

1fueA 60LQTDWEDFLGTLEASD-FANKTIGLVGLGDQDTYSETFAEGIFHIYEKAK--AGKVVGQT116

1ag9A 62AQCDWDDFFPTLE-EIDFNGKLVALFGCGDQEDYAEYFCDALGTIRDIIEPRGATIVGHW120

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C 14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

BLAST

PSI-BLAST 構造比較

構造比較

アミノ酸配列がほとんど似ていなくても立体構造は似ている場合がある

構造は配列より進化的に保存がよい 構造比較から新たなホモログが発見できる可能性

立体

構造

の変

アミノ酸配列の変化と立体構造の変化の相関(グロビン族)

立体構造の変化はアミノ酸配列の変化と相関配列が30以上一致していればRMSDは2Å以下

アミノ酸配列の類似度

2つの構造の類似性

ホモロジー (homology 相同)進化的起源を共有することによる類似多くの場合分子機能なども類似している

アナロジー (analogy 相似)進化的起源とは無関係な類似多くの場合分子機能など他の属性は似ていない物理化学的な構造の偏好が原因とされる

イルカの胸びれ サルの前足

チョウの羽 トリの翼

ネコの前足

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C

ldquoFlavodoxin-likerdquo fold (c23)

ldquoFlavoproteinsrdquo superfamily (c235)

ldquoCheY-likerdquosuperfamily(c231)

14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

AnalogyHomology

HomologyHomolo

gy

多く現れるフォールド(出現ドメイン数順)

太字はスーパーフォールド多くのスーパーファミリーを含むフォールド

d58

c1

g3

c23 b34

b1

a4フォールド名 (SCOP173によるクラスfhijkは除く) ドメイ

ンの数

スーパーファミリーの数

a4 DNARNA-binding 3-helical bundle 292 14c1 TIM betaalpha-barrel 269 33d58 Ferredoxin-like 248 55b1 Immunoglobulin-like beta sandwich 246 27c37 P-loop nucleoside triphosphate hydrolase 235 1c2 NAD(P)-binding Rossmann-fold domains 168 1g3 Knottins 154 19d15 Beta-Grasp(ubiquitin-like) 131 13c23 Flavodoxin-like 118 15b34 SH3-like barrel 117 18b40 OB-fold 100 12c66 SAM-dependent methyltransferases 95 1

c37 c2

d15

b40 c66

スーパーフォールド(Superfold)

フォールド名 (SCOP173によるクラスfhijkは除く) その下のスーパーファミリーの数

d58 Ferredoxin-like 55c1 TIM betaalpha-barrel 33b1 Immunoglobulin-like beta sandwich 27a24 Four-helical up-and-down bundle 27a118 Alpha-alpha superhelix 23g3 Knottins 19b34 SH3-like barrel 18g41 Rubredoxin-like 16c23 Flavodoxin-like 15a60 SAM(sterile alpha motif) domain-like 15b69 7-bladed beta-propeller 14a4 DNARNA-binding 3-helical bundle 14

スーパーフォールド多くのスーパーファミリーを含むフォールド

スーパーフォールドは「構造の類似と機能の類似が対応しにくいフォールド」ともいえる

d58

c1

g3a118

c23

a24

a60

b34

b1

g41

b69 a4

三本へリックスバンドルDNARNA‐binding 3‐helical bundle(a4)

Mating type protein A2 yeast(1k61Aa411)

(1gvdAa413)(1wh5Aa411)

三本のへリックスが束になった構造DNAやRNAに結合する蛋白質が多い

DNAと

結合した構造(1k61)

TIMバレルTIM betaalpha barrel (c1)

Triosephosphate isomerase1n55A(c111)

全般に解糖系の酵素が多い基質酵素反応は極めて多彩

八本のβストランドとαへリックスが交互に組み合わさり対称的な樽(barrel)構造を形成す

る中央の樽構造は平行のβシートからなる

Imidazole glycerol phosphate synthasesubunit hisF1thfD(c121)

KHGKDPG aldolase1euaA(c1101)

フェレドキシン様Ferredoxin‐like (d58)

4Fe-4S Ferredoxin(1fxdd581)

1 234 4本の逆平行のβストランドと2本のαへリックスからな

分子機能は極めて多彩

CheY binding domain of CheA(1eayCd5824)

U1A RNA binding domain(1nu4Ad5871)

免疫グロブリン様Immunoglobulin‐like beta sandwich(b1)

Immunoglobulin Heavy chain variabledomain 1mjuH1(b111)

Immunoglobulin Heavy chain constantdomain 1mjuH2(b112)

Macromomycin1noaA (b171)

免疫グロブリン分子はH鎖とL鎖から

なりそれぞれ免疫グロブリン様ドメインからできている

V

C

V

C

C

C

V

CV

CC

C

L鎖

H鎖H鎖 L鎖

細胞表面あるいは分泌蛋白質が多い免疫や分子認識に関する機能を担うことが多い

4本のβストランドからなるβシートが二枚サンドイッチ状に重なった構造をとる逆平行のβシートが主

P‐loop スーパーファミリーP‐loop nucleoside triphosphate hydrolase(c37)

Ras-related protein RAB-5A1r2qA(c3718)

Guanylate kinase1gkyA(c3711)

RecA proteinDomain1 1xmsA1(c37111)

平行のβシートが主トポロジーには様々な変異あり

シグナル伝達DNA結合

モーター機能など多彩な分子機能を担うがATP GTPなどのヌクレオシド

の加水分解を行う点は共通

N C

132 4 5 6

ヌクレオシド結合部GxxxxGKTの

配列モチーフ(P-loop)を持つ

ロスマン フォールドNAD(P)‐binding Rossmann‐fold domains (c2)

Alcohol dehydrogenase gamma chaindomain2 1u3wA(c211)

Aspartate beta-semialdehydedehydrogenase2gz1A1(c213)

L-alanine dehydrogenase1pjcA1(c214)

補酵素を利用したNAD(P)を脱水素酵素を持つ基質を認識するドメインは別に存在する

NC

123 4 5 6

平行のβシートが主

7枚羽 βプロペラ7‐bladed beta‐propeller (b69)

Garactose oxydasedomain3 1k3iA3(b6911)

Guanine nucleotide-bindingprotein subunit beta-11gotB(b6941)

細胞膜付近のシグナル伝達や糖結合に関わることが多い

Influenza Neuraminidase 1f8dA(b6811)

6枚羽 βプロペラ

N C

321 4

のユニットが7回円環状に繰り返しされたフォールド

立体構造比較プログラム1990年ごろから多くの構造比較プログラムが開発されている

WEBアドレス スコア アライメント

DALI httpwwwebiacukdali

距離の差を独自の関数で変換したスコア

局所アライメントをモンテカルロ法でつなぎ合わせる

CE httpclsdsceducehtml

局所的なRMSD 局所アライメントを積み上げていく

MATRAS httpbiunitnaistjpmatras

距離の変化が相同相似で起こる確率の比をスコアとする

SSEで仮アライメント

を生成残基アライメントを収束するまで反復する

タンパク質の相同性の判断基準

100

同一残基率30以上

BLASTのE-value lt 00001

PSI-BLASTのE-value lt 00001

0102030407025 15 535

同一残基率(Sequence Identity)()

立体構造比較が必要

(1)立体構造の類似性が高い(DALIのZスコアMATRASのRdisスコア)(2)同一残基率がそこそこ高い(PSI-BLASTでヒットするSeqIDgt=15ぐらい)

(3)分子機能に類似性がある(補酵素酵素反応基質代謝経路等の共通性等)(4)基質補酵素の結合部位が類似しておりそのアミノ酸が保存(モチーフ)(5)ドメイン構成の共通性(6)スーパーフォールドの場合は特別な注意が必要

配列解析

同一残基率が25以下の場合の相同性の判断基準

50608090

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 3: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

タンパク質の構造性質による大きな分類タンパク質の例 配列上の特徴

水溶性タンパク質soluble protein

球状タンパク質globular protein

多くの酵素抗体転写因子など

疎水性親水性のアミノ酸がバランスよく含まれている

不定形タンパク質Intrinsically disordered protein

真核生物の転写因子の非ドメイン領域など

親水性アミノ酸が多い特にEPQSRKが多い

膜タンパク質membraneprotein

レセプタートランスポーターなど

疎水性アミノ酸が多く連続する疎水性アミノ酸領域(膜貫通へリックス)が観察されることが多い

球状タンパク質の疎水性アミノ酸

1mbdAMyoglobin

疎水性相互作用(hydrophobic interaction) 水分子と親和性の少ない非極性(non-polar疎水性)基が水溶液中で互いに集まろうとする

相互作用電気や磁気と異なり符号はなく疎水性どうしのものは相手を問わず集合する

5p21rasp21

7pcyAplastocyanin

1timATriose phosphate isomerase

疎水基ACILMFWV親水基RNDEQGHKPSTY

球状タンパク質では分子内部に疎水性アミノ酸分子表面に親水性アミノ酸が分布する傾向にある

疎水性指標による内外予測

summinus=

++

=w

wk

wiSeqKDw

iV ][12

1][

I 45 V 42 L 38 F 28 C 25 M 19 A 18 G -04 T -07 S -08 W -09 Y -13 P -16 H -32 Q -35N -35 E -35 D -35 K -39 R -45

Kyte and Doolittle(1982)の疎水性指標

方法 配列を横軸にとって縦軸に

対応する疎水性指標をプロット 前後数残基でスムージング

httpkrexpasyorgtoolsprotscalehtml

予測結果と実際の埋もれ度との比較1mbdMyoglobin

不定形タンパク質intrinsically disordered protein

親水性アミノ酸が多く疎水性アミノ酸が少ないため天然状態でもコンパクトに折たたまらない

球状タンパク質ドメインをつなぐ領域としてよく見られる

親水性アミノ酸の中でもEPQSRK

真核生物に多く原核生物には少ない

転写因子に特に多くみられる

生物学的な機能はよくわかっていないがタンパク質間相互作用に重要な働きをするといわれている

膜タンパク質

膜タンパク質脂質二重膜に埋没して機能するタンパク質

脂質頭部(親水性)

脂質尾部(疎水性)

性質(1)疎水的な脂質尾部と相互作用するためタンパク質表面には疎水性アミノ酸が多い

(2)水に溶けにくく凝集しやすい

(3)多くは膜貫通へリックスを持つ

(4)膜貫通へリックスの長さは15-30アミノ酸ぐらいアミノ酸配列からも連続した疎水性アミノ酸領域としてある程度予測可能

膜タンパク質

アミノ酸配列から膜貫通へリックスを予測するサーバSOSUIサーバhttpbpnuapnagoya-uacjpsosui

他にTMHMM Tmpredなどがある

H19 問71

1 一般に表面ではアミノ酸の挿入欠失や置換が起こりやすく内部では起こりにくい

2 生物種間で比較した時に保存されているアミノ酸がタンパク質表面で集中している領域は他のタンパク質やリガンドとの結合に関与していると予測できる

3 DNAと相互作用するタンパク質の場合DNAとの結合面は負

電荷を持つアミノ酸が集中することから容易に予測できる4 一般に表面には溶媒との相互作用のため極性基をもつアミノ

酸が多く内部は疎水性アミノ酸による疎水コアを形成していることが多い

次に示した球状タンパク質の性質に関する記述の中で不適切なものを一つ選べ

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問71

1 一般に表面ではアミノ酸の挿入欠失や置換が起こりやすく内部では起こりにくい

2 生物種間で比較した時に保存されているアミノ酸がタンパク質表面で集中している領域は他のタンパク質やリガンドとの結合に関与していると予測できる

3 DNAと相互作用するタンパク質の場合DNAとの結合面は負

電荷を持つアミノ酸が集中することから容易に予測できる4 一般に表面には溶媒との相互作用のため極性基をもつアミノ

酸が多く内部は疎水性アミノ酸による疎水コアを形成していることが多い

次に示した球状タンパク質の性質に関する記述の中で不適切なものを一つ選べ

DNAやRNAなどの核酸はリン酸基にマイナスの電荷を持っているよって核酸に

結合する蛋白質は表面にプラスの電荷を持っているものが多い平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

「タンパク質構造解析」のキーワード(構造比較)

bull 立体構造表現(コンタクトマップラマチャンドランマップ)

bull 構造比較

bull 重ね合わせbull RMSDbull 構造アライメント

bull 構造モチーフ

bull 構造分類

立体構造の決定法X線結晶解析

NMR(核磁気共鳴法)

大量発現精製結晶化

X線回折強度の測定

原子モデルの構築

原子モデルの精密化

核磁気共鳴解析(NOE解析帰属と距離拘束の抽出)

3次元電子密度マップ

原子間距離拘束

(1)多数分子の平均構造の観察(精製が重要 大きな分子複合体はより難しくなる)(2)発現精製結晶化のステップで各タンパク質によって実験条件の調整が必須(3)実験データの収集原子モデル構築の段階で計算機の支援が不可欠

大量発現精製

原子モデルの構築

原子モデルの精密化

MET 1

GLN 2

1

2

34

56

7 8

9

10

11

12

13

14

15

1617

18 19 20

21

HEADER UBIQUITIN 17-APR-92 1AAR COMPND DI-UBIQUITINSOURCE BOVINE (BOS TAURUS) ERYTHROCYTESAUTHOR WJCOOKLCJEFFREYMCARSONZCHENCMPICKART

原子番号 残基名 鎖識別子原子名 残基番号 X座標 Y座標 Z座標 占有率 温度因子

ATOM 1 N MET A 1 15493 30088 14694 100 836ATOM 2 CA MET A 1 14600 29031 15110 100 815ATOM 3 C MET A 1 15476 27793 15419 100 930ATOM 4 O MET A 1 16571 27561 14871 100 896ATOM 5 CB MET A 1 13500 28837 14105 100 989ATOM 6 CG MET A 1 13823 27997 12931 100 1021ATOM 7 SD MET A 1 12312 27711 11891 100 1033ATOM 8 CE MET A 1 13174 26595 10726 100 730ATOM 9 N GLN A 2 14968 27014 16326 100 975ATOM 10 CA GLN A 2 15552 25806 16852 100 1192ATOM 11 C GLN A 2 15000 24553 16168 100 1171ATOM 12 O GLN A 2 13787 24387 16086 100 1000 ATOM 13 CB GLN A 2 15368 25715 18386 100 1239ATOM 14 CG GLN A 2 15858 24413 19051 100 1400ATOM 15 CD GLN A 2 15676 24587 20561 100 1559ATOM 16 OE1 GLN A 2 16525 25209 21205 100 1867ATOM 17 NE2 GLN A 2 14564 24203 21152 100 1539ATOM 18 N ILE A 3 15960 23745 15687 100 1179 ATOM 19 CA ILE A 3 15593 22437 15130 100 1214ATOM 20 C ILE A 3 16491 21342 15720 100 1199ATOM 21 O ILE A 3 17701 21540 15767 100 1291

PDB ID

wwPDB(World Wide Protein Data Bank) 立体構造データの収集するデータバンク

RCSB PDB httpwwwrcsborgpdbPDBフォーマット MSD EBI httpwwwebiacukmsd

PDBj httpwwwpdbjorg

PDBは1971年に設立

立体構造描画のフリーウエアシェアウエアソフト名 WebSite 対応機種 特徴

RasMol wwwopenrasmolorg Win Mac Linux(ソース公開)

独自の高速描画アルゴリズムを用い非力なハードでも同様に高速描画が可能コマンド言語は強力で多機能基本的な描画法をカバーするが分子表面の描画はできない描画の質はやや低い

Chime wwwmdlchimecom Win Mac RasMolをベースにしたWEBブラウザ内で動作するプラグイン分子表面表示など描画機能はRasMolより拡張分子描画機能を持ったWEBページを作れる

Jmol jmolsourceforgenet Win Mac Linux(ソース公開)

Java Applet によりWEBブラウザ内で動作Chimeと同様に分子描画機能を持ったWEBページを作れるJREをインストールする必要

PyMOL pymolsourceforgenet

Win Mac Linux

OpenGLを用いた質の高い描画Python言語で開発されておりソースも公開Python言語を用いた機能

拡張も可能

CHIMERA wwwcglucsfeduchimera

Win Mac Linux

OpenGLを用いた質の高い描画電顕画像などの多

様なデータの取り込みドッキング静電計算などのインタフェース有りPython言語を用いた機能拡張

VMD wwwksuiuceduResearchvmd

Win Mac Linux

OpenGLを用いた質の高い描画Tcl言語を用いた機

能拡張が可能分子動力学の可視化を主要目的として幅広い機能

MolScript wwwavatarsemolscrit

Linux(ソース公開)

主にリボン図の描画用のソフトGUIを持たずコマンドラインでPDBファイルをPSファイル等に変換

Swiss PDB Viewer

auexpasyorgspdbv Win Mac Linux

OpenGLを用いた質の高い描画幅広い機能をサ

ポートしているがアップデートは活発でない

H19 問51

タンパク質などの生体高分子をコンピュータで表示するためのソフトウェア名として適切でないものを選択肢の中から一つ選べ

1RasMol2Chime3TMHMM4Swiss-PdbViewer

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問51

タンパク質などの生体高分子をコンピュータで表示するためのソフトウェア名として適切でないものを選択肢の中から一つ選べ

1RasMol2Chime3TMHMM4Swiss-PdbViewer

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問59

タンパク質の立体構造のグラフィックス表示プログラムではないものを選択肢の中から一つ選べ

1Chime2PyMol3MEGA4MolScript

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問59

タンパク質の立体構造のグラフィックス表示プログラムではないものを選択肢の中から一つ選べ

1Chime2PyMol3MEGA4MolScript

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

PDBコード1fxd(ferredoxin II) Rasmol Chimeプラグインで描画

立体構造の描画スタイル

ワイアフレーム ボールスティック 空間充填

バックボーン リボン 分子表面

1 234

N

H C

O

Ala(A)(疎水性)

Phe(F)(疎水性)

Cys(C)(親水性)

Asp(D)(親水性)

Val(V)(疎水性)

Thr(親水性)

様々な物理化学的な性質を持った側鎖が主鎖のペプチド結合で連なる

Leu(L)(疎水性)

蛋白質ペプチド結合したアミノ酸群

アミノ酸は全部で20種類

I VL

M FYW H

KR

D E

P NSA Q

CG T

疎水性 親水性

脂肪族

芳香族正荷電

負荷電

N末

C末

変性状態(D) 天然状態(N)

フォールディング(折り畳み)という現象

非常に多種の構造の集合大きく広がっている

ほとんど唯一の構造小さくコンパクトに折りたたまっている

温度や変性剤濃度によって可逆に変化

折り畳みは原則としてその蛋白質以外の分子の介助を必要としない

アミノ酸配列の情報だけで天然状態の立体構造が決定される

どうやってコンパクトになるか rarr (1)主鎖の水素結合(2)側鎖間の疎水性相互作用

あるアミノ酸配列がどうやって一つの構造を決めるのか

3次元座標の差のスコア(RMSD)

並進ベクトルt を引いたあと回転行列R をかける

t 二つの分子の重心をあわせるように決めるR 2つの原子群の相関を 大化する行列rarr(1)特異値分解で導出

(2)四元数表現により 適な回転をLagrange未定乗数法で決定

sum=

minusminus=N

iiiN

RMSD1

2)](R[1 tyx

21

20

1

2

3

4

5

1xdaA

1

23

4

21

20

5

yi

)(R ty minusi

xi

1

23

4

21

20

5

原子の対応付けがわかっているとする

RMSD 適に重ね合わせたときのXYZ座標の差(Root Mean Square Deviation)

1benA

WKabsch Acta CrystA 32922-923(1976) 34827-828(1978)ADMclachlan JMolBiol 12874-77 (1979)Charles FF Karney ldquoQuaternions in molecular modelingrdquo E-print arXivphysics0506177

xi分子Xのi番目の原子の位置ベクトル yi分子Yのi番目の原子の位置ベクトル

距離の差のスコア (DRMS)

( )sumsum= ge

minusminus

=N

i

N

ij

Yij

Xij DD

NNDRMS

1

2

)1(2

21

20

1

2

3

4

5

YijD

XijD

1

23

4

21

20

5

yixi

DRMS 対応する原子ペアの距離の差(Distance-based RMSD)

原子の対応付けがわかっているとする

重ね合わせは不要なので計算は簡単

3次元によらない2次元や結合情報にも拡張できる

鏡像の区別はできない

1benA

計算が簡単なので高速な構造比較のアルゴリズムの基盤として使われる

1xdaA

H19 問73立体構造の似ている2つのタンパク質間で対応関係にある原子が分かっている場合にはRMSD(Root Mean Square Deviation)と呼ばれる数値を計算することにより立体構造の重なり合いの程度を数値化することができるRMSDは全ての対応する原子間の距離を

2乗した値の平均値(相加平均)にルートをとったものとして定義されるあるタンパク質における6つの原子ABCDEFと別のタンパク質の6つの原子

ArsquoBrsquoCrsquoDrsquoErsquoFrsquoについて対応関係が分かっており互いにもっともよく重なるように回転して重ねた時の対応原子間の距離は以下の表のようになったこの表からB-Brsquo C-Crsquo D-Drsquo E-Ersquoは正確に重なったが他の原子間ではずれが見られることがわかるここで6つの原子に対するRMSD値はいくらになるか選択肢の中からもっとも適切な値を一つ選べただ

し原子間距離の単位は考慮しないものとする

対応原子 距離

原子A―原子Arsquo 20

原子B―原子Brsquo 00

原子C―原子Crsquo 00

原子D―原子Crsquo 10

原子E―原子Crsquo 00

原子F―原子Crsquo 10

1 052 0663 104 133

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問73立体構造の似ている2つのタンパク質間で対応関係にある原子が分かっている場合にはRMSD(Root Mean Square Deviation)と呼ばれる数値を計算することにより立体構造の重なり合いの程度を数値化することができるRMSDは全ての対応する原子間の距離を

2乗した値の平均値(相加平均)にルートをとったものとして定義されるあるタンパク質における6つの原子ABCDEFと別のタンパク質の6つの原子

ArsquoBrsquoCrsquoDrsquoErsquoFrsquoについて対応関係が分かっており互いにもっともよく重なるように回転して重ねた時の対応原子間の距離は以下の表のようになったこの表からB-Brsquo C-Crsquo D-Drsquo E-Ersquoは正確に重なったが他の原子間ではずれが見られることがわかるここで6つの原子に対するRMSD値はいくらになるか選択肢の中からもっとも適切な値を一つ選べただ

し原子間距離の単位は考慮しないものとする

対応原子 距離

原子A―原子Arsquo 20

原子B―原子Brsquo 00

原子C―原子Crsquo 00

原子D―原子Crsquo 10

原子E―原子Crsquo 00

原子F―原子Crsquo 10

1 052 0663 104 133

RMSDは 適に重ね合わせたときの

「ずれの二乗の平均のルート」であるしたがってずれの二乗平均は

(22+0+0+1+0+1)6=66=1これのルートをとるとradic1=1

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

1

2

3

4

56

7

8

9

10

11

主鎖の水素結合αへリックス

1

2

34

56

78

9

10

11

O

N

CHN

N

H

H

CO Cα

i

i+3

i+4

HN O C

Cαi-1

i番目のCOがi+4番目のNHと水素結合を形成

36残基が1周期の右巻きらせん

NHO=Cが同じ向きに並ぶため

へリックス全体に電気双極子が発生

N末C末

ー +

主鎖の水素結合逆平行βシート

βターン

βターン

βヘアピン

βヘアピン

伸びた構造の1本1本をβストランドと呼ぶ二本以上のβストランドがシート状に並んだ構造をβシートと呼ぶ

βストランド

βストランド

βストランド

主鎖の水素結合平行βシート

βminusαminusβモチーフ

平行βシートがαへリックスで接続された構造モチーフ

βストランド

βストランド

βストランド

伸びた構造の1本1本をβストランドと呼ぶ二本以上のβストランドがシート状に並んだ構造をβシートと呼ぶ

Cαi

Cαi+1Cα

i-1φ ψ

ペプチド結合の平面性とφψの定義

主鎖の原子のXYZ座標はφψの2つ

の角度でほとんど記述できる

φψの角度を2次元にプロットしたものをラマチャンドランプロット(Ramachandran plot)という点が集中する領域は2次構造とよく対応

点が現れない領域は主鎖の原子が衝突する

βシート

αへリックス

左巻きへリックス

平面平面

φ

ψ

H19 問74タンパク質の主鎖に添って定義される二面角のうちφ(窒素原子と炭素原子の間の二面角)とψ(α炭素原子とカルボニル基の炭素原子の間の二面角)の値を各残

基ごとに計算して二次元にプロットしたものをラマチャンドランプロットと呼ぶ以下に示したラマチャンドランプロットに対する説明文の中でもっとも適切なものを一つ選べ

1 (a)(b)はともにαへリックスの領域である2 (a)(b)はともにβストランドの領域である3 (a)はαへリックス(b)はβストランドの領

域である4 (a)はβストランド(b)はαへリックスの領

域である

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問74タンパク質の主鎖に添って定義される二面角のうちφ(窒素原子と炭素原子の間の二面角)とψ(α炭素原子とカルボニル基の炭素原子の間の二面角)の値を各残

基ごとに計算して二次元にプロットしたものをラマチャンドランプロットと呼ぶ以下に示したラマチャンドランプロットに対する説明文の中でもっとも適切なものを一つ選べ

1 (a)(b)はともにαへリックスの領域である2 (a)(b)はともにβストランドの領域である3 (a)はαへリックス(b)はβストランドの領

域である4 (a)はβストランド(b)はαへリックスの領

域である

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

トポロジー図によるβシートの表現

4 23

N

C

1

1ubq (UbiquitinHumand151)

N

C123 4 5 6

1n8k (Alchol dehydrogenase E chain Horse c21)

ロスマンフォールド

βターン

βターン

1cauA1rhdA domain2

TOPSプログラムによる表示httpwwwtopsleedsacuk

1timA

はαへリックスはβストランドとなりあうの向きで平行逆平行を示す

コンタクトマップ

1ubq

C

4 23

N

1

縦横に残基を配置しある残基ペアのCα原子間の距離が10Å以下であれば対応するピクセルに色を塗る

分子描画ソフトVMDを用いて作成

平行のストランド間は方向逆平行ストランド間は方向に線分が観察される

N

C

N C

逆平行

逆平行

平行

αへリックスは太めの対角上の線分

へリックス

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから1か3コンタクトマップから平行シートしかないことがわかるため1であることがわかる

αβ5

αβ3

α

β4α

β1αβ2 β2

β1β3β4

β5

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから2か4コンタクトマップから平行シートしかないことがわかるため2であることがわかる

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

配列比較によるタンパク質分類1970年代から配列の一致度(sequence identity)に基づいてグループを作る作業が

行われてきた

どのくらいの類似性で一つにまとめるかは様々な考えがあるが少なくとも「相同なタンパク質群」を一つのグループにまとめるべき

ファミリー(family 族)

進化的に関係のある(相同な)タンパク質グループのこと

複数のファミリーがあつまった大きなグループ スーパーファミリー(superfamily clan)

一つのファミリーの中の小さなグループ サブファミリー(subfamily)

family

subfamily superfamily

ドメイン単位による分類

A2 B2

B3 C3

A1

配列1

配列2

配列3

配列の部分どうしだけが類似していた場合 部分一致を重視するとすべて一つのグループになるがhellip

配列1

配列2 配列3

Aを共有

Bを共有

1と2が類似2と3が類似していても1と3は類似していない

ドメインに分割すると

A1

A2

B2

B3

C3

A2 B2

B3 C3

A1

きれいに分類することができる

Pfam 蛋白質ファミリのデータベース各蛋白質ファミリのマルチプル

アライメント HMMなどを集めたデータベース

httppfamsangeracuk

Pkinase_Tyrドメインをもつタンパク質の例

ABL_HUMAN

BTK_HUMAN

ILK_HUMAN

MERTK_HUMAN

PGFRB_HUMAN

HCK_HUMAN

Family Pkinase_Tyr (PF07714) Protein tyrosine kinase

Pfamデータベース(httppfamsangeracukSoftwarePfam)からの引用

ドメイン構造と疎水性の関係Tyrosine protein kinase HCK (1ad5A HCK_HUMAN)

SH3 domain

SH2 domain

Tyrosine-kinase domain

3つの分断された疎水性コアrarr ドメイン構造

大きなタンパク質はいくつかの構造上のまとまり(ドメイン)を持つことが多い

立体構造によるタンパク質の分類

bull 配列による分類の延長ドメイン単位の分類進化的に関係のある(相同な)タンパク質を群にする(ファミリー)という考え方は同じ

bull 立体構造の類似性からより遠縁の相同性を見つけより大きな群を作る(スーパーファミリー)

bull スーパーファミリーをまとめたさらに大きなグループ(フォールドクラス)

bull 主にアミノ酸(Cαレベル)のラフな構造の類似性に

着目

bull 分類対象は主に球状タンパク質

立体構造分類データベースSCOPhttpscopmrc-lmbcamacukscop

4階層で分類Class(クラス)

Fold(フォールド)

Superfamily(スーパーファミリー)

Family(ファミリー)

どの階層に分類するかは配列の類似性立体構造の類似性分子機能の類似性機能部位の類似性

を専門家が総合的に判断して決める

1akr

ltホモロジーgt

ltアナロジーgt

他の構造分類データベースとしてCATHが有名

同様に階層的な分類体系を持つがその詳細はSCOPとは異なる

クラス

1mbd

1mqkH

1n55A 1pqwA

1fxd 1a2p

all-α (a)

all-β (b)

αβ (c)

α+β (d)

α-へリックスが中心

β-シートが中心

逆平行が多い

α-へリックスとβ-シートが配列上交互に現れる平行β-シートが中心

α-へリックスとβ-シートが混在配列上の並びの規則はない逆平行と平行のβ-シートが混在

アミノ酸配列と立体構造の関係ピロリ菌と大腸菌のフラボドキシン (同一残基率 SeqID 44)

ピロリ菌(1fueA) 大腸菌(1ag9A)

配列が似ていれば立体構造も似ている

SeqID = 44

RMSD = 12 Å

1fueA 2GKIGIFFGTDSGNAEAIAEKISKAIG--NAEVVDVAKASKEQFNGFTKVILVAPTAGAGD59

1ag9A 2AITGIFFGSDTGNTENIAKMIQKQLGKDVADVHDIAKSSKEDLEAYDILLLGIPTWYYGE61

1fueA 60LQTDWEDFLGTLEASD-FANKTIGLVGLGDQDTYSETFAEGIFHIYEKAK--AGKVVGQT116

1ag9A 62AQCDWDDFFPTLE-EIDFNGKLVALFGCGDQEDYAEYFCDALGTIRDIIEPRGATIVGHW120

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C 14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

BLAST

PSI-BLAST 構造比較

構造比較

アミノ酸配列がほとんど似ていなくても立体構造は似ている場合がある

構造は配列より進化的に保存がよい 構造比較から新たなホモログが発見できる可能性

立体

構造

の変

アミノ酸配列の変化と立体構造の変化の相関(グロビン族)

立体構造の変化はアミノ酸配列の変化と相関配列が30以上一致していればRMSDは2Å以下

アミノ酸配列の類似度

2つの構造の類似性

ホモロジー (homology 相同)進化的起源を共有することによる類似多くの場合分子機能なども類似している

アナロジー (analogy 相似)進化的起源とは無関係な類似多くの場合分子機能など他の属性は似ていない物理化学的な構造の偏好が原因とされる

イルカの胸びれ サルの前足

チョウの羽 トリの翼

ネコの前足

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C

ldquoFlavodoxin-likerdquo fold (c23)

ldquoFlavoproteinsrdquo superfamily (c235)

ldquoCheY-likerdquosuperfamily(c231)

14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

AnalogyHomology

HomologyHomolo

gy

多く現れるフォールド(出現ドメイン数順)

太字はスーパーフォールド多くのスーパーファミリーを含むフォールド

d58

c1

g3

c23 b34

b1

a4フォールド名 (SCOP173によるクラスfhijkは除く) ドメイ

ンの数

スーパーファミリーの数

a4 DNARNA-binding 3-helical bundle 292 14c1 TIM betaalpha-barrel 269 33d58 Ferredoxin-like 248 55b1 Immunoglobulin-like beta sandwich 246 27c37 P-loop nucleoside triphosphate hydrolase 235 1c2 NAD(P)-binding Rossmann-fold domains 168 1g3 Knottins 154 19d15 Beta-Grasp(ubiquitin-like) 131 13c23 Flavodoxin-like 118 15b34 SH3-like barrel 117 18b40 OB-fold 100 12c66 SAM-dependent methyltransferases 95 1

c37 c2

d15

b40 c66

スーパーフォールド(Superfold)

フォールド名 (SCOP173によるクラスfhijkは除く) その下のスーパーファミリーの数

d58 Ferredoxin-like 55c1 TIM betaalpha-barrel 33b1 Immunoglobulin-like beta sandwich 27a24 Four-helical up-and-down bundle 27a118 Alpha-alpha superhelix 23g3 Knottins 19b34 SH3-like barrel 18g41 Rubredoxin-like 16c23 Flavodoxin-like 15a60 SAM(sterile alpha motif) domain-like 15b69 7-bladed beta-propeller 14a4 DNARNA-binding 3-helical bundle 14

スーパーフォールド多くのスーパーファミリーを含むフォールド

スーパーフォールドは「構造の類似と機能の類似が対応しにくいフォールド」ともいえる

d58

c1

g3a118

c23

a24

a60

b34

b1

g41

b69 a4

三本へリックスバンドルDNARNA‐binding 3‐helical bundle(a4)

Mating type protein A2 yeast(1k61Aa411)

(1gvdAa413)(1wh5Aa411)

三本のへリックスが束になった構造DNAやRNAに結合する蛋白質が多い

DNAと

結合した構造(1k61)

TIMバレルTIM betaalpha barrel (c1)

Triosephosphate isomerase1n55A(c111)

全般に解糖系の酵素が多い基質酵素反応は極めて多彩

八本のβストランドとαへリックスが交互に組み合わさり対称的な樽(barrel)構造を形成す

る中央の樽構造は平行のβシートからなる

Imidazole glycerol phosphate synthasesubunit hisF1thfD(c121)

KHGKDPG aldolase1euaA(c1101)

フェレドキシン様Ferredoxin‐like (d58)

4Fe-4S Ferredoxin(1fxdd581)

1 234 4本の逆平行のβストランドと2本のαへリックスからな

分子機能は極めて多彩

CheY binding domain of CheA(1eayCd5824)

U1A RNA binding domain(1nu4Ad5871)

免疫グロブリン様Immunoglobulin‐like beta sandwich(b1)

Immunoglobulin Heavy chain variabledomain 1mjuH1(b111)

Immunoglobulin Heavy chain constantdomain 1mjuH2(b112)

Macromomycin1noaA (b171)

免疫グロブリン分子はH鎖とL鎖から

なりそれぞれ免疫グロブリン様ドメインからできている

V

C

V

C

C

C

V

CV

CC

C

L鎖

H鎖H鎖 L鎖

細胞表面あるいは分泌蛋白質が多い免疫や分子認識に関する機能を担うことが多い

4本のβストランドからなるβシートが二枚サンドイッチ状に重なった構造をとる逆平行のβシートが主

P‐loop スーパーファミリーP‐loop nucleoside triphosphate hydrolase(c37)

Ras-related protein RAB-5A1r2qA(c3718)

Guanylate kinase1gkyA(c3711)

RecA proteinDomain1 1xmsA1(c37111)

平行のβシートが主トポロジーには様々な変異あり

シグナル伝達DNA結合

モーター機能など多彩な分子機能を担うがATP GTPなどのヌクレオシド

の加水分解を行う点は共通

N C

132 4 5 6

ヌクレオシド結合部GxxxxGKTの

配列モチーフ(P-loop)を持つ

ロスマン フォールドNAD(P)‐binding Rossmann‐fold domains (c2)

Alcohol dehydrogenase gamma chaindomain2 1u3wA(c211)

Aspartate beta-semialdehydedehydrogenase2gz1A1(c213)

L-alanine dehydrogenase1pjcA1(c214)

補酵素を利用したNAD(P)を脱水素酵素を持つ基質を認識するドメインは別に存在する

NC

123 4 5 6

平行のβシートが主

7枚羽 βプロペラ7‐bladed beta‐propeller (b69)

Garactose oxydasedomain3 1k3iA3(b6911)

Guanine nucleotide-bindingprotein subunit beta-11gotB(b6941)

細胞膜付近のシグナル伝達や糖結合に関わることが多い

Influenza Neuraminidase 1f8dA(b6811)

6枚羽 βプロペラ

N C

321 4

のユニットが7回円環状に繰り返しされたフォールド

立体構造比較プログラム1990年ごろから多くの構造比較プログラムが開発されている

WEBアドレス スコア アライメント

DALI httpwwwebiacukdali

距離の差を独自の関数で変換したスコア

局所アライメントをモンテカルロ法でつなぎ合わせる

CE httpclsdsceducehtml

局所的なRMSD 局所アライメントを積み上げていく

MATRAS httpbiunitnaistjpmatras

距離の変化が相同相似で起こる確率の比をスコアとする

SSEで仮アライメント

を生成残基アライメントを収束するまで反復する

タンパク質の相同性の判断基準

100

同一残基率30以上

BLASTのE-value lt 00001

PSI-BLASTのE-value lt 00001

0102030407025 15 535

同一残基率(Sequence Identity)()

立体構造比較が必要

(1)立体構造の類似性が高い(DALIのZスコアMATRASのRdisスコア)(2)同一残基率がそこそこ高い(PSI-BLASTでヒットするSeqIDgt=15ぐらい)

(3)分子機能に類似性がある(補酵素酵素反応基質代謝経路等の共通性等)(4)基質補酵素の結合部位が類似しておりそのアミノ酸が保存(モチーフ)(5)ドメイン構成の共通性(6)スーパーフォールドの場合は特別な注意が必要

配列解析

同一残基率が25以下の場合の相同性の判断基準

50608090

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 4: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

球状タンパク質の疎水性アミノ酸

1mbdAMyoglobin

疎水性相互作用(hydrophobic interaction) 水分子と親和性の少ない非極性(non-polar疎水性)基が水溶液中で互いに集まろうとする

相互作用電気や磁気と異なり符号はなく疎水性どうしのものは相手を問わず集合する

5p21rasp21

7pcyAplastocyanin

1timATriose phosphate isomerase

疎水基ACILMFWV親水基RNDEQGHKPSTY

球状タンパク質では分子内部に疎水性アミノ酸分子表面に親水性アミノ酸が分布する傾向にある

疎水性指標による内外予測

summinus=

++

=w

wk

wiSeqKDw

iV ][12

1][

I 45 V 42 L 38 F 28 C 25 M 19 A 18 G -04 T -07 S -08 W -09 Y -13 P -16 H -32 Q -35N -35 E -35 D -35 K -39 R -45

Kyte and Doolittle(1982)の疎水性指標

方法 配列を横軸にとって縦軸に

対応する疎水性指標をプロット 前後数残基でスムージング

httpkrexpasyorgtoolsprotscalehtml

予測結果と実際の埋もれ度との比較1mbdMyoglobin

不定形タンパク質intrinsically disordered protein

親水性アミノ酸が多く疎水性アミノ酸が少ないため天然状態でもコンパクトに折たたまらない

球状タンパク質ドメインをつなぐ領域としてよく見られる

親水性アミノ酸の中でもEPQSRK

真核生物に多く原核生物には少ない

転写因子に特に多くみられる

生物学的な機能はよくわかっていないがタンパク質間相互作用に重要な働きをするといわれている

膜タンパク質

膜タンパク質脂質二重膜に埋没して機能するタンパク質

脂質頭部(親水性)

脂質尾部(疎水性)

性質(1)疎水的な脂質尾部と相互作用するためタンパク質表面には疎水性アミノ酸が多い

(2)水に溶けにくく凝集しやすい

(3)多くは膜貫通へリックスを持つ

(4)膜貫通へリックスの長さは15-30アミノ酸ぐらいアミノ酸配列からも連続した疎水性アミノ酸領域としてある程度予測可能

膜タンパク質

アミノ酸配列から膜貫通へリックスを予測するサーバSOSUIサーバhttpbpnuapnagoya-uacjpsosui

他にTMHMM Tmpredなどがある

H19 問71

1 一般に表面ではアミノ酸の挿入欠失や置換が起こりやすく内部では起こりにくい

2 生物種間で比較した時に保存されているアミノ酸がタンパク質表面で集中している領域は他のタンパク質やリガンドとの結合に関与していると予測できる

3 DNAと相互作用するタンパク質の場合DNAとの結合面は負

電荷を持つアミノ酸が集中することから容易に予測できる4 一般に表面には溶媒との相互作用のため極性基をもつアミノ

酸が多く内部は疎水性アミノ酸による疎水コアを形成していることが多い

次に示した球状タンパク質の性質に関する記述の中で不適切なものを一つ選べ

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問71

1 一般に表面ではアミノ酸の挿入欠失や置換が起こりやすく内部では起こりにくい

2 生物種間で比較した時に保存されているアミノ酸がタンパク質表面で集中している領域は他のタンパク質やリガンドとの結合に関与していると予測できる

3 DNAと相互作用するタンパク質の場合DNAとの結合面は負

電荷を持つアミノ酸が集中することから容易に予測できる4 一般に表面には溶媒との相互作用のため極性基をもつアミノ

酸が多く内部は疎水性アミノ酸による疎水コアを形成していることが多い

次に示した球状タンパク質の性質に関する記述の中で不適切なものを一つ選べ

DNAやRNAなどの核酸はリン酸基にマイナスの電荷を持っているよって核酸に

結合する蛋白質は表面にプラスの電荷を持っているものが多い平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

「タンパク質構造解析」のキーワード(構造比較)

bull 立体構造表現(コンタクトマップラマチャンドランマップ)

bull 構造比較

bull 重ね合わせbull RMSDbull 構造アライメント

bull 構造モチーフ

bull 構造分類

立体構造の決定法X線結晶解析

NMR(核磁気共鳴法)

大量発現精製結晶化

X線回折強度の測定

原子モデルの構築

原子モデルの精密化

核磁気共鳴解析(NOE解析帰属と距離拘束の抽出)

3次元電子密度マップ

原子間距離拘束

(1)多数分子の平均構造の観察(精製が重要 大きな分子複合体はより難しくなる)(2)発現精製結晶化のステップで各タンパク質によって実験条件の調整が必須(3)実験データの収集原子モデル構築の段階で計算機の支援が不可欠

大量発現精製

原子モデルの構築

原子モデルの精密化

MET 1

GLN 2

1

2

34

56

7 8

9

10

11

12

13

14

15

1617

18 19 20

21

HEADER UBIQUITIN 17-APR-92 1AAR COMPND DI-UBIQUITINSOURCE BOVINE (BOS TAURUS) ERYTHROCYTESAUTHOR WJCOOKLCJEFFREYMCARSONZCHENCMPICKART

原子番号 残基名 鎖識別子原子名 残基番号 X座標 Y座標 Z座標 占有率 温度因子

ATOM 1 N MET A 1 15493 30088 14694 100 836ATOM 2 CA MET A 1 14600 29031 15110 100 815ATOM 3 C MET A 1 15476 27793 15419 100 930ATOM 4 O MET A 1 16571 27561 14871 100 896ATOM 5 CB MET A 1 13500 28837 14105 100 989ATOM 6 CG MET A 1 13823 27997 12931 100 1021ATOM 7 SD MET A 1 12312 27711 11891 100 1033ATOM 8 CE MET A 1 13174 26595 10726 100 730ATOM 9 N GLN A 2 14968 27014 16326 100 975ATOM 10 CA GLN A 2 15552 25806 16852 100 1192ATOM 11 C GLN A 2 15000 24553 16168 100 1171ATOM 12 O GLN A 2 13787 24387 16086 100 1000 ATOM 13 CB GLN A 2 15368 25715 18386 100 1239ATOM 14 CG GLN A 2 15858 24413 19051 100 1400ATOM 15 CD GLN A 2 15676 24587 20561 100 1559ATOM 16 OE1 GLN A 2 16525 25209 21205 100 1867ATOM 17 NE2 GLN A 2 14564 24203 21152 100 1539ATOM 18 N ILE A 3 15960 23745 15687 100 1179 ATOM 19 CA ILE A 3 15593 22437 15130 100 1214ATOM 20 C ILE A 3 16491 21342 15720 100 1199ATOM 21 O ILE A 3 17701 21540 15767 100 1291

PDB ID

wwPDB(World Wide Protein Data Bank) 立体構造データの収集するデータバンク

RCSB PDB httpwwwrcsborgpdbPDBフォーマット MSD EBI httpwwwebiacukmsd

PDBj httpwwwpdbjorg

PDBは1971年に設立

立体構造描画のフリーウエアシェアウエアソフト名 WebSite 対応機種 特徴

RasMol wwwopenrasmolorg Win Mac Linux(ソース公開)

独自の高速描画アルゴリズムを用い非力なハードでも同様に高速描画が可能コマンド言語は強力で多機能基本的な描画法をカバーするが分子表面の描画はできない描画の質はやや低い

Chime wwwmdlchimecom Win Mac RasMolをベースにしたWEBブラウザ内で動作するプラグイン分子表面表示など描画機能はRasMolより拡張分子描画機能を持ったWEBページを作れる

Jmol jmolsourceforgenet Win Mac Linux(ソース公開)

Java Applet によりWEBブラウザ内で動作Chimeと同様に分子描画機能を持ったWEBページを作れるJREをインストールする必要

PyMOL pymolsourceforgenet

Win Mac Linux

OpenGLを用いた質の高い描画Python言語で開発されておりソースも公開Python言語を用いた機能

拡張も可能

CHIMERA wwwcglucsfeduchimera

Win Mac Linux

OpenGLを用いた質の高い描画電顕画像などの多

様なデータの取り込みドッキング静電計算などのインタフェース有りPython言語を用いた機能拡張

VMD wwwksuiuceduResearchvmd

Win Mac Linux

OpenGLを用いた質の高い描画Tcl言語を用いた機

能拡張が可能分子動力学の可視化を主要目的として幅広い機能

MolScript wwwavatarsemolscrit

Linux(ソース公開)

主にリボン図の描画用のソフトGUIを持たずコマンドラインでPDBファイルをPSファイル等に変換

Swiss PDB Viewer

auexpasyorgspdbv Win Mac Linux

OpenGLを用いた質の高い描画幅広い機能をサ

ポートしているがアップデートは活発でない

H19 問51

タンパク質などの生体高分子をコンピュータで表示するためのソフトウェア名として適切でないものを選択肢の中から一つ選べ

1RasMol2Chime3TMHMM4Swiss-PdbViewer

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問51

タンパク質などの生体高分子をコンピュータで表示するためのソフトウェア名として適切でないものを選択肢の中から一つ選べ

1RasMol2Chime3TMHMM4Swiss-PdbViewer

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問59

タンパク質の立体構造のグラフィックス表示プログラムではないものを選択肢の中から一つ選べ

1Chime2PyMol3MEGA4MolScript

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問59

タンパク質の立体構造のグラフィックス表示プログラムではないものを選択肢の中から一つ選べ

1Chime2PyMol3MEGA4MolScript

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

PDBコード1fxd(ferredoxin II) Rasmol Chimeプラグインで描画

立体構造の描画スタイル

ワイアフレーム ボールスティック 空間充填

バックボーン リボン 分子表面

1 234

N

H C

O

Ala(A)(疎水性)

Phe(F)(疎水性)

Cys(C)(親水性)

Asp(D)(親水性)

Val(V)(疎水性)

Thr(親水性)

様々な物理化学的な性質を持った側鎖が主鎖のペプチド結合で連なる

Leu(L)(疎水性)

蛋白質ペプチド結合したアミノ酸群

アミノ酸は全部で20種類

I VL

M FYW H

KR

D E

P NSA Q

CG T

疎水性 親水性

脂肪族

芳香族正荷電

負荷電

N末

C末

変性状態(D) 天然状態(N)

フォールディング(折り畳み)という現象

非常に多種の構造の集合大きく広がっている

ほとんど唯一の構造小さくコンパクトに折りたたまっている

温度や変性剤濃度によって可逆に変化

折り畳みは原則としてその蛋白質以外の分子の介助を必要としない

アミノ酸配列の情報だけで天然状態の立体構造が決定される

どうやってコンパクトになるか rarr (1)主鎖の水素結合(2)側鎖間の疎水性相互作用

あるアミノ酸配列がどうやって一つの構造を決めるのか

3次元座標の差のスコア(RMSD)

並進ベクトルt を引いたあと回転行列R をかける

t 二つの分子の重心をあわせるように決めるR 2つの原子群の相関を 大化する行列rarr(1)特異値分解で導出

(2)四元数表現により 適な回転をLagrange未定乗数法で決定

sum=

minusminus=N

iiiN

RMSD1

2)](R[1 tyx

21

20

1

2

3

4

5

1xdaA

1

23

4

21

20

5

yi

)(R ty minusi

xi

1

23

4

21

20

5

原子の対応付けがわかっているとする

RMSD 適に重ね合わせたときのXYZ座標の差(Root Mean Square Deviation)

1benA

WKabsch Acta CrystA 32922-923(1976) 34827-828(1978)ADMclachlan JMolBiol 12874-77 (1979)Charles FF Karney ldquoQuaternions in molecular modelingrdquo E-print arXivphysics0506177

xi分子Xのi番目の原子の位置ベクトル yi分子Yのi番目の原子の位置ベクトル

距離の差のスコア (DRMS)

( )sumsum= ge

minusminus

=N

i

N

ij

Yij

Xij DD

NNDRMS

1

2

)1(2

21

20

1

2

3

4

5

YijD

XijD

1

23

4

21

20

5

yixi

DRMS 対応する原子ペアの距離の差(Distance-based RMSD)

原子の対応付けがわかっているとする

重ね合わせは不要なので計算は簡単

3次元によらない2次元や結合情報にも拡張できる

鏡像の区別はできない

1benA

計算が簡単なので高速な構造比較のアルゴリズムの基盤として使われる

1xdaA

H19 問73立体構造の似ている2つのタンパク質間で対応関係にある原子が分かっている場合にはRMSD(Root Mean Square Deviation)と呼ばれる数値を計算することにより立体構造の重なり合いの程度を数値化することができるRMSDは全ての対応する原子間の距離を

2乗した値の平均値(相加平均)にルートをとったものとして定義されるあるタンパク質における6つの原子ABCDEFと別のタンパク質の6つの原子

ArsquoBrsquoCrsquoDrsquoErsquoFrsquoについて対応関係が分かっており互いにもっともよく重なるように回転して重ねた時の対応原子間の距離は以下の表のようになったこの表からB-Brsquo C-Crsquo D-Drsquo E-Ersquoは正確に重なったが他の原子間ではずれが見られることがわかるここで6つの原子に対するRMSD値はいくらになるか選択肢の中からもっとも適切な値を一つ選べただ

し原子間距離の単位は考慮しないものとする

対応原子 距離

原子A―原子Arsquo 20

原子B―原子Brsquo 00

原子C―原子Crsquo 00

原子D―原子Crsquo 10

原子E―原子Crsquo 00

原子F―原子Crsquo 10

1 052 0663 104 133

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問73立体構造の似ている2つのタンパク質間で対応関係にある原子が分かっている場合にはRMSD(Root Mean Square Deviation)と呼ばれる数値を計算することにより立体構造の重なり合いの程度を数値化することができるRMSDは全ての対応する原子間の距離を

2乗した値の平均値(相加平均)にルートをとったものとして定義されるあるタンパク質における6つの原子ABCDEFと別のタンパク質の6つの原子

ArsquoBrsquoCrsquoDrsquoErsquoFrsquoについて対応関係が分かっており互いにもっともよく重なるように回転して重ねた時の対応原子間の距離は以下の表のようになったこの表からB-Brsquo C-Crsquo D-Drsquo E-Ersquoは正確に重なったが他の原子間ではずれが見られることがわかるここで6つの原子に対するRMSD値はいくらになるか選択肢の中からもっとも適切な値を一つ選べただ

し原子間距離の単位は考慮しないものとする

対応原子 距離

原子A―原子Arsquo 20

原子B―原子Brsquo 00

原子C―原子Crsquo 00

原子D―原子Crsquo 10

原子E―原子Crsquo 00

原子F―原子Crsquo 10

1 052 0663 104 133

RMSDは 適に重ね合わせたときの

「ずれの二乗の平均のルート」であるしたがってずれの二乗平均は

(22+0+0+1+0+1)6=66=1これのルートをとるとradic1=1

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

1

2

3

4

56

7

8

9

10

11

主鎖の水素結合αへリックス

1

2

34

56

78

9

10

11

O

N

CHN

N

H

H

CO Cα

i

i+3

i+4

HN O C

Cαi-1

i番目のCOがi+4番目のNHと水素結合を形成

36残基が1周期の右巻きらせん

NHO=Cが同じ向きに並ぶため

へリックス全体に電気双極子が発生

N末C末

ー +

主鎖の水素結合逆平行βシート

βターン

βターン

βヘアピン

βヘアピン

伸びた構造の1本1本をβストランドと呼ぶ二本以上のβストランドがシート状に並んだ構造をβシートと呼ぶ

βストランド

βストランド

βストランド

主鎖の水素結合平行βシート

βminusαminusβモチーフ

平行βシートがαへリックスで接続された構造モチーフ

βストランド

βストランド

βストランド

伸びた構造の1本1本をβストランドと呼ぶ二本以上のβストランドがシート状に並んだ構造をβシートと呼ぶ

Cαi

Cαi+1Cα

i-1φ ψ

ペプチド結合の平面性とφψの定義

主鎖の原子のXYZ座標はφψの2つ

の角度でほとんど記述できる

φψの角度を2次元にプロットしたものをラマチャンドランプロット(Ramachandran plot)という点が集中する領域は2次構造とよく対応

点が現れない領域は主鎖の原子が衝突する

βシート

αへリックス

左巻きへリックス

平面平面

φ

ψ

H19 問74タンパク質の主鎖に添って定義される二面角のうちφ(窒素原子と炭素原子の間の二面角)とψ(α炭素原子とカルボニル基の炭素原子の間の二面角)の値を各残

基ごとに計算して二次元にプロットしたものをラマチャンドランプロットと呼ぶ以下に示したラマチャンドランプロットに対する説明文の中でもっとも適切なものを一つ選べ

1 (a)(b)はともにαへリックスの領域である2 (a)(b)はともにβストランドの領域である3 (a)はαへリックス(b)はβストランドの領

域である4 (a)はβストランド(b)はαへリックスの領

域である

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問74タンパク質の主鎖に添って定義される二面角のうちφ(窒素原子と炭素原子の間の二面角)とψ(α炭素原子とカルボニル基の炭素原子の間の二面角)の値を各残

基ごとに計算して二次元にプロットしたものをラマチャンドランプロットと呼ぶ以下に示したラマチャンドランプロットに対する説明文の中でもっとも適切なものを一つ選べ

1 (a)(b)はともにαへリックスの領域である2 (a)(b)はともにβストランドの領域である3 (a)はαへリックス(b)はβストランドの領

域である4 (a)はβストランド(b)はαへリックスの領

域である

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

トポロジー図によるβシートの表現

4 23

N

C

1

1ubq (UbiquitinHumand151)

N

C123 4 5 6

1n8k (Alchol dehydrogenase E chain Horse c21)

ロスマンフォールド

βターン

βターン

1cauA1rhdA domain2

TOPSプログラムによる表示httpwwwtopsleedsacuk

1timA

はαへリックスはβストランドとなりあうの向きで平行逆平行を示す

コンタクトマップ

1ubq

C

4 23

N

1

縦横に残基を配置しある残基ペアのCα原子間の距離が10Å以下であれば対応するピクセルに色を塗る

分子描画ソフトVMDを用いて作成

平行のストランド間は方向逆平行ストランド間は方向に線分が観察される

N

C

N C

逆平行

逆平行

平行

αへリックスは太めの対角上の線分

へリックス

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから1か3コンタクトマップから平行シートしかないことがわかるため1であることがわかる

αβ5

αβ3

α

β4α

β1αβ2 β2

β1β3β4

β5

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから2か4コンタクトマップから平行シートしかないことがわかるため2であることがわかる

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

配列比較によるタンパク質分類1970年代から配列の一致度(sequence identity)に基づいてグループを作る作業が

行われてきた

どのくらいの類似性で一つにまとめるかは様々な考えがあるが少なくとも「相同なタンパク質群」を一つのグループにまとめるべき

ファミリー(family 族)

進化的に関係のある(相同な)タンパク質グループのこと

複数のファミリーがあつまった大きなグループ スーパーファミリー(superfamily clan)

一つのファミリーの中の小さなグループ サブファミリー(subfamily)

family

subfamily superfamily

ドメイン単位による分類

A2 B2

B3 C3

A1

配列1

配列2

配列3

配列の部分どうしだけが類似していた場合 部分一致を重視するとすべて一つのグループになるがhellip

配列1

配列2 配列3

Aを共有

Bを共有

1と2が類似2と3が類似していても1と3は類似していない

ドメインに分割すると

A1

A2

B2

B3

C3

A2 B2

B3 C3

A1

きれいに分類することができる

Pfam 蛋白質ファミリのデータベース各蛋白質ファミリのマルチプル

アライメント HMMなどを集めたデータベース

httppfamsangeracuk

Pkinase_Tyrドメインをもつタンパク質の例

ABL_HUMAN

BTK_HUMAN

ILK_HUMAN

MERTK_HUMAN

PGFRB_HUMAN

HCK_HUMAN

Family Pkinase_Tyr (PF07714) Protein tyrosine kinase

Pfamデータベース(httppfamsangeracukSoftwarePfam)からの引用

ドメイン構造と疎水性の関係Tyrosine protein kinase HCK (1ad5A HCK_HUMAN)

SH3 domain

SH2 domain

Tyrosine-kinase domain

3つの分断された疎水性コアrarr ドメイン構造

大きなタンパク質はいくつかの構造上のまとまり(ドメイン)を持つことが多い

立体構造によるタンパク質の分類

bull 配列による分類の延長ドメイン単位の分類進化的に関係のある(相同な)タンパク質を群にする(ファミリー)という考え方は同じ

bull 立体構造の類似性からより遠縁の相同性を見つけより大きな群を作る(スーパーファミリー)

bull スーパーファミリーをまとめたさらに大きなグループ(フォールドクラス)

bull 主にアミノ酸(Cαレベル)のラフな構造の類似性に

着目

bull 分類対象は主に球状タンパク質

立体構造分類データベースSCOPhttpscopmrc-lmbcamacukscop

4階層で分類Class(クラス)

Fold(フォールド)

Superfamily(スーパーファミリー)

Family(ファミリー)

どの階層に分類するかは配列の類似性立体構造の類似性分子機能の類似性機能部位の類似性

を専門家が総合的に判断して決める

1akr

ltホモロジーgt

ltアナロジーgt

他の構造分類データベースとしてCATHが有名

同様に階層的な分類体系を持つがその詳細はSCOPとは異なる

クラス

1mbd

1mqkH

1n55A 1pqwA

1fxd 1a2p

all-α (a)

all-β (b)

αβ (c)

α+β (d)

α-へリックスが中心

β-シートが中心

逆平行が多い

α-へリックスとβ-シートが配列上交互に現れる平行β-シートが中心

α-へリックスとβ-シートが混在配列上の並びの規則はない逆平行と平行のβ-シートが混在

アミノ酸配列と立体構造の関係ピロリ菌と大腸菌のフラボドキシン (同一残基率 SeqID 44)

ピロリ菌(1fueA) 大腸菌(1ag9A)

配列が似ていれば立体構造も似ている

SeqID = 44

RMSD = 12 Å

1fueA 2GKIGIFFGTDSGNAEAIAEKISKAIG--NAEVVDVAKASKEQFNGFTKVILVAPTAGAGD59

1ag9A 2AITGIFFGSDTGNTENIAKMIQKQLGKDVADVHDIAKSSKEDLEAYDILLLGIPTWYYGE61

1fueA 60LQTDWEDFLGTLEASD-FANKTIGLVGLGDQDTYSETFAEGIFHIYEKAK--AGKVVGQT116

1ag9A 62AQCDWDDFFPTLE-EIDFNGKLVALFGCGDQEDYAEYFCDALGTIRDIIEPRGATIVGHW120

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C 14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

BLAST

PSI-BLAST 構造比較

構造比較

アミノ酸配列がほとんど似ていなくても立体構造は似ている場合がある

構造は配列より進化的に保存がよい 構造比較から新たなホモログが発見できる可能性

立体

構造

の変

アミノ酸配列の変化と立体構造の変化の相関(グロビン族)

立体構造の変化はアミノ酸配列の変化と相関配列が30以上一致していればRMSDは2Å以下

アミノ酸配列の類似度

2つの構造の類似性

ホモロジー (homology 相同)進化的起源を共有することによる類似多くの場合分子機能なども類似している

アナロジー (analogy 相似)進化的起源とは無関係な類似多くの場合分子機能など他の属性は似ていない物理化学的な構造の偏好が原因とされる

イルカの胸びれ サルの前足

チョウの羽 トリの翼

ネコの前足

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C

ldquoFlavodoxin-likerdquo fold (c23)

ldquoFlavoproteinsrdquo superfamily (c235)

ldquoCheY-likerdquosuperfamily(c231)

14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

AnalogyHomology

HomologyHomolo

gy

多く現れるフォールド(出現ドメイン数順)

太字はスーパーフォールド多くのスーパーファミリーを含むフォールド

d58

c1

g3

c23 b34

b1

a4フォールド名 (SCOP173によるクラスfhijkは除く) ドメイ

ンの数

スーパーファミリーの数

a4 DNARNA-binding 3-helical bundle 292 14c1 TIM betaalpha-barrel 269 33d58 Ferredoxin-like 248 55b1 Immunoglobulin-like beta sandwich 246 27c37 P-loop nucleoside triphosphate hydrolase 235 1c2 NAD(P)-binding Rossmann-fold domains 168 1g3 Knottins 154 19d15 Beta-Grasp(ubiquitin-like) 131 13c23 Flavodoxin-like 118 15b34 SH3-like barrel 117 18b40 OB-fold 100 12c66 SAM-dependent methyltransferases 95 1

c37 c2

d15

b40 c66

スーパーフォールド(Superfold)

フォールド名 (SCOP173によるクラスfhijkは除く) その下のスーパーファミリーの数

d58 Ferredoxin-like 55c1 TIM betaalpha-barrel 33b1 Immunoglobulin-like beta sandwich 27a24 Four-helical up-and-down bundle 27a118 Alpha-alpha superhelix 23g3 Knottins 19b34 SH3-like barrel 18g41 Rubredoxin-like 16c23 Flavodoxin-like 15a60 SAM(sterile alpha motif) domain-like 15b69 7-bladed beta-propeller 14a4 DNARNA-binding 3-helical bundle 14

スーパーフォールド多くのスーパーファミリーを含むフォールド

スーパーフォールドは「構造の類似と機能の類似が対応しにくいフォールド」ともいえる

d58

c1

g3a118

c23

a24

a60

b34

b1

g41

b69 a4

三本へリックスバンドルDNARNA‐binding 3‐helical bundle(a4)

Mating type protein A2 yeast(1k61Aa411)

(1gvdAa413)(1wh5Aa411)

三本のへリックスが束になった構造DNAやRNAに結合する蛋白質が多い

DNAと

結合した構造(1k61)

TIMバレルTIM betaalpha barrel (c1)

Triosephosphate isomerase1n55A(c111)

全般に解糖系の酵素が多い基質酵素反応は極めて多彩

八本のβストランドとαへリックスが交互に組み合わさり対称的な樽(barrel)構造を形成す

る中央の樽構造は平行のβシートからなる

Imidazole glycerol phosphate synthasesubunit hisF1thfD(c121)

KHGKDPG aldolase1euaA(c1101)

フェレドキシン様Ferredoxin‐like (d58)

4Fe-4S Ferredoxin(1fxdd581)

1 234 4本の逆平行のβストランドと2本のαへリックスからな

分子機能は極めて多彩

CheY binding domain of CheA(1eayCd5824)

U1A RNA binding domain(1nu4Ad5871)

免疫グロブリン様Immunoglobulin‐like beta sandwich(b1)

Immunoglobulin Heavy chain variabledomain 1mjuH1(b111)

Immunoglobulin Heavy chain constantdomain 1mjuH2(b112)

Macromomycin1noaA (b171)

免疫グロブリン分子はH鎖とL鎖から

なりそれぞれ免疫グロブリン様ドメインからできている

V

C

V

C

C

C

V

CV

CC

C

L鎖

H鎖H鎖 L鎖

細胞表面あるいは分泌蛋白質が多い免疫や分子認識に関する機能を担うことが多い

4本のβストランドからなるβシートが二枚サンドイッチ状に重なった構造をとる逆平行のβシートが主

P‐loop スーパーファミリーP‐loop nucleoside triphosphate hydrolase(c37)

Ras-related protein RAB-5A1r2qA(c3718)

Guanylate kinase1gkyA(c3711)

RecA proteinDomain1 1xmsA1(c37111)

平行のβシートが主トポロジーには様々な変異あり

シグナル伝達DNA結合

モーター機能など多彩な分子機能を担うがATP GTPなどのヌクレオシド

の加水分解を行う点は共通

N C

132 4 5 6

ヌクレオシド結合部GxxxxGKTの

配列モチーフ(P-loop)を持つ

ロスマン フォールドNAD(P)‐binding Rossmann‐fold domains (c2)

Alcohol dehydrogenase gamma chaindomain2 1u3wA(c211)

Aspartate beta-semialdehydedehydrogenase2gz1A1(c213)

L-alanine dehydrogenase1pjcA1(c214)

補酵素を利用したNAD(P)を脱水素酵素を持つ基質を認識するドメインは別に存在する

NC

123 4 5 6

平行のβシートが主

7枚羽 βプロペラ7‐bladed beta‐propeller (b69)

Garactose oxydasedomain3 1k3iA3(b6911)

Guanine nucleotide-bindingprotein subunit beta-11gotB(b6941)

細胞膜付近のシグナル伝達や糖結合に関わることが多い

Influenza Neuraminidase 1f8dA(b6811)

6枚羽 βプロペラ

N C

321 4

のユニットが7回円環状に繰り返しされたフォールド

立体構造比較プログラム1990年ごろから多くの構造比較プログラムが開発されている

WEBアドレス スコア アライメント

DALI httpwwwebiacukdali

距離の差を独自の関数で変換したスコア

局所アライメントをモンテカルロ法でつなぎ合わせる

CE httpclsdsceducehtml

局所的なRMSD 局所アライメントを積み上げていく

MATRAS httpbiunitnaistjpmatras

距離の変化が相同相似で起こる確率の比をスコアとする

SSEで仮アライメント

を生成残基アライメントを収束するまで反復する

タンパク質の相同性の判断基準

100

同一残基率30以上

BLASTのE-value lt 00001

PSI-BLASTのE-value lt 00001

0102030407025 15 535

同一残基率(Sequence Identity)()

立体構造比較が必要

(1)立体構造の類似性が高い(DALIのZスコアMATRASのRdisスコア)(2)同一残基率がそこそこ高い(PSI-BLASTでヒットするSeqIDgt=15ぐらい)

(3)分子機能に類似性がある(補酵素酵素反応基質代謝経路等の共通性等)(4)基質補酵素の結合部位が類似しておりそのアミノ酸が保存(モチーフ)(5)ドメイン構成の共通性(6)スーパーフォールドの場合は特別な注意が必要

配列解析

同一残基率が25以下の場合の相同性の判断基準

50608090

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 5: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

疎水性指標による内外予測

summinus=

++

=w

wk

wiSeqKDw

iV ][12

1][

I 45 V 42 L 38 F 28 C 25 M 19 A 18 G -04 T -07 S -08 W -09 Y -13 P -16 H -32 Q -35N -35 E -35 D -35 K -39 R -45

Kyte and Doolittle(1982)の疎水性指標

方法 配列を横軸にとって縦軸に

対応する疎水性指標をプロット 前後数残基でスムージング

httpkrexpasyorgtoolsprotscalehtml

予測結果と実際の埋もれ度との比較1mbdMyoglobin

不定形タンパク質intrinsically disordered protein

親水性アミノ酸が多く疎水性アミノ酸が少ないため天然状態でもコンパクトに折たたまらない

球状タンパク質ドメインをつなぐ領域としてよく見られる

親水性アミノ酸の中でもEPQSRK

真核生物に多く原核生物には少ない

転写因子に特に多くみられる

生物学的な機能はよくわかっていないがタンパク質間相互作用に重要な働きをするといわれている

膜タンパク質

膜タンパク質脂質二重膜に埋没して機能するタンパク質

脂質頭部(親水性)

脂質尾部(疎水性)

性質(1)疎水的な脂質尾部と相互作用するためタンパク質表面には疎水性アミノ酸が多い

(2)水に溶けにくく凝集しやすい

(3)多くは膜貫通へリックスを持つ

(4)膜貫通へリックスの長さは15-30アミノ酸ぐらいアミノ酸配列からも連続した疎水性アミノ酸領域としてある程度予測可能

膜タンパク質

アミノ酸配列から膜貫通へリックスを予測するサーバSOSUIサーバhttpbpnuapnagoya-uacjpsosui

他にTMHMM Tmpredなどがある

H19 問71

1 一般に表面ではアミノ酸の挿入欠失や置換が起こりやすく内部では起こりにくい

2 生物種間で比較した時に保存されているアミノ酸がタンパク質表面で集中している領域は他のタンパク質やリガンドとの結合に関与していると予測できる

3 DNAと相互作用するタンパク質の場合DNAとの結合面は負

電荷を持つアミノ酸が集中することから容易に予測できる4 一般に表面には溶媒との相互作用のため極性基をもつアミノ

酸が多く内部は疎水性アミノ酸による疎水コアを形成していることが多い

次に示した球状タンパク質の性質に関する記述の中で不適切なものを一つ選べ

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問71

1 一般に表面ではアミノ酸の挿入欠失や置換が起こりやすく内部では起こりにくい

2 生物種間で比較した時に保存されているアミノ酸がタンパク質表面で集中している領域は他のタンパク質やリガンドとの結合に関与していると予測できる

3 DNAと相互作用するタンパク質の場合DNAとの結合面は負

電荷を持つアミノ酸が集中することから容易に予測できる4 一般に表面には溶媒との相互作用のため極性基をもつアミノ

酸が多く内部は疎水性アミノ酸による疎水コアを形成していることが多い

次に示した球状タンパク質の性質に関する記述の中で不適切なものを一つ選べ

DNAやRNAなどの核酸はリン酸基にマイナスの電荷を持っているよって核酸に

結合する蛋白質は表面にプラスの電荷を持っているものが多い平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

「タンパク質構造解析」のキーワード(構造比較)

bull 立体構造表現(コンタクトマップラマチャンドランマップ)

bull 構造比較

bull 重ね合わせbull RMSDbull 構造アライメント

bull 構造モチーフ

bull 構造分類

立体構造の決定法X線結晶解析

NMR(核磁気共鳴法)

大量発現精製結晶化

X線回折強度の測定

原子モデルの構築

原子モデルの精密化

核磁気共鳴解析(NOE解析帰属と距離拘束の抽出)

3次元電子密度マップ

原子間距離拘束

(1)多数分子の平均構造の観察(精製が重要 大きな分子複合体はより難しくなる)(2)発現精製結晶化のステップで各タンパク質によって実験条件の調整が必須(3)実験データの収集原子モデル構築の段階で計算機の支援が不可欠

大量発現精製

原子モデルの構築

原子モデルの精密化

MET 1

GLN 2

1

2

34

56

7 8

9

10

11

12

13

14

15

1617

18 19 20

21

HEADER UBIQUITIN 17-APR-92 1AAR COMPND DI-UBIQUITINSOURCE BOVINE (BOS TAURUS) ERYTHROCYTESAUTHOR WJCOOKLCJEFFREYMCARSONZCHENCMPICKART

原子番号 残基名 鎖識別子原子名 残基番号 X座標 Y座標 Z座標 占有率 温度因子

ATOM 1 N MET A 1 15493 30088 14694 100 836ATOM 2 CA MET A 1 14600 29031 15110 100 815ATOM 3 C MET A 1 15476 27793 15419 100 930ATOM 4 O MET A 1 16571 27561 14871 100 896ATOM 5 CB MET A 1 13500 28837 14105 100 989ATOM 6 CG MET A 1 13823 27997 12931 100 1021ATOM 7 SD MET A 1 12312 27711 11891 100 1033ATOM 8 CE MET A 1 13174 26595 10726 100 730ATOM 9 N GLN A 2 14968 27014 16326 100 975ATOM 10 CA GLN A 2 15552 25806 16852 100 1192ATOM 11 C GLN A 2 15000 24553 16168 100 1171ATOM 12 O GLN A 2 13787 24387 16086 100 1000 ATOM 13 CB GLN A 2 15368 25715 18386 100 1239ATOM 14 CG GLN A 2 15858 24413 19051 100 1400ATOM 15 CD GLN A 2 15676 24587 20561 100 1559ATOM 16 OE1 GLN A 2 16525 25209 21205 100 1867ATOM 17 NE2 GLN A 2 14564 24203 21152 100 1539ATOM 18 N ILE A 3 15960 23745 15687 100 1179 ATOM 19 CA ILE A 3 15593 22437 15130 100 1214ATOM 20 C ILE A 3 16491 21342 15720 100 1199ATOM 21 O ILE A 3 17701 21540 15767 100 1291

PDB ID

wwPDB(World Wide Protein Data Bank) 立体構造データの収集するデータバンク

RCSB PDB httpwwwrcsborgpdbPDBフォーマット MSD EBI httpwwwebiacukmsd

PDBj httpwwwpdbjorg

PDBは1971年に設立

立体構造描画のフリーウエアシェアウエアソフト名 WebSite 対応機種 特徴

RasMol wwwopenrasmolorg Win Mac Linux(ソース公開)

独自の高速描画アルゴリズムを用い非力なハードでも同様に高速描画が可能コマンド言語は強力で多機能基本的な描画法をカバーするが分子表面の描画はできない描画の質はやや低い

Chime wwwmdlchimecom Win Mac RasMolをベースにしたWEBブラウザ内で動作するプラグイン分子表面表示など描画機能はRasMolより拡張分子描画機能を持ったWEBページを作れる

Jmol jmolsourceforgenet Win Mac Linux(ソース公開)

Java Applet によりWEBブラウザ内で動作Chimeと同様に分子描画機能を持ったWEBページを作れるJREをインストールする必要

PyMOL pymolsourceforgenet

Win Mac Linux

OpenGLを用いた質の高い描画Python言語で開発されておりソースも公開Python言語を用いた機能

拡張も可能

CHIMERA wwwcglucsfeduchimera

Win Mac Linux

OpenGLを用いた質の高い描画電顕画像などの多

様なデータの取り込みドッキング静電計算などのインタフェース有りPython言語を用いた機能拡張

VMD wwwksuiuceduResearchvmd

Win Mac Linux

OpenGLを用いた質の高い描画Tcl言語を用いた機

能拡張が可能分子動力学の可視化を主要目的として幅広い機能

MolScript wwwavatarsemolscrit

Linux(ソース公開)

主にリボン図の描画用のソフトGUIを持たずコマンドラインでPDBファイルをPSファイル等に変換

Swiss PDB Viewer

auexpasyorgspdbv Win Mac Linux

OpenGLを用いた質の高い描画幅広い機能をサ

ポートしているがアップデートは活発でない

H19 問51

タンパク質などの生体高分子をコンピュータで表示するためのソフトウェア名として適切でないものを選択肢の中から一つ選べ

1RasMol2Chime3TMHMM4Swiss-PdbViewer

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問51

タンパク質などの生体高分子をコンピュータで表示するためのソフトウェア名として適切でないものを選択肢の中から一つ選べ

1RasMol2Chime3TMHMM4Swiss-PdbViewer

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問59

タンパク質の立体構造のグラフィックス表示プログラムではないものを選択肢の中から一つ選べ

1Chime2PyMol3MEGA4MolScript

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問59

タンパク質の立体構造のグラフィックス表示プログラムではないものを選択肢の中から一つ選べ

1Chime2PyMol3MEGA4MolScript

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

PDBコード1fxd(ferredoxin II) Rasmol Chimeプラグインで描画

立体構造の描画スタイル

ワイアフレーム ボールスティック 空間充填

バックボーン リボン 分子表面

1 234

N

H C

O

Ala(A)(疎水性)

Phe(F)(疎水性)

Cys(C)(親水性)

Asp(D)(親水性)

Val(V)(疎水性)

Thr(親水性)

様々な物理化学的な性質を持った側鎖が主鎖のペプチド結合で連なる

Leu(L)(疎水性)

蛋白質ペプチド結合したアミノ酸群

アミノ酸は全部で20種類

I VL

M FYW H

KR

D E

P NSA Q

CG T

疎水性 親水性

脂肪族

芳香族正荷電

負荷電

N末

C末

変性状態(D) 天然状態(N)

フォールディング(折り畳み)という現象

非常に多種の構造の集合大きく広がっている

ほとんど唯一の構造小さくコンパクトに折りたたまっている

温度や変性剤濃度によって可逆に変化

折り畳みは原則としてその蛋白質以外の分子の介助を必要としない

アミノ酸配列の情報だけで天然状態の立体構造が決定される

どうやってコンパクトになるか rarr (1)主鎖の水素結合(2)側鎖間の疎水性相互作用

あるアミノ酸配列がどうやって一つの構造を決めるのか

3次元座標の差のスコア(RMSD)

並進ベクトルt を引いたあと回転行列R をかける

t 二つの分子の重心をあわせるように決めるR 2つの原子群の相関を 大化する行列rarr(1)特異値分解で導出

(2)四元数表現により 適な回転をLagrange未定乗数法で決定

sum=

minusminus=N

iiiN

RMSD1

2)](R[1 tyx

21

20

1

2

3

4

5

1xdaA

1

23

4

21

20

5

yi

)(R ty minusi

xi

1

23

4

21

20

5

原子の対応付けがわかっているとする

RMSD 適に重ね合わせたときのXYZ座標の差(Root Mean Square Deviation)

1benA

WKabsch Acta CrystA 32922-923(1976) 34827-828(1978)ADMclachlan JMolBiol 12874-77 (1979)Charles FF Karney ldquoQuaternions in molecular modelingrdquo E-print arXivphysics0506177

xi分子Xのi番目の原子の位置ベクトル yi分子Yのi番目の原子の位置ベクトル

距離の差のスコア (DRMS)

( )sumsum= ge

minusminus

=N

i

N

ij

Yij

Xij DD

NNDRMS

1

2

)1(2

21

20

1

2

3

4

5

YijD

XijD

1

23

4

21

20

5

yixi

DRMS 対応する原子ペアの距離の差(Distance-based RMSD)

原子の対応付けがわかっているとする

重ね合わせは不要なので計算は簡単

3次元によらない2次元や結合情報にも拡張できる

鏡像の区別はできない

1benA

計算が簡単なので高速な構造比較のアルゴリズムの基盤として使われる

1xdaA

H19 問73立体構造の似ている2つのタンパク質間で対応関係にある原子が分かっている場合にはRMSD(Root Mean Square Deviation)と呼ばれる数値を計算することにより立体構造の重なり合いの程度を数値化することができるRMSDは全ての対応する原子間の距離を

2乗した値の平均値(相加平均)にルートをとったものとして定義されるあるタンパク質における6つの原子ABCDEFと別のタンパク質の6つの原子

ArsquoBrsquoCrsquoDrsquoErsquoFrsquoについて対応関係が分かっており互いにもっともよく重なるように回転して重ねた時の対応原子間の距離は以下の表のようになったこの表からB-Brsquo C-Crsquo D-Drsquo E-Ersquoは正確に重なったが他の原子間ではずれが見られることがわかるここで6つの原子に対するRMSD値はいくらになるか選択肢の中からもっとも適切な値を一つ選べただ

し原子間距離の単位は考慮しないものとする

対応原子 距離

原子A―原子Arsquo 20

原子B―原子Brsquo 00

原子C―原子Crsquo 00

原子D―原子Crsquo 10

原子E―原子Crsquo 00

原子F―原子Crsquo 10

1 052 0663 104 133

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問73立体構造の似ている2つのタンパク質間で対応関係にある原子が分かっている場合にはRMSD(Root Mean Square Deviation)と呼ばれる数値を計算することにより立体構造の重なり合いの程度を数値化することができるRMSDは全ての対応する原子間の距離を

2乗した値の平均値(相加平均)にルートをとったものとして定義されるあるタンパク質における6つの原子ABCDEFと別のタンパク質の6つの原子

ArsquoBrsquoCrsquoDrsquoErsquoFrsquoについて対応関係が分かっており互いにもっともよく重なるように回転して重ねた時の対応原子間の距離は以下の表のようになったこの表からB-Brsquo C-Crsquo D-Drsquo E-Ersquoは正確に重なったが他の原子間ではずれが見られることがわかるここで6つの原子に対するRMSD値はいくらになるか選択肢の中からもっとも適切な値を一つ選べただ

し原子間距離の単位は考慮しないものとする

対応原子 距離

原子A―原子Arsquo 20

原子B―原子Brsquo 00

原子C―原子Crsquo 00

原子D―原子Crsquo 10

原子E―原子Crsquo 00

原子F―原子Crsquo 10

1 052 0663 104 133

RMSDは 適に重ね合わせたときの

「ずれの二乗の平均のルート」であるしたがってずれの二乗平均は

(22+0+0+1+0+1)6=66=1これのルートをとるとradic1=1

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

1

2

3

4

56

7

8

9

10

11

主鎖の水素結合αへリックス

1

2

34

56

78

9

10

11

O

N

CHN

N

H

H

CO Cα

i

i+3

i+4

HN O C

Cαi-1

i番目のCOがi+4番目のNHと水素結合を形成

36残基が1周期の右巻きらせん

NHO=Cが同じ向きに並ぶため

へリックス全体に電気双極子が発生

N末C末

ー +

主鎖の水素結合逆平行βシート

βターン

βターン

βヘアピン

βヘアピン

伸びた構造の1本1本をβストランドと呼ぶ二本以上のβストランドがシート状に並んだ構造をβシートと呼ぶ

βストランド

βストランド

βストランド

主鎖の水素結合平行βシート

βminusαminusβモチーフ

平行βシートがαへリックスで接続された構造モチーフ

βストランド

βストランド

βストランド

伸びた構造の1本1本をβストランドと呼ぶ二本以上のβストランドがシート状に並んだ構造をβシートと呼ぶ

Cαi

Cαi+1Cα

i-1φ ψ

ペプチド結合の平面性とφψの定義

主鎖の原子のXYZ座標はφψの2つ

の角度でほとんど記述できる

φψの角度を2次元にプロットしたものをラマチャンドランプロット(Ramachandran plot)という点が集中する領域は2次構造とよく対応

点が現れない領域は主鎖の原子が衝突する

βシート

αへリックス

左巻きへリックス

平面平面

φ

ψ

H19 問74タンパク質の主鎖に添って定義される二面角のうちφ(窒素原子と炭素原子の間の二面角)とψ(α炭素原子とカルボニル基の炭素原子の間の二面角)の値を各残

基ごとに計算して二次元にプロットしたものをラマチャンドランプロットと呼ぶ以下に示したラマチャンドランプロットに対する説明文の中でもっとも適切なものを一つ選べ

1 (a)(b)はともにαへリックスの領域である2 (a)(b)はともにβストランドの領域である3 (a)はαへリックス(b)はβストランドの領

域である4 (a)はβストランド(b)はαへリックスの領

域である

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問74タンパク質の主鎖に添って定義される二面角のうちφ(窒素原子と炭素原子の間の二面角)とψ(α炭素原子とカルボニル基の炭素原子の間の二面角)の値を各残

基ごとに計算して二次元にプロットしたものをラマチャンドランプロットと呼ぶ以下に示したラマチャンドランプロットに対する説明文の中でもっとも適切なものを一つ選べ

1 (a)(b)はともにαへリックスの領域である2 (a)(b)はともにβストランドの領域である3 (a)はαへリックス(b)はβストランドの領

域である4 (a)はβストランド(b)はαへリックスの領

域である

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

トポロジー図によるβシートの表現

4 23

N

C

1

1ubq (UbiquitinHumand151)

N

C123 4 5 6

1n8k (Alchol dehydrogenase E chain Horse c21)

ロスマンフォールド

βターン

βターン

1cauA1rhdA domain2

TOPSプログラムによる表示httpwwwtopsleedsacuk

1timA

はαへリックスはβストランドとなりあうの向きで平行逆平行を示す

コンタクトマップ

1ubq

C

4 23

N

1

縦横に残基を配置しある残基ペアのCα原子間の距離が10Å以下であれば対応するピクセルに色を塗る

分子描画ソフトVMDを用いて作成

平行のストランド間は方向逆平行ストランド間は方向に線分が観察される

N

C

N C

逆平行

逆平行

平行

αへリックスは太めの対角上の線分

へリックス

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから1か3コンタクトマップから平行シートしかないことがわかるため1であることがわかる

αβ5

αβ3

α

β4α

β1αβ2 β2

β1β3β4

β5

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから2か4コンタクトマップから平行シートしかないことがわかるため2であることがわかる

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

配列比較によるタンパク質分類1970年代から配列の一致度(sequence identity)に基づいてグループを作る作業が

行われてきた

どのくらいの類似性で一つにまとめるかは様々な考えがあるが少なくとも「相同なタンパク質群」を一つのグループにまとめるべき

ファミリー(family 族)

進化的に関係のある(相同な)タンパク質グループのこと

複数のファミリーがあつまった大きなグループ スーパーファミリー(superfamily clan)

一つのファミリーの中の小さなグループ サブファミリー(subfamily)

family

subfamily superfamily

ドメイン単位による分類

A2 B2

B3 C3

A1

配列1

配列2

配列3

配列の部分どうしだけが類似していた場合 部分一致を重視するとすべて一つのグループになるがhellip

配列1

配列2 配列3

Aを共有

Bを共有

1と2が類似2と3が類似していても1と3は類似していない

ドメインに分割すると

A1

A2

B2

B3

C3

A2 B2

B3 C3

A1

きれいに分類することができる

Pfam 蛋白質ファミリのデータベース各蛋白質ファミリのマルチプル

アライメント HMMなどを集めたデータベース

httppfamsangeracuk

Pkinase_Tyrドメインをもつタンパク質の例

ABL_HUMAN

BTK_HUMAN

ILK_HUMAN

MERTK_HUMAN

PGFRB_HUMAN

HCK_HUMAN

Family Pkinase_Tyr (PF07714) Protein tyrosine kinase

Pfamデータベース(httppfamsangeracukSoftwarePfam)からの引用

ドメイン構造と疎水性の関係Tyrosine protein kinase HCK (1ad5A HCK_HUMAN)

SH3 domain

SH2 domain

Tyrosine-kinase domain

3つの分断された疎水性コアrarr ドメイン構造

大きなタンパク質はいくつかの構造上のまとまり(ドメイン)を持つことが多い

立体構造によるタンパク質の分類

bull 配列による分類の延長ドメイン単位の分類進化的に関係のある(相同な)タンパク質を群にする(ファミリー)という考え方は同じ

bull 立体構造の類似性からより遠縁の相同性を見つけより大きな群を作る(スーパーファミリー)

bull スーパーファミリーをまとめたさらに大きなグループ(フォールドクラス)

bull 主にアミノ酸(Cαレベル)のラフな構造の類似性に

着目

bull 分類対象は主に球状タンパク質

立体構造分類データベースSCOPhttpscopmrc-lmbcamacukscop

4階層で分類Class(クラス)

Fold(フォールド)

Superfamily(スーパーファミリー)

Family(ファミリー)

どの階層に分類するかは配列の類似性立体構造の類似性分子機能の類似性機能部位の類似性

を専門家が総合的に判断して決める

1akr

ltホモロジーgt

ltアナロジーgt

他の構造分類データベースとしてCATHが有名

同様に階層的な分類体系を持つがその詳細はSCOPとは異なる

クラス

1mbd

1mqkH

1n55A 1pqwA

1fxd 1a2p

all-α (a)

all-β (b)

αβ (c)

α+β (d)

α-へリックスが中心

β-シートが中心

逆平行が多い

α-へリックスとβ-シートが配列上交互に現れる平行β-シートが中心

α-へリックスとβ-シートが混在配列上の並びの規則はない逆平行と平行のβ-シートが混在

アミノ酸配列と立体構造の関係ピロリ菌と大腸菌のフラボドキシン (同一残基率 SeqID 44)

ピロリ菌(1fueA) 大腸菌(1ag9A)

配列が似ていれば立体構造も似ている

SeqID = 44

RMSD = 12 Å

1fueA 2GKIGIFFGTDSGNAEAIAEKISKAIG--NAEVVDVAKASKEQFNGFTKVILVAPTAGAGD59

1ag9A 2AITGIFFGSDTGNTENIAKMIQKQLGKDVADVHDIAKSSKEDLEAYDILLLGIPTWYYGE61

1fueA 60LQTDWEDFLGTLEASD-FANKTIGLVGLGDQDTYSETFAEGIFHIYEKAK--AGKVVGQT116

1ag9A 62AQCDWDDFFPTLE-EIDFNGKLVALFGCGDQEDYAEYFCDALGTIRDIIEPRGATIVGHW120

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C 14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

BLAST

PSI-BLAST 構造比較

構造比較

アミノ酸配列がほとんど似ていなくても立体構造は似ている場合がある

構造は配列より進化的に保存がよい 構造比較から新たなホモログが発見できる可能性

立体

構造

の変

アミノ酸配列の変化と立体構造の変化の相関(グロビン族)

立体構造の変化はアミノ酸配列の変化と相関配列が30以上一致していればRMSDは2Å以下

アミノ酸配列の類似度

2つの構造の類似性

ホモロジー (homology 相同)進化的起源を共有することによる類似多くの場合分子機能なども類似している

アナロジー (analogy 相似)進化的起源とは無関係な類似多くの場合分子機能など他の属性は似ていない物理化学的な構造の偏好が原因とされる

イルカの胸びれ サルの前足

チョウの羽 トリの翼

ネコの前足

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C

ldquoFlavodoxin-likerdquo fold (c23)

ldquoFlavoproteinsrdquo superfamily (c235)

ldquoCheY-likerdquosuperfamily(c231)

14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

AnalogyHomology

HomologyHomolo

gy

多く現れるフォールド(出現ドメイン数順)

太字はスーパーフォールド多くのスーパーファミリーを含むフォールド

d58

c1

g3

c23 b34

b1

a4フォールド名 (SCOP173によるクラスfhijkは除く) ドメイ

ンの数

スーパーファミリーの数

a4 DNARNA-binding 3-helical bundle 292 14c1 TIM betaalpha-barrel 269 33d58 Ferredoxin-like 248 55b1 Immunoglobulin-like beta sandwich 246 27c37 P-loop nucleoside triphosphate hydrolase 235 1c2 NAD(P)-binding Rossmann-fold domains 168 1g3 Knottins 154 19d15 Beta-Grasp(ubiquitin-like) 131 13c23 Flavodoxin-like 118 15b34 SH3-like barrel 117 18b40 OB-fold 100 12c66 SAM-dependent methyltransferases 95 1

c37 c2

d15

b40 c66

スーパーフォールド(Superfold)

フォールド名 (SCOP173によるクラスfhijkは除く) その下のスーパーファミリーの数

d58 Ferredoxin-like 55c1 TIM betaalpha-barrel 33b1 Immunoglobulin-like beta sandwich 27a24 Four-helical up-and-down bundle 27a118 Alpha-alpha superhelix 23g3 Knottins 19b34 SH3-like barrel 18g41 Rubredoxin-like 16c23 Flavodoxin-like 15a60 SAM(sterile alpha motif) domain-like 15b69 7-bladed beta-propeller 14a4 DNARNA-binding 3-helical bundle 14

スーパーフォールド多くのスーパーファミリーを含むフォールド

スーパーフォールドは「構造の類似と機能の類似が対応しにくいフォールド」ともいえる

d58

c1

g3a118

c23

a24

a60

b34

b1

g41

b69 a4

三本へリックスバンドルDNARNA‐binding 3‐helical bundle(a4)

Mating type protein A2 yeast(1k61Aa411)

(1gvdAa413)(1wh5Aa411)

三本のへリックスが束になった構造DNAやRNAに結合する蛋白質が多い

DNAと

結合した構造(1k61)

TIMバレルTIM betaalpha barrel (c1)

Triosephosphate isomerase1n55A(c111)

全般に解糖系の酵素が多い基質酵素反応は極めて多彩

八本のβストランドとαへリックスが交互に組み合わさり対称的な樽(barrel)構造を形成す

る中央の樽構造は平行のβシートからなる

Imidazole glycerol phosphate synthasesubunit hisF1thfD(c121)

KHGKDPG aldolase1euaA(c1101)

フェレドキシン様Ferredoxin‐like (d58)

4Fe-4S Ferredoxin(1fxdd581)

1 234 4本の逆平行のβストランドと2本のαへリックスからな

分子機能は極めて多彩

CheY binding domain of CheA(1eayCd5824)

U1A RNA binding domain(1nu4Ad5871)

免疫グロブリン様Immunoglobulin‐like beta sandwich(b1)

Immunoglobulin Heavy chain variabledomain 1mjuH1(b111)

Immunoglobulin Heavy chain constantdomain 1mjuH2(b112)

Macromomycin1noaA (b171)

免疫グロブリン分子はH鎖とL鎖から

なりそれぞれ免疫グロブリン様ドメインからできている

V

C

V

C

C

C

V

CV

CC

C

L鎖

H鎖H鎖 L鎖

細胞表面あるいは分泌蛋白質が多い免疫や分子認識に関する機能を担うことが多い

4本のβストランドからなるβシートが二枚サンドイッチ状に重なった構造をとる逆平行のβシートが主

P‐loop スーパーファミリーP‐loop nucleoside triphosphate hydrolase(c37)

Ras-related protein RAB-5A1r2qA(c3718)

Guanylate kinase1gkyA(c3711)

RecA proteinDomain1 1xmsA1(c37111)

平行のβシートが主トポロジーには様々な変異あり

シグナル伝達DNA結合

モーター機能など多彩な分子機能を担うがATP GTPなどのヌクレオシド

の加水分解を行う点は共通

N C

132 4 5 6

ヌクレオシド結合部GxxxxGKTの

配列モチーフ(P-loop)を持つ

ロスマン フォールドNAD(P)‐binding Rossmann‐fold domains (c2)

Alcohol dehydrogenase gamma chaindomain2 1u3wA(c211)

Aspartate beta-semialdehydedehydrogenase2gz1A1(c213)

L-alanine dehydrogenase1pjcA1(c214)

補酵素を利用したNAD(P)を脱水素酵素を持つ基質を認識するドメインは別に存在する

NC

123 4 5 6

平行のβシートが主

7枚羽 βプロペラ7‐bladed beta‐propeller (b69)

Garactose oxydasedomain3 1k3iA3(b6911)

Guanine nucleotide-bindingprotein subunit beta-11gotB(b6941)

細胞膜付近のシグナル伝達や糖結合に関わることが多い

Influenza Neuraminidase 1f8dA(b6811)

6枚羽 βプロペラ

N C

321 4

のユニットが7回円環状に繰り返しされたフォールド

立体構造比較プログラム1990年ごろから多くの構造比較プログラムが開発されている

WEBアドレス スコア アライメント

DALI httpwwwebiacukdali

距離の差を独自の関数で変換したスコア

局所アライメントをモンテカルロ法でつなぎ合わせる

CE httpclsdsceducehtml

局所的なRMSD 局所アライメントを積み上げていく

MATRAS httpbiunitnaistjpmatras

距離の変化が相同相似で起こる確率の比をスコアとする

SSEで仮アライメント

を生成残基アライメントを収束するまで反復する

タンパク質の相同性の判断基準

100

同一残基率30以上

BLASTのE-value lt 00001

PSI-BLASTのE-value lt 00001

0102030407025 15 535

同一残基率(Sequence Identity)()

立体構造比較が必要

(1)立体構造の類似性が高い(DALIのZスコアMATRASのRdisスコア)(2)同一残基率がそこそこ高い(PSI-BLASTでヒットするSeqIDgt=15ぐらい)

(3)分子機能に類似性がある(補酵素酵素反応基質代謝経路等の共通性等)(4)基質補酵素の結合部位が類似しておりそのアミノ酸が保存(モチーフ)(5)ドメイン構成の共通性(6)スーパーフォールドの場合は特別な注意が必要

配列解析

同一残基率が25以下の場合の相同性の判断基準

50608090

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 6: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

予測結果と実際の埋もれ度との比較1mbdMyoglobin

不定形タンパク質intrinsically disordered protein

親水性アミノ酸が多く疎水性アミノ酸が少ないため天然状態でもコンパクトに折たたまらない

球状タンパク質ドメインをつなぐ領域としてよく見られる

親水性アミノ酸の中でもEPQSRK

真核生物に多く原核生物には少ない

転写因子に特に多くみられる

生物学的な機能はよくわかっていないがタンパク質間相互作用に重要な働きをするといわれている

膜タンパク質

膜タンパク質脂質二重膜に埋没して機能するタンパク質

脂質頭部(親水性)

脂質尾部(疎水性)

性質(1)疎水的な脂質尾部と相互作用するためタンパク質表面には疎水性アミノ酸が多い

(2)水に溶けにくく凝集しやすい

(3)多くは膜貫通へリックスを持つ

(4)膜貫通へリックスの長さは15-30アミノ酸ぐらいアミノ酸配列からも連続した疎水性アミノ酸領域としてある程度予測可能

膜タンパク質

アミノ酸配列から膜貫通へリックスを予測するサーバSOSUIサーバhttpbpnuapnagoya-uacjpsosui

他にTMHMM Tmpredなどがある

H19 問71

1 一般に表面ではアミノ酸の挿入欠失や置換が起こりやすく内部では起こりにくい

2 生物種間で比較した時に保存されているアミノ酸がタンパク質表面で集中している領域は他のタンパク質やリガンドとの結合に関与していると予測できる

3 DNAと相互作用するタンパク質の場合DNAとの結合面は負

電荷を持つアミノ酸が集中することから容易に予測できる4 一般に表面には溶媒との相互作用のため極性基をもつアミノ

酸が多く内部は疎水性アミノ酸による疎水コアを形成していることが多い

次に示した球状タンパク質の性質に関する記述の中で不適切なものを一つ選べ

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問71

1 一般に表面ではアミノ酸の挿入欠失や置換が起こりやすく内部では起こりにくい

2 生物種間で比較した時に保存されているアミノ酸がタンパク質表面で集中している領域は他のタンパク質やリガンドとの結合に関与していると予測できる

3 DNAと相互作用するタンパク質の場合DNAとの結合面は負

電荷を持つアミノ酸が集中することから容易に予測できる4 一般に表面には溶媒との相互作用のため極性基をもつアミノ

酸が多く内部は疎水性アミノ酸による疎水コアを形成していることが多い

次に示した球状タンパク質の性質に関する記述の中で不適切なものを一つ選べ

DNAやRNAなどの核酸はリン酸基にマイナスの電荷を持っているよって核酸に

結合する蛋白質は表面にプラスの電荷を持っているものが多い平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

「タンパク質構造解析」のキーワード(構造比較)

bull 立体構造表現(コンタクトマップラマチャンドランマップ)

bull 構造比較

bull 重ね合わせbull RMSDbull 構造アライメント

bull 構造モチーフ

bull 構造分類

立体構造の決定法X線結晶解析

NMR(核磁気共鳴法)

大量発現精製結晶化

X線回折強度の測定

原子モデルの構築

原子モデルの精密化

核磁気共鳴解析(NOE解析帰属と距離拘束の抽出)

3次元電子密度マップ

原子間距離拘束

(1)多数分子の平均構造の観察(精製が重要 大きな分子複合体はより難しくなる)(2)発現精製結晶化のステップで各タンパク質によって実験条件の調整が必須(3)実験データの収集原子モデル構築の段階で計算機の支援が不可欠

大量発現精製

原子モデルの構築

原子モデルの精密化

MET 1

GLN 2

1

2

34

56

7 8

9

10

11

12

13

14

15

1617

18 19 20

21

HEADER UBIQUITIN 17-APR-92 1AAR COMPND DI-UBIQUITINSOURCE BOVINE (BOS TAURUS) ERYTHROCYTESAUTHOR WJCOOKLCJEFFREYMCARSONZCHENCMPICKART

原子番号 残基名 鎖識別子原子名 残基番号 X座標 Y座標 Z座標 占有率 温度因子

ATOM 1 N MET A 1 15493 30088 14694 100 836ATOM 2 CA MET A 1 14600 29031 15110 100 815ATOM 3 C MET A 1 15476 27793 15419 100 930ATOM 4 O MET A 1 16571 27561 14871 100 896ATOM 5 CB MET A 1 13500 28837 14105 100 989ATOM 6 CG MET A 1 13823 27997 12931 100 1021ATOM 7 SD MET A 1 12312 27711 11891 100 1033ATOM 8 CE MET A 1 13174 26595 10726 100 730ATOM 9 N GLN A 2 14968 27014 16326 100 975ATOM 10 CA GLN A 2 15552 25806 16852 100 1192ATOM 11 C GLN A 2 15000 24553 16168 100 1171ATOM 12 O GLN A 2 13787 24387 16086 100 1000 ATOM 13 CB GLN A 2 15368 25715 18386 100 1239ATOM 14 CG GLN A 2 15858 24413 19051 100 1400ATOM 15 CD GLN A 2 15676 24587 20561 100 1559ATOM 16 OE1 GLN A 2 16525 25209 21205 100 1867ATOM 17 NE2 GLN A 2 14564 24203 21152 100 1539ATOM 18 N ILE A 3 15960 23745 15687 100 1179 ATOM 19 CA ILE A 3 15593 22437 15130 100 1214ATOM 20 C ILE A 3 16491 21342 15720 100 1199ATOM 21 O ILE A 3 17701 21540 15767 100 1291

PDB ID

wwPDB(World Wide Protein Data Bank) 立体構造データの収集するデータバンク

RCSB PDB httpwwwrcsborgpdbPDBフォーマット MSD EBI httpwwwebiacukmsd

PDBj httpwwwpdbjorg

PDBは1971年に設立

立体構造描画のフリーウエアシェアウエアソフト名 WebSite 対応機種 特徴

RasMol wwwopenrasmolorg Win Mac Linux(ソース公開)

独自の高速描画アルゴリズムを用い非力なハードでも同様に高速描画が可能コマンド言語は強力で多機能基本的な描画法をカバーするが分子表面の描画はできない描画の質はやや低い

Chime wwwmdlchimecom Win Mac RasMolをベースにしたWEBブラウザ内で動作するプラグイン分子表面表示など描画機能はRasMolより拡張分子描画機能を持ったWEBページを作れる

Jmol jmolsourceforgenet Win Mac Linux(ソース公開)

Java Applet によりWEBブラウザ内で動作Chimeと同様に分子描画機能を持ったWEBページを作れるJREをインストールする必要

PyMOL pymolsourceforgenet

Win Mac Linux

OpenGLを用いた質の高い描画Python言語で開発されておりソースも公開Python言語を用いた機能

拡張も可能

CHIMERA wwwcglucsfeduchimera

Win Mac Linux

OpenGLを用いた質の高い描画電顕画像などの多

様なデータの取り込みドッキング静電計算などのインタフェース有りPython言語を用いた機能拡張

VMD wwwksuiuceduResearchvmd

Win Mac Linux

OpenGLを用いた質の高い描画Tcl言語を用いた機

能拡張が可能分子動力学の可視化を主要目的として幅広い機能

MolScript wwwavatarsemolscrit

Linux(ソース公開)

主にリボン図の描画用のソフトGUIを持たずコマンドラインでPDBファイルをPSファイル等に変換

Swiss PDB Viewer

auexpasyorgspdbv Win Mac Linux

OpenGLを用いた質の高い描画幅広い機能をサ

ポートしているがアップデートは活発でない

H19 問51

タンパク質などの生体高分子をコンピュータで表示するためのソフトウェア名として適切でないものを選択肢の中から一つ選べ

1RasMol2Chime3TMHMM4Swiss-PdbViewer

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問51

タンパク質などの生体高分子をコンピュータで表示するためのソフトウェア名として適切でないものを選択肢の中から一つ選べ

1RasMol2Chime3TMHMM4Swiss-PdbViewer

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問59

タンパク質の立体構造のグラフィックス表示プログラムではないものを選択肢の中から一つ選べ

1Chime2PyMol3MEGA4MolScript

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問59

タンパク質の立体構造のグラフィックス表示プログラムではないものを選択肢の中から一つ選べ

1Chime2PyMol3MEGA4MolScript

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

PDBコード1fxd(ferredoxin II) Rasmol Chimeプラグインで描画

立体構造の描画スタイル

ワイアフレーム ボールスティック 空間充填

バックボーン リボン 分子表面

1 234

N

H C

O

Ala(A)(疎水性)

Phe(F)(疎水性)

Cys(C)(親水性)

Asp(D)(親水性)

Val(V)(疎水性)

Thr(親水性)

様々な物理化学的な性質を持った側鎖が主鎖のペプチド結合で連なる

Leu(L)(疎水性)

蛋白質ペプチド結合したアミノ酸群

アミノ酸は全部で20種類

I VL

M FYW H

KR

D E

P NSA Q

CG T

疎水性 親水性

脂肪族

芳香族正荷電

負荷電

N末

C末

変性状態(D) 天然状態(N)

フォールディング(折り畳み)という現象

非常に多種の構造の集合大きく広がっている

ほとんど唯一の構造小さくコンパクトに折りたたまっている

温度や変性剤濃度によって可逆に変化

折り畳みは原則としてその蛋白質以外の分子の介助を必要としない

アミノ酸配列の情報だけで天然状態の立体構造が決定される

どうやってコンパクトになるか rarr (1)主鎖の水素結合(2)側鎖間の疎水性相互作用

あるアミノ酸配列がどうやって一つの構造を決めるのか

3次元座標の差のスコア(RMSD)

並進ベクトルt を引いたあと回転行列R をかける

t 二つの分子の重心をあわせるように決めるR 2つの原子群の相関を 大化する行列rarr(1)特異値分解で導出

(2)四元数表現により 適な回転をLagrange未定乗数法で決定

sum=

minusminus=N

iiiN

RMSD1

2)](R[1 tyx

21

20

1

2

3

4

5

1xdaA

1

23

4

21

20

5

yi

)(R ty minusi

xi

1

23

4

21

20

5

原子の対応付けがわかっているとする

RMSD 適に重ね合わせたときのXYZ座標の差(Root Mean Square Deviation)

1benA

WKabsch Acta CrystA 32922-923(1976) 34827-828(1978)ADMclachlan JMolBiol 12874-77 (1979)Charles FF Karney ldquoQuaternions in molecular modelingrdquo E-print arXivphysics0506177

xi分子Xのi番目の原子の位置ベクトル yi分子Yのi番目の原子の位置ベクトル

距離の差のスコア (DRMS)

( )sumsum= ge

minusminus

=N

i

N

ij

Yij

Xij DD

NNDRMS

1

2

)1(2

21

20

1

2

3

4

5

YijD

XijD

1

23

4

21

20

5

yixi

DRMS 対応する原子ペアの距離の差(Distance-based RMSD)

原子の対応付けがわかっているとする

重ね合わせは不要なので計算は簡単

3次元によらない2次元や結合情報にも拡張できる

鏡像の区別はできない

1benA

計算が簡単なので高速な構造比較のアルゴリズムの基盤として使われる

1xdaA

H19 問73立体構造の似ている2つのタンパク質間で対応関係にある原子が分かっている場合にはRMSD(Root Mean Square Deviation)と呼ばれる数値を計算することにより立体構造の重なり合いの程度を数値化することができるRMSDは全ての対応する原子間の距離を

2乗した値の平均値(相加平均)にルートをとったものとして定義されるあるタンパク質における6つの原子ABCDEFと別のタンパク質の6つの原子

ArsquoBrsquoCrsquoDrsquoErsquoFrsquoについて対応関係が分かっており互いにもっともよく重なるように回転して重ねた時の対応原子間の距離は以下の表のようになったこの表からB-Brsquo C-Crsquo D-Drsquo E-Ersquoは正確に重なったが他の原子間ではずれが見られることがわかるここで6つの原子に対するRMSD値はいくらになるか選択肢の中からもっとも適切な値を一つ選べただ

し原子間距離の単位は考慮しないものとする

対応原子 距離

原子A―原子Arsquo 20

原子B―原子Brsquo 00

原子C―原子Crsquo 00

原子D―原子Crsquo 10

原子E―原子Crsquo 00

原子F―原子Crsquo 10

1 052 0663 104 133

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問73立体構造の似ている2つのタンパク質間で対応関係にある原子が分かっている場合にはRMSD(Root Mean Square Deviation)と呼ばれる数値を計算することにより立体構造の重なり合いの程度を数値化することができるRMSDは全ての対応する原子間の距離を

2乗した値の平均値(相加平均)にルートをとったものとして定義されるあるタンパク質における6つの原子ABCDEFと別のタンパク質の6つの原子

ArsquoBrsquoCrsquoDrsquoErsquoFrsquoについて対応関係が分かっており互いにもっともよく重なるように回転して重ねた時の対応原子間の距離は以下の表のようになったこの表からB-Brsquo C-Crsquo D-Drsquo E-Ersquoは正確に重なったが他の原子間ではずれが見られることがわかるここで6つの原子に対するRMSD値はいくらになるか選択肢の中からもっとも適切な値を一つ選べただ

し原子間距離の単位は考慮しないものとする

対応原子 距離

原子A―原子Arsquo 20

原子B―原子Brsquo 00

原子C―原子Crsquo 00

原子D―原子Crsquo 10

原子E―原子Crsquo 00

原子F―原子Crsquo 10

1 052 0663 104 133

RMSDは 適に重ね合わせたときの

「ずれの二乗の平均のルート」であるしたがってずれの二乗平均は

(22+0+0+1+0+1)6=66=1これのルートをとるとradic1=1

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

1

2

3

4

56

7

8

9

10

11

主鎖の水素結合αへリックス

1

2

34

56

78

9

10

11

O

N

CHN

N

H

H

CO Cα

i

i+3

i+4

HN O C

Cαi-1

i番目のCOがi+4番目のNHと水素結合を形成

36残基が1周期の右巻きらせん

NHO=Cが同じ向きに並ぶため

へリックス全体に電気双極子が発生

N末C末

ー +

主鎖の水素結合逆平行βシート

βターン

βターン

βヘアピン

βヘアピン

伸びた構造の1本1本をβストランドと呼ぶ二本以上のβストランドがシート状に並んだ構造をβシートと呼ぶ

βストランド

βストランド

βストランド

主鎖の水素結合平行βシート

βminusαminusβモチーフ

平行βシートがαへリックスで接続された構造モチーフ

βストランド

βストランド

βストランド

伸びた構造の1本1本をβストランドと呼ぶ二本以上のβストランドがシート状に並んだ構造をβシートと呼ぶ

Cαi

Cαi+1Cα

i-1φ ψ

ペプチド結合の平面性とφψの定義

主鎖の原子のXYZ座標はφψの2つ

の角度でほとんど記述できる

φψの角度を2次元にプロットしたものをラマチャンドランプロット(Ramachandran plot)という点が集中する領域は2次構造とよく対応

点が現れない領域は主鎖の原子が衝突する

βシート

αへリックス

左巻きへリックス

平面平面

φ

ψ

H19 問74タンパク質の主鎖に添って定義される二面角のうちφ(窒素原子と炭素原子の間の二面角)とψ(α炭素原子とカルボニル基の炭素原子の間の二面角)の値を各残

基ごとに計算して二次元にプロットしたものをラマチャンドランプロットと呼ぶ以下に示したラマチャンドランプロットに対する説明文の中でもっとも適切なものを一つ選べ

1 (a)(b)はともにαへリックスの領域である2 (a)(b)はともにβストランドの領域である3 (a)はαへリックス(b)はβストランドの領

域である4 (a)はβストランド(b)はαへリックスの領

域である

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問74タンパク質の主鎖に添って定義される二面角のうちφ(窒素原子と炭素原子の間の二面角)とψ(α炭素原子とカルボニル基の炭素原子の間の二面角)の値を各残

基ごとに計算して二次元にプロットしたものをラマチャンドランプロットと呼ぶ以下に示したラマチャンドランプロットに対する説明文の中でもっとも適切なものを一つ選べ

1 (a)(b)はともにαへリックスの領域である2 (a)(b)はともにβストランドの領域である3 (a)はαへリックス(b)はβストランドの領

域である4 (a)はβストランド(b)はαへリックスの領

域である

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

トポロジー図によるβシートの表現

4 23

N

C

1

1ubq (UbiquitinHumand151)

N

C123 4 5 6

1n8k (Alchol dehydrogenase E chain Horse c21)

ロスマンフォールド

βターン

βターン

1cauA1rhdA domain2

TOPSプログラムによる表示httpwwwtopsleedsacuk

1timA

はαへリックスはβストランドとなりあうの向きで平行逆平行を示す

コンタクトマップ

1ubq

C

4 23

N

1

縦横に残基を配置しある残基ペアのCα原子間の距離が10Å以下であれば対応するピクセルに色を塗る

分子描画ソフトVMDを用いて作成

平行のストランド間は方向逆平行ストランド間は方向に線分が観察される

N

C

N C

逆平行

逆平行

平行

αへリックスは太めの対角上の線分

へリックス

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから1か3コンタクトマップから平行シートしかないことがわかるため1であることがわかる

αβ5

αβ3

α

β4α

β1αβ2 β2

β1β3β4

β5

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから2か4コンタクトマップから平行シートしかないことがわかるため2であることがわかる

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

配列比較によるタンパク質分類1970年代から配列の一致度(sequence identity)に基づいてグループを作る作業が

行われてきた

どのくらいの類似性で一つにまとめるかは様々な考えがあるが少なくとも「相同なタンパク質群」を一つのグループにまとめるべき

ファミリー(family 族)

進化的に関係のある(相同な)タンパク質グループのこと

複数のファミリーがあつまった大きなグループ スーパーファミリー(superfamily clan)

一つのファミリーの中の小さなグループ サブファミリー(subfamily)

family

subfamily superfamily

ドメイン単位による分類

A2 B2

B3 C3

A1

配列1

配列2

配列3

配列の部分どうしだけが類似していた場合 部分一致を重視するとすべて一つのグループになるがhellip

配列1

配列2 配列3

Aを共有

Bを共有

1と2が類似2と3が類似していても1と3は類似していない

ドメインに分割すると

A1

A2

B2

B3

C3

A2 B2

B3 C3

A1

きれいに分類することができる

Pfam 蛋白質ファミリのデータベース各蛋白質ファミリのマルチプル

アライメント HMMなどを集めたデータベース

httppfamsangeracuk

Pkinase_Tyrドメインをもつタンパク質の例

ABL_HUMAN

BTK_HUMAN

ILK_HUMAN

MERTK_HUMAN

PGFRB_HUMAN

HCK_HUMAN

Family Pkinase_Tyr (PF07714) Protein tyrosine kinase

Pfamデータベース(httppfamsangeracukSoftwarePfam)からの引用

ドメイン構造と疎水性の関係Tyrosine protein kinase HCK (1ad5A HCK_HUMAN)

SH3 domain

SH2 domain

Tyrosine-kinase domain

3つの分断された疎水性コアrarr ドメイン構造

大きなタンパク質はいくつかの構造上のまとまり(ドメイン)を持つことが多い

立体構造によるタンパク質の分類

bull 配列による分類の延長ドメイン単位の分類進化的に関係のある(相同な)タンパク質を群にする(ファミリー)という考え方は同じ

bull 立体構造の類似性からより遠縁の相同性を見つけより大きな群を作る(スーパーファミリー)

bull スーパーファミリーをまとめたさらに大きなグループ(フォールドクラス)

bull 主にアミノ酸(Cαレベル)のラフな構造の類似性に

着目

bull 分類対象は主に球状タンパク質

立体構造分類データベースSCOPhttpscopmrc-lmbcamacukscop

4階層で分類Class(クラス)

Fold(フォールド)

Superfamily(スーパーファミリー)

Family(ファミリー)

どの階層に分類するかは配列の類似性立体構造の類似性分子機能の類似性機能部位の類似性

を専門家が総合的に判断して決める

1akr

ltホモロジーgt

ltアナロジーgt

他の構造分類データベースとしてCATHが有名

同様に階層的な分類体系を持つがその詳細はSCOPとは異なる

クラス

1mbd

1mqkH

1n55A 1pqwA

1fxd 1a2p

all-α (a)

all-β (b)

αβ (c)

α+β (d)

α-へリックスが中心

β-シートが中心

逆平行が多い

α-へリックスとβ-シートが配列上交互に現れる平行β-シートが中心

α-へリックスとβ-シートが混在配列上の並びの規則はない逆平行と平行のβ-シートが混在

アミノ酸配列と立体構造の関係ピロリ菌と大腸菌のフラボドキシン (同一残基率 SeqID 44)

ピロリ菌(1fueA) 大腸菌(1ag9A)

配列が似ていれば立体構造も似ている

SeqID = 44

RMSD = 12 Å

1fueA 2GKIGIFFGTDSGNAEAIAEKISKAIG--NAEVVDVAKASKEQFNGFTKVILVAPTAGAGD59

1ag9A 2AITGIFFGSDTGNTENIAKMIQKQLGKDVADVHDIAKSSKEDLEAYDILLLGIPTWYYGE61

1fueA 60LQTDWEDFLGTLEASD-FANKTIGLVGLGDQDTYSETFAEGIFHIYEKAK--AGKVVGQT116

1ag9A 62AQCDWDDFFPTLE-EIDFNGKLVALFGCGDQEDYAEYFCDALGTIRDIIEPRGATIVGHW120

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C 14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

BLAST

PSI-BLAST 構造比較

構造比較

アミノ酸配列がほとんど似ていなくても立体構造は似ている場合がある

構造は配列より進化的に保存がよい 構造比較から新たなホモログが発見できる可能性

立体

構造

の変

アミノ酸配列の変化と立体構造の変化の相関(グロビン族)

立体構造の変化はアミノ酸配列の変化と相関配列が30以上一致していればRMSDは2Å以下

アミノ酸配列の類似度

2つの構造の類似性

ホモロジー (homology 相同)進化的起源を共有することによる類似多くの場合分子機能なども類似している

アナロジー (analogy 相似)進化的起源とは無関係な類似多くの場合分子機能など他の属性は似ていない物理化学的な構造の偏好が原因とされる

イルカの胸びれ サルの前足

チョウの羽 トリの翼

ネコの前足

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C

ldquoFlavodoxin-likerdquo fold (c23)

ldquoFlavoproteinsrdquo superfamily (c235)

ldquoCheY-likerdquosuperfamily(c231)

14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

AnalogyHomology

HomologyHomolo

gy

多く現れるフォールド(出現ドメイン数順)

太字はスーパーフォールド多くのスーパーファミリーを含むフォールド

d58

c1

g3

c23 b34

b1

a4フォールド名 (SCOP173によるクラスfhijkは除く) ドメイ

ンの数

スーパーファミリーの数

a4 DNARNA-binding 3-helical bundle 292 14c1 TIM betaalpha-barrel 269 33d58 Ferredoxin-like 248 55b1 Immunoglobulin-like beta sandwich 246 27c37 P-loop nucleoside triphosphate hydrolase 235 1c2 NAD(P)-binding Rossmann-fold domains 168 1g3 Knottins 154 19d15 Beta-Grasp(ubiquitin-like) 131 13c23 Flavodoxin-like 118 15b34 SH3-like barrel 117 18b40 OB-fold 100 12c66 SAM-dependent methyltransferases 95 1

c37 c2

d15

b40 c66

スーパーフォールド(Superfold)

フォールド名 (SCOP173によるクラスfhijkは除く) その下のスーパーファミリーの数

d58 Ferredoxin-like 55c1 TIM betaalpha-barrel 33b1 Immunoglobulin-like beta sandwich 27a24 Four-helical up-and-down bundle 27a118 Alpha-alpha superhelix 23g3 Knottins 19b34 SH3-like barrel 18g41 Rubredoxin-like 16c23 Flavodoxin-like 15a60 SAM(sterile alpha motif) domain-like 15b69 7-bladed beta-propeller 14a4 DNARNA-binding 3-helical bundle 14

スーパーフォールド多くのスーパーファミリーを含むフォールド

スーパーフォールドは「構造の類似と機能の類似が対応しにくいフォールド」ともいえる

d58

c1

g3a118

c23

a24

a60

b34

b1

g41

b69 a4

三本へリックスバンドルDNARNA‐binding 3‐helical bundle(a4)

Mating type protein A2 yeast(1k61Aa411)

(1gvdAa413)(1wh5Aa411)

三本のへリックスが束になった構造DNAやRNAに結合する蛋白質が多い

DNAと

結合した構造(1k61)

TIMバレルTIM betaalpha barrel (c1)

Triosephosphate isomerase1n55A(c111)

全般に解糖系の酵素が多い基質酵素反応は極めて多彩

八本のβストランドとαへリックスが交互に組み合わさり対称的な樽(barrel)構造を形成す

る中央の樽構造は平行のβシートからなる

Imidazole glycerol phosphate synthasesubunit hisF1thfD(c121)

KHGKDPG aldolase1euaA(c1101)

フェレドキシン様Ferredoxin‐like (d58)

4Fe-4S Ferredoxin(1fxdd581)

1 234 4本の逆平行のβストランドと2本のαへリックスからな

分子機能は極めて多彩

CheY binding domain of CheA(1eayCd5824)

U1A RNA binding domain(1nu4Ad5871)

免疫グロブリン様Immunoglobulin‐like beta sandwich(b1)

Immunoglobulin Heavy chain variabledomain 1mjuH1(b111)

Immunoglobulin Heavy chain constantdomain 1mjuH2(b112)

Macromomycin1noaA (b171)

免疫グロブリン分子はH鎖とL鎖から

なりそれぞれ免疫グロブリン様ドメインからできている

V

C

V

C

C

C

V

CV

CC

C

L鎖

H鎖H鎖 L鎖

細胞表面あるいは分泌蛋白質が多い免疫や分子認識に関する機能を担うことが多い

4本のβストランドからなるβシートが二枚サンドイッチ状に重なった構造をとる逆平行のβシートが主

P‐loop スーパーファミリーP‐loop nucleoside triphosphate hydrolase(c37)

Ras-related protein RAB-5A1r2qA(c3718)

Guanylate kinase1gkyA(c3711)

RecA proteinDomain1 1xmsA1(c37111)

平行のβシートが主トポロジーには様々な変異あり

シグナル伝達DNA結合

モーター機能など多彩な分子機能を担うがATP GTPなどのヌクレオシド

の加水分解を行う点は共通

N C

132 4 5 6

ヌクレオシド結合部GxxxxGKTの

配列モチーフ(P-loop)を持つ

ロスマン フォールドNAD(P)‐binding Rossmann‐fold domains (c2)

Alcohol dehydrogenase gamma chaindomain2 1u3wA(c211)

Aspartate beta-semialdehydedehydrogenase2gz1A1(c213)

L-alanine dehydrogenase1pjcA1(c214)

補酵素を利用したNAD(P)を脱水素酵素を持つ基質を認識するドメインは別に存在する

NC

123 4 5 6

平行のβシートが主

7枚羽 βプロペラ7‐bladed beta‐propeller (b69)

Garactose oxydasedomain3 1k3iA3(b6911)

Guanine nucleotide-bindingprotein subunit beta-11gotB(b6941)

細胞膜付近のシグナル伝達や糖結合に関わることが多い

Influenza Neuraminidase 1f8dA(b6811)

6枚羽 βプロペラ

N C

321 4

のユニットが7回円環状に繰り返しされたフォールド

立体構造比較プログラム1990年ごろから多くの構造比較プログラムが開発されている

WEBアドレス スコア アライメント

DALI httpwwwebiacukdali

距離の差を独自の関数で変換したスコア

局所アライメントをモンテカルロ法でつなぎ合わせる

CE httpclsdsceducehtml

局所的なRMSD 局所アライメントを積み上げていく

MATRAS httpbiunitnaistjpmatras

距離の変化が相同相似で起こる確率の比をスコアとする

SSEで仮アライメント

を生成残基アライメントを収束するまで反復する

タンパク質の相同性の判断基準

100

同一残基率30以上

BLASTのE-value lt 00001

PSI-BLASTのE-value lt 00001

0102030407025 15 535

同一残基率(Sequence Identity)()

立体構造比較が必要

(1)立体構造の類似性が高い(DALIのZスコアMATRASのRdisスコア)(2)同一残基率がそこそこ高い(PSI-BLASTでヒットするSeqIDgt=15ぐらい)

(3)分子機能に類似性がある(補酵素酵素反応基質代謝経路等の共通性等)(4)基質補酵素の結合部位が類似しておりそのアミノ酸が保存(モチーフ)(5)ドメイン構成の共通性(6)スーパーフォールドの場合は特別な注意が必要

配列解析

同一残基率が25以下の場合の相同性の判断基準

50608090

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 7: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

不定形タンパク質intrinsically disordered protein

親水性アミノ酸が多く疎水性アミノ酸が少ないため天然状態でもコンパクトに折たたまらない

球状タンパク質ドメインをつなぐ領域としてよく見られる

親水性アミノ酸の中でもEPQSRK

真核生物に多く原核生物には少ない

転写因子に特に多くみられる

生物学的な機能はよくわかっていないがタンパク質間相互作用に重要な働きをするといわれている

膜タンパク質

膜タンパク質脂質二重膜に埋没して機能するタンパク質

脂質頭部(親水性)

脂質尾部(疎水性)

性質(1)疎水的な脂質尾部と相互作用するためタンパク質表面には疎水性アミノ酸が多い

(2)水に溶けにくく凝集しやすい

(3)多くは膜貫通へリックスを持つ

(4)膜貫通へリックスの長さは15-30アミノ酸ぐらいアミノ酸配列からも連続した疎水性アミノ酸領域としてある程度予測可能

膜タンパク質

アミノ酸配列から膜貫通へリックスを予測するサーバSOSUIサーバhttpbpnuapnagoya-uacjpsosui

他にTMHMM Tmpredなどがある

H19 問71

1 一般に表面ではアミノ酸の挿入欠失や置換が起こりやすく内部では起こりにくい

2 生物種間で比較した時に保存されているアミノ酸がタンパク質表面で集中している領域は他のタンパク質やリガンドとの結合に関与していると予測できる

3 DNAと相互作用するタンパク質の場合DNAとの結合面は負

電荷を持つアミノ酸が集中することから容易に予測できる4 一般に表面には溶媒との相互作用のため極性基をもつアミノ

酸が多く内部は疎水性アミノ酸による疎水コアを形成していることが多い

次に示した球状タンパク質の性質に関する記述の中で不適切なものを一つ選べ

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問71

1 一般に表面ではアミノ酸の挿入欠失や置換が起こりやすく内部では起こりにくい

2 生物種間で比較した時に保存されているアミノ酸がタンパク質表面で集中している領域は他のタンパク質やリガンドとの結合に関与していると予測できる

3 DNAと相互作用するタンパク質の場合DNAとの結合面は負

電荷を持つアミノ酸が集中することから容易に予測できる4 一般に表面には溶媒との相互作用のため極性基をもつアミノ

酸が多く内部は疎水性アミノ酸による疎水コアを形成していることが多い

次に示した球状タンパク質の性質に関する記述の中で不適切なものを一つ選べ

DNAやRNAなどの核酸はリン酸基にマイナスの電荷を持っているよって核酸に

結合する蛋白質は表面にプラスの電荷を持っているものが多い平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

「タンパク質構造解析」のキーワード(構造比較)

bull 立体構造表現(コンタクトマップラマチャンドランマップ)

bull 構造比較

bull 重ね合わせbull RMSDbull 構造アライメント

bull 構造モチーフ

bull 構造分類

立体構造の決定法X線結晶解析

NMR(核磁気共鳴法)

大量発現精製結晶化

X線回折強度の測定

原子モデルの構築

原子モデルの精密化

核磁気共鳴解析(NOE解析帰属と距離拘束の抽出)

3次元電子密度マップ

原子間距離拘束

(1)多数分子の平均構造の観察(精製が重要 大きな分子複合体はより難しくなる)(2)発現精製結晶化のステップで各タンパク質によって実験条件の調整が必須(3)実験データの収集原子モデル構築の段階で計算機の支援が不可欠

大量発現精製

原子モデルの構築

原子モデルの精密化

MET 1

GLN 2

1

2

34

56

7 8

9

10

11

12

13

14

15

1617

18 19 20

21

HEADER UBIQUITIN 17-APR-92 1AAR COMPND DI-UBIQUITINSOURCE BOVINE (BOS TAURUS) ERYTHROCYTESAUTHOR WJCOOKLCJEFFREYMCARSONZCHENCMPICKART

原子番号 残基名 鎖識別子原子名 残基番号 X座標 Y座標 Z座標 占有率 温度因子

ATOM 1 N MET A 1 15493 30088 14694 100 836ATOM 2 CA MET A 1 14600 29031 15110 100 815ATOM 3 C MET A 1 15476 27793 15419 100 930ATOM 4 O MET A 1 16571 27561 14871 100 896ATOM 5 CB MET A 1 13500 28837 14105 100 989ATOM 6 CG MET A 1 13823 27997 12931 100 1021ATOM 7 SD MET A 1 12312 27711 11891 100 1033ATOM 8 CE MET A 1 13174 26595 10726 100 730ATOM 9 N GLN A 2 14968 27014 16326 100 975ATOM 10 CA GLN A 2 15552 25806 16852 100 1192ATOM 11 C GLN A 2 15000 24553 16168 100 1171ATOM 12 O GLN A 2 13787 24387 16086 100 1000 ATOM 13 CB GLN A 2 15368 25715 18386 100 1239ATOM 14 CG GLN A 2 15858 24413 19051 100 1400ATOM 15 CD GLN A 2 15676 24587 20561 100 1559ATOM 16 OE1 GLN A 2 16525 25209 21205 100 1867ATOM 17 NE2 GLN A 2 14564 24203 21152 100 1539ATOM 18 N ILE A 3 15960 23745 15687 100 1179 ATOM 19 CA ILE A 3 15593 22437 15130 100 1214ATOM 20 C ILE A 3 16491 21342 15720 100 1199ATOM 21 O ILE A 3 17701 21540 15767 100 1291

PDB ID

wwPDB(World Wide Protein Data Bank) 立体構造データの収集するデータバンク

RCSB PDB httpwwwrcsborgpdbPDBフォーマット MSD EBI httpwwwebiacukmsd

PDBj httpwwwpdbjorg

PDBは1971年に設立

立体構造描画のフリーウエアシェアウエアソフト名 WebSite 対応機種 特徴

RasMol wwwopenrasmolorg Win Mac Linux(ソース公開)

独自の高速描画アルゴリズムを用い非力なハードでも同様に高速描画が可能コマンド言語は強力で多機能基本的な描画法をカバーするが分子表面の描画はできない描画の質はやや低い

Chime wwwmdlchimecom Win Mac RasMolをベースにしたWEBブラウザ内で動作するプラグイン分子表面表示など描画機能はRasMolより拡張分子描画機能を持ったWEBページを作れる

Jmol jmolsourceforgenet Win Mac Linux(ソース公開)

Java Applet によりWEBブラウザ内で動作Chimeと同様に分子描画機能を持ったWEBページを作れるJREをインストールする必要

PyMOL pymolsourceforgenet

Win Mac Linux

OpenGLを用いた質の高い描画Python言語で開発されておりソースも公開Python言語を用いた機能

拡張も可能

CHIMERA wwwcglucsfeduchimera

Win Mac Linux

OpenGLを用いた質の高い描画電顕画像などの多

様なデータの取り込みドッキング静電計算などのインタフェース有りPython言語を用いた機能拡張

VMD wwwksuiuceduResearchvmd

Win Mac Linux

OpenGLを用いた質の高い描画Tcl言語を用いた機

能拡張が可能分子動力学の可視化を主要目的として幅広い機能

MolScript wwwavatarsemolscrit

Linux(ソース公開)

主にリボン図の描画用のソフトGUIを持たずコマンドラインでPDBファイルをPSファイル等に変換

Swiss PDB Viewer

auexpasyorgspdbv Win Mac Linux

OpenGLを用いた質の高い描画幅広い機能をサ

ポートしているがアップデートは活発でない

H19 問51

タンパク質などの生体高分子をコンピュータで表示するためのソフトウェア名として適切でないものを選択肢の中から一つ選べ

1RasMol2Chime3TMHMM4Swiss-PdbViewer

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問51

タンパク質などの生体高分子をコンピュータで表示するためのソフトウェア名として適切でないものを選択肢の中から一つ選べ

1RasMol2Chime3TMHMM4Swiss-PdbViewer

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問59

タンパク質の立体構造のグラフィックス表示プログラムではないものを選択肢の中から一つ選べ

1Chime2PyMol3MEGA4MolScript

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問59

タンパク質の立体構造のグラフィックス表示プログラムではないものを選択肢の中から一つ選べ

1Chime2PyMol3MEGA4MolScript

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

PDBコード1fxd(ferredoxin II) Rasmol Chimeプラグインで描画

立体構造の描画スタイル

ワイアフレーム ボールスティック 空間充填

バックボーン リボン 分子表面

1 234

N

H C

O

Ala(A)(疎水性)

Phe(F)(疎水性)

Cys(C)(親水性)

Asp(D)(親水性)

Val(V)(疎水性)

Thr(親水性)

様々な物理化学的な性質を持った側鎖が主鎖のペプチド結合で連なる

Leu(L)(疎水性)

蛋白質ペプチド結合したアミノ酸群

アミノ酸は全部で20種類

I VL

M FYW H

KR

D E

P NSA Q

CG T

疎水性 親水性

脂肪族

芳香族正荷電

負荷電

N末

C末

変性状態(D) 天然状態(N)

フォールディング(折り畳み)という現象

非常に多種の構造の集合大きく広がっている

ほとんど唯一の構造小さくコンパクトに折りたたまっている

温度や変性剤濃度によって可逆に変化

折り畳みは原則としてその蛋白質以外の分子の介助を必要としない

アミノ酸配列の情報だけで天然状態の立体構造が決定される

どうやってコンパクトになるか rarr (1)主鎖の水素結合(2)側鎖間の疎水性相互作用

あるアミノ酸配列がどうやって一つの構造を決めるのか

3次元座標の差のスコア(RMSD)

並進ベクトルt を引いたあと回転行列R をかける

t 二つの分子の重心をあわせるように決めるR 2つの原子群の相関を 大化する行列rarr(1)特異値分解で導出

(2)四元数表現により 適な回転をLagrange未定乗数法で決定

sum=

minusminus=N

iiiN

RMSD1

2)](R[1 tyx

21

20

1

2

3

4

5

1xdaA

1

23

4

21

20

5

yi

)(R ty minusi

xi

1

23

4

21

20

5

原子の対応付けがわかっているとする

RMSD 適に重ね合わせたときのXYZ座標の差(Root Mean Square Deviation)

1benA

WKabsch Acta CrystA 32922-923(1976) 34827-828(1978)ADMclachlan JMolBiol 12874-77 (1979)Charles FF Karney ldquoQuaternions in molecular modelingrdquo E-print arXivphysics0506177

xi分子Xのi番目の原子の位置ベクトル yi分子Yのi番目の原子の位置ベクトル

距離の差のスコア (DRMS)

( )sumsum= ge

minusminus

=N

i

N

ij

Yij

Xij DD

NNDRMS

1

2

)1(2

21

20

1

2

3

4

5

YijD

XijD

1

23

4

21

20

5

yixi

DRMS 対応する原子ペアの距離の差(Distance-based RMSD)

原子の対応付けがわかっているとする

重ね合わせは不要なので計算は簡単

3次元によらない2次元や結合情報にも拡張できる

鏡像の区別はできない

1benA

計算が簡単なので高速な構造比較のアルゴリズムの基盤として使われる

1xdaA

H19 問73立体構造の似ている2つのタンパク質間で対応関係にある原子が分かっている場合にはRMSD(Root Mean Square Deviation)と呼ばれる数値を計算することにより立体構造の重なり合いの程度を数値化することができるRMSDは全ての対応する原子間の距離を

2乗した値の平均値(相加平均)にルートをとったものとして定義されるあるタンパク質における6つの原子ABCDEFと別のタンパク質の6つの原子

ArsquoBrsquoCrsquoDrsquoErsquoFrsquoについて対応関係が分かっており互いにもっともよく重なるように回転して重ねた時の対応原子間の距離は以下の表のようになったこの表からB-Brsquo C-Crsquo D-Drsquo E-Ersquoは正確に重なったが他の原子間ではずれが見られることがわかるここで6つの原子に対するRMSD値はいくらになるか選択肢の中からもっとも適切な値を一つ選べただ

し原子間距離の単位は考慮しないものとする

対応原子 距離

原子A―原子Arsquo 20

原子B―原子Brsquo 00

原子C―原子Crsquo 00

原子D―原子Crsquo 10

原子E―原子Crsquo 00

原子F―原子Crsquo 10

1 052 0663 104 133

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問73立体構造の似ている2つのタンパク質間で対応関係にある原子が分かっている場合にはRMSD(Root Mean Square Deviation)と呼ばれる数値を計算することにより立体構造の重なり合いの程度を数値化することができるRMSDは全ての対応する原子間の距離を

2乗した値の平均値(相加平均)にルートをとったものとして定義されるあるタンパク質における6つの原子ABCDEFと別のタンパク質の6つの原子

ArsquoBrsquoCrsquoDrsquoErsquoFrsquoについて対応関係が分かっており互いにもっともよく重なるように回転して重ねた時の対応原子間の距離は以下の表のようになったこの表からB-Brsquo C-Crsquo D-Drsquo E-Ersquoは正確に重なったが他の原子間ではずれが見られることがわかるここで6つの原子に対するRMSD値はいくらになるか選択肢の中からもっとも適切な値を一つ選べただ

し原子間距離の単位は考慮しないものとする

対応原子 距離

原子A―原子Arsquo 20

原子B―原子Brsquo 00

原子C―原子Crsquo 00

原子D―原子Crsquo 10

原子E―原子Crsquo 00

原子F―原子Crsquo 10

1 052 0663 104 133

RMSDは 適に重ね合わせたときの

「ずれの二乗の平均のルート」であるしたがってずれの二乗平均は

(22+0+0+1+0+1)6=66=1これのルートをとるとradic1=1

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

1

2

3

4

56

7

8

9

10

11

主鎖の水素結合αへリックス

1

2

34

56

78

9

10

11

O

N

CHN

N

H

H

CO Cα

i

i+3

i+4

HN O C

Cαi-1

i番目のCOがi+4番目のNHと水素結合を形成

36残基が1周期の右巻きらせん

NHO=Cが同じ向きに並ぶため

へリックス全体に電気双極子が発生

N末C末

ー +

主鎖の水素結合逆平行βシート

βターン

βターン

βヘアピン

βヘアピン

伸びた構造の1本1本をβストランドと呼ぶ二本以上のβストランドがシート状に並んだ構造をβシートと呼ぶ

βストランド

βストランド

βストランド

主鎖の水素結合平行βシート

βminusαminusβモチーフ

平行βシートがαへリックスで接続された構造モチーフ

βストランド

βストランド

βストランド

伸びた構造の1本1本をβストランドと呼ぶ二本以上のβストランドがシート状に並んだ構造をβシートと呼ぶ

Cαi

Cαi+1Cα

i-1φ ψ

ペプチド結合の平面性とφψの定義

主鎖の原子のXYZ座標はφψの2つ

の角度でほとんど記述できる

φψの角度を2次元にプロットしたものをラマチャンドランプロット(Ramachandran plot)という点が集中する領域は2次構造とよく対応

点が現れない領域は主鎖の原子が衝突する

βシート

αへリックス

左巻きへリックス

平面平面

φ

ψ

H19 問74タンパク質の主鎖に添って定義される二面角のうちφ(窒素原子と炭素原子の間の二面角)とψ(α炭素原子とカルボニル基の炭素原子の間の二面角)の値を各残

基ごとに計算して二次元にプロットしたものをラマチャンドランプロットと呼ぶ以下に示したラマチャンドランプロットに対する説明文の中でもっとも適切なものを一つ選べ

1 (a)(b)はともにαへリックスの領域である2 (a)(b)はともにβストランドの領域である3 (a)はαへリックス(b)はβストランドの領

域である4 (a)はβストランド(b)はαへリックスの領

域である

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問74タンパク質の主鎖に添って定義される二面角のうちφ(窒素原子と炭素原子の間の二面角)とψ(α炭素原子とカルボニル基の炭素原子の間の二面角)の値を各残

基ごとに計算して二次元にプロットしたものをラマチャンドランプロットと呼ぶ以下に示したラマチャンドランプロットに対する説明文の中でもっとも適切なものを一つ選べ

1 (a)(b)はともにαへリックスの領域である2 (a)(b)はともにβストランドの領域である3 (a)はαへリックス(b)はβストランドの領

域である4 (a)はβストランド(b)はαへリックスの領

域である

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

トポロジー図によるβシートの表現

4 23

N

C

1

1ubq (UbiquitinHumand151)

N

C123 4 5 6

1n8k (Alchol dehydrogenase E chain Horse c21)

ロスマンフォールド

βターン

βターン

1cauA1rhdA domain2

TOPSプログラムによる表示httpwwwtopsleedsacuk

1timA

はαへリックスはβストランドとなりあうの向きで平行逆平行を示す

コンタクトマップ

1ubq

C

4 23

N

1

縦横に残基を配置しある残基ペアのCα原子間の距離が10Å以下であれば対応するピクセルに色を塗る

分子描画ソフトVMDを用いて作成

平行のストランド間は方向逆平行ストランド間は方向に線分が観察される

N

C

N C

逆平行

逆平行

平行

αへリックスは太めの対角上の線分

へリックス

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから1か3コンタクトマップから平行シートしかないことがわかるため1であることがわかる

αβ5

αβ3

α

β4α

β1αβ2 β2

β1β3β4

β5

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから2か4コンタクトマップから平行シートしかないことがわかるため2であることがわかる

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

配列比較によるタンパク質分類1970年代から配列の一致度(sequence identity)に基づいてグループを作る作業が

行われてきた

どのくらいの類似性で一つにまとめるかは様々な考えがあるが少なくとも「相同なタンパク質群」を一つのグループにまとめるべき

ファミリー(family 族)

進化的に関係のある(相同な)タンパク質グループのこと

複数のファミリーがあつまった大きなグループ スーパーファミリー(superfamily clan)

一つのファミリーの中の小さなグループ サブファミリー(subfamily)

family

subfamily superfamily

ドメイン単位による分類

A2 B2

B3 C3

A1

配列1

配列2

配列3

配列の部分どうしだけが類似していた場合 部分一致を重視するとすべて一つのグループになるがhellip

配列1

配列2 配列3

Aを共有

Bを共有

1と2が類似2と3が類似していても1と3は類似していない

ドメインに分割すると

A1

A2

B2

B3

C3

A2 B2

B3 C3

A1

きれいに分類することができる

Pfam 蛋白質ファミリのデータベース各蛋白質ファミリのマルチプル

アライメント HMMなどを集めたデータベース

httppfamsangeracuk

Pkinase_Tyrドメインをもつタンパク質の例

ABL_HUMAN

BTK_HUMAN

ILK_HUMAN

MERTK_HUMAN

PGFRB_HUMAN

HCK_HUMAN

Family Pkinase_Tyr (PF07714) Protein tyrosine kinase

Pfamデータベース(httppfamsangeracukSoftwarePfam)からの引用

ドメイン構造と疎水性の関係Tyrosine protein kinase HCK (1ad5A HCK_HUMAN)

SH3 domain

SH2 domain

Tyrosine-kinase domain

3つの分断された疎水性コアrarr ドメイン構造

大きなタンパク質はいくつかの構造上のまとまり(ドメイン)を持つことが多い

立体構造によるタンパク質の分類

bull 配列による分類の延長ドメイン単位の分類進化的に関係のある(相同な)タンパク質を群にする(ファミリー)という考え方は同じ

bull 立体構造の類似性からより遠縁の相同性を見つけより大きな群を作る(スーパーファミリー)

bull スーパーファミリーをまとめたさらに大きなグループ(フォールドクラス)

bull 主にアミノ酸(Cαレベル)のラフな構造の類似性に

着目

bull 分類対象は主に球状タンパク質

立体構造分類データベースSCOPhttpscopmrc-lmbcamacukscop

4階層で分類Class(クラス)

Fold(フォールド)

Superfamily(スーパーファミリー)

Family(ファミリー)

どの階層に分類するかは配列の類似性立体構造の類似性分子機能の類似性機能部位の類似性

を専門家が総合的に判断して決める

1akr

ltホモロジーgt

ltアナロジーgt

他の構造分類データベースとしてCATHが有名

同様に階層的な分類体系を持つがその詳細はSCOPとは異なる

クラス

1mbd

1mqkH

1n55A 1pqwA

1fxd 1a2p

all-α (a)

all-β (b)

αβ (c)

α+β (d)

α-へリックスが中心

β-シートが中心

逆平行が多い

α-へリックスとβ-シートが配列上交互に現れる平行β-シートが中心

α-へリックスとβ-シートが混在配列上の並びの規則はない逆平行と平行のβ-シートが混在

アミノ酸配列と立体構造の関係ピロリ菌と大腸菌のフラボドキシン (同一残基率 SeqID 44)

ピロリ菌(1fueA) 大腸菌(1ag9A)

配列が似ていれば立体構造も似ている

SeqID = 44

RMSD = 12 Å

1fueA 2GKIGIFFGTDSGNAEAIAEKISKAIG--NAEVVDVAKASKEQFNGFTKVILVAPTAGAGD59

1ag9A 2AITGIFFGSDTGNTENIAKMIQKQLGKDVADVHDIAKSSKEDLEAYDILLLGIPTWYYGE61

1fueA 60LQTDWEDFLGTLEASD-FANKTIGLVGLGDQDTYSETFAEGIFHIYEKAK--AGKVVGQT116

1ag9A 62AQCDWDDFFPTLE-EIDFNGKLVALFGCGDQEDYAEYFCDALGTIRDIIEPRGATIVGHW120

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C 14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

BLAST

PSI-BLAST 構造比較

構造比較

アミノ酸配列がほとんど似ていなくても立体構造は似ている場合がある

構造は配列より進化的に保存がよい 構造比較から新たなホモログが発見できる可能性

立体

構造

の変

アミノ酸配列の変化と立体構造の変化の相関(グロビン族)

立体構造の変化はアミノ酸配列の変化と相関配列が30以上一致していればRMSDは2Å以下

アミノ酸配列の類似度

2つの構造の類似性

ホモロジー (homology 相同)進化的起源を共有することによる類似多くの場合分子機能なども類似している

アナロジー (analogy 相似)進化的起源とは無関係な類似多くの場合分子機能など他の属性は似ていない物理化学的な構造の偏好が原因とされる

イルカの胸びれ サルの前足

チョウの羽 トリの翼

ネコの前足

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C

ldquoFlavodoxin-likerdquo fold (c23)

ldquoFlavoproteinsrdquo superfamily (c235)

ldquoCheY-likerdquosuperfamily(c231)

14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

AnalogyHomology

HomologyHomolo

gy

多く現れるフォールド(出現ドメイン数順)

太字はスーパーフォールド多くのスーパーファミリーを含むフォールド

d58

c1

g3

c23 b34

b1

a4フォールド名 (SCOP173によるクラスfhijkは除く) ドメイ

ンの数

スーパーファミリーの数

a4 DNARNA-binding 3-helical bundle 292 14c1 TIM betaalpha-barrel 269 33d58 Ferredoxin-like 248 55b1 Immunoglobulin-like beta sandwich 246 27c37 P-loop nucleoside triphosphate hydrolase 235 1c2 NAD(P)-binding Rossmann-fold domains 168 1g3 Knottins 154 19d15 Beta-Grasp(ubiquitin-like) 131 13c23 Flavodoxin-like 118 15b34 SH3-like barrel 117 18b40 OB-fold 100 12c66 SAM-dependent methyltransferases 95 1

c37 c2

d15

b40 c66

スーパーフォールド(Superfold)

フォールド名 (SCOP173によるクラスfhijkは除く) その下のスーパーファミリーの数

d58 Ferredoxin-like 55c1 TIM betaalpha-barrel 33b1 Immunoglobulin-like beta sandwich 27a24 Four-helical up-and-down bundle 27a118 Alpha-alpha superhelix 23g3 Knottins 19b34 SH3-like barrel 18g41 Rubredoxin-like 16c23 Flavodoxin-like 15a60 SAM(sterile alpha motif) domain-like 15b69 7-bladed beta-propeller 14a4 DNARNA-binding 3-helical bundle 14

スーパーフォールド多くのスーパーファミリーを含むフォールド

スーパーフォールドは「構造の類似と機能の類似が対応しにくいフォールド」ともいえる

d58

c1

g3a118

c23

a24

a60

b34

b1

g41

b69 a4

三本へリックスバンドルDNARNA‐binding 3‐helical bundle(a4)

Mating type protein A2 yeast(1k61Aa411)

(1gvdAa413)(1wh5Aa411)

三本のへリックスが束になった構造DNAやRNAに結合する蛋白質が多い

DNAと

結合した構造(1k61)

TIMバレルTIM betaalpha barrel (c1)

Triosephosphate isomerase1n55A(c111)

全般に解糖系の酵素が多い基質酵素反応は極めて多彩

八本のβストランドとαへリックスが交互に組み合わさり対称的な樽(barrel)構造を形成す

る中央の樽構造は平行のβシートからなる

Imidazole glycerol phosphate synthasesubunit hisF1thfD(c121)

KHGKDPG aldolase1euaA(c1101)

フェレドキシン様Ferredoxin‐like (d58)

4Fe-4S Ferredoxin(1fxdd581)

1 234 4本の逆平行のβストランドと2本のαへリックスからな

分子機能は極めて多彩

CheY binding domain of CheA(1eayCd5824)

U1A RNA binding domain(1nu4Ad5871)

免疫グロブリン様Immunoglobulin‐like beta sandwich(b1)

Immunoglobulin Heavy chain variabledomain 1mjuH1(b111)

Immunoglobulin Heavy chain constantdomain 1mjuH2(b112)

Macromomycin1noaA (b171)

免疫グロブリン分子はH鎖とL鎖から

なりそれぞれ免疫グロブリン様ドメインからできている

V

C

V

C

C

C

V

CV

CC

C

L鎖

H鎖H鎖 L鎖

細胞表面あるいは分泌蛋白質が多い免疫や分子認識に関する機能を担うことが多い

4本のβストランドからなるβシートが二枚サンドイッチ状に重なった構造をとる逆平行のβシートが主

P‐loop スーパーファミリーP‐loop nucleoside triphosphate hydrolase(c37)

Ras-related protein RAB-5A1r2qA(c3718)

Guanylate kinase1gkyA(c3711)

RecA proteinDomain1 1xmsA1(c37111)

平行のβシートが主トポロジーには様々な変異あり

シグナル伝達DNA結合

モーター機能など多彩な分子機能を担うがATP GTPなどのヌクレオシド

の加水分解を行う点は共通

N C

132 4 5 6

ヌクレオシド結合部GxxxxGKTの

配列モチーフ(P-loop)を持つ

ロスマン フォールドNAD(P)‐binding Rossmann‐fold domains (c2)

Alcohol dehydrogenase gamma chaindomain2 1u3wA(c211)

Aspartate beta-semialdehydedehydrogenase2gz1A1(c213)

L-alanine dehydrogenase1pjcA1(c214)

補酵素を利用したNAD(P)を脱水素酵素を持つ基質を認識するドメインは別に存在する

NC

123 4 5 6

平行のβシートが主

7枚羽 βプロペラ7‐bladed beta‐propeller (b69)

Garactose oxydasedomain3 1k3iA3(b6911)

Guanine nucleotide-bindingprotein subunit beta-11gotB(b6941)

細胞膜付近のシグナル伝達や糖結合に関わることが多い

Influenza Neuraminidase 1f8dA(b6811)

6枚羽 βプロペラ

N C

321 4

のユニットが7回円環状に繰り返しされたフォールド

立体構造比較プログラム1990年ごろから多くの構造比較プログラムが開発されている

WEBアドレス スコア アライメント

DALI httpwwwebiacukdali

距離の差を独自の関数で変換したスコア

局所アライメントをモンテカルロ法でつなぎ合わせる

CE httpclsdsceducehtml

局所的なRMSD 局所アライメントを積み上げていく

MATRAS httpbiunitnaistjpmatras

距離の変化が相同相似で起こる確率の比をスコアとする

SSEで仮アライメント

を生成残基アライメントを収束するまで反復する

タンパク質の相同性の判断基準

100

同一残基率30以上

BLASTのE-value lt 00001

PSI-BLASTのE-value lt 00001

0102030407025 15 535

同一残基率(Sequence Identity)()

立体構造比較が必要

(1)立体構造の類似性が高い(DALIのZスコアMATRASのRdisスコア)(2)同一残基率がそこそこ高い(PSI-BLASTでヒットするSeqIDgt=15ぐらい)

(3)分子機能に類似性がある(補酵素酵素反応基質代謝経路等の共通性等)(4)基質補酵素の結合部位が類似しておりそのアミノ酸が保存(モチーフ)(5)ドメイン構成の共通性(6)スーパーフォールドの場合は特別な注意が必要

配列解析

同一残基率が25以下の場合の相同性の判断基準

50608090

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 8: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

膜タンパク質

膜タンパク質脂質二重膜に埋没して機能するタンパク質

脂質頭部(親水性)

脂質尾部(疎水性)

性質(1)疎水的な脂質尾部と相互作用するためタンパク質表面には疎水性アミノ酸が多い

(2)水に溶けにくく凝集しやすい

(3)多くは膜貫通へリックスを持つ

(4)膜貫通へリックスの長さは15-30アミノ酸ぐらいアミノ酸配列からも連続した疎水性アミノ酸領域としてある程度予測可能

膜タンパク質

アミノ酸配列から膜貫通へリックスを予測するサーバSOSUIサーバhttpbpnuapnagoya-uacjpsosui

他にTMHMM Tmpredなどがある

H19 問71

1 一般に表面ではアミノ酸の挿入欠失や置換が起こりやすく内部では起こりにくい

2 生物種間で比較した時に保存されているアミノ酸がタンパク質表面で集中している領域は他のタンパク質やリガンドとの結合に関与していると予測できる

3 DNAと相互作用するタンパク質の場合DNAとの結合面は負

電荷を持つアミノ酸が集中することから容易に予測できる4 一般に表面には溶媒との相互作用のため極性基をもつアミノ

酸が多く内部は疎水性アミノ酸による疎水コアを形成していることが多い

次に示した球状タンパク質の性質に関する記述の中で不適切なものを一つ選べ

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問71

1 一般に表面ではアミノ酸の挿入欠失や置換が起こりやすく内部では起こりにくい

2 生物種間で比較した時に保存されているアミノ酸がタンパク質表面で集中している領域は他のタンパク質やリガンドとの結合に関与していると予測できる

3 DNAと相互作用するタンパク質の場合DNAとの結合面は負

電荷を持つアミノ酸が集中することから容易に予測できる4 一般に表面には溶媒との相互作用のため極性基をもつアミノ

酸が多く内部は疎水性アミノ酸による疎水コアを形成していることが多い

次に示した球状タンパク質の性質に関する記述の中で不適切なものを一つ選べ

DNAやRNAなどの核酸はリン酸基にマイナスの電荷を持っているよって核酸に

結合する蛋白質は表面にプラスの電荷を持っているものが多い平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

「タンパク質構造解析」のキーワード(構造比較)

bull 立体構造表現(コンタクトマップラマチャンドランマップ)

bull 構造比較

bull 重ね合わせbull RMSDbull 構造アライメント

bull 構造モチーフ

bull 構造分類

立体構造の決定法X線結晶解析

NMR(核磁気共鳴法)

大量発現精製結晶化

X線回折強度の測定

原子モデルの構築

原子モデルの精密化

核磁気共鳴解析(NOE解析帰属と距離拘束の抽出)

3次元電子密度マップ

原子間距離拘束

(1)多数分子の平均構造の観察(精製が重要 大きな分子複合体はより難しくなる)(2)発現精製結晶化のステップで各タンパク質によって実験条件の調整が必須(3)実験データの収集原子モデル構築の段階で計算機の支援が不可欠

大量発現精製

原子モデルの構築

原子モデルの精密化

MET 1

GLN 2

1

2

34

56

7 8

9

10

11

12

13

14

15

1617

18 19 20

21

HEADER UBIQUITIN 17-APR-92 1AAR COMPND DI-UBIQUITINSOURCE BOVINE (BOS TAURUS) ERYTHROCYTESAUTHOR WJCOOKLCJEFFREYMCARSONZCHENCMPICKART

原子番号 残基名 鎖識別子原子名 残基番号 X座標 Y座標 Z座標 占有率 温度因子

ATOM 1 N MET A 1 15493 30088 14694 100 836ATOM 2 CA MET A 1 14600 29031 15110 100 815ATOM 3 C MET A 1 15476 27793 15419 100 930ATOM 4 O MET A 1 16571 27561 14871 100 896ATOM 5 CB MET A 1 13500 28837 14105 100 989ATOM 6 CG MET A 1 13823 27997 12931 100 1021ATOM 7 SD MET A 1 12312 27711 11891 100 1033ATOM 8 CE MET A 1 13174 26595 10726 100 730ATOM 9 N GLN A 2 14968 27014 16326 100 975ATOM 10 CA GLN A 2 15552 25806 16852 100 1192ATOM 11 C GLN A 2 15000 24553 16168 100 1171ATOM 12 O GLN A 2 13787 24387 16086 100 1000 ATOM 13 CB GLN A 2 15368 25715 18386 100 1239ATOM 14 CG GLN A 2 15858 24413 19051 100 1400ATOM 15 CD GLN A 2 15676 24587 20561 100 1559ATOM 16 OE1 GLN A 2 16525 25209 21205 100 1867ATOM 17 NE2 GLN A 2 14564 24203 21152 100 1539ATOM 18 N ILE A 3 15960 23745 15687 100 1179 ATOM 19 CA ILE A 3 15593 22437 15130 100 1214ATOM 20 C ILE A 3 16491 21342 15720 100 1199ATOM 21 O ILE A 3 17701 21540 15767 100 1291

PDB ID

wwPDB(World Wide Protein Data Bank) 立体構造データの収集するデータバンク

RCSB PDB httpwwwrcsborgpdbPDBフォーマット MSD EBI httpwwwebiacukmsd

PDBj httpwwwpdbjorg

PDBは1971年に設立

立体構造描画のフリーウエアシェアウエアソフト名 WebSite 対応機種 特徴

RasMol wwwopenrasmolorg Win Mac Linux(ソース公開)

独自の高速描画アルゴリズムを用い非力なハードでも同様に高速描画が可能コマンド言語は強力で多機能基本的な描画法をカバーするが分子表面の描画はできない描画の質はやや低い

Chime wwwmdlchimecom Win Mac RasMolをベースにしたWEBブラウザ内で動作するプラグイン分子表面表示など描画機能はRasMolより拡張分子描画機能を持ったWEBページを作れる

Jmol jmolsourceforgenet Win Mac Linux(ソース公開)

Java Applet によりWEBブラウザ内で動作Chimeと同様に分子描画機能を持ったWEBページを作れるJREをインストールする必要

PyMOL pymolsourceforgenet

Win Mac Linux

OpenGLを用いた質の高い描画Python言語で開発されておりソースも公開Python言語を用いた機能

拡張も可能

CHIMERA wwwcglucsfeduchimera

Win Mac Linux

OpenGLを用いた質の高い描画電顕画像などの多

様なデータの取り込みドッキング静電計算などのインタフェース有りPython言語を用いた機能拡張

VMD wwwksuiuceduResearchvmd

Win Mac Linux

OpenGLを用いた質の高い描画Tcl言語を用いた機

能拡張が可能分子動力学の可視化を主要目的として幅広い機能

MolScript wwwavatarsemolscrit

Linux(ソース公開)

主にリボン図の描画用のソフトGUIを持たずコマンドラインでPDBファイルをPSファイル等に変換

Swiss PDB Viewer

auexpasyorgspdbv Win Mac Linux

OpenGLを用いた質の高い描画幅広い機能をサ

ポートしているがアップデートは活発でない

H19 問51

タンパク質などの生体高分子をコンピュータで表示するためのソフトウェア名として適切でないものを選択肢の中から一つ選べ

1RasMol2Chime3TMHMM4Swiss-PdbViewer

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問51

タンパク質などの生体高分子をコンピュータで表示するためのソフトウェア名として適切でないものを選択肢の中から一つ選べ

1RasMol2Chime3TMHMM4Swiss-PdbViewer

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問59

タンパク質の立体構造のグラフィックス表示プログラムではないものを選択肢の中から一つ選べ

1Chime2PyMol3MEGA4MolScript

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問59

タンパク質の立体構造のグラフィックス表示プログラムではないものを選択肢の中から一つ選べ

1Chime2PyMol3MEGA4MolScript

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

PDBコード1fxd(ferredoxin II) Rasmol Chimeプラグインで描画

立体構造の描画スタイル

ワイアフレーム ボールスティック 空間充填

バックボーン リボン 分子表面

1 234

N

H C

O

Ala(A)(疎水性)

Phe(F)(疎水性)

Cys(C)(親水性)

Asp(D)(親水性)

Val(V)(疎水性)

Thr(親水性)

様々な物理化学的な性質を持った側鎖が主鎖のペプチド結合で連なる

Leu(L)(疎水性)

蛋白質ペプチド結合したアミノ酸群

アミノ酸は全部で20種類

I VL

M FYW H

KR

D E

P NSA Q

CG T

疎水性 親水性

脂肪族

芳香族正荷電

負荷電

N末

C末

変性状態(D) 天然状態(N)

フォールディング(折り畳み)という現象

非常に多種の構造の集合大きく広がっている

ほとんど唯一の構造小さくコンパクトに折りたたまっている

温度や変性剤濃度によって可逆に変化

折り畳みは原則としてその蛋白質以外の分子の介助を必要としない

アミノ酸配列の情報だけで天然状態の立体構造が決定される

どうやってコンパクトになるか rarr (1)主鎖の水素結合(2)側鎖間の疎水性相互作用

あるアミノ酸配列がどうやって一つの構造を決めるのか

3次元座標の差のスコア(RMSD)

並進ベクトルt を引いたあと回転行列R をかける

t 二つの分子の重心をあわせるように決めるR 2つの原子群の相関を 大化する行列rarr(1)特異値分解で導出

(2)四元数表現により 適な回転をLagrange未定乗数法で決定

sum=

minusminus=N

iiiN

RMSD1

2)](R[1 tyx

21

20

1

2

3

4

5

1xdaA

1

23

4

21

20

5

yi

)(R ty minusi

xi

1

23

4

21

20

5

原子の対応付けがわかっているとする

RMSD 適に重ね合わせたときのXYZ座標の差(Root Mean Square Deviation)

1benA

WKabsch Acta CrystA 32922-923(1976) 34827-828(1978)ADMclachlan JMolBiol 12874-77 (1979)Charles FF Karney ldquoQuaternions in molecular modelingrdquo E-print arXivphysics0506177

xi分子Xのi番目の原子の位置ベクトル yi分子Yのi番目の原子の位置ベクトル

距離の差のスコア (DRMS)

( )sumsum= ge

minusminus

=N

i

N

ij

Yij

Xij DD

NNDRMS

1

2

)1(2

21

20

1

2

3

4

5

YijD

XijD

1

23

4

21

20

5

yixi

DRMS 対応する原子ペアの距離の差(Distance-based RMSD)

原子の対応付けがわかっているとする

重ね合わせは不要なので計算は簡単

3次元によらない2次元や結合情報にも拡張できる

鏡像の区別はできない

1benA

計算が簡単なので高速な構造比較のアルゴリズムの基盤として使われる

1xdaA

H19 問73立体構造の似ている2つのタンパク質間で対応関係にある原子が分かっている場合にはRMSD(Root Mean Square Deviation)と呼ばれる数値を計算することにより立体構造の重なり合いの程度を数値化することができるRMSDは全ての対応する原子間の距離を

2乗した値の平均値(相加平均)にルートをとったものとして定義されるあるタンパク質における6つの原子ABCDEFと別のタンパク質の6つの原子

ArsquoBrsquoCrsquoDrsquoErsquoFrsquoについて対応関係が分かっており互いにもっともよく重なるように回転して重ねた時の対応原子間の距離は以下の表のようになったこの表からB-Brsquo C-Crsquo D-Drsquo E-Ersquoは正確に重なったが他の原子間ではずれが見られることがわかるここで6つの原子に対するRMSD値はいくらになるか選択肢の中からもっとも適切な値を一つ選べただ

し原子間距離の単位は考慮しないものとする

対応原子 距離

原子A―原子Arsquo 20

原子B―原子Brsquo 00

原子C―原子Crsquo 00

原子D―原子Crsquo 10

原子E―原子Crsquo 00

原子F―原子Crsquo 10

1 052 0663 104 133

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問73立体構造の似ている2つのタンパク質間で対応関係にある原子が分かっている場合にはRMSD(Root Mean Square Deviation)と呼ばれる数値を計算することにより立体構造の重なり合いの程度を数値化することができるRMSDは全ての対応する原子間の距離を

2乗した値の平均値(相加平均)にルートをとったものとして定義されるあるタンパク質における6つの原子ABCDEFと別のタンパク質の6つの原子

ArsquoBrsquoCrsquoDrsquoErsquoFrsquoについて対応関係が分かっており互いにもっともよく重なるように回転して重ねた時の対応原子間の距離は以下の表のようになったこの表からB-Brsquo C-Crsquo D-Drsquo E-Ersquoは正確に重なったが他の原子間ではずれが見られることがわかるここで6つの原子に対するRMSD値はいくらになるか選択肢の中からもっとも適切な値を一つ選べただ

し原子間距離の単位は考慮しないものとする

対応原子 距離

原子A―原子Arsquo 20

原子B―原子Brsquo 00

原子C―原子Crsquo 00

原子D―原子Crsquo 10

原子E―原子Crsquo 00

原子F―原子Crsquo 10

1 052 0663 104 133

RMSDは 適に重ね合わせたときの

「ずれの二乗の平均のルート」であるしたがってずれの二乗平均は

(22+0+0+1+0+1)6=66=1これのルートをとるとradic1=1

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

1

2

3

4

56

7

8

9

10

11

主鎖の水素結合αへリックス

1

2

34

56

78

9

10

11

O

N

CHN

N

H

H

CO Cα

i

i+3

i+4

HN O C

Cαi-1

i番目のCOがi+4番目のNHと水素結合を形成

36残基が1周期の右巻きらせん

NHO=Cが同じ向きに並ぶため

へリックス全体に電気双極子が発生

N末C末

ー +

主鎖の水素結合逆平行βシート

βターン

βターン

βヘアピン

βヘアピン

伸びた構造の1本1本をβストランドと呼ぶ二本以上のβストランドがシート状に並んだ構造をβシートと呼ぶ

βストランド

βストランド

βストランド

主鎖の水素結合平行βシート

βminusαminusβモチーフ

平行βシートがαへリックスで接続された構造モチーフ

βストランド

βストランド

βストランド

伸びた構造の1本1本をβストランドと呼ぶ二本以上のβストランドがシート状に並んだ構造をβシートと呼ぶ

Cαi

Cαi+1Cα

i-1φ ψ

ペプチド結合の平面性とφψの定義

主鎖の原子のXYZ座標はφψの2つ

の角度でほとんど記述できる

φψの角度を2次元にプロットしたものをラマチャンドランプロット(Ramachandran plot)という点が集中する領域は2次構造とよく対応

点が現れない領域は主鎖の原子が衝突する

βシート

αへリックス

左巻きへリックス

平面平面

φ

ψ

H19 問74タンパク質の主鎖に添って定義される二面角のうちφ(窒素原子と炭素原子の間の二面角)とψ(α炭素原子とカルボニル基の炭素原子の間の二面角)の値を各残

基ごとに計算して二次元にプロットしたものをラマチャンドランプロットと呼ぶ以下に示したラマチャンドランプロットに対する説明文の中でもっとも適切なものを一つ選べ

1 (a)(b)はともにαへリックスの領域である2 (a)(b)はともにβストランドの領域である3 (a)はαへリックス(b)はβストランドの領

域である4 (a)はβストランド(b)はαへリックスの領

域である

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問74タンパク質の主鎖に添って定義される二面角のうちφ(窒素原子と炭素原子の間の二面角)とψ(α炭素原子とカルボニル基の炭素原子の間の二面角)の値を各残

基ごとに計算して二次元にプロットしたものをラマチャンドランプロットと呼ぶ以下に示したラマチャンドランプロットに対する説明文の中でもっとも適切なものを一つ選べ

1 (a)(b)はともにαへリックスの領域である2 (a)(b)はともにβストランドの領域である3 (a)はαへリックス(b)はβストランドの領

域である4 (a)はβストランド(b)はαへリックスの領

域である

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

トポロジー図によるβシートの表現

4 23

N

C

1

1ubq (UbiquitinHumand151)

N

C123 4 5 6

1n8k (Alchol dehydrogenase E chain Horse c21)

ロスマンフォールド

βターン

βターン

1cauA1rhdA domain2

TOPSプログラムによる表示httpwwwtopsleedsacuk

1timA

はαへリックスはβストランドとなりあうの向きで平行逆平行を示す

コンタクトマップ

1ubq

C

4 23

N

1

縦横に残基を配置しある残基ペアのCα原子間の距離が10Å以下であれば対応するピクセルに色を塗る

分子描画ソフトVMDを用いて作成

平行のストランド間は方向逆平行ストランド間は方向に線分が観察される

N

C

N C

逆平行

逆平行

平行

αへリックスは太めの対角上の線分

へリックス

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから1か3コンタクトマップから平行シートしかないことがわかるため1であることがわかる

αβ5

αβ3

α

β4α

β1αβ2 β2

β1β3β4

β5

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから2か4コンタクトマップから平行シートしかないことがわかるため2であることがわかる

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

配列比較によるタンパク質分類1970年代から配列の一致度(sequence identity)に基づいてグループを作る作業が

行われてきた

どのくらいの類似性で一つにまとめるかは様々な考えがあるが少なくとも「相同なタンパク質群」を一つのグループにまとめるべき

ファミリー(family 族)

進化的に関係のある(相同な)タンパク質グループのこと

複数のファミリーがあつまった大きなグループ スーパーファミリー(superfamily clan)

一つのファミリーの中の小さなグループ サブファミリー(subfamily)

family

subfamily superfamily

ドメイン単位による分類

A2 B2

B3 C3

A1

配列1

配列2

配列3

配列の部分どうしだけが類似していた場合 部分一致を重視するとすべて一つのグループになるがhellip

配列1

配列2 配列3

Aを共有

Bを共有

1と2が類似2と3が類似していても1と3は類似していない

ドメインに分割すると

A1

A2

B2

B3

C3

A2 B2

B3 C3

A1

きれいに分類することができる

Pfam 蛋白質ファミリのデータベース各蛋白質ファミリのマルチプル

アライメント HMMなどを集めたデータベース

httppfamsangeracuk

Pkinase_Tyrドメインをもつタンパク質の例

ABL_HUMAN

BTK_HUMAN

ILK_HUMAN

MERTK_HUMAN

PGFRB_HUMAN

HCK_HUMAN

Family Pkinase_Tyr (PF07714) Protein tyrosine kinase

Pfamデータベース(httppfamsangeracukSoftwarePfam)からの引用

ドメイン構造と疎水性の関係Tyrosine protein kinase HCK (1ad5A HCK_HUMAN)

SH3 domain

SH2 domain

Tyrosine-kinase domain

3つの分断された疎水性コアrarr ドメイン構造

大きなタンパク質はいくつかの構造上のまとまり(ドメイン)を持つことが多い

立体構造によるタンパク質の分類

bull 配列による分類の延長ドメイン単位の分類進化的に関係のある(相同な)タンパク質を群にする(ファミリー)という考え方は同じ

bull 立体構造の類似性からより遠縁の相同性を見つけより大きな群を作る(スーパーファミリー)

bull スーパーファミリーをまとめたさらに大きなグループ(フォールドクラス)

bull 主にアミノ酸(Cαレベル)のラフな構造の類似性に

着目

bull 分類対象は主に球状タンパク質

立体構造分類データベースSCOPhttpscopmrc-lmbcamacukscop

4階層で分類Class(クラス)

Fold(フォールド)

Superfamily(スーパーファミリー)

Family(ファミリー)

どの階層に分類するかは配列の類似性立体構造の類似性分子機能の類似性機能部位の類似性

を専門家が総合的に判断して決める

1akr

ltホモロジーgt

ltアナロジーgt

他の構造分類データベースとしてCATHが有名

同様に階層的な分類体系を持つがその詳細はSCOPとは異なる

クラス

1mbd

1mqkH

1n55A 1pqwA

1fxd 1a2p

all-α (a)

all-β (b)

αβ (c)

α+β (d)

α-へリックスが中心

β-シートが中心

逆平行が多い

α-へリックスとβ-シートが配列上交互に現れる平行β-シートが中心

α-へリックスとβ-シートが混在配列上の並びの規則はない逆平行と平行のβ-シートが混在

アミノ酸配列と立体構造の関係ピロリ菌と大腸菌のフラボドキシン (同一残基率 SeqID 44)

ピロリ菌(1fueA) 大腸菌(1ag9A)

配列が似ていれば立体構造も似ている

SeqID = 44

RMSD = 12 Å

1fueA 2GKIGIFFGTDSGNAEAIAEKISKAIG--NAEVVDVAKASKEQFNGFTKVILVAPTAGAGD59

1ag9A 2AITGIFFGSDTGNTENIAKMIQKQLGKDVADVHDIAKSSKEDLEAYDILLLGIPTWYYGE61

1fueA 60LQTDWEDFLGTLEASD-FANKTIGLVGLGDQDTYSETFAEGIFHIYEKAK--AGKVVGQT116

1ag9A 62AQCDWDDFFPTLE-EIDFNGKLVALFGCGDQEDYAEYFCDALGTIRDIIEPRGATIVGHW120

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C 14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

BLAST

PSI-BLAST 構造比較

構造比較

アミノ酸配列がほとんど似ていなくても立体構造は似ている場合がある

構造は配列より進化的に保存がよい 構造比較から新たなホモログが発見できる可能性

立体

構造

の変

アミノ酸配列の変化と立体構造の変化の相関(グロビン族)

立体構造の変化はアミノ酸配列の変化と相関配列が30以上一致していればRMSDは2Å以下

アミノ酸配列の類似度

2つの構造の類似性

ホモロジー (homology 相同)進化的起源を共有することによる類似多くの場合分子機能なども類似している

アナロジー (analogy 相似)進化的起源とは無関係な類似多くの場合分子機能など他の属性は似ていない物理化学的な構造の偏好が原因とされる

イルカの胸びれ サルの前足

チョウの羽 トリの翼

ネコの前足

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C

ldquoFlavodoxin-likerdquo fold (c23)

ldquoFlavoproteinsrdquo superfamily (c235)

ldquoCheY-likerdquosuperfamily(c231)

14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

AnalogyHomology

HomologyHomolo

gy

多く現れるフォールド(出現ドメイン数順)

太字はスーパーフォールド多くのスーパーファミリーを含むフォールド

d58

c1

g3

c23 b34

b1

a4フォールド名 (SCOP173によるクラスfhijkは除く) ドメイ

ンの数

スーパーファミリーの数

a4 DNARNA-binding 3-helical bundle 292 14c1 TIM betaalpha-barrel 269 33d58 Ferredoxin-like 248 55b1 Immunoglobulin-like beta sandwich 246 27c37 P-loop nucleoside triphosphate hydrolase 235 1c2 NAD(P)-binding Rossmann-fold domains 168 1g3 Knottins 154 19d15 Beta-Grasp(ubiquitin-like) 131 13c23 Flavodoxin-like 118 15b34 SH3-like barrel 117 18b40 OB-fold 100 12c66 SAM-dependent methyltransferases 95 1

c37 c2

d15

b40 c66

スーパーフォールド(Superfold)

フォールド名 (SCOP173によるクラスfhijkは除く) その下のスーパーファミリーの数

d58 Ferredoxin-like 55c1 TIM betaalpha-barrel 33b1 Immunoglobulin-like beta sandwich 27a24 Four-helical up-and-down bundle 27a118 Alpha-alpha superhelix 23g3 Knottins 19b34 SH3-like barrel 18g41 Rubredoxin-like 16c23 Flavodoxin-like 15a60 SAM(sterile alpha motif) domain-like 15b69 7-bladed beta-propeller 14a4 DNARNA-binding 3-helical bundle 14

スーパーフォールド多くのスーパーファミリーを含むフォールド

スーパーフォールドは「構造の類似と機能の類似が対応しにくいフォールド」ともいえる

d58

c1

g3a118

c23

a24

a60

b34

b1

g41

b69 a4

三本へリックスバンドルDNARNA‐binding 3‐helical bundle(a4)

Mating type protein A2 yeast(1k61Aa411)

(1gvdAa413)(1wh5Aa411)

三本のへリックスが束になった構造DNAやRNAに結合する蛋白質が多い

DNAと

結合した構造(1k61)

TIMバレルTIM betaalpha barrel (c1)

Triosephosphate isomerase1n55A(c111)

全般に解糖系の酵素が多い基質酵素反応は極めて多彩

八本のβストランドとαへリックスが交互に組み合わさり対称的な樽(barrel)構造を形成す

る中央の樽構造は平行のβシートからなる

Imidazole glycerol phosphate synthasesubunit hisF1thfD(c121)

KHGKDPG aldolase1euaA(c1101)

フェレドキシン様Ferredoxin‐like (d58)

4Fe-4S Ferredoxin(1fxdd581)

1 234 4本の逆平行のβストランドと2本のαへリックスからな

分子機能は極めて多彩

CheY binding domain of CheA(1eayCd5824)

U1A RNA binding domain(1nu4Ad5871)

免疫グロブリン様Immunoglobulin‐like beta sandwich(b1)

Immunoglobulin Heavy chain variabledomain 1mjuH1(b111)

Immunoglobulin Heavy chain constantdomain 1mjuH2(b112)

Macromomycin1noaA (b171)

免疫グロブリン分子はH鎖とL鎖から

なりそれぞれ免疫グロブリン様ドメインからできている

V

C

V

C

C

C

V

CV

CC

C

L鎖

H鎖H鎖 L鎖

細胞表面あるいは分泌蛋白質が多い免疫や分子認識に関する機能を担うことが多い

4本のβストランドからなるβシートが二枚サンドイッチ状に重なった構造をとる逆平行のβシートが主

P‐loop スーパーファミリーP‐loop nucleoside triphosphate hydrolase(c37)

Ras-related protein RAB-5A1r2qA(c3718)

Guanylate kinase1gkyA(c3711)

RecA proteinDomain1 1xmsA1(c37111)

平行のβシートが主トポロジーには様々な変異あり

シグナル伝達DNA結合

モーター機能など多彩な分子機能を担うがATP GTPなどのヌクレオシド

の加水分解を行う点は共通

N C

132 4 5 6

ヌクレオシド結合部GxxxxGKTの

配列モチーフ(P-loop)を持つ

ロスマン フォールドNAD(P)‐binding Rossmann‐fold domains (c2)

Alcohol dehydrogenase gamma chaindomain2 1u3wA(c211)

Aspartate beta-semialdehydedehydrogenase2gz1A1(c213)

L-alanine dehydrogenase1pjcA1(c214)

補酵素を利用したNAD(P)を脱水素酵素を持つ基質を認識するドメインは別に存在する

NC

123 4 5 6

平行のβシートが主

7枚羽 βプロペラ7‐bladed beta‐propeller (b69)

Garactose oxydasedomain3 1k3iA3(b6911)

Guanine nucleotide-bindingprotein subunit beta-11gotB(b6941)

細胞膜付近のシグナル伝達や糖結合に関わることが多い

Influenza Neuraminidase 1f8dA(b6811)

6枚羽 βプロペラ

N C

321 4

のユニットが7回円環状に繰り返しされたフォールド

立体構造比較プログラム1990年ごろから多くの構造比較プログラムが開発されている

WEBアドレス スコア アライメント

DALI httpwwwebiacukdali

距離の差を独自の関数で変換したスコア

局所アライメントをモンテカルロ法でつなぎ合わせる

CE httpclsdsceducehtml

局所的なRMSD 局所アライメントを積み上げていく

MATRAS httpbiunitnaistjpmatras

距離の変化が相同相似で起こる確率の比をスコアとする

SSEで仮アライメント

を生成残基アライメントを収束するまで反復する

タンパク質の相同性の判断基準

100

同一残基率30以上

BLASTのE-value lt 00001

PSI-BLASTのE-value lt 00001

0102030407025 15 535

同一残基率(Sequence Identity)()

立体構造比較が必要

(1)立体構造の類似性が高い(DALIのZスコアMATRASのRdisスコア)(2)同一残基率がそこそこ高い(PSI-BLASTでヒットするSeqIDgt=15ぐらい)

(3)分子機能に類似性がある(補酵素酵素反応基質代謝経路等の共通性等)(4)基質補酵素の結合部位が類似しておりそのアミノ酸が保存(モチーフ)(5)ドメイン構成の共通性(6)スーパーフォールドの場合は特別な注意が必要

配列解析

同一残基率が25以下の場合の相同性の判断基準

50608090

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 9: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

アミノ酸配列から膜貫通へリックスを予測するサーバSOSUIサーバhttpbpnuapnagoya-uacjpsosui

他にTMHMM Tmpredなどがある

H19 問71

1 一般に表面ではアミノ酸の挿入欠失や置換が起こりやすく内部では起こりにくい

2 生物種間で比較した時に保存されているアミノ酸がタンパク質表面で集中している領域は他のタンパク質やリガンドとの結合に関与していると予測できる

3 DNAと相互作用するタンパク質の場合DNAとの結合面は負

電荷を持つアミノ酸が集中することから容易に予測できる4 一般に表面には溶媒との相互作用のため極性基をもつアミノ

酸が多く内部は疎水性アミノ酸による疎水コアを形成していることが多い

次に示した球状タンパク質の性質に関する記述の中で不適切なものを一つ選べ

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問71

1 一般に表面ではアミノ酸の挿入欠失や置換が起こりやすく内部では起こりにくい

2 生物種間で比較した時に保存されているアミノ酸がタンパク質表面で集中している領域は他のタンパク質やリガンドとの結合に関与していると予測できる

3 DNAと相互作用するタンパク質の場合DNAとの結合面は負

電荷を持つアミノ酸が集中することから容易に予測できる4 一般に表面には溶媒との相互作用のため極性基をもつアミノ

酸が多く内部は疎水性アミノ酸による疎水コアを形成していることが多い

次に示した球状タンパク質の性質に関する記述の中で不適切なものを一つ選べ

DNAやRNAなどの核酸はリン酸基にマイナスの電荷を持っているよって核酸に

結合する蛋白質は表面にプラスの電荷を持っているものが多い平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

「タンパク質構造解析」のキーワード(構造比較)

bull 立体構造表現(コンタクトマップラマチャンドランマップ)

bull 構造比較

bull 重ね合わせbull RMSDbull 構造アライメント

bull 構造モチーフ

bull 構造分類

立体構造の決定法X線結晶解析

NMR(核磁気共鳴法)

大量発現精製結晶化

X線回折強度の測定

原子モデルの構築

原子モデルの精密化

核磁気共鳴解析(NOE解析帰属と距離拘束の抽出)

3次元電子密度マップ

原子間距離拘束

(1)多数分子の平均構造の観察(精製が重要 大きな分子複合体はより難しくなる)(2)発現精製結晶化のステップで各タンパク質によって実験条件の調整が必須(3)実験データの収集原子モデル構築の段階で計算機の支援が不可欠

大量発現精製

原子モデルの構築

原子モデルの精密化

MET 1

GLN 2

1

2

34

56

7 8

9

10

11

12

13

14

15

1617

18 19 20

21

HEADER UBIQUITIN 17-APR-92 1AAR COMPND DI-UBIQUITINSOURCE BOVINE (BOS TAURUS) ERYTHROCYTESAUTHOR WJCOOKLCJEFFREYMCARSONZCHENCMPICKART

原子番号 残基名 鎖識別子原子名 残基番号 X座標 Y座標 Z座標 占有率 温度因子

ATOM 1 N MET A 1 15493 30088 14694 100 836ATOM 2 CA MET A 1 14600 29031 15110 100 815ATOM 3 C MET A 1 15476 27793 15419 100 930ATOM 4 O MET A 1 16571 27561 14871 100 896ATOM 5 CB MET A 1 13500 28837 14105 100 989ATOM 6 CG MET A 1 13823 27997 12931 100 1021ATOM 7 SD MET A 1 12312 27711 11891 100 1033ATOM 8 CE MET A 1 13174 26595 10726 100 730ATOM 9 N GLN A 2 14968 27014 16326 100 975ATOM 10 CA GLN A 2 15552 25806 16852 100 1192ATOM 11 C GLN A 2 15000 24553 16168 100 1171ATOM 12 O GLN A 2 13787 24387 16086 100 1000 ATOM 13 CB GLN A 2 15368 25715 18386 100 1239ATOM 14 CG GLN A 2 15858 24413 19051 100 1400ATOM 15 CD GLN A 2 15676 24587 20561 100 1559ATOM 16 OE1 GLN A 2 16525 25209 21205 100 1867ATOM 17 NE2 GLN A 2 14564 24203 21152 100 1539ATOM 18 N ILE A 3 15960 23745 15687 100 1179 ATOM 19 CA ILE A 3 15593 22437 15130 100 1214ATOM 20 C ILE A 3 16491 21342 15720 100 1199ATOM 21 O ILE A 3 17701 21540 15767 100 1291

PDB ID

wwPDB(World Wide Protein Data Bank) 立体構造データの収集するデータバンク

RCSB PDB httpwwwrcsborgpdbPDBフォーマット MSD EBI httpwwwebiacukmsd

PDBj httpwwwpdbjorg

PDBは1971年に設立

立体構造描画のフリーウエアシェアウエアソフト名 WebSite 対応機種 特徴

RasMol wwwopenrasmolorg Win Mac Linux(ソース公開)

独自の高速描画アルゴリズムを用い非力なハードでも同様に高速描画が可能コマンド言語は強力で多機能基本的な描画法をカバーするが分子表面の描画はできない描画の質はやや低い

Chime wwwmdlchimecom Win Mac RasMolをベースにしたWEBブラウザ内で動作するプラグイン分子表面表示など描画機能はRasMolより拡張分子描画機能を持ったWEBページを作れる

Jmol jmolsourceforgenet Win Mac Linux(ソース公開)

Java Applet によりWEBブラウザ内で動作Chimeと同様に分子描画機能を持ったWEBページを作れるJREをインストールする必要

PyMOL pymolsourceforgenet

Win Mac Linux

OpenGLを用いた質の高い描画Python言語で開発されておりソースも公開Python言語を用いた機能

拡張も可能

CHIMERA wwwcglucsfeduchimera

Win Mac Linux

OpenGLを用いた質の高い描画電顕画像などの多

様なデータの取り込みドッキング静電計算などのインタフェース有りPython言語を用いた機能拡張

VMD wwwksuiuceduResearchvmd

Win Mac Linux

OpenGLを用いた質の高い描画Tcl言語を用いた機

能拡張が可能分子動力学の可視化を主要目的として幅広い機能

MolScript wwwavatarsemolscrit

Linux(ソース公開)

主にリボン図の描画用のソフトGUIを持たずコマンドラインでPDBファイルをPSファイル等に変換

Swiss PDB Viewer

auexpasyorgspdbv Win Mac Linux

OpenGLを用いた質の高い描画幅広い機能をサ

ポートしているがアップデートは活発でない

H19 問51

タンパク質などの生体高分子をコンピュータで表示するためのソフトウェア名として適切でないものを選択肢の中から一つ選べ

1RasMol2Chime3TMHMM4Swiss-PdbViewer

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問51

タンパク質などの生体高分子をコンピュータで表示するためのソフトウェア名として適切でないものを選択肢の中から一つ選べ

1RasMol2Chime3TMHMM4Swiss-PdbViewer

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問59

タンパク質の立体構造のグラフィックス表示プログラムではないものを選択肢の中から一つ選べ

1Chime2PyMol3MEGA4MolScript

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問59

タンパク質の立体構造のグラフィックス表示プログラムではないものを選択肢の中から一つ選べ

1Chime2PyMol3MEGA4MolScript

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

PDBコード1fxd(ferredoxin II) Rasmol Chimeプラグインで描画

立体構造の描画スタイル

ワイアフレーム ボールスティック 空間充填

バックボーン リボン 分子表面

1 234

N

H C

O

Ala(A)(疎水性)

Phe(F)(疎水性)

Cys(C)(親水性)

Asp(D)(親水性)

Val(V)(疎水性)

Thr(親水性)

様々な物理化学的な性質を持った側鎖が主鎖のペプチド結合で連なる

Leu(L)(疎水性)

蛋白質ペプチド結合したアミノ酸群

アミノ酸は全部で20種類

I VL

M FYW H

KR

D E

P NSA Q

CG T

疎水性 親水性

脂肪族

芳香族正荷電

負荷電

N末

C末

変性状態(D) 天然状態(N)

フォールディング(折り畳み)という現象

非常に多種の構造の集合大きく広がっている

ほとんど唯一の構造小さくコンパクトに折りたたまっている

温度や変性剤濃度によって可逆に変化

折り畳みは原則としてその蛋白質以外の分子の介助を必要としない

アミノ酸配列の情報だけで天然状態の立体構造が決定される

どうやってコンパクトになるか rarr (1)主鎖の水素結合(2)側鎖間の疎水性相互作用

あるアミノ酸配列がどうやって一つの構造を決めるのか

3次元座標の差のスコア(RMSD)

並進ベクトルt を引いたあと回転行列R をかける

t 二つの分子の重心をあわせるように決めるR 2つの原子群の相関を 大化する行列rarr(1)特異値分解で導出

(2)四元数表現により 適な回転をLagrange未定乗数法で決定

sum=

minusminus=N

iiiN

RMSD1

2)](R[1 tyx

21

20

1

2

3

4

5

1xdaA

1

23

4

21

20

5

yi

)(R ty minusi

xi

1

23

4

21

20

5

原子の対応付けがわかっているとする

RMSD 適に重ね合わせたときのXYZ座標の差(Root Mean Square Deviation)

1benA

WKabsch Acta CrystA 32922-923(1976) 34827-828(1978)ADMclachlan JMolBiol 12874-77 (1979)Charles FF Karney ldquoQuaternions in molecular modelingrdquo E-print arXivphysics0506177

xi分子Xのi番目の原子の位置ベクトル yi分子Yのi番目の原子の位置ベクトル

距離の差のスコア (DRMS)

( )sumsum= ge

minusminus

=N

i

N

ij

Yij

Xij DD

NNDRMS

1

2

)1(2

21

20

1

2

3

4

5

YijD

XijD

1

23

4

21

20

5

yixi

DRMS 対応する原子ペアの距離の差(Distance-based RMSD)

原子の対応付けがわかっているとする

重ね合わせは不要なので計算は簡単

3次元によらない2次元や結合情報にも拡張できる

鏡像の区別はできない

1benA

計算が簡単なので高速な構造比較のアルゴリズムの基盤として使われる

1xdaA

H19 問73立体構造の似ている2つのタンパク質間で対応関係にある原子が分かっている場合にはRMSD(Root Mean Square Deviation)と呼ばれる数値を計算することにより立体構造の重なり合いの程度を数値化することができるRMSDは全ての対応する原子間の距離を

2乗した値の平均値(相加平均)にルートをとったものとして定義されるあるタンパク質における6つの原子ABCDEFと別のタンパク質の6つの原子

ArsquoBrsquoCrsquoDrsquoErsquoFrsquoについて対応関係が分かっており互いにもっともよく重なるように回転して重ねた時の対応原子間の距離は以下の表のようになったこの表からB-Brsquo C-Crsquo D-Drsquo E-Ersquoは正確に重なったが他の原子間ではずれが見られることがわかるここで6つの原子に対するRMSD値はいくらになるか選択肢の中からもっとも適切な値を一つ選べただ

し原子間距離の単位は考慮しないものとする

対応原子 距離

原子A―原子Arsquo 20

原子B―原子Brsquo 00

原子C―原子Crsquo 00

原子D―原子Crsquo 10

原子E―原子Crsquo 00

原子F―原子Crsquo 10

1 052 0663 104 133

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問73立体構造の似ている2つのタンパク質間で対応関係にある原子が分かっている場合にはRMSD(Root Mean Square Deviation)と呼ばれる数値を計算することにより立体構造の重なり合いの程度を数値化することができるRMSDは全ての対応する原子間の距離を

2乗した値の平均値(相加平均)にルートをとったものとして定義されるあるタンパク質における6つの原子ABCDEFと別のタンパク質の6つの原子

ArsquoBrsquoCrsquoDrsquoErsquoFrsquoについて対応関係が分かっており互いにもっともよく重なるように回転して重ねた時の対応原子間の距離は以下の表のようになったこの表からB-Brsquo C-Crsquo D-Drsquo E-Ersquoは正確に重なったが他の原子間ではずれが見られることがわかるここで6つの原子に対するRMSD値はいくらになるか選択肢の中からもっとも適切な値を一つ選べただ

し原子間距離の単位は考慮しないものとする

対応原子 距離

原子A―原子Arsquo 20

原子B―原子Brsquo 00

原子C―原子Crsquo 00

原子D―原子Crsquo 10

原子E―原子Crsquo 00

原子F―原子Crsquo 10

1 052 0663 104 133

RMSDは 適に重ね合わせたときの

「ずれの二乗の平均のルート」であるしたがってずれの二乗平均は

(22+0+0+1+0+1)6=66=1これのルートをとるとradic1=1

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

1

2

3

4

56

7

8

9

10

11

主鎖の水素結合αへリックス

1

2

34

56

78

9

10

11

O

N

CHN

N

H

H

CO Cα

i

i+3

i+4

HN O C

Cαi-1

i番目のCOがi+4番目のNHと水素結合を形成

36残基が1周期の右巻きらせん

NHO=Cが同じ向きに並ぶため

へリックス全体に電気双極子が発生

N末C末

ー +

主鎖の水素結合逆平行βシート

βターン

βターン

βヘアピン

βヘアピン

伸びた構造の1本1本をβストランドと呼ぶ二本以上のβストランドがシート状に並んだ構造をβシートと呼ぶ

βストランド

βストランド

βストランド

主鎖の水素結合平行βシート

βminusαminusβモチーフ

平行βシートがαへリックスで接続された構造モチーフ

βストランド

βストランド

βストランド

伸びた構造の1本1本をβストランドと呼ぶ二本以上のβストランドがシート状に並んだ構造をβシートと呼ぶ

Cαi

Cαi+1Cα

i-1φ ψ

ペプチド結合の平面性とφψの定義

主鎖の原子のXYZ座標はφψの2つ

の角度でほとんど記述できる

φψの角度を2次元にプロットしたものをラマチャンドランプロット(Ramachandran plot)という点が集中する領域は2次構造とよく対応

点が現れない領域は主鎖の原子が衝突する

βシート

αへリックス

左巻きへリックス

平面平面

φ

ψ

H19 問74タンパク質の主鎖に添って定義される二面角のうちφ(窒素原子と炭素原子の間の二面角)とψ(α炭素原子とカルボニル基の炭素原子の間の二面角)の値を各残

基ごとに計算して二次元にプロットしたものをラマチャンドランプロットと呼ぶ以下に示したラマチャンドランプロットに対する説明文の中でもっとも適切なものを一つ選べ

1 (a)(b)はともにαへリックスの領域である2 (a)(b)はともにβストランドの領域である3 (a)はαへリックス(b)はβストランドの領

域である4 (a)はβストランド(b)はαへリックスの領

域である

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問74タンパク質の主鎖に添って定義される二面角のうちφ(窒素原子と炭素原子の間の二面角)とψ(α炭素原子とカルボニル基の炭素原子の間の二面角)の値を各残

基ごとに計算して二次元にプロットしたものをラマチャンドランプロットと呼ぶ以下に示したラマチャンドランプロットに対する説明文の中でもっとも適切なものを一つ選べ

1 (a)(b)はともにαへリックスの領域である2 (a)(b)はともにβストランドの領域である3 (a)はαへリックス(b)はβストランドの領

域である4 (a)はβストランド(b)はαへリックスの領

域である

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

トポロジー図によるβシートの表現

4 23

N

C

1

1ubq (UbiquitinHumand151)

N

C123 4 5 6

1n8k (Alchol dehydrogenase E chain Horse c21)

ロスマンフォールド

βターン

βターン

1cauA1rhdA domain2

TOPSプログラムによる表示httpwwwtopsleedsacuk

1timA

はαへリックスはβストランドとなりあうの向きで平行逆平行を示す

コンタクトマップ

1ubq

C

4 23

N

1

縦横に残基を配置しある残基ペアのCα原子間の距離が10Å以下であれば対応するピクセルに色を塗る

分子描画ソフトVMDを用いて作成

平行のストランド間は方向逆平行ストランド間は方向に線分が観察される

N

C

N C

逆平行

逆平行

平行

αへリックスは太めの対角上の線分

へリックス

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから1か3コンタクトマップから平行シートしかないことがわかるため1であることがわかる

αβ5

αβ3

α

β4α

β1αβ2 β2

β1β3β4

β5

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから2か4コンタクトマップから平行シートしかないことがわかるため2であることがわかる

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

配列比較によるタンパク質分類1970年代から配列の一致度(sequence identity)に基づいてグループを作る作業が

行われてきた

どのくらいの類似性で一つにまとめるかは様々な考えがあるが少なくとも「相同なタンパク質群」を一つのグループにまとめるべき

ファミリー(family 族)

進化的に関係のある(相同な)タンパク質グループのこと

複数のファミリーがあつまった大きなグループ スーパーファミリー(superfamily clan)

一つのファミリーの中の小さなグループ サブファミリー(subfamily)

family

subfamily superfamily

ドメイン単位による分類

A2 B2

B3 C3

A1

配列1

配列2

配列3

配列の部分どうしだけが類似していた場合 部分一致を重視するとすべて一つのグループになるがhellip

配列1

配列2 配列3

Aを共有

Bを共有

1と2が類似2と3が類似していても1と3は類似していない

ドメインに分割すると

A1

A2

B2

B3

C3

A2 B2

B3 C3

A1

きれいに分類することができる

Pfam 蛋白質ファミリのデータベース各蛋白質ファミリのマルチプル

アライメント HMMなどを集めたデータベース

httppfamsangeracuk

Pkinase_Tyrドメインをもつタンパク質の例

ABL_HUMAN

BTK_HUMAN

ILK_HUMAN

MERTK_HUMAN

PGFRB_HUMAN

HCK_HUMAN

Family Pkinase_Tyr (PF07714) Protein tyrosine kinase

Pfamデータベース(httppfamsangeracukSoftwarePfam)からの引用

ドメイン構造と疎水性の関係Tyrosine protein kinase HCK (1ad5A HCK_HUMAN)

SH3 domain

SH2 domain

Tyrosine-kinase domain

3つの分断された疎水性コアrarr ドメイン構造

大きなタンパク質はいくつかの構造上のまとまり(ドメイン)を持つことが多い

立体構造によるタンパク質の分類

bull 配列による分類の延長ドメイン単位の分類進化的に関係のある(相同な)タンパク質を群にする(ファミリー)という考え方は同じ

bull 立体構造の類似性からより遠縁の相同性を見つけより大きな群を作る(スーパーファミリー)

bull スーパーファミリーをまとめたさらに大きなグループ(フォールドクラス)

bull 主にアミノ酸(Cαレベル)のラフな構造の類似性に

着目

bull 分類対象は主に球状タンパク質

立体構造分類データベースSCOPhttpscopmrc-lmbcamacukscop

4階層で分類Class(クラス)

Fold(フォールド)

Superfamily(スーパーファミリー)

Family(ファミリー)

どの階層に分類するかは配列の類似性立体構造の類似性分子機能の類似性機能部位の類似性

を専門家が総合的に判断して決める

1akr

ltホモロジーgt

ltアナロジーgt

他の構造分類データベースとしてCATHが有名

同様に階層的な分類体系を持つがその詳細はSCOPとは異なる

クラス

1mbd

1mqkH

1n55A 1pqwA

1fxd 1a2p

all-α (a)

all-β (b)

αβ (c)

α+β (d)

α-へリックスが中心

β-シートが中心

逆平行が多い

α-へリックスとβ-シートが配列上交互に現れる平行β-シートが中心

α-へリックスとβ-シートが混在配列上の並びの規則はない逆平行と平行のβ-シートが混在

アミノ酸配列と立体構造の関係ピロリ菌と大腸菌のフラボドキシン (同一残基率 SeqID 44)

ピロリ菌(1fueA) 大腸菌(1ag9A)

配列が似ていれば立体構造も似ている

SeqID = 44

RMSD = 12 Å

1fueA 2GKIGIFFGTDSGNAEAIAEKISKAIG--NAEVVDVAKASKEQFNGFTKVILVAPTAGAGD59

1ag9A 2AITGIFFGSDTGNTENIAKMIQKQLGKDVADVHDIAKSSKEDLEAYDILLLGIPTWYYGE61

1fueA 60LQTDWEDFLGTLEASD-FANKTIGLVGLGDQDTYSETFAEGIFHIYEKAK--AGKVVGQT116

1ag9A 62AQCDWDDFFPTLE-EIDFNGKLVALFGCGDQEDYAEYFCDALGTIRDIIEPRGATIVGHW120

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C 14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

BLAST

PSI-BLAST 構造比較

構造比較

アミノ酸配列がほとんど似ていなくても立体構造は似ている場合がある

構造は配列より進化的に保存がよい 構造比較から新たなホモログが発見できる可能性

立体

構造

の変

アミノ酸配列の変化と立体構造の変化の相関(グロビン族)

立体構造の変化はアミノ酸配列の変化と相関配列が30以上一致していればRMSDは2Å以下

アミノ酸配列の類似度

2つの構造の類似性

ホモロジー (homology 相同)進化的起源を共有することによる類似多くの場合分子機能なども類似している

アナロジー (analogy 相似)進化的起源とは無関係な類似多くの場合分子機能など他の属性は似ていない物理化学的な構造の偏好が原因とされる

イルカの胸びれ サルの前足

チョウの羽 トリの翼

ネコの前足

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C

ldquoFlavodoxin-likerdquo fold (c23)

ldquoFlavoproteinsrdquo superfamily (c235)

ldquoCheY-likerdquosuperfamily(c231)

14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

AnalogyHomology

HomologyHomolo

gy

多く現れるフォールド(出現ドメイン数順)

太字はスーパーフォールド多くのスーパーファミリーを含むフォールド

d58

c1

g3

c23 b34

b1

a4フォールド名 (SCOP173によるクラスfhijkは除く) ドメイ

ンの数

スーパーファミリーの数

a4 DNARNA-binding 3-helical bundle 292 14c1 TIM betaalpha-barrel 269 33d58 Ferredoxin-like 248 55b1 Immunoglobulin-like beta sandwich 246 27c37 P-loop nucleoside triphosphate hydrolase 235 1c2 NAD(P)-binding Rossmann-fold domains 168 1g3 Knottins 154 19d15 Beta-Grasp(ubiquitin-like) 131 13c23 Flavodoxin-like 118 15b34 SH3-like barrel 117 18b40 OB-fold 100 12c66 SAM-dependent methyltransferases 95 1

c37 c2

d15

b40 c66

スーパーフォールド(Superfold)

フォールド名 (SCOP173によるクラスfhijkは除く) その下のスーパーファミリーの数

d58 Ferredoxin-like 55c1 TIM betaalpha-barrel 33b1 Immunoglobulin-like beta sandwich 27a24 Four-helical up-and-down bundle 27a118 Alpha-alpha superhelix 23g3 Knottins 19b34 SH3-like barrel 18g41 Rubredoxin-like 16c23 Flavodoxin-like 15a60 SAM(sterile alpha motif) domain-like 15b69 7-bladed beta-propeller 14a4 DNARNA-binding 3-helical bundle 14

スーパーフォールド多くのスーパーファミリーを含むフォールド

スーパーフォールドは「構造の類似と機能の類似が対応しにくいフォールド」ともいえる

d58

c1

g3a118

c23

a24

a60

b34

b1

g41

b69 a4

三本へリックスバンドルDNARNA‐binding 3‐helical bundle(a4)

Mating type protein A2 yeast(1k61Aa411)

(1gvdAa413)(1wh5Aa411)

三本のへリックスが束になった構造DNAやRNAに結合する蛋白質が多い

DNAと

結合した構造(1k61)

TIMバレルTIM betaalpha barrel (c1)

Triosephosphate isomerase1n55A(c111)

全般に解糖系の酵素が多い基質酵素反応は極めて多彩

八本のβストランドとαへリックスが交互に組み合わさり対称的な樽(barrel)構造を形成す

る中央の樽構造は平行のβシートからなる

Imidazole glycerol phosphate synthasesubunit hisF1thfD(c121)

KHGKDPG aldolase1euaA(c1101)

フェレドキシン様Ferredoxin‐like (d58)

4Fe-4S Ferredoxin(1fxdd581)

1 234 4本の逆平行のβストランドと2本のαへリックスからな

分子機能は極めて多彩

CheY binding domain of CheA(1eayCd5824)

U1A RNA binding domain(1nu4Ad5871)

免疫グロブリン様Immunoglobulin‐like beta sandwich(b1)

Immunoglobulin Heavy chain variabledomain 1mjuH1(b111)

Immunoglobulin Heavy chain constantdomain 1mjuH2(b112)

Macromomycin1noaA (b171)

免疫グロブリン分子はH鎖とL鎖から

なりそれぞれ免疫グロブリン様ドメインからできている

V

C

V

C

C

C

V

CV

CC

C

L鎖

H鎖H鎖 L鎖

細胞表面あるいは分泌蛋白質が多い免疫や分子認識に関する機能を担うことが多い

4本のβストランドからなるβシートが二枚サンドイッチ状に重なった構造をとる逆平行のβシートが主

P‐loop スーパーファミリーP‐loop nucleoside triphosphate hydrolase(c37)

Ras-related protein RAB-5A1r2qA(c3718)

Guanylate kinase1gkyA(c3711)

RecA proteinDomain1 1xmsA1(c37111)

平行のβシートが主トポロジーには様々な変異あり

シグナル伝達DNA結合

モーター機能など多彩な分子機能を担うがATP GTPなどのヌクレオシド

の加水分解を行う点は共通

N C

132 4 5 6

ヌクレオシド結合部GxxxxGKTの

配列モチーフ(P-loop)を持つ

ロスマン フォールドNAD(P)‐binding Rossmann‐fold domains (c2)

Alcohol dehydrogenase gamma chaindomain2 1u3wA(c211)

Aspartate beta-semialdehydedehydrogenase2gz1A1(c213)

L-alanine dehydrogenase1pjcA1(c214)

補酵素を利用したNAD(P)を脱水素酵素を持つ基質を認識するドメインは別に存在する

NC

123 4 5 6

平行のβシートが主

7枚羽 βプロペラ7‐bladed beta‐propeller (b69)

Garactose oxydasedomain3 1k3iA3(b6911)

Guanine nucleotide-bindingprotein subunit beta-11gotB(b6941)

細胞膜付近のシグナル伝達や糖結合に関わることが多い

Influenza Neuraminidase 1f8dA(b6811)

6枚羽 βプロペラ

N C

321 4

のユニットが7回円環状に繰り返しされたフォールド

立体構造比較プログラム1990年ごろから多くの構造比較プログラムが開発されている

WEBアドレス スコア アライメント

DALI httpwwwebiacukdali

距離の差を独自の関数で変換したスコア

局所アライメントをモンテカルロ法でつなぎ合わせる

CE httpclsdsceducehtml

局所的なRMSD 局所アライメントを積み上げていく

MATRAS httpbiunitnaistjpmatras

距離の変化が相同相似で起こる確率の比をスコアとする

SSEで仮アライメント

を生成残基アライメントを収束するまで反復する

タンパク質の相同性の判断基準

100

同一残基率30以上

BLASTのE-value lt 00001

PSI-BLASTのE-value lt 00001

0102030407025 15 535

同一残基率(Sequence Identity)()

立体構造比較が必要

(1)立体構造の類似性が高い(DALIのZスコアMATRASのRdisスコア)(2)同一残基率がそこそこ高い(PSI-BLASTでヒットするSeqIDgt=15ぐらい)

(3)分子機能に類似性がある(補酵素酵素反応基質代謝経路等の共通性等)(4)基質補酵素の結合部位が類似しておりそのアミノ酸が保存(モチーフ)(5)ドメイン構成の共通性(6)スーパーフォールドの場合は特別な注意が必要

配列解析

同一残基率が25以下の場合の相同性の判断基準

50608090

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 10: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

H19 問71

1 一般に表面ではアミノ酸の挿入欠失や置換が起こりやすく内部では起こりにくい

2 生物種間で比較した時に保存されているアミノ酸がタンパク質表面で集中している領域は他のタンパク質やリガンドとの結合に関与していると予測できる

3 DNAと相互作用するタンパク質の場合DNAとの結合面は負

電荷を持つアミノ酸が集中することから容易に予測できる4 一般に表面には溶媒との相互作用のため極性基をもつアミノ

酸が多く内部は疎水性アミノ酸による疎水コアを形成していることが多い

次に示した球状タンパク質の性質に関する記述の中で不適切なものを一つ選べ

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問71

1 一般に表面ではアミノ酸の挿入欠失や置換が起こりやすく内部では起こりにくい

2 生物種間で比較した時に保存されているアミノ酸がタンパク質表面で集中している領域は他のタンパク質やリガンドとの結合に関与していると予測できる

3 DNAと相互作用するタンパク質の場合DNAとの結合面は負

電荷を持つアミノ酸が集中することから容易に予測できる4 一般に表面には溶媒との相互作用のため極性基をもつアミノ

酸が多く内部は疎水性アミノ酸による疎水コアを形成していることが多い

次に示した球状タンパク質の性質に関する記述の中で不適切なものを一つ選べ

DNAやRNAなどの核酸はリン酸基にマイナスの電荷を持っているよって核酸に

結合する蛋白質は表面にプラスの電荷を持っているものが多い平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

「タンパク質構造解析」のキーワード(構造比較)

bull 立体構造表現(コンタクトマップラマチャンドランマップ)

bull 構造比較

bull 重ね合わせbull RMSDbull 構造アライメント

bull 構造モチーフ

bull 構造分類

立体構造の決定法X線結晶解析

NMR(核磁気共鳴法)

大量発現精製結晶化

X線回折強度の測定

原子モデルの構築

原子モデルの精密化

核磁気共鳴解析(NOE解析帰属と距離拘束の抽出)

3次元電子密度マップ

原子間距離拘束

(1)多数分子の平均構造の観察(精製が重要 大きな分子複合体はより難しくなる)(2)発現精製結晶化のステップで各タンパク質によって実験条件の調整が必須(3)実験データの収集原子モデル構築の段階で計算機の支援が不可欠

大量発現精製

原子モデルの構築

原子モデルの精密化

MET 1

GLN 2

1

2

34

56

7 8

9

10

11

12

13

14

15

1617

18 19 20

21

HEADER UBIQUITIN 17-APR-92 1AAR COMPND DI-UBIQUITINSOURCE BOVINE (BOS TAURUS) ERYTHROCYTESAUTHOR WJCOOKLCJEFFREYMCARSONZCHENCMPICKART

原子番号 残基名 鎖識別子原子名 残基番号 X座標 Y座標 Z座標 占有率 温度因子

ATOM 1 N MET A 1 15493 30088 14694 100 836ATOM 2 CA MET A 1 14600 29031 15110 100 815ATOM 3 C MET A 1 15476 27793 15419 100 930ATOM 4 O MET A 1 16571 27561 14871 100 896ATOM 5 CB MET A 1 13500 28837 14105 100 989ATOM 6 CG MET A 1 13823 27997 12931 100 1021ATOM 7 SD MET A 1 12312 27711 11891 100 1033ATOM 8 CE MET A 1 13174 26595 10726 100 730ATOM 9 N GLN A 2 14968 27014 16326 100 975ATOM 10 CA GLN A 2 15552 25806 16852 100 1192ATOM 11 C GLN A 2 15000 24553 16168 100 1171ATOM 12 O GLN A 2 13787 24387 16086 100 1000 ATOM 13 CB GLN A 2 15368 25715 18386 100 1239ATOM 14 CG GLN A 2 15858 24413 19051 100 1400ATOM 15 CD GLN A 2 15676 24587 20561 100 1559ATOM 16 OE1 GLN A 2 16525 25209 21205 100 1867ATOM 17 NE2 GLN A 2 14564 24203 21152 100 1539ATOM 18 N ILE A 3 15960 23745 15687 100 1179 ATOM 19 CA ILE A 3 15593 22437 15130 100 1214ATOM 20 C ILE A 3 16491 21342 15720 100 1199ATOM 21 O ILE A 3 17701 21540 15767 100 1291

PDB ID

wwPDB(World Wide Protein Data Bank) 立体構造データの収集するデータバンク

RCSB PDB httpwwwrcsborgpdbPDBフォーマット MSD EBI httpwwwebiacukmsd

PDBj httpwwwpdbjorg

PDBは1971年に設立

立体構造描画のフリーウエアシェアウエアソフト名 WebSite 対応機種 特徴

RasMol wwwopenrasmolorg Win Mac Linux(ソース公開)

独自の高速描画アルゴリズムを用い非力なハードでも同様に高速描画が可能コマンド言語は強力で多機能基本的な描画法をカバーするが分子表面の描画はできない描画の質はやや低い

Chime wwwmdlchimecom Win Mac RasMolをベースにしたWEBブラウザ内で動作するプラグイン分子表面表示など描画機能はRasMolより拡張分子描画機能を持ったWEBページを作れる

Jmol jmolsourceforgenet Win Mac Linux(ソース公開)

Java Applet によりWEBブラウザ内で動作Chimeと同様に分子描画機能を持ったWEBページを作れるJREをインストールする必要

PyMOL pymolsourceforgenet

Win Mac Linux

OpenGLを用いた質の高い描画Python言語で開発されておりソースも公開Python言語を用いた機能

拡張も可能

CHIMERA wwwcglucsfeduchimera

Win Mac Linux

OpenGLを用いた質の高い描画電顕画像などの多

様なデータの取り込みドッキング静電計算などのインタフェース有りPython言語を用いた機能拡張

VMD wwwksuiuceduResearchvmd

Win Mac Linux

OpenGLを用いた質の高い描画Tcl言語を用いた機

能拡張が可能分子動力学の可視化を主要目的として幅広い機能

MolScript wwwavatarsemolscrit

Linux(ソース公開)

主にリボン図の描画用のソフトGUIを持たずコマンドラインでPDBファイルをPSファイル等に変換

Swiss PDB Viewer

auexpasyorgspdbv Win Mac Linux

OpenGLを用いた質の高い描画幅広い機能をサ

ポートしているがアップデートは活発でない

H19 問51

タンパク質などの生体高分子をコンピュータで表示するためのソフトウェア名として適切でないものを選択肢の中から一つ選べ

1RasMol2Chime3TMHMM4Swiss-PdbViewer

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問51

タンパク質などの生体高分子をコンピュータで表示するためのソフトウェア名として適切でないものを選択肢の中から一つ選べ

1RasMol2Chime3TMHMM4Swiss-PdbViewer

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問59

タンパク質の立体構造のグラフィックス表示プログラムではないものを選択肢の中から一つ選べ

1Chime2PyMol3MEGA4MolScript

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問59

タンパク質の立体構造のグラフィックス表示プログラムではないものを選択肢の中から一つ選べ

1Chime2PyMol3MEGA4MolScript

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

PDBコード1fxd(ferredoxin II) Rasmol Chimeプラグインで描画

立体構造の描画スタイル

ワイアフレーム ボールスティック 空間充填

バックボーン リボン 分子表面

1 234

N

H C

O

Ala(A)(疎水性)

Phe(F)(疎水性)

Cys(C)(親水性)

Asp(D)(親水性)

Val(V)(疎水性)

Thr(親水性)

様々な物理化学的な性質を持った側鎖が主鎖のペプチド結合で連なる

Leu(L)(疎水性)

蛋白質ペプチド結合したアミノ酸群

アミノ酸は全部で20種類

I VL

M FYW H

KR

D E

P NSA Q

CG T

疎水性 親水性

脂肪族

芳香族正荷電

負荷電

N末

C末

変性状態(D) 天然状態(N)

フォールディング(折り畳み)という現象

非常に多種の構造の集合大きく広がっている

ほとんど唯一の構造小さくコンパクトに折りたたまっている

温度や変性剤濃度によって可逆に変化

折り畳みは原則としてその蛋白質以外の分子の介助を必要としない

アミノ酸配列の情報だけで天然状態の立体構造が決定される

どうやってコンパクトになるか rarr (1)主鎖の水素結合(2)側鎖間の疎水性相互作用

あるアミノ酸配列がどうやって一つの構造を決めるのか

3次元座標の差のスコア(RMSD)

並進ベクトルt を引いたあと回転行列R をかける

t 二つの分子の重心をあわせるように決めるR 2つの原子群の相関を 大化する行列rarr(1)特異値分解で導出

(2)四元数表現により 適な回転をLagrange未定乗数法で決定

sum=

minusminus=N

iiiN

RMSD1

2)](R[1 tyx

21

20

1

2

3

4

5

1xdaA

1

23

4

21

20

5

yi

)(R ty minusi

xi

1

23

4

21

20

5

原子の対応付けがわかっているとする

RMSD 適に重ね合わせたときのXYZ座標の差(Root Mean Square Deviation)

1benA

WKabsch Acta CrystA 32922-923(1976) 34827-828(1978)ADMclachlan JMolBiol 12874-77 (1979)Charles FF Karney ldquoQuaternions in molecular modelingrdquo E-print arXivphysics0506177

xi分子Xのi番目の原子の位置ベクトル yi分子Yのi番目の原子の位置ベクトル

距離の差のスコア (DRMS)

( )sumsum= ge

minusminus

=N

i

N

ij

Yij

Xij DD

NNDRMS

1

2

)1(2

21

20

1

2

3

4

5

YijD

XijD

1

23

4

21

20

5

yixi

DRMS 対応する原子ペアの距離の差(Distance-based RMSD)

原子の対応付けがわかっているとする

重ね合わせは不要なので計算は簡単

3次元によらない2次元や結合情報にも拡張できる

鏡像の区別はできない

1benA

計算が簡単なので高速な構造比較のアルゴリズムの基盤として使われる

1xdaA

H19 問73立体構造の似ている2つのタンパク質間で対応関係にある原子が分かっている場合にはRMSD(Root Mean Square Deviation)と呼ばれる数値を計算することにより立体構造の重なり合いの程度を数値化することができるRMSDは全ての対応する原子間の距離を

2乗した値の平均値(相加平均)にルートをとったものとして定義されるあるタンパク質における6つの原子ABCDEFと別のタンパク質の6つの原子

ArsquoBrsquoCrsquoDrsquoErsquoFrsquoについて対応関係が分かっており互いにもっともよく重なるように回転して重ねた時の対応原子間の距離は以下の表のようになったこの表からB-Brsquo C-Crsquo D-Drsquo E-Ersquoは正確に重なったが他の原子間ではずれが見られることがわかるここで6つの原子に対するRMSD値はいくらになるか選択肢の中からもっとも適切な値を一つ選べただ

し原子間距離の単位は考慮しないものとする

対応原子 距離

原子A―原子Arsquo 20

原子B―原子Brsquo 00

原子C―原子Crsquo 00

原子D―原子Crsquo 10

原子E―原子Crsquo 00

原子F―原子Crsquo 10

1 052 0663 104 133

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問73立体構造の似ている2つのタンパク質間で対応関係にある原子が分かっている場合にはRMSD(Root Mean Square Deviation)と呼ばれる数値を計算することにより立体構造の重なり合いの程度を数値化することができるRMSDは全ての対応する原子間の距離を

2乗した値の平均値(相加平均)にルートをとったものとして定義されるあるタンパク質における6つの原子ABCDEFと別のタンパク質の6つの原子

ArsquoBrsquoCrsquoDrsquoErsquoFrsquoについて対応関係が分かっており互いにもっともよく重なるように回転して重ねた時の対応原子間の距離は以下の表のようになったこの表からB-Brsquo C-Crsquo D-Drsquo E-Ersquoは正確に重なったが他の原子間ではずれが見られることがわかるここで6つの原子に対するRMSD値はいくらになるか選択肢の中からもっとも適切な値を一つ選べただ

し原子間距離の単位は考慮しないものとする

対応原子 距離

原子A―原子Arsquo 20

原子B―原子Brsquo 00

原子C―原子Crsquo 00

原子D―原子Crsquo 10

原子E―原子Crsquo 00

原子F―原子Crsquo 10

1 052 0663 104 133

RMSDは 適に重ね合わせたときの

「ずれの二乗の平均のルート」であるしたがってずれの二乗平均は

(22+0+0+1+0+1)6=66=1これのルートをとるとradic1=1

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

1

2

3

4

56

7

8

9

10

11

主鎖の水素結合αへリックス

1

2

34

56

78

9

10

11

O

N

CHN

N

H

H

CO Cα

i

i+3

i+4

HN O C

Cαi-1

i番目のCOがi+4番目のNHと水素結合を形成

36残基が1周期の右巻きらせん

NHO=Cが同じ向きに並ぶため

へリックス全体に電気双極子が発生

N末C末

ー +

主鎖の水素結合逆平行βシート

βターン

βターン

βヘアピン

βヘアピン

伸びた構造の1本1本をβストランドと呼ぶ二本以上のβストランドがシート状に並んだ構造をβシートと呼ぶ

βストランド

βストランド

βストランド

主鎖の水素結合平行βシート

βminusαminusβモチーフ

平行βシートがαへリックスで接続された構造モチーフ

βストランド

βストランド

βストランド

伸びた構造の1本1本をβストランドと呼ぶ二本以上のβストランドがシート状に並んだ構造をβシートと呼ぶ

Cαi

Cαi+1Cα

i-1φ ψ

ペプチド結合の平面性とφψの定義

主鎖の原子のXYZ座標はφψの2つ

の角度でほとんど記述できる

φψの角度を2次元にプロットしたものをラマチャンドランプロット(Ramachandran plot)という点が集中する領域は2次構造とよく対応

点が現れない領域は主鎖の原子が衝突する

βシート

αへリックス

左巻きへリックス

平面平面

φ

ψ

H19 問74タンパク質の主鎖に添って定義される二面角のうちφ(窒素原子と炭素原子の間の二面角)とψ(α炭素原子とカルボニル基の炭素原子の間の二面角)の値を各残

基ごとに計算して二次元にプロットしたものをラマチャンドランプロットと呼ぶ以下に示したラマチャンドランプロットに対する説明文の中でもっとも適切なものを一つ選べ

1 (a)(b)はともにαへリックスの領域である2 (a)(b)はともにβストランドの領域である3 (a)はαへリックス(b)はβストランドの領

域である4 (a)はβストランド(b)はαへリックスの領

域である

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問74タンパク質の主鎖に添って定義される二面角のうちφ(窒素原子と炭素原子の間の二面角)とψ(α炭素原子とカルボニル基の炭素原子の間の二面角)の値を各残

基ごとに計算して二次元にプロットしたものをラマチャンドランプロットと呼ぶ以下に示したラマチャンドランプロットに対する説明文の中でもっとも適切なものを一つ選べ

1 (a)(b)はともにαへリックスの領域である2 (a)(b)はともにβストランドの領域である3 (a)はαへリックス(b)はβストランドの領

域である4 (a)はβストランド(b)はαへリックスの領

域である

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

トポロジー図によるβシートの表現

4 23

N

C

1

1ubq (UbiquitinHumand151)

N

C123 4 5 6

1n8k (Alchol dehydrogenase E chain Horse c21)

ロスマンフォールド

βターン

βターン

1cauA1rhdA domain2

TOPSプログラムによる表示httpwwwtopsleedsacuk

1timA

はαへリックスはβストランドとなりあうの向きで平行逆平行を示す

コンタクトマップ

1ubq

C

4 23

N

1

縦横に残基を配置しある残基ペアのCα原子間の距離が10Å以下であれば対応するピクセルに色を塗る

分子描画ソフトVMDを用いて作成

平行のストランド間は方向逆平行ストランド間は方向に線分が観察される

N

C

N C

逆平行

逆平行

平行

αへリックスは太めの対角上の線分

へリックス

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから1か3コンタクトマップから平行シートしかないことがわかるため1であることがわかる

αβ5

αβ3

α

β4α

β1αβ2 β2

β1β3β4

β5

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから2か4コンタクトマップから平行シートしかないことがわかるため2であることがわかる

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

配列比較によるタンパク質分類1970年代から配列の一致度(sequence identity)に基づいてグループを作る作業が

行われてきた

どのくらいの類似性で一つにまとめるかは様々な考えがあるが少なくとも「相同なタンパク質群」を一つのグループにまとめるべき

ファミリー(family 族)

進化的に関係のある(相同な)タンパク質グループのこと

複数のファミリーがあつまった大きなグループ スーパーファミリー(superfamily clan)

一つのファミリーの中の小さなグループ サブファミリー(subfamily)

family

subfamily superfamily

ドメイン単位による分類

A2 B2

B3 C3

A1

配列1

配列2

配列3

配列の部分どうしだけが類似していた場合 部分一致を重視するとすべて一つのグループになるがhellip

配列1

配列2 配列3

Aを共有

Bを共有

1と2が類似2と3が類似していても1と3は類似していない

ドメインに分割すると

A1

A2

B2

B3

C3

A2 B2

B3 C3

A1

きれいに分類することができる

Pfam 蛋白質ファミリのデータベース各蛋白質ファミリのマルチプル

アライメント HMMなどを集めたデータベース

httppfamsangeracuk

Pkinase_Tyrドメインをもつタンパク質の例

ABL_HUMAN

BTK_HUMAN

ILK_HUMAN

MERTK_HUMAN

PGFRB_HUMAN

HCK_HUMAN

Family Pkinase_Tyr (PF07714) Protein tyrosine kinase

Pfamデータベース(httppfamsangeracukSoftwarePfam)からの引用

ドメイン構造と疎水性の関係Tyrosine protein kinase HCK (1ad5A HCK_HUMAN)

SH3 domain

SH2 domain

Tyrosine-kinase domain

3つの分断された疎水性コアrarr ドメイン構造

大きなタンパク質はいくつかの構造上のまとまり(ドメイン)を持つことが多い

立体構造によるタンパク質の分類

bull 配列による分類の延長ドメイン単位の分類進化的に関係のある(相同な)タンパク質を群にする(ファミリー)という考え方は同じ

bull 立体構造の類似性からより遠縁の相同性を見つけより大きな群を作る(スーパーファミリー)

bull スーパーファミリーをまとめたさらに大きなグループ(フォールドクラス)

bull 主にアミノ酸(Cαレベル)のラフな構造の類似性に

着目

bull 分類対象は主に球状タンパク質

立体構造分類データベースSCOPhttpscopmrc-lmbcamacukscop

4階層で分類Class(クラス)

Fold(フォールド)

Superfamily(スーパーファミリー)

Family(ファミリー)

どの階層に分類するかは配列の類似性立体構造の類似性分子機能の類似性機能部位の類似性

を専門家が総合的に判断して決める

1akr

ltホモロジーgt

ltアナロジーgt

他の構造分類データベースとしてCATHが有名

同様に階層的な分類体系を持つがその詳細はSCOPとは異なる

クラス

1mbd

1mqkH

1n55A 1pqwA

1fxd 1a2p

all-α (a)

all-β (b)

αβ (c)

α+β (d)

α-へリックスが中心

β-シートが中心

逆平行が多い

α-へリックスとβ-シートが配列上交互に現れる平行β-シートが中心

α-へリックスとβ-シートが混在配列上の並びの規則はない逆平行と平行のβ-シートが混在

アミノ酸配列と立体構造の関係ピロリ菌と大腸菌のフラボドキシン (同一残基率 SeqID 44)

ピロリ菌(1fueA) 大腸菌(1ag9A)

配列が似ていれば立体構造も似ている

SeqID = 44

RMSD = 12 Å

1fueA 2GKIGIFFGTDSGNAEAIAEKISKAIG--NAEVVDVAKASKEQFNGFTKVILVAPTAGAGD59

1ag9A 2AITGIFFGSDTGNTENIAKMIQKQLGKDVADVHDIAKSSKEDLEAYDILLLGIPTWYYGE61

1fueA 60LQTDWEDFLGTLEASD-FANKTIGLVGLGDQDTYSETFAEGIFHIYEKAK--AGKVVGQT116

1ag9A 62AQCDWDDFFPTLE-EIDFNGKLVALFGCGDQEDYAEYFCDALGTIRDIIEPRGATIVGHW120

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C 14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

BLAST

PSI-BLAST 構造比較

構造比較

アミノ酸配列がほとんど似ていなくても立体構造は似ている場合がある

構造は配列より進化的に保存がよい 構造比較から新たなホモログが発見できる可能性

立体

構造

の変

アミノ酸配列の変化と立体構造の変化の相関(グロビン族)

立体構造の変化はアミノ酸配列の変化と相関配列が30以上一致していればRMSDは2Å以下

アミノ酸配列の類似度

2つの構造の類似性

ホモロジー (homology 相同)進化的起源を共有することによる類似多くの場合分子機能なども類似している

アナロジー (analogy 相似)進化的起源とは無関係な類似多くの場合分子機能など他の属性は似ていない物理化学的な構造の偏好が原因とされる

イルカの胸びれ サルの前足

チョウの羽 トリの翼

ネコの前足

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C

ldquoFlavodoxin-likerdquo fold (c23)

ldquoFlavoproteinsrdquo superfamily (c235)

ldquoCheY-likerdquosuperfamily(c231)

14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

AnalogyHomology

HomologyHomolo

gy

多く現れるフォールド(出現ドメイン数順)

太字はスーパーフォールド多くのスーパーファミリーを含むフォールド

d58

c1

g3

c23 b34

b1

a4フォールド名 (SCOP173によるクラスfhijkは除く) ドメイ

ンの数

スーパーファミリーの数

a4 DNARNA-binding 3-helical bundle 292 14c1 TIM betaalpha-barrel 269 33d58 Ferredoxin-like 248 55b1 Immunoglobulin-like beta sandwich 246 27c37 P-loop nucleoside triphosphate hydrolase 235 1c2 NAD(P)-binding Rossmann-fold domains 168 1g3 Knottins 154 19d15 Beta-Grasp(ubiquitin-like) 131 13c23 Flavodoxin-like 118 15b34 SH3-like barrel 117 18b40 OB-fold 100 12c66 SAM-dependent methyltransferases 95 1

c37 c2

d15

b40 c66

スーパーフォールド(Superfold)

フォールド名 (SCOP173によるクラスfhijkは除く) その下のスーパーファミリーの数

d58 Ferredoxin-like 55c1 TIM betaalpha-barrel 33b1 Immunoglobulin-like beta sandwich 27a24 Four-helical up-and-down bundle 27a118 Alpha-alpha superhelix 23g3 Knottins 19b34 SH3-like barrel 18g41 Rubredoxin-like 16c23 Flavodoxin-like 15a60 SAM(sterile alpha motif) domain-like 15b69 7-bladed beta-propeller 14a4 DNARNA-binding 3-helical bundle 14

スーパーフォールド多くのスーパーファミリーを含むフォールド

スーパーフォールドは「構造の類似と機能の類似が対応しにくいフォールド」ともいえる

d58

c1

g3a118

c23

a24

a60

b34

b1

g41

b69 a4

三本へリックスバンドルDNARNA‐binding 3‐helical bundle(a4)

Mating type protein A2 yeast(1k61Aa411)

(1gvdAa413)(1wh5Aa411)

三本のへリックスが束になった構造DNAやRNAに結合する蛋白質が多い

DNAと

結合した構造(1k61)

TIMバレルTIM betaalpha barrel (c1)

Triosephosphate isomerase1n55A(c111)

全般に解糖系の酵素が多い基質酵素反応は極めて多彩

八本のβストランドとαへリックスが交互に組み合わさり対称的な樽(barrel)構造を形成す

る中央の樽構造は平行のβシートからなる

Imidazole glycerol phosphate synthasesubunit hisF1thfD(c121)

KHGKDPG aldolase1euaA(c1101)

フェレドキシン様Ferredoxin‐like (d58)

4Fe-4S Ferredoxin(1fxdd581)

1 234 4本の逆平行のβストランドと2本のαへリックスからな

分子機能は極めて多彩

CheY binding domain of CheA(1eayCd5824)

U1A RNA binding domain(1nu4Ad5871)

免疫グロブリン様Immunoglobulin‐like beta sandwich(b1)

Immunoglobulin Heavy chain variabledomain 1mjuH1(b111)

Immunoglobulin Heavy chain constantdomain 1mjuH2(b112)

Macromomycin1noaA (b171)

免疫グロブリン分子はH鎖とL鎖から

なりそれぞれ免疫グロブリン様ドメインからできている

V

C

V

C

C

C

V

CV

CC

C

L鎖

H鎖H鎖 L鎖

細胞表面あるいは分泌蛋白質が多い免疫や分子認識に関する機能を担うことが多い

4本のβストランドからなるβシートが二枚サンドイッチ状に重なった構造をとる逆平行のβシートが主

P‐loop スーパーファミリーP‐loop nucleoside triphosphate hydrolase(c37)

Ras-related protein RAB-5A1r2qA(c3718)

Guanylate kinase1gkyA(c3711)

RecA proteinDomain1 1xmsA1(c37111)

平行のβシートが主トポロジーには様々な変異あり

シグナル伝達DNA結合

モーター機能など多彩な分子機能を担うがATP GTPなどのヌクレオシド

の加水分解を行う点は共通

N C

132 4 5 6

ヌクレオシド結合部GxxxxGKTの

配列モチーフ(P-loop)を持つ

ロスマン フォールドNAD(P)‐binding Rossmann‐fold domains (c2)

Alcohol dehydrogenase gamma chaindomain2 1u3wA(c211)

Aspartate beta-semialdehydedehydrogenase2gz1A1(c213)

L-alanine dehydrogenase1pjcA1(c214)

補酵素を利用したNAD(P)を脱水素酵素を持つ基質を認識するドメインは別に存在する

NC

123 4 5 6

平行のβシートが主

7枚羽 βプロペラ7‐bladed beta‐propeller (b69)

Garactose oxydasedomain3 1k3iA3(b6911)

Guanine nucleotide-bindingprotein subunit beta-11gotB(b6941)

細胞膜付近のシグナル伝達や糖結合に関わることが多い

Influenza Neuraminidase 1f8dA(b6811)

6枚羽 βプロペラ

N C

321 4

のユニットが7回円環状に繰り返しされたフォールド

立体構造比較プログラム1990年ごろから多くの構造比較プログラムが開発されている

WEBアドレス スコア アライメント

DALI httpwwwebiacukdali

距離の差を独自の関数で変換したスコア

局所アライメントをモンテカルロ法でつなぎ合わせる

CE httpclsdsceducehtml

局所的なRMSD 局所アライメントを積み上げていく

MATRAS httpbiunitnaistjpmatras

距離の変化が相同相似で起こる確率の比をスコアとする

SSEで仮アライメント

を生成残基アライメントを収束するまで反復する

タンパク質の相同性の判断基準

100

同一残基率30以上

BLASTのE-value lt 00001

PSI-BLASTのE-value lt 00001

0102030407025 15 535

同一残基率(Sequence Identity)()

立体構造比較が必要

(1)立体構造の類似性が高い(DALIのZスコアMATRASのRdisスコア)(2)同一残基率がそこそこ高い(PSI-BLASTでヒットするSeqIDgt=15ぐらい)

(3)分子機能に類似性がある(補酵素酵素反応基質代謝経路等の共通性等)(4)基質補酵素の結合部位が類似しておりそのアミノ酸が保存(モチーフ)(5)ドメイン構成の共通性(6)スーパーフォールドの場合は特別な注意が必要

配列解析

同一残基率が25以下の場合の相同性の判断基準

50608090

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 11: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

H19 問71

1 一般に表面ではアミノ酸の挿入欠失や置換が起こりやすく内部では起こりにくい

2 生物種間で比較した時に保存されているアミノ酸がタンパク質表面で集中している領域は他のタンパク質やリガンドとの結合に関与していると予測できる

3 DNAと相互作用するタンパク質の場合DNAとの結合面は負

電荷を持つアミノ酸が集中することから容易に予測できる4 一般に表面には溶媒との相互作用のため極性基をもつアミノ

酸が多く内部は疎水性アミノ酸による疎水コアを形成していることが多い

次に示した球状タンパク質の性質に関する記述の中で不適切なものを一つ選べ

DNAやRNAなどの核酸はリン酸基にマイナスの電荷を持っているよって核酸に

結合する蛋白質は表面にプラスの電荷を持っているものが多い平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

「タンパク質構造解析」のキーワード(構造比較)

bull 立体構造表現(コンタクトマップラマチャンドランマップ)

bull 構造比較

bull 重ね合わせbull RMSDbull 構造アライメント

bull 構造モチーフ

bull 構造分類

立体構造の決定法X線結晶解析

NMR(核磁気共鳴法)

大量発現精製結晶化

X線回折強度の測定

原子モデルの構築

原子モデルの精密化

核磁気共鳴解析(NOE解析帰属と距離拘束の抽出)

3次元電子密度マップ

原子間距離拘束

(1)多数分子の平均構造の観察(精製が重要 大きな分子複合体はより難しくなる)(2)発現精製結晶化のステップで各タンパク質によって実験条件の調整が必須(3)実験データの収集原子モデル構築の段階で計算機の支援が不可欠

大量発現精製

原子モデルの構築

原子モデルの精密化

MET 1

GLN 2

1

2

34

56

7 8

9

10

11

12

13

14

15

1617

18 19 20

21

HEADER UBIQUITIN 17-APR-92 1AAR COMPND DI-UBIQUITINSOURCE BOVINE (BOS TAURUS) ERYTHROCYTESAUTHOR WJCOOKLCJEFFREYMCARSONZCHENCMPICKART

原子番号 残基名 鎖識別子原子名 残基番号 X座標 Y座標 Z座標 占有率 温度因子

ATOM 1 N MET A 1 15493 30088 14694 100 836ATOM 2 CA MET A 1 14600 29031 15110 100 815ATOM 3 C MET A 1 15476 27793 15419 100 930ATOM 4 O MET A 1 16571 27561 14871 100 896ATOM 5 CB MET A 1 13500 28837 14105 100 989ATOM 6 CG MET A 1 13823 27997 12931 100 1021ATOM 7 SD MET A 1 12312 27711 11891 100 1033ATOM 8 CE MET A 1 13174 26595 10726 100 730ATOM 9 N GLN A 2 14968 27014 16326 100 975ATOM 10 CA GLN A 2 15552 25806 16852 100 1192ATOM 11 C GLN A 2 15000 24553 16168 100 1171ATOM 12 O GLN A 2 13787 24387 16086 100 1000 ATOM 13 CB GLN A 2 15368 25715 18386 100 1239ATOM 14 CG GLN A 2 15858 24413 19051 100 1400ATOM 15 CD GLN A 2 15676 24587 20561 100 1559ATOM 16 OE1 GLN A 2 16525 25209 21205 100 1867ATOM 17 NE2 GLN A 2 14564 24203 21152 100 1539ATOM 18 N ILE A 3 15960 23745 15687 100 1179 ATOM 19 CA ILE A 3 15593 22437 15130 100 1214ATOM 20 C ILE A 3 16491 21342 15720 100 1199ATOM 21 O ILE A 3 17701 21540 15767 100 1291

PDB ID

wwPDB(World Wide Protein Data Bank) 立体構造データの収集するデータバンク

RCSB PDB httpwwwrcsborgpdbPDBフォーマット MSD EBI httpwwwebiacukmsd

PDBj httpwwwpdbjorg

PDBは1971年に設立

立体構造描画のフリーウエアシェアウエアソフト名 WebSite 対応機種 特徴

RasMol wwwopenrasmolorg Win Mac Linux(ソース公開)

独自の高速描画アルゴリズムを用い非力なハードでも同様に高速描画が可能コマンド言語は強力で多機能基本的な描画法をカバーするが分子表面の描画はできない描画の質はやや低い

Chime wwwmdlchimecom Win Mac RasMolをベースにしたWEBブラウザ内で動作するプラグイン分子表面表示など描画機能はRasMolより拡張分子描画機能を持ったWEBページを作れる

Jmol jmolsourceforgenet Win Mac Linux(ソース公開)

Java Applet によりWEBブラウザ内で動作Chimeと同様に分子描画機能を持ったWEBページを作れるJREをインストールする必要

PyMOL pymolsourceforgenet

Win Mac Linux

OpenGLを用いた質の高い描画Python言語で開発されておりソースも公開Python言語を用いた機能

拡張も可能

CHIMERA wwwcglucsfeduchimera

Win Mac Linux

OpenGLを用いた質の高い描画電顕画像などの多

様なデータの取り込みドッキング静電計算などのインタフェース有りPython言語を用いた機能拡張

VMD wwwksuiuceduResearchvmd

Win Mac Linux

OpenGLを用いた質の高い描画Tcl言語を用いた機

能拡張が可能分子動力学の可視化を主要目的として幅広い機能

MolScript wwwavatarsemolscrit

Linux(ソース公開)

主にリボン図の描画用のソフトGUIを持たずコマンドラインでPDBファイルをPSファイル等に変換

Swiss PDB Viewer

auexpasyorgspdbv Win Mac Linux

OpenGLを用いた質の高い描画幅広い機能をサ

ポートしているがアップデートは活発でない

H19 問51

タンパク質などの生体高分子をコンピュータで表示するためのソフトウェア名として適切でないものを選択肢の中から一つ選べ

1RasMol2Chime3TMHMM4Swiss-PdbViewer

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問51

タンパク質などの生体高分子をコンピュータで表示するためのソフトウェア名として適切でないものを選択肢の中から一つ選べ

1RasMol2Chime3TMHMM4Swiss-PdbViewer

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問59

タンパク質の立体構造のグラフィックス表示プログラムではないものを選択肢の中から一つ選べ

1Chime2PyMol3MEGA4MolScript

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問59

タンパク質の立体構造のグラフィックス表示プログラムではないものを選択肢の中から一つ選べ

1Chime2PyMol3MEGA4MolScript

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

PDBコード1fxd(ferredoxin II) Rasmol Chimeプラグインで描画

立体構造の描画スタイル

ワイアフレーム ボールスティック 空間充填

バックボーン リボン 分子表面

1 234

N

H C

O

Ala(A)(疎水性)

Phe(F)(疎水性)

Cys(C)(親水性)

Asp(D)(親水性)

Val(V)(疎水性)

Thr(親水性)

様々な物理化学的な性質を持った側鎖が主鎖のペプチド結合で連なる

Leu(L)(疎水性)

蛋白質ペプチド結合したアミノ酸群

アミノ酸は全部で20種類

I VL

M FYW H

KR

D E

P NSA Q

CG T

疎水性 親水性

脂肪族

芳香族正荷電

負荷電

N末

C末

変性状態(D) 天然状態(N)

フォールディング(折り畳み)という現象

非常に多種の構造の集合大きく広がっている

ほとんど唯一の構造小さくコンパクトに折りたたまっている

温度や変性剤濃度によって可逆に変化

折り畳みは原則としてその蛋白質以外の分子の介助を必要としない

アミノ酸配列の情報だけで天然状態の立体構造が決定される

どうやってコンパクトになるか rarr (1)主鎖の水素結合(2)側鎖間の疎水性相互作用

あるアミノ酸配列がどうやって一つの構造を決めるのか

3次元座標の差のスコア(RMSD)

並進ベクトルt を引いたあと回転行列R をかける

t 二つの分子の重心をあわせるように決めるR 2つの原子群の相関を 大化する行列rarr(1)特異値分解で導出

(2)四元数表現により 適な回転をLagrange未定乗数法で決定

sum=

minusminus=N

iiiN

RMSD1

2)](R[1 tyx

21

20

1

2

3

4

5

1xdaA

1

23

4

21

20

5

yi

)(R ty minusi

xi

1

23

4

21

20

5

原子の対応付けがわかっているとする

RMSD 適に重ね合わせたときのXYZ座標の差(Root Mean Square Deviation)

1benA

WKabsch Acta CrystA 32922-923(1976) 34827-828(1978)ADMclachlan JMolBiol 12874-77 (1979)Charles FF Karney ldquoQuaternions in molecular modelingrdquo E-print arXivphysics0506177

xi分子Xのi番目の原子の位置ベクトル yi分子Yのi番目の原子の位置ベクトル

距離の差のスコア (DRMS)

( )sumsum= ge

minusminus

=N

i

N

ij

Yij

Xij DD

NNDRMS

1

2

)1(2

21

20

1

2

3

4

5

YijD

XijD

1

23

4

21

20

5

yixi

DRMS 対応する原子ペアの距離の差(Distance-based RMSD)

原子の対応付けがわかっているとする

重ね合わせは不要なので計算は簡単

3次元によらない2次元や結合情報にも拡張できる

鏡像の区別はできない

1benA

計算が簡単なので高速な構造比較のアルゴリズムの基盤として使われる

1xdaA

H19 問73立体構造の似ている2つのタンパク質間で対応関係にある原子が分かっている場合にはRMSD(Root Mean Square Deviation)と呼ばれる数値を計算することにより立体構造の重なり合いの程度を数値化することができるRMSDは全ての対応する原子間の距離を

2乗した値の平均値(相加平均)にルートをとったものとして定義されるあるタンパク質における6つの原子ABCDEFと別のタンパク質の6つの原子

ArsquoBrsquoCrsquoDrsquoErsquoFrsquoについて対応関係が分かっており互いにもっともよく重なるように回転して重ねた時の対応原子間の距離は以下の表のようになったこの表からB-Brsquo C-Crsquo D-Drsquo E-Ersquoは正確に重なったが他の原子間ではずれが見られることがわかるここで6つの原子に対するRMSD値はいくらになるか選択肢の中からもっとも適切な値を一つ選べただ

し原子間距離の単位は考慮しないものとする

対応原子 距離

原子A―原子Arsquo 20

原子B―原子Brsquo 00

原子C―原子Crsquo 00

原子D―原子Crsquo 10

原子E―原子Crsquo 00

原子F―原子Crsquo 10

1 052 0663 104 133

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問73立体構造の似ている2つのタンパク質間で対応関係にある原子が分かっている場合にはRMSD(Root Mean Square Deviation)と呼ばれる数値を計算することにより立体構造の重なり合いの程度を数値化することができるRMSDは全ての対応する原子間の距離を

2乗した値の平均値(相加平均)にルートをとったものとして定義されるあるタンパク質における6つの原子ABCDEFと別のタンパク質の6つの原子

ArsquoBrsquoCrsquoDrsquoErsquoFrsquoについて対応関係が分かっており互いにもっともよく重なるように回転して重ねた時の対応原子間の距離は以下の表のようになったこの表からB-Brsquo C-Crsquo D-Drsquo E-Ersquoは正確に重なったが他の原子間ではずれが見られることがわかるここで6つの原子に対するRMSD値はいくらになるか選択肢の中からもっとも適切な値を一つ選べただ

し原子間距離の単位は考慮しないものとする

対応原子 距離

原子A―原子Arsquo 20

原子B―原子Brsquo 00

原子C―原子Crsquo 00

原子D―原子Crsquo 10

原子E―原子Crsquo 00

原子F―原子Crsquo 10

1 052 0663 104 133

RMSDは 適に重ね合わせたときの

「ずれの二乗の平均のルート」であるしたがってずれの二乗平均は

(22+0+0+1+0+1)6=66=1これのルートをとるとradic1=1

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

1

2

3

4

56

7

8

9

10

11

主鎖の水素結合αへリックス

1

2

34

56

78

9

10

11

O

N

CHN

N

H

H

CO Cα

i

i+3

i+4

HN O C

Cαi-1

i番目のCOがi+4番目のNHと水素結合を形成

36残基が1周期の右巻きらせん

NHO=Cが同じ向きに並ぶため

へリックス全体に電気双極子が発生

N末C末

ー +

主鎖の水素結合逆平行βシート

βターン

βターン

βヘアピン

βヘアピン

伸びた構造の1本1本をβストランドと呼ぶ二本以上のβストランドがシート状に並んだ構造をβシートと呼ぶ

βストランド

βストランド

βストランド

主鎖の水素結合平行βシート

βminusαminusβモチーフ

平行βシートがαへリックスで接続された構造モチーフ

βストランド

βストランド

βストランド

伸びた構造の1本1本をβストランドと呼ぶ二本以上のβストランドがシート状に並んだ構造をβシートと呼ぶ

Cαi

Cαi+1Cα

i-1φ ψ

ペプチド結合の平面性とφψの定義

主鎖の原子のXYZ座標はφψの2つ

の角度でほとんど記述できる

φψの角度を2次元にプロットしたものをラマチャンドランプロット(Ramachandran plot)という点が集中する領域は2次構造とよく対応

点が現れない領域は主鎖の原子が衝突する

βシート

αへリックス

左巻きへリックス

平面平面

φ

ψ

H19 問74タンパク質の主鎖に添って定義される二面角のうちφ(窒素原子と炭素原子の間の二面角)とψ(α炭素原子とカルボニル基の炭素原子の間の二面角)の値を各残

基ごとに計算して二次元にプロットしたものをラマチャンドランプロットと呼ぶ以下に示したラマチャンドランプロットに対する説明文の中でもっとも適切なものを一つ選べ

1 (a)(b)はともにαへリックスの領域である2 (a)(b)はともにβストランドの領域である3 (a)はαへリックス(b)はβストランドの領

域である4 (a)はβストランド(b)はαへリックスの領

域である

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問74タンパク質の主鎖に添って定義される二面角のうちφ(窒素原子と炭素原子の間の二面角)とψ(α炭素原子とカルボニル基の炭素原子の間の二面角)の値を各残

基ごとに計算して二次元にプロットしたものをラマチャンドランプロットと呼ぶ以下に示したラマチャンドランプロットに対する説明文の中でもっとも適切なものを一つ選べ

1 (a)(b)はともにαへリックスの領域である2 (a)(b)はともにβストランドの領域である3 (a)はαへリックス(b)はβストランドの領

域である4 (a)はβストランド(b)はαへリックスの領

域である

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

トポロジー図によるβシートの表現

4 23

N

C

1

1ubq (UbiquitinHumand151)

N

C123 4 5 6

1n8k (Alchol dehydrogenase E chain Horse c21)

ロスマンフォールド

βターン

βターン

1cauA1rhdA domain2

TOPSプログラムによる表示httpwwwtopsleedsacuk

1timA

はαへリックスはβストランドとなりあうの向きで平行逆平行を示す

コンタクトマップ

1ubq

C

4 23

N

1

縦横に残基を配置しある残基ペアのCα原子間の距離が10Å以下であれば対応するピクセルに色を塗る

分子描画ソフトVMDを用いて作成

平行のストランド間は方向逆平行ストランド間は方向に線分が観察される

N

C

N C

逆平行

逆平行

平行

αへリックスは太めの対角上の線分

へリックス

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから1か3コンタクトマップから平行シートしかないことがわかるため1であることがわかる

αβ5

αβ3

α

β4α

β1αβ2 β2

β1β3β4

β5

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから2か4コンタクトマップから平行シートしかないことがわかるため2であることがわかる

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

配列比較によるタンパク質分類1970年代から配列の一致度(sequence identity)に基づいてグループを作る作業が

行われてきた

どのくらいの類似性で一つにまとめるかは様々な考えがあるが少なくとも「相同なタンパク質群」を一つのグループにまとめるべき

ファミリー(family 族)

進化的に関係のある(相同な)タンパク質グループのこと

複数のファミリーがあつまった大きなグループ スーパーファミリー(superfamily clan)

一つのファミリーの中の小さなグループ サブファミリー(subfamily)

family

subfamily superfamily

ドメイン単位による分類

A2 B2

B3 C3

A1

配列1

配列2

配列3

配列の部分どうしだけが類似していた場合 部分一致を重視するとすべて一つのグループになるがhellip

配列1

配列2 配列3

Aを共有

Bを共有

1と2が類似2と3が類似していても1と3は類似していない

ドメインに分割すると

A1

A2

B2

B3

C3

A2 B2

B3 C3

A1

きれいに分類することができる

Pfam 蛋白質ファミリのデータベース各蛋白質ファミリのマルチプル

アライメント HMMなどを集めたデータベース

httppfamsangeracuk

Pkinase_Tyrドメインをもつタンパク質の例

ABL_HUMAN

BTK_HUMAN

ILK_HUMAN

MERTK_HUMAN

PGFRB_HUMAN

HCK_HUMAN

Family Pkinase_Tyr (PF07714) Protein tyrosine kinase

Pfamデータベース(httppfamsangeracukSoftwarePfam)からの引用

ドメイン構造と疎水性の関係Tyrosine protein kinase HCK (1ad5A HCK_HUMAN)

SH3 domain

SH2 domain

Tyrosine-kinase domain

3つの分断された疎水性コアrarr ドメイン構造

大きなタンパク質はいくつかの構造上のまとまり(ドメイン)を持つことが多い

立体構造によるタンパク質の分類

bull 配列による分類の延長ドメイン単位の分類進化的に関係のある(相同な)タンパク質を群にする(ファミリー)という考え方は同じ

bull 立体構造の類似性からより遠縁の相同性を見つけより大きな群を作る(スーパーファミリー)

bull スーパーファミリーをまとめたさらに大きなグループ(フォールドクラス)

bull 主にアミノ酸(Cαレベル)のラフな構造の類似性に

着目

bull 分類対象は主に球状タンパク質

立体構造分類データベースSCOPhttpscopmrc-lmbcamacukscop

4階層で分類Class(クラス)

Fold(フォールド)

Superfamily(スーパーファミリー)

Family(ファミリー)

どの階層に分類するかは配列の類似性立体構造の類似性分子機能の類似性機能部位の類似性

を専門家が総合的に判断して決める

1akr

ltホモロジーgt

ltアナロジーgt

他の構造分類データベースとしてCATHが有名

同様に階層的な分類体系を持つがその詳細はSCOPとは異なる

クラス

1mbd

1mqkH

1n55A 1pqwA

1fxd 1a2p

all-α (a)

all-β (b)

αβ (c)

α+β (d)

α-へリックスが中心

β-シートが中心

逆平行が多い

α-へリックスとβ-シートが配列上交互に現れる平行β-シートが中心

α-へリックスとβ-シートが混在配列上の並びの規則はない逆平行と平行のβ-シートが混在

アミノ酸配列と立体構造の関係ピロリ菌と大腸菌のフラボドキシン (同一残基率 SeqID 44)

ピロリ菌(1fueA) 大腸菌(1ag9A)

配列が似ていれば立体構造も似ている

SeqID = 44

RMSD = 12 Å

1fueA 2GKIGIFFGTDSGNAEAIAEKISKAIG--NAEVVDVAKASKEQFNGFTKVILVAPTAGAGD59

1ag9A 2AITGIFFGSDTGNTENIAKMIQKQLGKDVADVHDIAKSSKEDLEAYDILLLGIPTWYYGE61

1fueA 60LQTDWEDFLGTLEASD-FANKTIGLVGLGDQDTYSETFAEGIFHIYEKAK--AGKVVGQT116

1ag9A 62AQCDWDDFFPTLE-EIDFNGKLVALFGCGDQEDYAEYFCDALGTIRDIIEPRGATIVGHW120

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C 14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

BLAST

PSI-BLAST 構造比較

構造比較

アミノ酸配列がほとんど似ていなくても立体構造は似ている場合がある

構造は配列より進化的に保存がよい 構造比較から新たなホモログが発見できる可能性

立体

構造

の変

アミノ酸配列の変化と立体構造の変化の相関(グロビン族)

立体構造の変化はアミノ酸配列の変化と相関配列が30以上一致していればRMSDは2Å以下

アミノ酸配列の類似度

2つの構造の類似性

ホモロジー (homology 相同)進化的起源を共有することによる類似多くの場合分子機能なども類似している

アナロジー (analogy 相似)進化的起源とは無関係な類似多くの場合分子機能など他の属性は似ていない物理化学的な構造の偏好が原因とされる

イルカの胸びれ サルの前足

チョウの羽 トリの翼

ネコの前足

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C

ldquoFlavodoxin-likerdquo fold (c23)

ldquoFlavoproteinsrdquo superfamily (c235)

ldquoCheY-likerdquosuperfamily(c231)

14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

AnalogyHomology

HomologyHomolo

gy

多く現れるフォールド(出現ドメイン数順)

太字はスーパーフォールド多くのスーパーファミリーを含むフォールド

d58

c1

g3

c23 b34

b1

a4フォールド名 (SCOP173によるクラスfhijkは除く) ドメイ

ンの数

スーパーファミリーの数

a4 DNARNA-binding 3-helical bundle 292 14c1 TIM betaalpha-barrel 269 33d58 Ferredoxin-like 248 55b1 Immunoglobulin-like beta sandwich 246 27c37 P-loop nucleoside triphosphate hydrolase 235 1c2 NAD(P)-binding Rossmann-fold domains 168 1g3 Knottins 154 19d15 Beta-Grasp(ubiquitin-like) 131 13c23 Flavodoxin-like 118 15b34 SH3-like barrel 117 18b40 OB-fold 100 12c66 SAM-dependent methyltransferases 95 1

c37 c2

d15

b40 c66

スーパーフォールド(Superfold)

フォールド名 (SCOP173によるクラスfhijkは除く) その下のスーパーファミリーの数

d58 Ferredoxin-like 55c1 TIM betaalpha-barrel 33b1 Immunoglobulin-like beta sandwich 27a24 Four-helical up-and-down bundle 27a118 Alpha-alpha superhelix 23g3 Knottins 19b34 SH3-like barrel 18g41 Rubredoxin-like 16c23 Flavodoxin-like 15a60 SAM(sterile alpha motif) domain-like 15b69 7-bladed beta-propeller 14a4 DNARNA-binding 3-helical bundle 14

スーパーフォールド多くのスーパーファミリーを含むフォールド

スーパーフォールドは「構造の類似と機能の類似が対応しにくいフォールド」ともいえる

d58

c1

g3a118

c23

a24

a60

b34

b1

g41

b69 a4

三本へリックスバンドルDNARNA‐binding 3‐helical bundle(a4)

Mating type protein A2 yeast(1k61Aa411)

(1gvdAa413)(1wh5Aa411)

三本のへリックスが束になった構造DNAやRNAに結合する蛋白質が多い

DNAと

結合した構造(1k61)

TIMバレルTIM betaalpha barrel (c1)

Triosephosphate isomerase1n55A(c111)

全般に解糖系の酵素が多い基質酵素反応は極めて多彩

八本のβストランドとαへリックスが交互に組み合わさり対称的な樽(barrel)構造を形成す

る中央の樽構造は平行のβシートからなる

Imidazole glycerol phosphate synthasesubunit hisF1thfD(c121)

KHGKDPG aldolase1euaA(c1101)

フェレドキシン様Ferredoxin‐like (d58)

4Fe-4S Ferredoxin(1fxdd581)

1 234 4本の逆平行のβストランドと2本のαへリックスからな

分子機能は極めて多彩

CheY binding domain of CheA(1eayCd5824)

U1A RNA binding domain(1nu4Ad5871)

免疫グロブリン様Immunoglobulin‐like beta sandwich(b1)

Immunoglobulin Heavy chain variabledomain 1mjuH1(b111)

Immunoglobulin Heavy chain constantdomain 1mjuH2(b112)

Macromomycin1noaA (b171)

免疫グロブリン分子はH鎖とL鎖から

なりそれぞれ免疫グロブリン様ドメインからできている

V

C

V

C

C

C

V

CV

CC

C

L鎖

H鎖H鎖 L鎖

細胞表面あるいは分泌蛋白質が多い免疫や分子認識に関する機能を担うことが多い

4本のβストランドからなるβシートが二枚サンドイッチ状に重なった構造をとる逆平行のβシートが主

P‐loop スーパーファミリーP‐loop nucleoside triphosphate hydrolase(c37)

Ras-related protein RAB-5A1r2qA(c3718)

Guanylate kinase1gkyA(c3711)

RecA proteinDomain1 1xmsA1(c37111)

平行のβシートが主トポロジーには様々な変異あり

シグナル伝達DNA結合

モーター機能など多彩な分子機能を担うがATP GTPなどのヌクレオシド

の加水分解を行う点は共通

N C

132 4 5 6

ヌクレオシド結合部GxxxxGKTの

配列モチーフ(P-loop)を持つ

ロスマン フォールドNAD(P)‐binding Rossmann‐fold domains (c2)

Alcohol dehydrogenase gamma chaindomain2 1u3wA(c211)

Aspartate beta-semialdehydedehydrogenase2gz1A1(c213)

L-alanine dehydrogenase1pjcA1(c214)

補酵素を利用したNAD(P)を脱水素酵素を持つ基質を認識するドメインは別に存在する

NC

123 4 5 6

平行のβシートが主

7枚羽 βプロペラ7‐bladed beta‐propeller (b69)

Garactose oxydasedomain3 1k3iA3(b6911)

Guanine nucleotide-bindingprotein subunit beta-11gotB(b6941)

細胞膜付近のシグナル伝達や糖結合に関わることが多い

Influenza Neuraminidase 1f8dA(b6811)

6枚羽 βプロペラ

N C

321 4

のユニットが7回円環状に繰り返しされたフォールド

立体構造比較プログラム1990年ごろから多くの構造比較プログラムが開発されている

WEBアドレス スコア アライメント

DALI httpwwwebiacukdali

距離の差を独自の関数で変換したスコア

局所アライメントをモンテカルロ法でつなぎ合わせる

CE httpclsdsceducehtml

局所的なRMSD 局所アライメントを積み上げていく

MATRAS httpbiunitnaistjpmatras

距離の変化が相同相似で起こる確率の比をスコアとする

SSEで仮アライメント

を生成残基アライメントを収束するまで反復する

タンパク質の相同性の判断基準

100

同一残基率30以上

BLASTのE-value lt 00001

PSI-BLASTのE-value lt 00001

0102030407025 15 535

同一残基率(Sequence Identity)()

立体構造比較が必要

(1)立体構造の類似性が高い(DALIのZスコアMATRASのRdisスコア)(2)同一残基率がそこそこ高い(PSI-BLASTでヒットするSeqIDgt=15ぐらい)

(3)分子機能に類似性がある(補酵素酵素反応基質代謝経路等の共通性等)(4)基質補酵素の結合部位が類似しておりそのアミノ酸が保存(モチーフ)(5)ドメイン構成の共通性(6)スーパーフォールドの場合は特別な注意が必要

配列解析

同一残基率が25以下の場合の相同性の判断基準

50608090

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 12: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

「タンパク質構造解析」のキーワード(構造比較)

bull 立体構造表現(コンタクトマップラマチャンドランマップ)

bull 構造比較

bull 重ね合わせbull RMSDbull 構造アライメント

bull 構造モチーフ

bull 構造分類

立体構造の決定法X線結晶解析

NMR(核磁気共鳴法)

大量発現精製結晶化

X線回折強度の測定

原子モデルの構築

原子モデルの精密化

核磁気共鳴解析(NOE解析帰属と距離拘束の抽出)

3次元電子密度マップ

原子間距離拘束

(1)多数分子の平均構造の観察(精製が重要 大きな分子複合体はより難しくなる)(2)発現精製結晶化のステップで各タンパク質によって実験条件の調整が必須(3)実験データの収集原子モデル構築の段階で計算機の支援が不可欠

大量発現精製

原子モデルの構築

原子モデルの精密化

MET 1

GLN 2

1

2

34

56

7 8

9

10

11

12

13

14

15

1617

18 19 20

21

HEADER UBIQUITIN 17-APR-92 1AAR COMPND DI-UBIQUITINSOURCE BOVINE (BOS TAURUS) ERYTHROCYTESAUTHOR WJCOOKLCJEFFREYMCARSONZCHENCMPICKART

原子番号 残基名 鎖識別子原子名 残基番号 X座標 Y座標 Z座標 占有率 温度因子

ATOM 1 N MET A 1 15493 30088 14694 100 836ATOM 2 CA MET A 1 14600 29031 15110 100 815ATOM 3 C MET A 1 15476 27793 15419 100 930ATOM 4 O MET A 1 16571 27561 14871 100 896ATOM 5 CB MET A 1 13500 28837 14105 100 989ATOM 6 CG MET A 1 13823 27997 12931 100 1021ATOM 7 SD MET A 1 12312 27711 11891 100 1033ATOM 8 CE MET A 1 13174 26595 10726 100 730ATOM 9 N GLN A 2 14968 27014 16326 100 975ATOM 10 CA GLN A 2 15552 25806 16852 100 1192ATOM 11 C GLN A 2 15000 24553 16168 100 1171ATOM 12 O GLN A 2 13787 24387 16086 100 1000 ATOM 13 CB GLN A 2 15368 25715 18386 100 1239ATOM 14 CG GLN A 2 15858 24413 19051 100 1400ATOM 15 CD GLN A 2 15676 24587 20561 100 1559ATOM 16 OE1 GLN A 2 16525 25209 21205 100 1867ATOM 17 NE2 GLN A 2 14564 24203 21152 100 1539ATOM 18 N ILE A 3 15960 23745 15687 100 1179 ATOM 19 CA ILE A 3 15593 22437 15130 100 1214ATOM 20 C ILE A 3 16491 21342 15720 100 1199ATOM 21 O ILE A 3 17701 21540 15767 100 1291

PDB ID

wwPDB(World Wide Protein Data Bank) 立体構造データの収集するデータバンク

RCSB PDB httpwwwrcsborgpdbPDBフォーマット MSD EBI httpwwwebiacukmsd

PDBj httpwwwpdbjorg

PDBは1971年に設立

立体構造描画のフリーウエアシェアウエアソフト名 WebSite 対応機種 特徴

RasMol wwwopenrasmolorg Win Mac Linux(ソース公開)

独自の高速描画アルゴリズムを用い非力なハードでも同様に高速描画が可能コマンド言語は強力で多機能基本的な描画法をカバーするが分子表面の描画はできない描画の質はやや低い

Chime wwwmdlchimecom Win Mac RasMolをベースにしたWEBブラウザ内で動作するプラグイン分子表面表示など描画機能はRasMolより拡張分子描画機能を持ったWEBページを作れる

Jmol jmolsourceforgenet Win Mac Linux(ソース公開)

Java Applet によりWEBブラウザ内で動作Chimeと同様に分子描画機能を持ったWEBページを作れるJREをインストールする必要

PyMOL pymolsourceforgenet

Win Mac Linux

OpenGLを用いた質の高い描画Python言語で開発されておりソースも公開Python言語を用いた機能

拡張も可能

CHIMERA wwwcglucsfeduchimera

Win Mac Linux

OpenGLを用いた質の高い描画電顕画像などの多

様なデータの取り込みドッキング静電計算などのインタフェース有りPython言語を用いた機能拡張

VMD wwwksuiuceduResearchvmd

Win Mac Linux

OpenGLを用いた質の高い描画Tcl言語を用いた機

能拡張が可能分子動力学の可視化を主要目的として幅広い機能

MolScript wwwavatarsemolscrit

Linux(ソース公開)

主にリボン図の描画用のソフトGUIを持たずコマンドラインでPDBファイルをPSファイル等に変換

Swiss PDB Viewer

auexpasyorgspdbv Win Mac Linux

OpenGLを用いた質の高い描画幅広い機能をサ

ポートしているがアップデートは活発でない

H19 問51

タンパク質などの生体高分子をコンピュータで表示するためのソフトウェア名として適切でないものを選択肢の中から一つ選べ

1RasMol2Chime3TMHMM4Swiss-PdbViewer

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問51

タンパク質などの生体高分子をコンピュータで表示するためのソフトウェア名として適切でないものを選択肢の中から一つ選べ

1RasMol2Chime3TMHMM4Swiss-PdbViewer

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問59

タンパク質の立体構造のグラフィックス表示プログラムではないものを選択肢の中から一つ選べ

1Chime2PyMol3MEGA4MolScript

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問59

タンパク質の立体構造のグラフィックス表示プログラムではないものを選択肢の中から一つ選べ

1Chime2PyMol3MEGA4MolScript

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

PDBコード1fxd(ferredoxin II) Rasmol Chimeプラグインで描画

立体構造の描画スタイル

ワイアフレーム ボールスティック 空間充填

バックボーン リボン 分子表面

1 234

N

H C

O

Ala(A)(疎水性)

Phe(F)(疎水性)

Cys(C)(親水性)

Asp(D)(親水性)

Val(V)(疎水性)

Thr(親水性)

様々な物理化学的な性質を持った側鎖が主鎖のペプチド結合で連なる

Leu(L)(疎水性)

蛋白質ペプチド結合したアミノ酸群

アミノ酸は全部で20種類

I VL

M FYW H

KR

D E

P NSA Q

CG T

疎水性 親水性

脂肪族

芳香族正荷電

負荷電

N末

C末

変性状態(D) 天然状態(N)

フォールディング(折り畳み)という現象

非常に多種の構造の集合大きく広がっている

ほとんど唯一の構造小さくコンパクトに折りたたまっている

温度や変性剤濃度によって可逆に変化

折り畳みは原則としてその蛋白質以外の分子の介助を必要としない

アミノ酸配列の情報だけで天然状態の立体構造が決定される

どうやってコンパクトになるか rarr (1)主鎖の水素結合(2)側鎖間の疎水性相互作用

あるアミノ酸配列がどうやって一つの構造を決めるのか

3次元座標の差のスコア(RMSD)

並進ベクトルt を引いたあと回転行列R をかける

t 二つの分子の重心をあわせるように決めるR 2つの原子群の相関を 大化する行列rarr(1)特異値分解で導出

(2)四元数表現により 適な回転をLagrange未定乗数法で決定

sum=

minusminus=N

iiiN

RMSD1

2)](R[1 tyx

21

20

1

2

3

4

5

1xdaA

1

23

4

21

20

5

yi

)(R ty minusi

xi

1

23

4

21

20

5

原子の対応付けがわかっているとする

RMSD 適に重ね合わせたときのXYZ座標の差(Root Mean Square Deviation)

1benA

WKabsch Acta CrystA 32922-923(1976) 34827-828(1978)ADMclachlan JMolBiol 12874-77 (1979)Charles FF Karney ldquoQuaternions in molecular modelingrdquo E-print arXivphysics0506177

xi分子Xのi番目の原子の位置ベクトル yi分子Yのi番目の原子の位置ベクトル

距離の差のスコア (DRMS)

( )sumsum= ge

minusminus

=N

i

N

ij

Yij

Xij DD

NNDRMS

1

2

)1(2

21

20

1

2

3

4

5

YijD

XijD

1

23

4

21

20

5

yixi

DRMS 対応する原子ペアの距離の差(Distance-based RMSD)

原子の対応付けがわかっているとする

重ね合わせは不要なので計算は簡単

3次元によらない2次元や結合情報にも拡張できる

鏡像の区別はできない

1benA

計算が簡単なので高速な構造比較のアルゴリズムの基盤として使われる

1xdaA

H19 問73立体構造の似ている2つのタンパク質間で対応関係にある原子が分かっている場合にはRMSD(Root Mean Square Deviation)と呼ばれる数値を計算することにより立体構造の重なり合いの程度を数値化することができるRMSDは全ての対応する原子間の距離を

2乗した値の平均値(相加平均)にルートをとったものとして定義されるあるタンパク質における6つの原子ABCDEFと別のタンパク質の6つの原子

ArsquoBrsquoCrsquoDrsquoErsquoFrsquoについて対応関係が分かっており互いにもっともよく重なるように回転して重ねた時の対応原子間の距離は以下の表のようになったこの表からB-Brsquo C-Crsquo D-Drsquo E-Ersquoは正確に重なったが他の原子間ではずれが見られることがわかるここで6つの原子に対するRMSD値はいくらになるか選択肢の中からもっとも適切な値を一つ選べただ

し原子間距離の単位は考慮しないものとする

対応原子 距離

原子A―原子Arsquo 20

原子B―原子Brsquo 00

原子C―原子Crsquo 00

原子D―原子Crsquo 10

原子E―原子Crsquo 00

原子F―原子Crsquo 10

1 052 0663 104 133

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問73立体構造の似ている2つのタンパク質間で対応関係にある原子が分かっている場合にはRMSD(Root Mean Square Deviation)と呼ばれる数値を計算することにより立体構造の重なり合いの程度を数値化することができるRMSDは全ての対応する原子間の距離を

2乗した値の平均値(相加平均)にルートをとったものとして定義されるあるタンパク質における6つの原子ABCDEFと別のタンパク質の6つの原子

ArsquoBrsquoCrsquoDrsquoErsquoFrsquoについて対応関係が分かっており互いにもっともよく重なるように回転して重ねた時の対応原子間の距離は以下の表のようになったこの表からB-Brsquo C-Crsquo D-Drsquo E-Ersquoは正確に重なったが他の原子間ではずれが見られることがわかるここで6つの原子に対するRMSD値はいくらになるか選択肢の中からもっとも適切な値を一つ選べただ

し原子間距離の単位は考慮しないものとする

対応原子 距離

原子A―原子Arsquo 20

原子B―原子Brsquo 00

原子C―原子Crsquo 00

原子D―原子Crsquo 10

原子E―原子Crsquo 00

原子F―原子Crsquo 10

1 052 0663 104 133

RMSDは 適に重ね合わせたときの

「ずれの二乗の平均のルート」であるしたがってずれの二乗平均は

(22+0+0+1+0+1)6=66=1これのルートをとるとradic1=1

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

1

2

3

4

56

7

8

9

10

11

主鎖の水素結合αへリックス

1

2

34

56

78

9

10

11

O

N

CHN

N

H

H

CO Cα

i

i+3

i+4

HN O C

Cαi-1

i番目のCOがi+4番目のNHと水素結合を形成

36残基が1周期の右巻きらせん

NHO=Cが同じ向きに並ぶため

へリックス全体に電気双極子が発生

N末C末

ー +

主鎖の水素結合逆平行βシート

βターン

βターン

βヘアピン

βヘアピン

伸びた構造の1本1本をβストランドと呼ぶ二本以上のβストランドがシート状に並んだ構造をβシートと呼ぶ

βストランド

βストランド

βストランド

主鎖の水素結合平行βシート

βminusαminusβモチーフ

平行βシートがαへリックスで接続された構造モチーフ

βストランド

βストランド

βストランド

伸びた構造の1本1本をβストランドと呼ぶ二本以上のβストランドがシート状に並んだ構造をβシートと呼ぶ

Cαi

Cαi+1Cα

i-1φ ψ

ペプチド結合の平面性とφψの定義

主鎖の原子のXYZ座標はφψの2つ

の角度でほとんど記述できる

φψの角度を2次元にプロットしたものをラマチャンドランプロット(Ramachandran plot)という点が集中する領域は2次構造とよく対応

点が現れない領域は主鎖の原子が衝突する

βシート

αへリックス

左巻きへリックス

平面平面

φ

ψ

H19 問74タンパク質の主鎖に添って定義される二面角のうちφ(窒素原子と炭素原子の間の二面角)とψ(α炭素原子とカルボニル基の炭素原子の間の二面角)の値を各残

基ごとに計算して二次元にプロットしたものをラマチャンドランプロットと呼ぶ以下に示したラマチャンドランプロットに対する説明文の中でもっとも適切なものを一つ選べ

1 (a)(b)はともにαへリックスの領域である2 (a)(b)はともにβストランドの領域である3 (a)はαへリックス(b)はβストランドの領

域である4 (a)はβストランド(b)はαへリックスの領

域である

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問74タンパク質の主鎖に添って定義される二面角のうちφ(窒素原子と炭素原子の間の二面角)とψ(α炭素原子とカルボニル基の炭素原子の間の二面角)の値を各残

基ごとに計算して二次元にプロットしたものをラマチャンドランプロットと呼ぶ以下に示したラマチャンドランプロットに対する説明文の中でもっとも適切なものを一つ選べ

1 (a)(b)はともにαへリックスの領域である2 (a)(b)はともにβストランドの領域である3 (a)はαへリックス(b)はβストランドの領

域である4 (a)はβストランド(b)はαへリックスの領

域である

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

トポロジー図によるβシートの表現

4 23

N

C

1

1ubq (UbiquitinHumand151)

N

C123 4 5 6

1n8k (Alchol dehydrogenase E chain Horse c21)

ロスマンフォールド

βターン

βターン

1cauA1rhdA domain2

TOPSプログラムによる表示httpwwwtopsleedsacuk

1timA

はαへリックスはβストランドとなりあうの向きで平行逆平行を示す

コンタクトマップ

1ubq

C

4 23

N

1

縦横に残基を配置しある残基ペアのCα原子間の距離が10Å以下であれば対応するピクセルに色を塗る

分子描画ソフトVMDを用いて作成

平行のストランド間は方向逆平行ストランド間は方向に線分が観察される

N

C

N C

逆平行

逆平行

平行

αへリックスは太めの対角上の線分

へリックス

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから1か3コンタクトマップから平行シートしかないことがわかるため1であることがわかる

αβ5

αβ3

α

β4α

β1αβ2 β2

β1β3β4

β5

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから2か4コンタクトマップから平行シートしかないことがわかるため2であることがわかる

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

配列比較によるタンパク質分類1970年代から配列の一致度(sequence identity)に基づいてグループを作る作業が

行われてきた

どのくらいの類似性で一つにまとめるかは様々な考えがあるが少なくとも「相同なタンパク質群」を一つのグループにまとめるべき

ファミリー(family 族)

進化的に関係のある(相同な)タンパク質グループのこと

複数のファミリーがあつまった大きなグループ スーパーファミリー(superfamily clan)

一つのファミリーの中の小さなグループ サブファミリー(subfamily)

family

subfamily superfamily

ドメイン単位による分類

A2 B2

B3 C3

A1

配列1

配列2

配列3

配列の部分どうしだけが類似していた場合 部分一致を重視するとすべて一つのグループになるがhellip

配列1

配列2 配列3

Aを共有

Bを共有

1と2が類似2と3が類似していても1と3は類似していない

ドメインに分割すると

A1

A2

B2

B3

C3

A2 B2

B3 C3

A1

きれいに分類することができる

Pfam 蛋白質ファミリのデータベース各蛋白質ファミリのマルチプル

アライメント HMMなどを集めたデータベース

httppfamsangeracuk

Pkinase_Tyrドメインをもつタンパク質の例

ABL_HUMAN

BTK_HUMAN

ILK_HUMAN

MERTK_HUMAN

PGFRB_HUMAN

HCK_HUMAN

Family Pkinase_Tyr (PF07714) Protein tyrosine kinase

Pfamデータベース(httppfamsangeracukSoftwarePfam)からの引用

ドメイン構造と疎水性の関係Tyrosine protein kinase HCK (1ad5A HCK_HUMAN)

SH3 domain

SH2 domain

Tyrosine-kinase domain

3つの分断された疎水性コアrarr ドメイン構造

大きなタンパク質はいくつかの構造上のまとまり(ドメイン)を持つことが多い

立体構造によるタンパク質の分類

bull 配列による分類の延長ドメイン単位の分類進化的に関係のある(相同な)タンパク質を群にする(ファミリー)という考え方は同じ

bull 立体構造の類似性からより遠縁の相同性を見つけより大きな群を作る(スーパーファミリー)

bull スーパーファミリーをまとめたさらに大きなグループ(フォールドクラス)

bull 主にアミノ酸(Cαレベル)のラフな構造の類似性に

着目

bull 分類対象は主に球状タンパク質

立体構造分類データベースSCOPhttpscopmrc-lmbcamacukscop

4階層で分類Class(クラス)

Fold(フォールド)

Superfamily(スーパーファミリー)

Family(ファミリー)

どの階層に分類するかは配列の類似性立体構造の類似性分子機能の類似性機能部位の類似性

を専門家が総合的に判断して決める

1akr

ltホモロジーgt

ltアナロジーgt

他の構造分類データベースとしてCATHが有名

同様に階層的な分類体系を持つがその詳細はSCOPとは異なる

クラス

1mbd

1mqkH

1n55A 1pqwA

1fxd 1a2p

all-α (a)

all-β (b)

αβ (c)

α+β (d)

α-へリックスが中心

β-シートが中心

逆平行が多い

α-へリックスとβ-シートが配列上交互に現れる平行β-シートが中心

α-へリックスとβ-シートが混在配列上の並びの規則はない逆平行と平行のβ-シートが混在

アミノ酸配列と立体構造の関係ピロリ菌と大腸菌のフラボドキシン (同一残基率 SeqID 44)

ピロリ菌(1fueA) 大腸菌(1ag9A)

配列が似ていれば立体構造も似ている

SeqID = 44

RMSD = 12 Å

1fueA 2GKIGIFFGTDSGNAEAIAEKISKAIG--NAEVVDVAKASKEQFNGFTKVILVAPTAGAGD59

1ag9A 2AITGIFFGSDTGNTENIAKMIQKQLGKDVADVHDIAKSSKEDLEAYDILLLGIPTWYYGE61

1fueA 60LQTDWEDFLGTLEASD-FANKTIGLVGLGDQDTYSETFAEGIFHIYEKAK--AGKVVGQT116

1ag9A 62AQCDWDDFFPTLE-EIDFNGKLVALFGCGDQEDYAEYFCDALGTIRDIIEPRGATIVGHW120

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C 14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

BLAST

PSI-BLAST 構造比較

構造比較

アミノ酸配列がほとんど似ていなくても立体構造は似ている場合がある

構造は配列より進化的に保存がよい 構造比較から新たなホモログが発見できる可能性

立体

構造

の変

アミノ酸配列の変化と立体構造の変化の相関(グロビン族)

立体構造の変化はアミノ酸配列の変化と相関配列が30以上一致していればRMSDは2Å以下

アミノ酸配列の類似度

2つの構造の類似性

ホモロジー (homology 相同)進化的起源を共有することによる類似多くの場合分子機能なども類似している

アナロジー (analogy 相似)進化的起源とは無関係な類似多くの場合分子機能など他の属性は似ていない物理化学的な構造の偏好が原因とされる

イルカの胸びれ サルの前足

チョウの羽 トリの翼

ネコの前足

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C

ldquoFlavodoxin-likerdquo fold (c23)

ldquoFlavoproteinsrdquo superfamily (c235)

ldquoCheY-likerdquosuperfamily(c231)

14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

AnalogyHomology

HomologyHomolo

gy

多く現れるフォールド(出現ドメイン数順)

太字はスーパーフォールド多くのスーパーファミリーを含むフォールド

d58

c1

g3

c23 b34

b1

a4フォールド名 (SCOP173によるクラスfhijkは除く) ドメイ

ンの数

スーパーファミリーの数

a4 DNARNA-binding 3-helical bundle 292 14c1 TIM betaalpha-barrel 269 33d58 Ferredoxin-like 248 55b1 Immunoglobulin-like beta sandwich 246 27c37 P-loop nucleoside triphosphate hydrolase 235 1c2 NAD(P)-binding Rossmann-fold domains 168 1g3 Knottins 154 19d15 Beta-Grasp(ubiquitin-like) 131 13c23 Flavodoxin-like 118 15b34 SH3-like barrel 117 18b40 OB-fold 100 12c66 SAM-dependent methyltransferases 95 1

c37 c2

d15

b40 c66

スーパーフォールド(Superfold)

フォールド名 (SCOP173によるクラスfhijkは除く) その下のスーパーファミリーの数

d58 Ferredoxin-like 55c1 TIM betaalpha-barrel 33b1 Immunoglobulin-like beta sandwich 27a24 Four-helical up-and-down bundle 27a118 Alpha-alpha superhelix 23g3 Knottins 19b34 SH3-like barrel 18g41 Rubredoxin-like 16c23 Flavodoxin-like 15a60 SAM(sterile alpha motif) domain-like 15b69 7-bladed beta-propeller 14a4 DNARNA-binding 3-helical bundle 14

スーパーフォールド多くのスーパーファミリーを含むフォールド

スーパーフォールドは「構造の類似と機能の類似が対応しにくいフォールド」ともいえる

d58

c1

g3a118

c23

a24

a60

b34

b1

g41

b69 a4

三本へリックスバンドルDNARNA‐binding 3‐helical bundle(a4)

Mating type protein A2 yeast(1k61Aa411)

(1gvdAa413)(1wh5Aa411)

三本のへリックスが束になった構造DNAやRNAに結合する蛋白質が多い

DNAと

結合した構造(1k61)

TIMバレルTIM betaalpha barrel (c1)

Triosephosphate isomerase1n55A(c111)

全般に解糖系の酵素が多い基質酵素反応は極めて多彩

八本のβストランドとαへリックスが交互に組み合わさり対称的な樽(barrel)構造を形成す

る中央の樽構造は平行のβシートからなる

Imidazole glycerol phosphate synthasesubunit hisF1thfD(c121)

KHGKDPG aldolase1euaA(c1101)

フェレドキシン様Ferredoxin‐like (d58)

4Fe-4S Ferredoxin(1fxdd581)

1 234 4本の逆平行のβストランドと2本のαへリックスからな

分子機能は極めて多彩

CheY binding domain of CheA(1eayCd5824)

U1A RNA binding domain(1nu4Ad5871)

免疫グロブリン様Immunoglobulin‐like beta sandwich(b1)

Immunoglobulin Heavy chain variabledomain 1mjuH1(b111)

Immunoglobulin Heavy chain constantdomain 1mjuH2(b112)

Macromomycin1noaA (b171)

免疫グロブリン分子はH鎖とL鎖から

なりそれぞれ免疫グロブリン様ドメインからできている

V

C

V

C

C

C

V

CV

CC

C

L鎖

H鎖H鎖 L鎖

細胞表面あるいは分泌蛋白質が多い免疫や分子認識に関する機能を担うことが多い

4本のβストランドからなるβシートが二枚サンドイッチ状に重なった構造をとる逆平行のβシートが主

P‐loop スーパーファミリーP‐loop nucleoside triphosphate hydrolase(c37)

Ras-related protein RAB-5A1r2qA(c3718)

Guanylate kinase1gkyA(c3711)

RecA proteinDomain1 1xmsA1(c37111)

平行のβシートが主トポロジーには様々な変異あり

シグナル伝達DNA結合

モーター機能など多彩な分子機能を担うがATP GTPなどのヌクレオシド

の加水分解を行う点は共通

N C

132 4 5 6

ヌクレオシド結合部GxxxxGKTの

配列モチーフ(P-loop)を持つ

ロスマン フォールドNAD(P)‐binding Rossmann‐fold domains (c2)

Alcohol dehydrogenase gamma chaindomain2 1u3wA(c211)

Aspartate beta-semialdehydedehydrogenase2gz1A1(c213)

L-alanine dehydrogenase1pjcA1(c214)

補酵素を利用したNAD(P)を脱水素酵素を持つ基質を認識するドメインは別に存在する

NC

123 4 5 6

平行のβシートが主

7枚羽 βプロペラ7‐bladed beta‐propeller (b69)

Garactose oxydasedomain3 1k3iA3(b6911)

Guanine nucleotide-bindingprotein subunit beta-11gotB(b6941)

細胞膜付近のシグナル伝達や糖結合に関わることが多い

Influenza Neuraminidase 1f8dA(b6811)

6枚羽 βプロペラ

N C

321 4

のユニットが7回円環状に繰り返しされたフォールド

立体構造比較プログラム1990年ごろから多くの構造比較プログラムが開発されている

WEBアドレス スコア アライメント

DALI httpwwwebiacukdali

距離の差を独自の関数で変換したスコア

局所アライメントをモンテカルロ法でつなぎ合わせる

CE httpclsdsceducehtml

局所的なRMSD 局所アライメントを積み上げていく

MATRAS httpbiunitnaistjpmatras

距離の変化が相同相似で起こる確率の比をスコアとする

SSEで仮アライメント

を生成残基アライメントを収束するまで反復する

タンパク質の相同性の判断基準

100

同一残基率30以上

BLASTのE-value lt 00001

PSI-BLASTのE-value lt 00001

0102030407025 15 535

同一残基率(Sequence Identity)()

立体構造比較が必要

(1)立体構造の類似性が高い(DALIのZスコアMATRASのRdisスコア)(2)同一残基率がそこそこ高い(PSI-BLASTでヒットするSeqIDgt=15ぐらい)

(3)分子機能に類似性がある(補酵素酵素反応基質代謝経路等の共通性等)(4)基質補酵素の結合部位が類似しておりそのアミノ酸が保存(モチーフ)(5)ドメイン構成の共通性(6)スーパーフォールドの場合は特別な注意が必要

配列解析

同一残基率が25以下の場合の相同性の判断基準

50608090

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 13: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

立体構造の決定法X線結晶解析

NMR(核磁気共鳴法)

大量発現精製結晶化

X線回折強度の測定

原子モデルの構築

原子モデルの精密化

核磁気共鳴解析(NOE解析帰属と距離拘束の抽出)

3次元電子密度マップ

原子間距離拘束

(1)多数分子の平均構造の観察(精製が重要 大きな分子複合体はより難しくなる)(2)発現精製結晶化のステップで各タンパク質によって実験条件の調整が必須(3)実験データの収集原子モデル構築の段階で計算機の支援が不可欠

大量発現精製

原子モデルの構築

原子モデルの精密化

MET 1

GLN 2

1

2

34

56

7 8

9

10

11

12

13

14

15

1617

18 19 20

21

HEADER UBIQUITIN 17-APR-92 1AAR COMPND DI-UBIQUITINSOURCE BOVINE (BOS TAURUS) ERYTHROCYTESAUTHOR WJCOOKLCJEFFREYMCARSONZCHENCMPICKART

原子番号 残基名 鎖識別子原子名 残基番号 X座標 Y座標 Z座標 占有率 温度因子

ATOM 1 N MET A 1 15493 30088 14694 100 836ATOM 2 CA MET A 1 14600 29031 15110 100 815ATOM 3 C MET A 1 15476 27793 15419 100 930ATOM 4 O MET A 1 16571 27561 14871 100 896ATOM 5 CB MET A 1 13500 28837 14105 100 989ATOM 6 CG MET A 1 13823 27997 12931 100 1021ATOM 7 SD MET A 1 12312 27711 11891 100 1033ATOM 8 CE MET A 1 13174 26595 10726 100 730ATOM 9 N GLN A 2 14968 27014 16326 100 975ATOM 10 CA GLN A 2 15552 25806 16852 100 1192ATOM 11 C GLN A 2 15000 24553 16168 100 1171ATOM 12 O GLN A 2 13787 24387 16086 100 1000 ATOM 13 CB GLN A 2 15368 25715 18386 100 1239ATOM 14 CG GLN A 2 15858 24413 19051 100 1400ATOM 15 CD GLN A 2 15676 24587 20561 100 1559ATOM 16 OE1 GLN A 2 16525 25209 21205 100 1867ATOM 17 NE2 GLN A 2 14564 24203 21152 100 1539ATOM 18 N ILE A 3 15960 23745 15687 100 1179 ATOM 19 CA ILE A 3 15593 22437 15130 100 1214ATOM 20 C ILE A 3 16491 21342 15720 100 1199ATOM 21 O ILE A 3 17701 21540 15767 100 1291

PDB ID

wwPDB(World Wide Protein Data Bank) 立体構造データの収集するデータバンク

RCSB PDB httpwwwrcsborgpdbPDBフォーマット MSD EBI httpwwwebiacukmsd

PDBj httpwwwpdbjorg

PDBは1971年に設立

立体構造描画のフリーウエアシェアウエアソフト名 WebSite 対応機種 特徴

RasMol wwwopenrasmolorg Win Mac Linux(ソース公開)

独自の高速描画アルゴリズムを用い非力なハードでも同様に高速描画が可能コマンド言語は強力で多機能基本的な描画法をカバーするが分子表面の描画はできない描画の質はやや低い

Chime wwwmdlchimecom Win Mac RasMolをベースにしたWEBブラウザ内で動作するプラグイン分子表面表示など描画機能はRasMolより拡張分子描画機能を持ったWEBページを作れる

Jmol jmolsourceforgenet Win Mac Linux(ソース公開)

Java Applet によりWEBブラウザ内で動作Chimeと同様に分子描画機能を持ったWEBページを作れるJREをインストールする必要

PyMOL pymolsourceforgenet

Win Mac Linux

OpenGLを用いた質の高い描画Python言語で開発されておりソースも公開Python言語を用いた機能

拡張も可能

CHIMERA wwwcglucsfeduchimera

Win Mac Linux

OpenGLを用いた質の高い描画電顕画像などの多

様なデータの取り込みドッキング静電計算などのインタフェース有りPython言語を用いた機能拡張

VMD wwwksuiuceduResearchvmd

Win Mac Linux

OpenGLを用いた質の高い描画Tcl言語を用いた機

能拡張が可能分子動力学の可視化を主要目的として幅広い機能

MolScript wwwavatarsemolscrit

Linux(ソース公開)

主にリボン図の描画用のソフトGUIを持たずコマンドラインでPDBファイルをPSファイル等に変換

Swiss PDB Viewer

auexpasyorgspdbv Win Mac Linux

OpenGLを用いた質の高い描画幅広い機能をサ

ポートしているがアップデートは活発でない

H19 問51

タンパク質などの生体高分子をコンピュータで表示するためのソフトウェア名として適切でないものを選択肢の中から一つ選べ

1RasMol2Chime3TMHMM4Swiss-PdbViewer

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問51

タンパク質などの生体高分子をコンピュータで表示するためのソフトウェア名として適切でないものを選択肢の中から一つ選べ

1RasMol2Chime3TMHMM4Swiss-PdbViewer

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問59

タンパク質の立体構造のグラフィックス表示プログラムではないものを選択肢の中から一つ選べ

1Chime2PyMol3MEGA4MolScript

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問59

タンパク質の立体構造のグラフィックス表示プログラムではないものを選択肢の中から一つ選べ

1Chime2PyMol3MEGA4MolScript

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

PDBコード1fxd(ferredoxin II) Rasmol Chimeプラグインで描画

立体構造の描画スタイル

ワイアフレーム ボールスティック 空間充填

バックボーン リボン 分子表面

1 234

N

H C

O

Ala(A)(疎水性)

Phe(F)(疎水性)

Cys(C)(親水性)

Asp(D)(親水性)

Val(V)(疎水性)

Thr(親水性)

様々な物理化学的な性質を持った側鎖が主鎖のペプチド結合で連なる

Leu(L)(疎水性)

蛋白質ペプチド結合したアミノ酸群

アミノ酸は全部で20種類

I VL

M FYW H

KR

D E

P NSA Q

CG T

疎水性 親水性

脂肪族

芳香族正荷電

負荷電

N末

C末

変性状態(D) 天然状態(N)

フォールディング(折り畳み)という現象

非常に多種の構造の集合大きく広がっている

ほとんど唯一の構造小さくコンパクトに折りたたまっている

温度や変性剤濃度によって可逆に変化

折り畳みは原則としてその蛋白質以外の分子の介助を必要としない

アミノ酸配列の情報だけで天然状態の立体構造が決定される

どうやってコンパクトになるか rarr (1)主鎖の水素結合(2)側鎖間の疎水性相互作用

あるアミノ酸配列がどうやって一つの構造を決めるのか

3次元座標の差のスコア(RMSD)

並進ベクトルt を引いたあと回転行列R をかける

t 二つの分子の重心をあわせるように決めるR 2つの原子群の相関を 大化する行列rarr(1)特異値分解で導出

(2)四元数表現により 適な回転をLagrange未定乗数法で決定

sum=

minusminus=N

iiiN

RMSD1

2)](R[1 tyx

21

20

1

2

3

4

5

1xdaA

1

23

4

21

20

5

yi

)(R ty minusi

xi

1

23

4

21

20

5

原子の対応付けがわかっているとする

RMSD 適に重ね合わせたときのXYZ座標の差(Root Mean Square Deviation)

1benA

WKabsch Acta CrystA 32922-923(1976) 34827-828(1978)ADMclachlan JMolBiol 12874-77 (1979)Charles FF Karney ldquoQuaternions in molecular modelingrdquo E-print arXivphysics0506177

xi分子Xのi番目の原子の位置ベクトル yi分子Yのi番目の原子の位置ベクトル

距離の差のスコア (DRMS)

( )sumsum= ge

minusminus

=N

i

N

ij

Yij

Xij DD

NNDRMS

1

2

)1(2

21

20

1

2

3

4

5

YijD

XijD

1

23

4

21

20

5

yixi

DRMS 対応する原子ペアの距離の差(Distance-based RMSD)

原子の対応付けがわかっているとする

重ね合わせは不要なので計算は簡単

3次元によらない2次元や結合情報にも拡張できる

鏡像の区別はできない

1benA

計算が簡単なので高速な構造比較のアルゴリズムの基盤として使われる

1xdaA

H19 問73立体構造の似ている2つのタンパク質間で対応関係にある原子が分かっている場合にはRMSD(Root Mean Square Deviation)と呼ばれる数値を計算することにより立体構造の重なり合いの程度を数値化することができるRMSDは全ての対応する原子間の距離を

2乗した値の平均値(相加平均)にルートをとったものとして定義されるあるタンパク質における6つの原子ABCDEFと別のタンパク質の6つの原子

ArsquoBrsquoCrsquoDrsquoErsquoFrsquoについて対応関係が分かっており互いにもっともよく重なるように回転して重ねた時の対応原子間の距離は以下の表のようになったこの表からB-Brsquo C-Crsquo D-Drsquo E-Ersquoは正確に重なったが他の原子間ではずれが見られることがわかるここで6つの原子に対するRMSD値はいくらになるか選択肢の中からもっとも適切な値を一つ選べただ

し原子間距離の単位は考慮しないものとする

対応原子 距離

原子A―原子Arsquo 20

原子B―原子Brsquo 00

原子C―原子Crsquo 00

原子D―原子Crsquo 10

原子E―原子Crsquo 00

原子F―原子Crsquo 10

1 052 0663 104 133

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問73立体構造の似ている2つのタンパク質間で対応関係にある原子が分かっている場合にはRMSD(Root Mean Square Deviation)と呼ばれる数値を計算することにより立体構造の重なり合いの程度を数値化することができるRMSDは全ての対応する原子間の距離を

2乗した値の平均値(相加平均)にルートをとったものとして定義されるあるタンパク質における6つの原子ABCDEFと別のタンパク質の6つの原子

ArsquoBrsquoCrsquoDrsquoErsquoFrsquoについて対応関係が分かっており互いにもっともよく重なるように回転して重ねた時の対応原子間の距離は以下の表のようになったこの表からB-Brsquo C-Crsquo D-Drsquo E-Ersquoは正確に重なったが他の原子間ではずれが見られることがわかるここで6つの原子に対するRMSD値はいくらになるか選択肢の中からもっとも適切な値を一つ選べただ

し原子間距離の単位は考慮しないものとする

対応原子 距離

原子A―原子Arsquo 20

原子B―原子Brsquo 00

原子C―原子Crsquo 00

原子D―原子Crsquo 10

原子E―原子Crsquo 00

原子F―原子Crsquo 10

1 052 0663 104 133

RMSDは 適に重ね合わせたときの

「ずれの二乗の平均のルート」であるしたがってずれの二乗平均は

(22+0+0+1+0+1)6=66=1これのルートをとるとradic1=1

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

1

2

3

4

56

7

8

9

10

11

主鎖の水素結合αへリックス

1

2

34

56

78

9

10

11

O

N

CHN

N

H

H

CO Cα

i

i+3

i+4

HN O C

Cαi-1

i番目のCOがi+4番目のNHと水素結合を形成

36残基が1周期の右巻きらせん

NHO=Cが同じ向きに並ぶため

へリックス全体に電気双極子が発生

N末C末

ー +

主鎖の水素結合逆平行βシート

βターン

βターン

βヘアピン

βヘアピン

伸びた構造の1本1本をβストランドと呼ぶ二本以上のβストランドがシート状に並んだ構造をβシートと呼ぶ

βストランド

βストランド

βストランド

主鎖の水素結合平行βシート

βminusαminusβモチーフ

平行βシートがαへリックスで接続された構造モチーフ

βストランド

βストランド

βストランド

伸びた構造の1本1本をβストランドと呼ぶ二本以上のβストランドがシート状に並んだ構造をβシートと呼ぶ

Cαi

Cαi+1Cα

i-1φ ψ

ペプチド結合の平面性とφψの定義

主鎖の原子のXYZ座標はφψの2つ

の角度でほとんど記述できる

φψの角度を2次元にプロットしたものをラマチャンドランプロット(Ramachandran plot)という点が集中する領域は2次構造とよく対応

点が現れない領域は主鎖の原子が衝突する

βシート

αへリックス

左巻きへリックス

平面平面

φ

ψ

H19 問74タンパク質の主鎖に添って定義される二面角のうちφ(窒素原子と炭素原子の間の二面角)とψ(α炭素原子とカルボニル基の炭素原子の間の二面角)の値を各残

基ごとに計算して二次元にプロットしたものをラマチャンドランプロットと呼ぶ以下に示したラマチャンドランプロットに対する説明文の中でもっとも適切なものを一つ選べ

1 (a)(b)はともにαへリックスの領域である2 (a)(b)はともにβストランドの領域である3 (a)はαへリックス(b)はβストランドの領

域である4 (a)はβストランド(b)はαへリックスの領

域である

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問74タンパク質の主鎖に添って定義される二面角のうちφ(窒素原子と炭素原子の間の二面角)とψ(α炭素原子とカルボニル基の炭素原子の間の二面角)の値を各残

基ごとに計算して二次元にプロットしたものをラマチャンドランプロットと呼ぶ以下に示したラマチャンドランプロットに対する説明文の中でもっとも適切なものを一つ選べ

1 (a)(b)はともにαへリックスの領域である2 (a)(b)はともにβストランドの領域である3 (a)はαへリックス(b)はβストランドの領

域である4 (a)はβストランド(b)はαへリックスの領

域である

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

トポロジー図によるβシートの表現

4 23

N

C

1

1ubq (UbiquitinHumand151)

N

C123 4 5 6

1n8k (Alchol dehydrogenase E chain Horse c21)

ロスマンフォールド

βターン

βターン

1cauA1rhdA domain2

TOPSプログラムによる表示httpwwwtopsleedsacuk

1timA

はαへリックスはβストランドとなりあうの向きで平行逆平行を示す

コンタクトマップ

1ubq

C

4 23

N

1

縦横に残基を配置しある残基ペアのCα原子間の距離が10Å以下であれば対応するピクセルに色を塗る

分子描画ソフトVMDを用いて作成

平行のストランド間は方向逆平行ストランド間は方向に線分が観察される

N

C

N C

逆平行

逆平行

平行

αへリックスは太めの対角上の線分

へリックス

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから1か3コンタクトマップから平行シートしかないことがわかるため1であることがわかる

αβ5

αβ3

α

β4α

β1αβ2 β2

β1β3β4

β5

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから2か4コンタクトマップから平行シートしかないことがわかるため2であることがわかる

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

配列比較によるタンパク質分類1970年代から配列の一致度(sequence identity)に基づいてグループを作る作業が

行われてきた

どのくらいの類似性で一つにまとめるかは様々な考えがあるが少なくとも「相同なタンパク質群」を一つのグループにまとめるべき

ファミリー(family 族)

進化的に関係のある(相同な)タンパク質グループのこと

複数のファミリーがあつまった大きなグループ スーパーファミリー(superfamily clan)

一つのファミリーの中の小さなグループ サブファミリー(subfamily)

family

subfamily superfamily

ドメイン単位による分類

A2 B2

B3 C3

A1

配列1

配列2

配列3

配列の部分どうしだけが類似していた場合 部分一致を重視するとすべて一つのグループになるがhellip

配列1

配列2 配列3

Aを共有

Bを共有

1と2が類似2と3が類似していても1と3は類似していない

ドメインに分割すると

A1

A2

B2

B3

C3

A2 B2

B3 C3

A1

きれいに分類することができる

Pfam 蛋白質ファミリのデータベース各蛋白質ファミリのマルチプル

アライメント HMMなどを集めたデータベース

httppfamsangeracuk

Pkinase_Tyrドメインをもつタンパク質の例

ABL_HUMAN

BTK_HUMAN

ILK_HUMAN

MERTK_HUMAN

PGFRB_HUMAN

HCK_HUMAN

Family Pkinase_Tyr (PF07714) Protein tyrosine kinase

Pfamデータベース(httppfamsangeracukSoftwarePfam)からの引用

ドメイン構造と疎水性の関係Tyrosine protein kinase HCK (1ad5A HCK_HUMAN)

SH3 domain

SH2 domain

Tyrosine-kinase domain

3つの分断された疎水性コアrarr ドメイン構造

大きなタンパク質はいくつかの構造上のまとまり(ドメイン)を持つことが多い

立体構造によるタンパク質の分類

bull 配列による分類の延長ドメイン単位の分類進化的に関係のある(相同な)タンパク質を群にする(ファミリー)という考え方は同じ

bull 立体構造の類似性からより遠縁の相同性を見つけより大きな群を作る(スーパーファミリー)

bull スーパーファミリーをまとめたさらに大きなグループ(フォールドクラス)

bull 主にアミノ酸(Cαレベル)のラフな構造の類似性に

着目

bull 分類対象は主に球状タンパク質

立体構造分類データベースSCOPhttpscopmrc-lmbcamacukscop

4階層で分類Class(クラス)

Fold(フォールド)

Superfamily(スーパーファミリー)

Family(ファミリー)

どの階層に分類するかは配列の類似性立体構造の類似性分子機能の類似性機能部位の類似性

を専門家が総合的に判断して決める

1akr

ltホモロジーgt

ltアナロジーgt

他の構造分類データベースとしてCATHが有名

同様に階層的な分類体系を持つがその詳細はSCOPとは異なる

クラス

1mbd

1mqkH

1n55A 1pqwA

1fxd 1a2p

all-α (a)

all-β (b)

αβ (c)

α+β (d)

α-へリックスが中心

β-シートが中心

逆平行が多い

α-へリックスとβ-シートが配列上交互に現れる平行β-シートが中心

α-へリックスとβ-シートが混在配列上の並びの規則はない逆平行と平行のβ-シートが混在

アミノ酸配列と立体構造の関係ピロリ菌と大腸菌のフラボドキシン (同一残基率 SeqID 44)

ピロリ菌(1fueA) 大腸菌(1ag9A)

配列が似ていれば立体構造も似ている

SeqID = 44

RMSD = 12 Å

1fueA 2GKIGIFFGTDSGNAEAIAEKISKAIG--NAEVVDVAKASKEQFNGFTKVILVAPTAGAGD59

1ag9A 2AITGIFFGSDTGNTENIAKMIQKQLGKDVADVHDIAKSSKEDLEAYDILLLGIPTWYYGE61

1fueA 60LQTDWEDFLGTLEASD-FANKTIGLVGLGDQDTYSETFAEGIFHIYEKAK--AGKVVGQT116

1ag9A 62AQCDWDDFFPTLE-EIDFNGKLVALFGCGDQEDYAEYFCDALGTIRDIIEPRGATIVGHW120

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C 14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

BLAST

PSI-BLAST 構造比較

構造比較

アミノ酸配列がほとんど似ていなくても立体構造は似ている場合がある

構造は配列より進化的に保存がよい 構造比較から新たなホモログが発見できる可能性

立体

構造

の変

アミノ酸配列の変化と立体構造の変化の相関(グロビン族)

立体構造の変化はアミノ酸配列の変化と相関配列が30以上一致していればRMSDは2Å以下

アミノ酸配列の類似度

2つの構造の類似性

ホモロジー (homology 相同)進化的起源を共有することによる類似多くの場合分子機能なども類似している

アナロジー (analogy 相似)進化的起源とは無関係な類似多くの場合分子機能など他の属性は似ていない物理化学的な構造の偏好が原因とされる

イルカの胸びれ サルの前足

チョウの羽 トリの翼

ネコの前足

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C

ldquoFlavodoxin-likerdquo fold (c23)

ldquoFlavoproteinsrdquo superfamily (c235)

ldquoCheY-likerdquosuperfamily(c231)

14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

AnalogyHomology

HomologyHomolo

gy

多く現れるフォールド(出現ドメイン数順)

太字はスーパーフォールド多くのスーパーファミリーを含むフォールド

d58

c1

g3

c23 b34

b1

a4フォールド名 (SCOP173によるクラスfhijkは除く) ドメイ

ンの数

スーパーファミリーの数

a4 DNARNA-binding 3-helical bundle 292 14c1 TIM betaalpha-barrel 269 33d58 Ferredoxin-like 248 55b1 Immunoglobulin-like beta sandwich 246 27c37 P-loop nucleoside triphosphate hydrolase 235 1c2 NAD(P)-binding Rossmann-fold domains 168 1g3 Knottins 154 19d15 Beta-Grasp(ubiquitin-like) 131 13c23 Flavodoxin-like 118 15b34 SH3-like barrel 117 18b40 OB-fold 100 12c66 SAM-dependent methyltransferases 95 1

c37 c2

d15

b40 c66

スーパーフォールド(Superfold)

フォールド名 (SCOP173によるクラスfhijkは除く) その下のスーパーファミリーの数

d58 Ferredoxin-like 55c1 TIM betaalpha-barrel 33b1 Immunoglobulin-like beta sandwich 27a24 Four-helical up-and-down bundle 27a118 Alpha-alpha superhelix 23g3 Knottins 19b34 SH3-like barrel 18g41 Rubredoxin-like 16c23 Flavodoxin-like 15a60 SAM(sterile alpha motif) domain-like 15b69 7-bladed beta-propeller 14a4 DNARNA-binding 3-helical bundle 14

スーパーフォールド多くのスーパーファミリーを含むフォールド

スーパーフォールドは「構造の類似と機能の類似が対応しにくいフォールド」ともいえる

d58

c1

g3a118

c23

a24

a60

b34

b1

g41

b69 a4

三本へリックスバンドルDNARNA‐binding 3‐helical bundle(a4)

Mating type protein A2 yeast(1k61Aa411)

(1gvdAa413)(1wh5Aa411)

三本のへリックスが束になった構造DNAやRNAに結合する蛋白質が多い

DNAと

結合した構造(1k61)

TIMバレルTIM betaalpha barrel (c1)

Triosephosphate isomerase1n55A(c111)

全般に解糖系の酵素が多い基質酵素反応は極めて多彩

八本のβストランドとαへリックスが交互に組み合わさり対称的な樽(barrel)構造を形成す

る中央の樽構造は平行のβシートからなる

Imidazole glycerol phosphate synthasesubunit hisF1thfD(c121)

KHGKDPG aldolase1euaA(c1101)

フェレドキシン様Ferredoxin‐like (d58)

4Fe-4S Ferredoxin(1fxdd581)

1 234 4本の逆平行のβストランドと2本のαへリックスからな

分子機能は極めて多彩

CheY binding domain of CheA(1eayCd5824)

U1A RNA binding domain(1nu4Ad5871)

免疫グロブリン様Immunoglobulin‐like beta sandwich(b1)

Immunoglobulin Heavy chain variabledomain 1mjuH1(b111)

Immunoglobulin Heavy chain constantdomain 1mjuH2(b112)

Macromomycin1noaA (b171)

免疫グロブリン分子はH鎖とL鎖から

なりそれぞれ免疫グロブリン様ドメインからできている

V

C

V

C

C

C

V

CV

CC

C

L鎖

H鎖H鎖 L鎖

細胞表面あるいは分泌蛋白質が多い免疫や分子認識に関する機能を担うことが多い

4本のβストランドからなるβシートが二枚サンドイッチ状に重なった構造をとる逆平行のβシートが主

P‐loop スーパーファミリーP‐loop nucleoside triphosphate hydrolase(c37)

Ras-related protein RAB-5A1r2qA(c3718)

Guanylate kinase1gkyA(c3711)

RecA proteinDomain1 1xmsA1(c37111)

平行のβシートが主トポロジーには様々な変異あり

シグナル伝達DNA結合

モーター機能など多彩な分子機能を担うがATP GTPなどのヌクレオシド

の加水分解を行う点は共通

N C

132 4 5 6

ヌクレオシド結合部GxxxxGKTの

配列モチーフ(P-loop)を持つ

ロスマン フォールドNAD(P)‐binding Rossmann‐fold domains (c2)

Alcohol dehydrogenase gamma chaindomain2 1u3wA(c211)

Aspartate beta-semialdehydedehydrogenase2gz1A1(c213)

L-alanine dehydrogenase1pjcA1(c214)

補酵素を利用したNAD(P)を脱水素酵素を持つ基質を認識するドメインは別に存在する

NC

123 4 5 6

平行のβシートが主

7枚羽 βプロペラ7‐bladed beta‐propeller (b69)

Garactose oxydasedomain3 1k3iA3(b6911)

Guanine nucleotide-bindingprotein subunit beta-11gotB(b6941)

細胞膜付近のシグナル伝達や糖結合に関わることが多い

Influenza Neuraminidase 1f8dA(b6811)

6枚羽 βプロペラ

N C

321 4

のユニットが7回円環状に繰り返しされたフォールド

立体構造比較プログラム1990年ごろから多くの構造比較プログラムが開発されている

WEBアドレス スコア アライメント

DALI httpwwwebiacukdali

距離の差を独自の関数で変換したスコア

局所アライメントをモンテカルロ法でつなぎ合わせる

CE httpclsdsceducehtml

局所的なRMSD 局所アライメントを積み上げていく

MATRAS httpbiunitnaistjpmatras

距離の変化が相同相似で起こる確率の比をスコアとする

SSEで仮アライメント

を生成残基アライメントを収束するまで反復する

タンパク質の相同性の判断基準

100

同一残基率30以上

BLASTのE-value lt 00001

PSI-BLASTのE-value lt 00001

0102030407025 15 535

同一残基率(Sequence Identity)()

立体構造比較が必要

(1)立体構造の類似性が高い(DALIのZスコアMATRASのRdisスコア)(2)同一残基率がそこそこ高い(PSI-BLASTでヒットするSeqIDgt=15ぐらい)

(3)分子機能に類似性がある(補酵素酵素反応基質代謝経路等の共通性等)(4)基質補酵素の結合部位が類似しておりそのアミノ酸が保存(モチーフ)(5)ドメイン構成の共通性(6)スーパーフォールドの場合は特別な注意が必要

配列解析

同一残基率が25以下の場合の相同性の判断基準

50608090

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 14: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

MET 1

GLN 2

1

2

34

56

7 8

9

10

11

12

13

14

15

1617

18 19 20

21

HEADER UBIQUITIN 17-APR-92 1AAR COMPND DI-UBIQUITINSOURCE BOVINE (BOS TAURUS) ERYTHROCYTESAUTHOR WJCOOKLCJEFFREYMCARSONZCHENCMPICKART

原子番号 残基名 鎖識別子原子名 残基番号 X座標 Y座標 Z座標 占有率 温度因子

ATOM 1 N MET A 1 15493 30088 14694 100 836ATOM 2 CA MET A 1 14600 29031 15110 100 815ATOM 3 C MET A 1 15476 27793 15419 100 930ATOM 4 O MET A 1 16571 27561 14871 100 896ATOM 5 CB MET A 1 13500 28837 14105 100 989ATOM 6 CG MET A 1 13823 27997 12931 100 1021ATOM 7 SD MET A 1 12312 27711 11891 100 1033ATOM 8 CE MET A 1 13174 26595 10726 100 730ATOM 9 N GLN A 2 14968 27014 16326 100 975ATOM 10 CA GLN A 2 15552 25806 16852 100 1192ATOM 11 C GLN A 2 15000 24553 16168 100 1171ATOM 12 O GLN A 2 13787 24387 16086 100 1000 ATOM 13 CB GLN A 2 15368 25715 18386 100 1239ATOM 14 CG GLN A 2 15858 24413 19051 100 1400ATOM 15 CD GLN A 2 15676 24587 20561 100 1559ATOM 16 OE1 GLN A 2 16525 25209 21205 100 1867ATOM 17 NE2 GLN A 2 14564 24203 21152 100 1539ATOM 18 N ILE A 3 15960 23745 15687 100 1179 ATOM 19 CA ILE A 3 15593 22437 15130 100 1214ATOM 20 C ILE A 3 16491 21342 15720 100 1199ATOM 21 O ILE A 3 17701 21540 15767 100 1291

PDB ID

wwPDB(World Wide Protein Data Bank) 立体構造データの収集するデータバンク

RCSB PDB httpwwwrcsborgpdbPDBフォーマット MSD EBI httpwwwebiacukmsd

PDBj httpwwwpdbjorg

PDBは1971年に設立

立体構造描画のフリーウエアシェアウエアソフト名 WebSite 対応機種 特徴

RasMol wwwopenrasmolorg Win Mac Linux(ソース公開)

独自の高速描画アルゴリズムを用い非力なハードでも同様に高速描画が可能コマンド言語は強力で多機能基本的な描画法をカバーするが分子表面の描画はできない描画の質はやや低い

Chime wwwmdlchimecom Win Mac RasMolをベースにしたWEBブラウザ内で動作するプラグイン分子表面表示など描画機能はRasMolより拡張分子描画機能を持ったWEBページを作れる

Jmol jmolsourceforgenet Win Mac Linux(ソース公開)

Java Applet によりWEBブラウザ内で動作Chimeと同様に分子描画機能を持ったWEBページを作れるJREをインストールする必要

PyMOL pymolsourceforgenet

Win Mac Linux

OpenGLを用いた質の高い描画Python言語で開発されておりソースも公開Python言語を用いた機能

拡張も可能

CHIMERA wwwcglucsfeduchimera

Win Mac Linux

OpenGLを用いた質の高い描画電顕画像などの多

様なデータの取り込みドッキング静電計算などのインタフェース有りPython言語を用いた機能拡張

VMD wwwksuiuceduResearchvmd

Win Mac Linux

OpenGLを用いた質の高い描画Tcl言語を用いた機

能拡張が可能分子動力学の可視化を主要目的として幅広い機能

MolScript wwwavatarsemolscrit

Linux(ソース公開)

主にリボン図の描画用のソフトGUIを持たずコマンドラインでPDBファイルをPSファイル等に変換

Swiss PDB Viewer

auexpasyorgspdbv Win Mac Linux

OpenGLを用いた質の高い描画幅広い機能をサ

ポートしているがアップデートは活発でない

H19 問51

タンパク質などの生体高分子をコンピュータで表示するためのソフトウェア名として適切でないものを選択肢の中から一つ選べ

1RasMol2Chime3TMHMM4Swiss-PdbViewer

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問51

タンパク質などの生体高分子をコンピュータで表示するためのソフトウェア名として適切でないものを選択肢の中から一つ選べ

1RasMol2Chime3TMHMM4Swiss-PdbViewer

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問59

タンパク質の立体構造のグラフィックス表示プログラムではないものを選択肢の中から一つ選べ

1Chime2PyMol3MEGA4MolScript

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問59

タンパク質の立体構造のグラフィックス表示プログラムではないものを選択肢の中から一つ選べ

1Chime2PyMol3MEGA4MolScript

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

PDBコード1fxd(ferredoxin II) Rasmol Chimeプラグインで描画

立体構造の描画スタイル

ワイアフレーム ボールスティック 空間充填

バックボーン リボン 分子表面

1 234

N

H C

O

Ala(A)(疎水性)

Phe(F)(疎水性)

Cys(C)(親水性)

Asp(D)(親水性)

Val(V)(疎水性)

Thr(親水性)

様々な物理化学的な性質を持った側鎖が主鎖のペプチド結合で連なる

Leu(L)(疎水性)

蛋白質ペプチド結合したアミノ酸群

アミノ酸は全部で20種類

I VL

M FYW H

KR

D E

P NSA Q

CG T

疎水性 親水性

脂肪族

芳香族正荷電

負荷電

N末

C末

変性状態(D) 天然状態(N)

フォールディング(折り畳み)という現象

非常に多種の構造の集合大きく広がっている

ほとんど唯一の構造小さくコンパクトに折りたたまっている

温度や変性剤濃度によって可逆に変化

折り畳みは原則としてその蛋白質以外の分子の介助を必要としない

アミノ酸配列の情報だけで天然状態の立体構造が決定される

どうやってコンパクトになるか rarr (1)主鎖の水素結合(2)側鎖間の疎水性相互作用

あるアミノ酸配列がどうやって一つの構造を決めるのか

3次元座標の差のスコア(RMSD)

並進ベクトルt を引いたあと回転行列R をかける

t 二つの分子の重心をあわせるように決めるR 2つの原子群の相関を 大化する行列rarr(1)特異値分解で導出

(2)四元数表現により 適な回転をLagrange未定乗数法で決定

sum=

minusminus=N

iiiN

RMSD1

2)](R[1 tyx

21

20

1

2

3

4

5

1xdaA

1

23

4

21

20

5

yi

)(R ty minusi

xi

1

23

4

21

20

5

原子の対応付けがわかっているとする

RMSD 適に重ね合わせたときのXYZ座標の差(Root Mean Square Deviation)

1benA

WKabsch Acta CrystA 32922-923(1976) 34827-828(1978)ADMclachlan JMolBiol 12874-77 (1979)Charles FF Karney ldquoQuaternions in molecular modelingrdquo E-print arXivphysics0506177

xi分子Xのi番目の原子の位置ベクトル yi分子Yのi番目の原子の位置ベクトル

距離の差のスコア (DRMS)

( )sumsum= ge

minusminus

=N

i

N

ij

Yij

Xij DD

NNDRMS

1

2

)1(2

21

20

1

2

3

4

5

YijD

XijD

1

23

4

21

20

5

yixi

DRMS 対応する原子ペアの距離の差(Distance-based RMSD)

原子の対応付けがわかっているとする

重ね合わせは不要なので計算は簡単

3次元によらない2次元や結合情報にも拡張できる

鏡像の区別はできない

1benA

計算が簡単なので高速な構造比較のアルゴリズムの基盤として使われる

1xdaA

H19 問73立体構造の似ている2つのタンパク質間で対応関係にある原子が分かっている場合にはRMSD(Root Mean Square Deviation)と呼ばれる数値を計算することにより立体構造の重なり合いの程度を数値化することができるRMSDは全ての対応する原子間の距離を

2乗した値の平均値(相加平均)にルートをとったものとして定義されるあるタンパク質における6つの原子ABCDEFと別のタンパク質の6つの原子

ArsquoBrsquoCrsquoDrsquoErsquoFrsquoについて対応関係が分かっており互いにもっともよく重なるように回転して重ねた時の対応原子間の距離は以下の表のようになったこの表からB-Brsquo C-Crsquo D-Drsquo E-Ersquoは正確に重なったが他の原子間ではずれが見られることがわかるここで6つの原子に対するRMSD値はいくらになるか選択肢の中からもっとも適切な値を一つ選べただ

し原子間距離の単位は考慮しないものとする

対応原子 距離

原子A―原子Arsquo 20

原子B―原子Brsquo 00

原子C―原子Crsquo 00

原子D―原子Crsquo 10

原子E―原子Crsquo 00

原子F―原子Crsquo 10

1 052 0663 104 133

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問73立体構造の似ている2つのタンパク質間で対応関係にある原子が分かっている場合にはRMSD(Root Mean Square Deviation)と呼ばれる数値を計算することにより立体構造の重なり合いの程度を数値化することができるRMSDは全ての対応する原子間の距離を

2乗した値の平均値(相加平均)にルートをとったものとして定義されるあるタンパク質における6つの原子ABCDEFと別のタンパク質の6つの原子

ArsquoBrsquoCrsquoDrsquoErsquoFrsquoについて対応関係が分かっており互いにもっともよく重なるように回転して重ねた時の対応原子間の距離は以下の表のようになったこの表からB-Brsquo C-Crsquo D-Drsquo E-Ersquoは正確に重なったが他の原子間ではずれが見られることがわかるここで6つの原子に対するRMSD値はいくらになるか選択肢の中からもっとも適切な値を一つ選べただ

し原子間距離の単位は考慮しないものとする

対応原子 距離

原子A―原子Arsquo 20

原子B―原子Brsquo 00

原子C―原子Crsquo 00

原子D―原子Crsquo 10

原子E―原子Crsquo 00

原子F―原子Crsquo 10

1 052 0663 104 133

RMSDは 適に重ね合わせたときの

「ずれの二乗の平均のルート」であるしたがってずれの二乗平均は

(22+0+0+1+0+1)6=66=1これのルートをとるとradic1=1

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

1

2

3

4

56

7

8

9

10

11

主鎖の水素結合αへリックス

1

2

34

56

78

9

10

11

O

N

CHN

N

H

H

CO Cα

i

i+3

i+4

HN O C

Cαi-1

i番目のCOがi+4番目のNHと水素結合を形成

36残基が1周期の右巻きらせん

NHO=Cが同じ向きに並ぶため

へリックス全体に電気双極子が発生

N末C末

ー +

主鎖の水素結合逆平行βシート

βターン

βターン

βヘアピン

βヘアピン

伸びた構造の1本1本をβストランドと呼ぶ二本以上のβストランドがシート状に並んだ構造をβシートと呼ぶ

βストランド

βストランド

βストランド

主鎖の水素結合平行βシート

βminusαminusβモチーフ

平行βシートがαへリックスで接続された構造モチーフ

βストランド

βストランド

βストランド

伸びた構造の1本1本をβストランドと呼ぶ二本以上のβストランドがシート状に並んだ構造をβシートと呼ぶ

Cαi

Cαi+1Cα

i-1φ ψ

ペプチド結合の平面性とφψの定義

主鎖の原子のXYZ座標はφψの2つ

の角度でほとんど記述できる

φψの角度を2次元にプロットしたものをラマチャンドランプロット(Ramachandran plot)という点が集中する領域は2次構造とよく対応

点が現れない領域は主鎖の原子が衝突する

βシート

αへリックス

左巻きへリックス

平面平面

φ

ψ

H19 問74タンパク質の主鎖に添って定義される二面角のうちφ(窒素原子と炭素原子の間の二面角)とψ(α炭素原子とカルボニル基の炭素原子の間の二面角)の値を各残

基ごとに計算して二次元にプロットしたものをラマチャンドランプロットと呼ぶ以下に示したラマチャンドランプロットに対する説明文の中でもっとも適切なものを一つ選べ

1 (a)(b)はともにαへリックスの領域である2 (a)(b)はともにβストランドの領域である3 (a)はαへリックス(b)はβストランドの領

域である4 (a)はβストランド(b)はαへリックスの領

域である

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問74タンパク質の主鎖に添って定義される二面角のうちφ(窒素原子と炭素原子の間の二面角)とψ(α炭素原子とカルボニル基の炭素原子の間の二面角)の値を各残

基ごとに計算して二次元にプロットしたものをラマチャンドランプロットと呼ぶ以下に示したラマチャンドランプロットに対する説明文の中でもっとも適切なものを一つ選べ

1 (a)(b)はともにαへリックスの領域である2 (a)(b)はともにβストランドの領域である3 (a)はαへリックス(b)はβストランドの領

域である4 (a)はβストランド(b)はαへリックスの領

域である

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

トポロジー図によるβシートの表現

4 23

N

C

1

1ubq (UbiquitinHumand151)

N

C123 4 5 6

1n8k (Alchol dehydrogenase E chain Horse c21)

ロスマンフォールド

βターン

βターン

1cauA1rhdA domain2

TOPSプログラムによる表示httpwwwtopsleedsacuk

1timA

はαへリックスはβストランドとなりあうの向きで平行逆平行を示す

コンタクトマップ

1ubq

C

4 23

N

1

縦横に残基を配置しある残基ペアのCα原子間の距離が10Å以下であれば対応するピクセルに色を塗る

分子描画ソフトVMDを用いて作成

平行のストランド間は方向逆平行ストランド間は方向に線分が観察される

N

C

N C

逆平行

逆平行

平行

αへリックスは太めの対角上の線分

へリックス

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから1か3コンタクトマップから平行シートしかないことがわかるため1であることがわかる

αβ5

αβ3

α

β4α

β1αβ2 β2

β1β3β4

β5

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから2か4コンタクトマップから平行シートしかないことがわかるため2であることがわかる

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

配列比較によるタンパク質分類1970年代から配列の一致度(sequence identity)に基づいてグループを作る作業が

行われてきた

どのくらいの類似性で一つにまとめるかは様々な考えがあるが少なくとも「相同なタンパク質群」を一つのグループにまとめるべき

ファミリー(family 族)

進化的に関係のある(相同な)タンパク質グループのこと

複数のファミリーがあつまった大きなグループ スーパーファミリー(superfamily clan)

一つのファミリーの中の小さなグループ サブファミリー(subfamily)

family

subfamily superfamily

ドメイン単位による分類

A2 B2

B3 C3

A1

配列1

配列2

配列3

配列の部分どうしだけが類似していた場合 部分一致を重視するとすべて一つのグループになるがhellip

配列1

配列2 配列3

Aを共有

Bを共有

1と2が類似2と3が類似していても1と3は類似していない

ドメインに分割すると

A1

A2

B2

B3

C3

A2 B2

B3 C3

A1

きれいに分類することができる

Pfam 蛋白質ファミリのデータベース各蛋白質ファミリのマルチプル

アライメント HMMなどを集めたデータベース

httppfamsangeracuk

Pkinase_Tyrドメインをもつタンパク質の例

ABL_HUMAN

BTK_HUMAN

ILK_HUMAN

MERTK_HUMAN

PGFRB_HUMAN

HCK_HUMAN

Family Pkinase_Tyr (PF07714) Protein tyrosine kinase

Pfamデータベース(httppfamsangeracukSoftwarePfam)からの引用

ドメイン構造と疎水性の関係Tyrosine protein kinase HCK (1ad5A HCK_HUMAN)

SH3 domain

SH2 domain

Tyrosine-kinase domain

3つの分断された疎水性コアrarr ドメイン構造

大きなタンパク質はいくつかの構造上のまとまり(ドメイン)を持つことが多い

立体構造によるタンパク質の分類

bull 配列による分類の延長ドメイン単位の分類進化的に関係のある(相同な)タンパク質を群にする(ファミリー)という考え方は同じ

bull 立体構造の類似性からより遠縁の相同性を見つけより大きな群を作る(スーパーファミリー)

bull スーパーファミリーをまとめたさらに大きなグループ(フォールドクラス)

bull 主にアミノ酸(Cαレベル)のラフな構造の類似性に

着目

bull 分類対象は主に球状タンパク質

立体構造分類データベースSCOPhttpscopmrc-lmbcamacukscop

4階層で分類Class(クラス)

Fold(フォールド)

Superfamily(スーパーファミリー)

Family(ファミリー)

どの階層に分類するかは配列の類似性立体構造の類似性分子機能の類似性機能部位の類似性

を専門家が総合的に判断して決める

1akr

ltホモロジーgt

ltアナロジーgt

他の構造分類データベースとしてCATHが有名

同様に階層的な分類体系を持つがその詳細はSCOPとは異なる

クラス

1mbd

1mqkH

1n55A 1pqwA

1fxd 1a2p

all-α (a)

all-β (b)

αβ (c)

α+β (d)

α-へリックスが中心

β-シートが中心

逆平行が多い

α-へリックスとβ-シートが配列上交互に現れる平行β-シートが中心

α-へリックスとβ-シートが混在配列上の並びの規則はない逆平行と平行のβ-シートが混在

アミノ酸配列と立体構造の関係ピロリ菌と大腸菌のフラボドキシン (同一残基率 SeqID 44)

ピロリ菌(1fueA) 大腸菌(1ag9A)

配列が似ていれば立体構造も似ている

SeqID = 44

RMSD = 12 Å

1fueA 2GKIGIFFGTDSGNAEAIAEKISKAIG--NAEVVDVAKASKEQFNGFTKVILVAPTAGAGD59

1ag9A 2AITGIFFGSDTGNTENIAKMIQKQLGKDVADVHDIAKSSKEDLEAYDILLLGIPTWYYGE61

1fueA 60LQTDWEDFLGTLEASD-FANKTIGLVGLGDQDTYSETFAEGIFHIYEKAK--AGKVVGQT116

1ag9A 62AQCDWDDFFPTLE-EIDFNGKLVALFGCGDQEDYAEYFCDALGTIRDIIEPRGATIVGHW120

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C 14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

BLAST

PSI-BLAST 構造比較

構造比較

アミノ酸配列がほとんど似ていなくても立体構造は似ている場合がある

構造は配列より進化的に保存がよい 構造比較から新たなホモログが発見できる可能性

立体

構造

の変

アミノ酸配列の変化と立体構造の変化の相関(グロビン族)

立体構造の変化はアミノ酸配列の変化と相関配列が30以上一致していればRMSDは2Å以下

アミノ酸配列の類似度

2つの構造の類似性

ホモロジー (homology 相同)進化的起源を共有することによる類似多くの場合分子機能なども類似している

アナロジー (analogy 相似)進化的起源とは無関係な類似多くの場合分子機能など他の属性は似ていない物理化学的な構造の偏好が原因とされる

イルカの胸びれ サルの前足

チョウの羽 トリの翼

ネコの前足

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C

ldquoFlavodoxin-likerdquo fold (c23)

ldquoFlavoproteinsrdquo superfamily (c235)

ldquoCheY-likerdquosuperfamily(c231)

14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

AnalogyHomology

HomologyHomolo

gy

多く現れるフォールド(出現ドメイン数順)

太字はスーパーフォールド多くのスーパーファミリーを含むフォールド

d58

c1

g3

c23 b34

b1

a4フォールド名 (SCOP173によるクラスfhijkは除く) ドメイ

ンの数

スーパーファミリーの数

a4 DNARNA-binding 3-helical bundle 292 14c1 TIM betaalpha-barrel 269 33d58 Ferredoxin-like 248 55b1 Immunoglobulin-like beta sandwich 246 27c37 P-loop nucleoside triphosphate hydrolase 235 1c2 NAD(P)-binding Rossmann-fold domains 168 1g3 Knottins 154 19d15 Beta-Grasp(ubiquitin-like) 131 13c23 Flavodoxin-like 118 15b34 SH3-like barrel 117 18b40 OB-fold 100 12c66 SAM-dependent methyltransferases 95 1

c37 c2

d15

b40 c66

スーパーフォールド(Superfold)

フォールド名 (SCOP173によるクラスfhijkは除く) その下のスーパーファミリーの数

d58 Ferredoxin-like 55c1 TIM betaalpha-barrel 33b1 Immunoglobulin-like beta sandwich 27a24 Four-helical up-and-down bundle 27a118 Alpha-alpha superhelix 23g3 Knottins 19b34 SH3-like barrel 18g41 Rubredoxin-like 16c23 Flavodoxin-like 15a60 SAM(sterile alpha motif) domain-like 15b69 7-bladed beta-propeller 14a4 DNARNA-binding 3-helical bundle 14

スーパーフォールド多くのスーパーファミリーを含むフォールド

スーパーフォールドは「構造の類似と機能の類似が対応しにくいフォールド」ともいえる

d58

c1

g3a118

c23

a24

a60

b34

b1

g41

b69 a4

三本へリックスバンドルDNARNA‐binding 3‐helical bundle(a4)

Mating type protein A2 yeast(1k61Aa411)

(1gvdAa413)(1wh5Aa411)

三本のへリックスが束になった構造DNAやRNAに結合する蛋白質が多い

DNAと

結合した構造(1k61)

TIMバレルTIM betaalpha barrel (c1)

Triosephosphate isomerase1n55A(c111)

全般に解糖系の酵素が多い基質酵素反応は極めて多彩

八本のβストランドとαへリックスが交互に組み合わさり対称的な樽(barrel)構造を形成す

る中央の樽構造は平行のβシートからなる

Imidazole glycerol phosphate synthasesubunit hisF1thfD(c121)

KHGKDPG aldolase1euaA(c1101)

フェレドキシン様Ferredoxin‐like (d58)

4Fe-4S Ferredoxin(1fxdd581)

1 234 4本の逆平行のβストランドと2本のαへリックスからな

分子機能は極めて多彩

CheY binding domain of CheA(1eayCd5824)

U1A RNA binding domain(1nu4Ad5871)

免疫グロブリン様Immunoglobulin‐like beta sandwich(b1)

Immunoglobulin Heavy chain variabledomain 1mjuH1(b111)

Immunoglobulin Heavy chain constantdomain 1mjuH2(b112)

Macromomycin1noaA (b171)

免疫グロブリン分子はH鎖とL鎖から

なりそれぞれ免疫グロブリン様ドメインからできている

V

C

V

C

C

C

V

CV

CC

C

L鎖

H鎖H鎖 L鎖

細胞表面あるいは分泌蛋白質が多い免疫や分子認識に関する機能を担うことが多い

4本のβストランドからなるβシートが二枚サンドイッチ状に重なった構造をとる逆平行のβシートが主

P‐loop スーパーファミリーP‐loop nucleoside triphosphate hydrolase(c37)

Ras-related protein RAB-5A1r2qA(c3718)

Guanylate kinase1gkyA(c3711)

RecA proteinDomain1 1xmsA1(c37111)

平行のβシートが主トポロジーには様々な変異あり

シグナル伝達DNA結合

モーター機能など多彩な分子機能を担うがATP GTPなどのヌクレオシド

の加水分解を行う点は共通

N C

132 4 5 6

ヌクレオシド結合部GxxxxGKTの

配列モチーフ(P-loop)を持つ

ロスマン フォールドNAD(P)‐binding Rossmann‐fold domains (c2)

Alcohol dehydrogenase gamma chaindomain2 1u3wA(c211)

Aspartate beta-semialdehydedehydrogenase2gz1A1(c213)

L-alanine dehydrogenase1pjcA1(c214)

補酵素を利用したNAD(P)を脱水素酵素を持つ基質を認識するドメインは別に存在する

NC

123 4 5 6

平行のβシートが主

7枚羽 βプロペラ7‐bladed beta‐propeller (b69)

Garactose oxydasedomain3 1k3iA3(b6911)

Guanine nucleotide-bindingprotein subunit beta-11gotB(b6941)

細胞膜付近のシグナル伝達や糖結合に関わることが多い

Influenza Neuraminidase 1f8dA(b6811)

6枚羽 βプロペラ

N C

321 4

のユニットが7回円環状に繰り返しされたフォールド

立体構造比較プログラム1990年ごろから多くの構造比較プログラムが開発されている

WEBアドレス スコア アライメント

DALI httpwwwebiacukdali

距離の差を独自の関数で変換したスコア

局所アライメントをモンテカルロ法でつなぎ合わせる

CE httpclsdsceducehtml

局所的なRMSD 局所アライメントを積み上げていく

MATRAS httpbiunitnaistjpmatras

距離の変化が相同相似で起こる確率の比をスコアとする

SSEで仮アライメント

を生成残基アライメントを収束するまで反復する

タンパク質の相同性の判断基準

100

同一残基率30以上

BLASTのE-value lt 00001

PSI-BLASTのE-value lt 00001

0102030407025 15 535

同一残基率(Sequence Identity)()

立体構造比較が必要

(1)立体構造の類似性が高い(DALIのZスコアMATRASのRdisスコア)(2)同一残基率がそこそこ高い(PSI-BLASTでヒットするSeqIDgt=15ぐらい)

(3)分子機能に類似性がある(補酵素酵素反応基質代謝経路等の共通性等)(4)基質補酵素の結合部位が類似しておりそのアミノ酸が保存(モチーフ)(5)ドメイン構成の共通性(6)スーパーフォールドの場合は特別な注意が必要

配列解析

同一残基率が25以下の場合の相同性の判断基準

50608090

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 15: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

立体構造描画のフリーウエアシェアウエアソフト名 WebSite 対応機種 特徴

RasMol wwwopenrasmolorg Win Mac Linux(ソース公開)

独自の高速描画アルゴリズムを用い非力なハードでも同様に高速描画が可能コマンド言語は強力で多機能基本的な描画法をカバーするが分子表面の描画はできない描画の質はやや低い

Chime wwwmdlchimecom Win Mac RasMolをベースにしたWEBブラウザ内で動作するプラグイン分子表面表示など描画機能はRasMolより拡張分子描画機能を持ったWEBページを作れる

Jmol jmolsourceforgenet Win Mac Linux(ソース公開)

Java Applet によりWEBブラウザ内で動作Chimeと同様に分子描画機能を持ったWEBページを作れるJREをインストールする必要

PyMOL pymolsourceforgenet

Win Mac Linux

OpenGLを用いた質の高い描画Python言語で開発されておりソースも公開Python言語を用いた機能

拡張も可能

CHIMERA wwwcglucsfeduchimera

Win Mac Linux

OpenGLを用いた質の高い描画電顕画像などの多

様なデータの取り込みドッキング静電計算などのインタフェース有りPython言語を用いた機能拡張

VMD wwwksuiuceduResearchvmd

Win Mac Linux

OpenGLを用いた質の高い描画Tcl言語を用いた機

能拡張が可能分子動力学の可視化を主要目的として幅広い機能

MolScript wwwavatarsemolscrit

Linux(ソース公開)

主にリボン図の描画用のソフトGUIを持たずコマンドラインでPDBファイルをPSファイル等に変換

Swiss PDB Viewer

auexpasyorgspdbv Win Mac Linux

OpenGLを用いた質の高い描画幅広い機能をサ

ポートしているがアップデートは活発でない

H19 問51

タンパク質などの生体高分子をコンピュータで表示するためのソフトウェア名として適切でないものを選択肢の中から一つ選べ

1RasMol2Chime3TMHMM4Swiss-PdbViewer

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問51

タンパク質などの生体高分子をコンピュータで表示するためのソフトウェア名として適切でないものを選択肢の中から一つ選べ

1RasMol2Chime3TMHMM4Swiss-PdbViewer

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問59

タンパク質の立体構造のグラフィックス表示プログラムではないものを選択肢の中から一つ選べ

1Chime2PyMol3MEGA4MolScript

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問59

タンパク質の立体構造のグラフィックス表示プログラムではないものを選択肢の中から一つ選べ

1Chime2PyMol3MEGA4MolScript

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

PDBコード1fxd(ferredoxin II) Rasmol Chimeプラグインで描画

立体構造の描画スタイル

ワイアフレーム ボールスティック 空間充填

バックボーン リボン 分子表面

1 234

N

H C

O

Ala(A)(疎水性)

Phe(F)(疎水性)

Cys(C)(親水性)

Asp(D)(親水性)

Val(V)(疎水性)

Thr(親水性)

様々な物理化学的な性質を持った側鎖が主鎖のペプチド結合で連なる

Leu(L)(疎水性)

蛋白質ペプチド結合したアミノ酸群

アミノ酸は全部で20種類

I VL

M FYW H

KR

D E

P NSA Q

CG T

疎水性 親水性

脂肪族

芳香族正荷電

負荷電

N末

C末

変性状態(D) 天然状態(N)

フォールディング(折り畳み)という現象

非常に多種の構造の集合大きく広がっている

ほとんど唯一の構造小さくコンパクトに折りたたまっている

温度や変性剤濃度によって可逆に変化

折り畳みは原則としてその蛋白質以外の分子の介助を必要としない

アミノ酸配列の情報だけで天然状態の立体構造が決定される

どうやってコンパクトになるか rarr (1)主鎖の水素結合(2)側鎖間の疎水性相互作用

あるアミノ酸配列がどうやって一つの構造を決めるのか

3次元座標の差のスコア(RMSD)

並進ベクトルt を引いたあと回転行列R をかける

t 二つの分子の重心をあわせるように決めるR 2つの原子群の相関を 大化する行列rarr(1)特異値分解で導出

(2)四元数表現により 適な回転をLagrange未定乗数法で決定

sum=

minusminus=N

iiiN

RMSD1

2)](R[1 tyx

21

20

1

2

3

4

5

1xdaA

1

23

4

21

20

5

yi

)(R ty minusi

xi

1

23

4

21

20

5

原子の対応付けがわかっているとする

RMSD 適に重ね合わせたときのXYZ座標の差(Root Mean Square Deviation)

1benA

WKabsch Acta CrystA 32922-923(1976) 34827-828(1978)ADMclachlan JMolBiol 12874-77 (1979)Charles FF Karney ldquoQuaternions in molecular modelingrdquo E-print arXivphysics0506177

xi分子Xのi番目の原子の位置ベクトル yi分子Yのi番目の原子の位置ベクトル

距離の差のスコア (DRMS)

( )sumsum= ge

minusminus

=N

i

N

ij

Yij

Xij DD

NNDRMS

1

2

)1(2

21

20

1

2

3

4

5

YijD

XijD

1

23

4

21

20

5

yixi

DRMS 対応する原子ペアの距離の差(Distance-based RMSD)

原子の対応付けがわかっているとする

重ね合わせは不要なので計算は簡単

3次元によらない2次元や結合情報にも拡張できる

鏡像の区別はできない

1benA

計算が簡単なので高速な構造比較のアルゴリズムの基盤として使われる

1xdaA

H19 問73立体構造の似ている2つのタンパク質間で対応関係にある原子が分かっている場合にはRMSD(Root Mean Square Deviation)と呼ばれる数値を計算することにより立体構造の重なり合いの程度を数値化することができるRMSDは全ての対応する原子間の距離を

2乗した値の平均値(相加平均)にルートをとったものとして定義されるあるタンパク質における6つの原子ABCDEFと別のタンパク質の6つの原子

ArsquoBrsquoCrsquoDrsquoErsquoFrsquoについて対応関係が分かっており互いにもっともよく重なるように回転して重ねた時の対応原子間の距離は以下の表のようになったこの表からB-Brsquo C-Crsquo D-Drsquo E-Ersquoは正確に重なったが他の原子間ではずれが見られることがわかるここで6つの原子に対するRMSD値はいくらになるか選択肢の中からもっとも適切な値を一つ選べただ

し原子間距離の単位は考慮しないものとする

対応原子 距離

原子A―原子Arsquo 20

原子B―原子Brsquo 00

原子C―原子Crsquo 00

原子D―原子Crsquo 10

原子E―原子Crsquo 00

原子F―原子Crsquo 10

1 052 0663 104 133

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問73立体構造の似ている2つのタンパク質間で対応関係にある原子が分かっている場合にはRMSD(Root Mean Square Deviation)と呼ばれる数値を計算することにより立体構造の重なり合いの程度を数値化することができるRMSDは全ての対応する原子間の距離を

2乗した値の平均値(相加平均)にルートをとったものとして定義されるあるタンパク質における6つの原子ABCDEFと別のタンパク質の6つの原子

ArsquoBrsquoCrsquoDrsquoErsquoFrsquoについて対応関係が分かっており互いにもっともよく重なるように回転して重ねた時の対応原子間の距離は以下の表のようになったこの表からB-Brsquo C-Crsquo D-Drsquo E-Ersquoは正確に重なったが他の原子間ではずれが見られることがわかるここで6つの原子に対するRMSD値はいくらになるか選択肢の中からもっとも適切な値を一つ選べただ

し原子間距離の単位は考慮しないものとする

対応原子 距離

原子A―原子Arsquo 20

原子B―原子Brsquo 00

原子C―原子Crsquo 00

原子D―原子Crsquo 10

原子E―原子Crsquo 00

原子F―原子Crsquo 10

1 052 0663 104 133

RMSDは 適に重ね合わせたときの

「ずれの二乗の平均のルート」であるしたがってずれの二乗平均は

(22+0+0+1+0+1)6=66=1これのルートをとるとradic1=1

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

1

2

3

4

56

7

8

9

10

11

主鎖の水素結合αへリックス

1

2

34

56

78

9

10

11

O

N

CHN

N

H

H

CO Cα

i

i+3

i+4

HN O C

Cαi-1

i番目のCOがi+4番目のNHと水素結合を形成

36残基が1周期の右巻きらせん

NHO=Cが同じ向きに並ぶため

へリックス全体に電気双極子が発生

N末C末

ー +

主鎖の水素結合逆平行βシート

βターン

βターン

βヘアピン

βヘアピン

伸びた構造の1本1本をβストランドと呼ぶ二本以上のβストランドがシート状に並んだ構造をβシートと呼ぶ

βストランド

βストランド

βストランド

主鎖の水素結合平行βシート

βminusαminusβモチーフ

平行βシートがαへリックスで接続された構造モチーフ

βストランド

βストランド

βストランド

伸びた構造の1本1本をβストランドと呼ぶ二本以上のβストランドがシート状に並んだ構造をβシートと呼ぶ

Cαi

Cαi+1Cα

i-1φ ψ

ペプチド結合の平面性とφψの定義

主鎖の原子のXYZ座標はφψの2つ

の角度でほとんど記述できる

φψの角度を2次元にプロットしたものをラマチャンドランプロット(Ramachandran plot)という点が集中する領域は2次構造とよく対応

点が現れない領域は主鎖の原子が衝突する

βシート

αへリックス

左巻きへリックス

平面平面

φ

ψ

H19 問74タンパク質の主鎖に添って定義される二面角のうちφ(窒素原子と炭素原子の間の二面角)とψ(α炭素原子とカルボニル基の炭素原子の間の二面角)の値を各残

基ごとに計算して二次元にプロットしたものをラマチャンドランプロットと呼ぶ以下に示したラマチャンドランプロットに対する説明文の中でもっとも適切なものを一つ選べ

1 (a)(b)はともにαへリックスの領域である2 (a)(b)はともにβストランドの領域である3 (a)はαへリックス(b)はβストランドの領

域である4 (a)はβストランド(b)はαへリックスの領

域である

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問74タンパク質の主鎖に添って定義される二面角のうちφ(窒素原子と炭素原子の間の二面角)とψ(α炭素原子とカルボニル基の炭素原子の間の二面角)の値を各残

基ごとに計算して二次元にプロットしたものをラマチャンドランプロットと呼ぶ以下に示したラマチャンドランプロットに対する説明文の中でもっとも適切なものを一つ選べ

1 (a)(b)はともにαへリックスの領域である2 (a)(b)はともにβストランドの領域である3 (a)はαへリックス(b)はβストランドの領

域である4 (a)はβストランド(b)はαへリックスの領

域である

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

トポロジー図によるβシートの表現

4 23

N

C

1

1ubq (UbiquitinHumand151)

N

C123 4 5 6

1n8k (Alchol dehydrogenase E chain Horse c21)

ロスマンフォールド

βターン

βターン

1cauA1rhdA domain2

TOPSプログラムによる表示httpwwwtopsleedsacuk

1timA

はαへリックスはβストランドとなりあうの向きで平行逆平行を示す

コンタクトマップ

1ubq

C

4 23

N

1

縦横に残基を配置しある残基ペアのCα原子間の距離が10Å以下であれば対応するピクセルに色を塗る

分子描画ソフトVMDを用いて作成

平行のストランド間は方向逆平行ストランド間は方向に線分が観察される

N

C

N C

逆平行

逆平行

平行

αへリックスは太めの対角上の線分

へリックス

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから1か3コンタクトマップから平行シートしかないことがわかるため1であることがわかる

αβ5

αβ3

α

β4α

β1αβ2 β2

β1β3β4

β5

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから2か4コンタクトマップから平行シートしかないことがわかるため2であることがわかる

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

配列比較によるタンパク質分類1970年代から配列の一致度(sequence identity)に基づいてグループを作る作業が

行われてきた

どのくらいの類似性で一つにまとめるかは様々な考えがあるが少なくとも「相同なタンパク質群」を一つのグループにまとめるべき

ファミリー(family 族)

進化的に関係のある(相同な)タンパク質グループのこと

複数のファミリーがあつまった大きなグループ スーパーファミリー(superfamily clan)

一つのファミリーの中の小さなグループ サブファミリー(subfamily)

family

subfamily superfamily

ドメイン単位による分類

A2 B2

B3 C3

A1

配列1

配列2

配列3

配列の部分どうしだけが類似していた場合 部分一致を重視するとすべて一つのグループになるがhellip

配列1

配列2 配列3

Aを共有

Bを共有

1と2が類似2と3が類似していても1と3は類似していない

ドメインに分割すると

A1

A2

B2

B3

C3

A2 B2

B3 C3

A1

きれいに分類することができる

Pfam 蛋白質ファミリのデータベース各蛋白質ファミリのマルチプル

アライメント HMMなどを集めたデータベース

httppfamsangeracuk

Pkinase_Tyrドメインをもつタンパク質の例

ABL_HUMAN

BTK_HUMAN

ILK_HUMAN

MERTK_HUMAN

PGFRB_HUMAN

HCK_HUMAN

Family Pkinase_Tyr (PF07714) Protein tyrosine kinase

Pfamデータベース(httppfamsangeracukSoftwarePfam)からの引用

ドメイン構造と疎水性の関係Tyrosine protein kinase HCK (1ad5A HCK_HUMAN)

SH3 domain

SH2 domain

Tyrosine-kinase domain

3つの分断された疎水性コアrarr ドメイン構造

大きなタンパク質はいくつかの構造上のまとまり(ドメイン)を持つことが多い

立体構造によるタンパク質の分類

bull 配列による分類の延長ドメイン単位の分類進化的に関係のある(相同な)タンパク質を群にする(ファミリー)という考え方は同じ

bull 立体構造の類似性からより遠縁の相同性を見つけより大きな群を作る(スーパーファミリー)

bull スーパーファミリーをまとめたさらに大きなグループ(フォールドクラス)

bull 主にアミノ酸(Cαレベル)のラフな構造の類似性に

着目

bull 分類対象は主に球状タンパク質

立体構造分類データベースSCOPhttpscopmrc-lmbcamacukscop

4階層で分類Class(クラス)

Fold(フォールド)

Superfamily(スーパーファミリー)

Family(ファミリー)

どの階層に分類するかは配列の類似性立体構造の類似性分子機能の類似性機能部位の類似性

を専門家が総合的に判断して決める

1akr

ltホモロジーgt

ltアナロジーgt

他の構造分類データベースとしてCATHが有名

同様に階層的な分類体系を持つがその詳細はSCOPとは異なる

クラス

1mbd

1mqkH

1n55A 1pqwA

1fxd 1a2p

all-α (a)

all-β (b)

αβ (c)

α+β (d)

α-へリックスが中心

β-シートが中心

逆平行が多い

α-へリックスとβ-シートが配列上交互に現れる平行β-シートが中心

α-へリックスとβ-シートが混在配列上の並びの規則はない逆平行と平行のβ-シートが混在

アミノ酸配列と立体構造の関係ピロリ菌と大腸菌のフラボドキシン (同一残基率 SeqID 44)

ピロリ菌(1fueA) 大腸菌(1ag9A)

配列が似ていれば立体構造も似ている

SeqID = 44

RMSD = 12 Å

1fueA 2GKIGIFFGTDSGNAEAIAEKISKAIG--NAEVVDVAKASKEQFNGFTKVILVAPTAGAGD59

1ag9A 2AITGIFFGSDTGNTENIAKMIQKQLGKDVADVHDIAKSSKEDLEAYDILLLGIPTWYYGE61

1fueA 60LQTDWEDFLGTLEASD-FANKTIGLVGLGDQDTYSETFAEGIFHIYEKAK--AGKVVGQT116

1ag9A 62AQCDWDDFFPTLE-EIDFNGKLVALFGCGDQEDYAEYFCDALGTIRDIIEPRGATIVGHW120

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C 14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

BLAST

PSI-BLAST 構造比較

構造比較

アミノ酸配列がほとんど似ていなくても立体構造は似ている場合がある

構造は配列より進化的に保存がよい 構造比較から新たなホモログが発見できる可能性

立体

構造

の変

アミノ酸配列の変化と立体構造の変化の相関(グロビン族)

立体構造の変化はアミノ酸配列の変化と相関配列が30以上一致していればRMSDは2Å以下

アミノ酸配列の類似度

2つの構造の類似性

ホモロジー (homology 相同)進化的起源を共有することによる類似多くの場合分子機能なども類似している

アナロジー (analogy 相似)進化的起源とは無関係な類似多くの場合分子機能など他の属性は似ていない物理化学的な構造の偏好が原因とされる

イルカの胸びれ サルの前足

チョウの羽 トリの翼

ネコの前足

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C

ldquoFlavodoxin-likerdquo fold (c23)

ldquoFlavoproteinsrdquo superfamily (c235)

ldquoCheY-likerdquosuperfamily(c231)

14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

AnalogyHomology

HomologyHomolo

gy

多く現れるフォールド(出現ドメイン数順)

太字はスーパーフォールド多くのスーパーファミリーを含むフォールド

d58

c1

g3

c23 b34

b1

a4フォールド名 (SCOP173によるクラスfhijkは除く) ドメイ

ンの数

スーパーファミリーの数

a4 DNARNA-binding 3-helical bundle 292 14c1 TIM betaalpha-barrel 269 33d58 Ferredoxin-like 248 55b1 Immunoglobulin-like beta sandwich 246 27c37 P-loop nucleoside triphosphate hydrolase 235 1c2 NAD(P)-binding Rossmann-fold domains 168 1g3 Knottins 154 19d15 Beta-Grasp(ubiquitin-like) 131 13c23 Flavodoxin-like 118 15b34 SH3-like barrel 117 18b40 OB-fold 100 12c66 SAM-dependent methyltransferases 95 1

c37 c2

d15

b40 c66

スーパーフォールド(Superfold)

フォールド名 (SCOP173によるクラスfhijkは除く) その下のスーパーファミリーの数

d58 Ferredoxin-like 55c1 TIM betaalpha-barrel 33b1 Immunoglobulin-like beta sandwich 27a24 Four-helical up-and-down bundle 27a118 Alpha-alpha superhelix 23g3 Knottins 19b34 SH3-like barrel 18g41 Rubredoxin-like 16c23 Flavodoxin-like 15a60 SAM(sterile alpha motif) domain-like 15b69 7-bladed beta-propeller 14a4 DNARNA-binding 3-helical bundle 14

スーパーフォールド多くのスーパーファミリーを含むフォールド

スーパーフォールドは「構造の類似と機能の類似が対応しにくいフォールド」ともいえる

d58

c1

g3a118

c23

a24

a60

b34

b1

g41

b69 a4

三本へリックスバンドルDNARNA‐binding 3‐helical bundle(a4)

Mating type protein A2 yeast(1k61Aa411)

(1gvdAa413)(1wh5Aa411)

三本のへリックスが束になった構造DNAやRNAに結合する蛋白質が多い

DNAと

結合した構造(1k61)

TIMバレルTIM betaalpha barrel (c1)

Triosephosphate isomerase1n55A(c111)

全般に解糖系の酵素が多い基質酵素反応は極めて多彩

八本のβストランドとαへリックスが交互に組み合わさり対称的な樽(barrel)構造を形成す

る中央の樽構造は平行のβシートからなる

Imidazole glycerol phosphate synthasesubunit hisF1thfD(c121)

KHGKDPG aldolase1euaA(c1101)

フェレドキシン様Ferredoxin‐like (d58)

4Fe-4S Ferredoxin(1fxdd581)

1 234 4本の逆平行のβストランドと2本のαへリックスからな

分子機能は極めて多彩

CheY binding domain of CheA(1eayCd5824)

U1A RNA binding domain(1nu4Ad5871)

免疫グロブリン様Immunoglobulin‐like beta sandwich(b1)

Immunoglobulin Heavy chain variabledomain 1mjuH1(b111)

Immunoglobulin Heavy chain constantdomain 1mjuH2(b112)

Macromomycin1noaA (b171)

免疫グロブリン分子はH鎖とL鎖から

なりそれぞれ免疫グロブリン様ドメインからできている

V

C

V

C

C

C

V

CV

CC

C

L鎖

H鎖H鎖 L鎖

細胞表面あるいは分泌蛋白質が多い免疫や分子認識に関する機能を担うことが多い

4本のβストランドからなるβシートが二枚サンドイッチ状に重なった構造をとる逆平行のβシートが主

P‐loop スーパーファミリーP‐loop nucleoside triphosphate hydrolase(c37)

Ras-related protein RAB-5A1r2qA(c3718)

Guanylate kinase1gkyA(c3711)

RecA proteinDomain1 1xmsA1(c37111)

平行のβシートが主トポロジーには様々な変異あり

シグナル伝達DNA結合

モーター機能など多彩な分子機能を担うがATP GTPなどのヌクレオシド

の加水分解を行う点は共通

N C

132 4 5 6

ヌクレオシド結合部GxxxxGKTの

配列モチーフ(P-loop)を持つ

ロスマン フォールドNAD(P)‐binding Rossmann‐fold domains (c2)

Alcohol dehydrogenase gamma chaindomain2 1u3wA(c211)

Aspartate beta-semialdehydedehydrogenase2gz1A1(c213)

L-alanine dehydrogenase1pjcA1(c214)

補酵素を利用したNAD(P)を脱水素酵素を持つ基質を認識するドメインは別に存在する

NC

123 4 5 6

平行のβシートが主

7枚羽 βプロペラ7‐bladed beta‐propeller (b69)

Garactose oxydasedomain3 1k3iA3(b6911)

Guanine nucleotide-bindingprotein subunit beta-11gotB(b6941)

細胞膜付近のシグナル伝達や糖結合に関わることが多い

Influenza Neuraminidase 1f8dA(b6811)

6枚羽 βプロペラ

N C

321 4

のユニットが7回円環状に繰り返しされたフォールド

立体構造比較プログラム1990年ごろから多くの構造比較プログラムが開発されている

WEBアドレス スコア アライメント

DALI httpwwwebiacukdali

距離の差を独自の関数で変換したスコア

局所アライメントをモンテカルロ法でつなぎ合わせる

CE httpclsdsceducehtml

局所的なRMSD 局所アライメントを積み上げていく

MATRAS httpbiunitnaistjpmatras

距離の変化が相同相似で起こる確率の比をスコアとする

SSEで仮アライメント

を生成残基アライメントを収束するまで反復する

タンパク質の相同性の判断基準

100

同一残基率30以上

BLASTのE-value lt 00001

PSI-BLASTのE-value lt 00001

0102030407025 15 535

同一残基率(Sequence Identity)()

立体構造比較が必要

(1)立体構造の類似性が高い(DALIのZスコアMATRASのRdisスコア)(2)同一残基率がそこそこ高い(PSI-BLASTでヒットするSeqIDgt=15ぐらい)

(3)分子機能に類似性がある(補酵素酵素反応基質代謝経路等の共通性等)(4)基質補酵素の結合部位が類似しておりそのアミノ酸が保存(モチーフ)(5)ドメイン構成の共通性(6)スーパーフォールドの場合は特別な注意が必要

配列解析

同一残基率が25以下の場合の相同性の判断基準

50608090

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 16: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

H19 問51

タンパク質などの生体高分子をコンピュータで表示するためのソフトウェア名として適切でないものを選択肢の中から一つ選べ

1RasMol2Chime3TMHMM4Swiss-PdbViewer

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問51

タンパク質などの生体高分子をコンピュータで表示するためのソフトウェア名として適切でないものを選択肢の中から一つ選べ

1RasMol2Chime3TMHMM4Swiss-PdbViewer

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問59

タンパク質の立体構造のグラフィックス表示プログラムではないものを選択肢の中から一つ選べ

1Chime2PyMol3MEGA4MolScript

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問59

タンパク質の立体構造のグラフィックス表示プログラムではないものを選択肢の中から一つ選べ

1Chime2PyMol3MEGA4MolScript

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

PDBコード1fxd(ferredoxin II) Rasmol Chimeプラグインで描画

立体構造の描画スタイル

ワイアフレーム ボールスティック 空間充填

バックボーン リボン 分子表面

1 234

N

H C

O

Ala(A)(疎水性)

Phe(F)(疎水性)

Cys(C)(親水性)

Asp(D)(親水性)

Val(V)(疎水性)

Thr(親水性)

様々な物理化学的な性質を持った側鎖が主鎖のペプチド結合で連なる

Leu(L)(疎水性)

蛋白質ペプチド結合したアミノ酸群

アミノ酸は全部で20種類

I VL

M FYW H

KR

D E

P NSA Q

CG T

疎水性 親水性

脂肪族

芳香族正荷電

負荷電

N末

C末

変性状態(D) 天然状態(N)

フォールディング(折り畳み)という現象

非常に多種の構造の集合大きく広がっている

ほとんど唯一の構造小さくコンパクトに折りたたまっている

温度や変性剤濃度によって可逆に変化

折り畳みは原則としてその蛋白質以外の分子の介助を必要としない

アミノ酸配列の情報だけで天然状態の立体構造が決定される

どうやってコンパクトになるか rarr (1)主鎖の水素結合(2)側鎖間の疎水性相互作用

あるアミノ酸配列がどうやって一つの構造を決めるのか

3次元座標の差のスコア(RMSD)

並進ベクトルt を引いたあと回転行列R をかける

t 二つの分子の重心をあわせるように決めるR 2つの原子群の相関を 大化する行列rarr(1)特異値分解で導出

(2)四元数表現により 適な回転をLagrange未定乗数法で決定

sum=

minusminus=N

iiiN

RMSD1

2)](R[1 tyx

21

20

1

2

3

4

5

1xdaA

1

23

4

21

20

5

yi

)(R ty minusi

xi

1

23

4

21

20

5

原子の対応付けがわかっているとする

RMSD 適に重ね合わせたときのXYZ座標の差(Root Mean Square Deviation)

1benA

WKabsch Acta CrystA 32922-923(1976) 34827-828(1978)ADMclachlan JMolBiol 12874-77 (1979)Charles FF Karney ldquoQuaternions in molecular modelingrdquo E-print arXivphysics0506177

xi分子Xのi番目の原子の位置ベクトル yi分子Yのi番目の原子の位置ベクトル

距離の差のスコア (DRMS)

( )sumsum= ge

minusminus

=N

i

N

ij

Yij

Xij DD

NNDRMS

1

2

)1(2

21

20

1

2

3

4

5

YijD

XijD

1

23

4

21

20

5

yixi

DRMS 対応する原子ペアの距離の差(Distance-based RMSD)

原子の対応付けがわかっているとする

重ね合わせは不要なので計算は簡単

3次元によらない2次元や結合情報にも拡張できる

鏡像の区別はできない

1benA

計算が簡単なので高速な構造比較のアルゴリズムの基盤として使われる

1xdaA

H19 問73立体構造の似ている2つのタンパク質間で対応関係にある原子が分かっている場合にはRMSD(Root Mean Square Deviation)と呼ばれる数値を計算することにより立体構造の重なり合いの程度を数値化することができるRMSDは全ての対応する原子間の距離を

2乗した値の平均値(相加平均)にルートをとったものとして定義されるあるタンパク質における6つの原子ABCDEFと別のタンパク質の6つの原子

ArsquoBrsquoCrsquoDrsquoErsquoFrsquoについて対応関係が分かっており互いにもっともよく重なるように回転して重ねた時の対応原子間の距離は以下の表のようになったこの表からB-Brsquo C-Crsquo D-Drsquo E-Ersquoは正確に重なったが他の原子間ではずれが見られることがわかるここで6つの原子に対するRMSD値はいくらになるか選択肢の中からもっとも適切な値を一つ選べただ

し原子間距離の単位は考慮しないものとする

対応原子 距離

原子A―原子Arsquo 20

原子B―原子Brsquo 00

原子C―原子Crsquo 00

原子D―原子Crsquo 10

原子E―原子Crsquo 00

原子F―原子Crsquo 10

1 052 0663 104 133

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問73立体構造の似ている2つのタンパク質間で対応関係にある原子が分かっている場合にはRMSD(Root Mean Square Deviation)と呼ばれる数値を計算することにより立体構造の重なり合いの程度を数値化することができるRMSDは全ての対応する原子間の距離を

2乗した値の平均値(相加平均)にルートをとったものとして定義されるあるタンパク質における6つの原子ABCDEFと別のタンパク質の6つの原子

ArsquoBrsquoCrsquoDrsquoErsquoFrsquoについて対応関係が分かっており互いにもっともよく重なるように回転して重ねた時の対応原子間の距離は以下の表のようになったこの表からB-Brsquo C-Crsquo D-Drsquo E-Ersquoは正確に重なったが他の原子間ではずれが見られることがわかるここで6つの原子に対するRMSD値はいくらになるか選択肢の中からもっとも適切な値を一つ選べただ

し原子間距離の単位は考慮しないものとする

対応原子 距離

原子A―原子Arsquo 20

原子B―原子Brsquo 00

原子C―原子Crsquo 00

原子D―原子Crsquo 10

原子E―原子Crsquo 00

原子F―原子Crsquo 10

1 052 0663 104 133

RMSDは 適に重ね合わせたときの

「ずれの二乗の平均のルート」であるしたがってずれの二乗平均は

(22+0+0+1+0+1)6=66=1これのルートをとるとradic1=1

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

1

2

3

4

56

7

8

9

10

11

主鎖の水素結合αへリックス

1

2

34

56

78

9

10

11

O

N

CHN

N

H

H

CO Cα

i

i+3

i+4

HN O C

Cαi-1

i番目のCOがi+4番目のNHと水素結合を形成

36残基が1周期の右巻きらせん

NHO=Cが同じ向きに並ぶため

へリックス全体に電気双極子が発生

N末C末

ー +

主鎖の水素結合逆平行βシート

βターン

βターン

βヘアピン

βヘアピン

伸びた構造の1本1本をβストランドと呼ぶ二本以上のβストランドがシート状に並んだ構造をβシートと呼ぶ

βストランド

βストランド

βストランド

主鎖の水素結合平行βシート

βminusαminusβモチーフ

平行βシートがαへリックスで接続された構造モチーフ

βストランド

βストランド

βストランド

伸びた構造の1本1本をβストランドと呼ぶ二本以上のβストランドがシート状に並んだ構造をβシートと呼ぶ

Cαi

Cαi+1Cα

i-1φ ψ

ペプチド結合の平面性とφψの定義

主鎖の原子のXYZ座標はφψの2つ

の角度でほとんど記述できる

φψの角度を2次元にプロットしたものをラマチャンドランプロット(Ramachandran plot)という点が集中する領域は2次構造とよく対応

点が現れない領域は主鎖の原子が衝突する

βシート

αへリックス

左巻きへリックス

平面平面

φ

ψ

H19 問74タンパク質の主鎖に添って定義される二面角のうちφ(窒素原子と炭素原子の間の二面角)とψ(α炭素原子とカルボニル基の炭素原子の間の二面角)の値を各残

基ごとに計算して二次元にプロットしたものをラマチャンドランプロットと呼ぶ以下に示したラマチャンドランプロットに対する説明文の中でもっとも適切なものを一つ選べ

1 (a)(b)はともにαへリックスの領域である2 (a)(b)はともにβストランドの領域である3 (a)はαへリックス(b)はβストランドの領

域である4 (a)はβストランド(b)はαへリックスの領

域である

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問74タンパク質の主鎖に添って定義される二面角のうちφ(窒素原子と炭素原子の間の二面角)とψ(α炭素原子とカルボニル基の炭素原子の間の二面角)の値を各残

基ごとに計算して二次元にプロットしたものをラマチャンドランプロットと呼ぶ以下に示したラマチャンドランプロットに対する説明文の中でもっとも適切なものを一つ選べ

1 (a)(b)はともにαへリックスの領域である2 (a)(b)はともにβストランドの領域である3 (a)はαへリックス(b)はβストランドの領

域である4 (a)はβストランド(b)はαへリックスの領

域である

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

トポロジー図によるβシートの表現

4 23

N

C

1

1ubq (UbiquitinHumand151)

N

C123 4 5 6

1n8k (Alchol dehydrogenase E chain Horse c21)

ロスマンフォールド

βターン

βターン

1cauA1rhdA domain2

TOPSプログラムによる表示httpwwwtopsleedsacuk

1timA

はαへリックスはβストランドとなりあうの向きで平行逆平行を示す

コンタクトマップ

1ubq

C

4 23

N

1

縦横に残基を配置しある残基ペアのCα原子間の距離が10Å以下であれば対応するピクセルに色を塗る

分子描画ソフトVMDを用いて作成

平行のストランド間は方向逆平行ストランド間は方向に線分が観察される

N

C

N C

逆平行

逆平行

平行

αへリックスは太めの対角上の線分

へリックス

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから1か3コンタクトマップから平行シートしかないことがわかるため1であることがわかる

αβ5

αβ3

α

β4α

β1αβ2 β2

β1β3β4

β5

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから2か4コンタクトマップから平行シートしかないことがわかるため2であることがわかる

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

配列比較によるタンパク質分類1970年代から配列の一致度(sequence identity)に基づいてグループを作る作業が

行われてきた

どのくらいの類似性で一つにまとめるかは様々な考えがあるが少なくとも「相同なタンパク質群」を一つのグループにまとめるべき

ファミリー(family 族)

進化的に関係のある(相同な)タンパク質グループのこと

複数のファミリーがあつまった大きなグループ スーパーファミリー(superfamily clan)

一つのファミリーの中の小さなグループ サブファミリー(subfamily)

family

subfamily superfamily

ドメイン単位による分類

A2 B2

B3 C3

A1

配列1

配列2

配列3

配列の部分どうしだけが類似していた場合 部分一致を重視するとすべて一つのグループになるがhellip

配列1

配列2 配列3

Aを共有

Bを共有

1と2が類似2と3が類似していても1と3は類似していない

ドメインに分割すると

A1

A2

B2

B3

C3

A2 B2

B3 C3

A1

きれいに分類することができる

Pfam 蛋白質ファミリのデータベース各蛋白質ファミリのマルチプル

アライメント HMMなどを集めたデータベース

httppfamsangeracuk

Pkinase_Tyrドメインをもつタンパク質の例

ABL_HUMAN

BTK_HUMAN

ILK_HUMAN

MERTK_HUMAN

PGFRB_HUMAN

HCK_HUMAN

Family Pkinase_Tyr (PF07714) Protein tyrosine kinase

Pfamデータベース(httppfamsangeracukSoftwarePfam)からの引用

ドメイン構造と疎水性の関係Tyrosine protein kinase HCK (1ad5A HCK_HUMAN)

SH3 domain

SH2 domain

Tyrosine-kinase domain

3つの分断された疎水性コアrarr ドメイン構造

大きなタンパク質はいくつかの構造上のまとまり(ドメイン)を持つことが多い

立体構造によるタンパク質の分類

bull 配列による分類の延長ドメイン単位の分類進化的に関係のある(相同な)タンパク質を群にする(ファミリー)という考え方は同じ

bull 立体構造の類似性からより遠縁の相同性を見つけより大きな群を作る(スーパーファミリー)

bull スーパーファミリーをまとめたさらに大きなグループ(フォールドクラス)

bull 主にアミノ酸(Cαレベル)のラフな構造の類似性に

着目

bull 分類対象は主に球状タンパク質

立体構造分類データベースSCOPhttpscopmrc-lmbcamacukscop

4階層で分類Class(クラス)

Fold(フォールド)

Superfamily(スーパーファミリー)

Family(ファミリー)

どの階層に分類するかは配列の類似性立体構造の類似性分子機能の類似性機能部位の類似性

を専門家が総合的に判断して決める

1akr

ltホモロジーgt

ltアナロジーgt

他の構造分類データベースとしてCATHが有名

同様に階層的な分類体系を持つがその詳細はSCOPとは異なる

クラス

1mbd

1mqkH

1n55A 1pqwA

1fxd 1a2p

all-α (a)

all-β (b)

αβ (c)

α+β (d)

α-へリックスが中心

β-シートが中心

逆平行が多い

α-へリックスとβ-シートが配列上交互に現れる平行β-シートが中心

α-へリックスとβ-シートが混在配列上の並びの規則はない逆平行と平行のβ-シートが混在

アミノ酸配列と立体構造の関係ピロリ菌と大腸菌のフラボドキシン (同一残基率 SeqID 44)

ピロリ菌(1fueA) 大腸菌(1ag9A)

配列が似ていれば立体構造も似ている

SeqID = 44

RMSD = 12 Å

1fueA 2GKIGIFFGTDSGNAEAIAEKISKAIG--NAEVVDVAKASKEQFNGFTKVILVAPTAGAGD59

1ag9A 2AITGIFFGSDTGNTENIAKMIQKQLGKDVADVHDIAKSSKEDLEAYDILLLGIPTWYYGE61

1fueA 60LQTDWEDFLGTLEASD-FANKTIGLVGLGDQDTYSETFAEGIFHIYEKAK--AGKVVGQT116

1ag9A 62AQCDWDDFFPTLE-EIDFNGKLVALFGCGDQEDYAEYFCDALGTIRDIIEPRGATIVGHW120

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C 14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

BLAST

PSI-BLAST 構造比較

構造比較

アミノ酸配列がほとんど似ていなくても立体構造は似ている場合がある

構造は配列より進化的に保存がよい 構造比較から新たなホモログが発見できる可能性

立体

構造

の変

アミノ酸配列の変化と立体構造の変化の相関(グロビン族)

立体構造の変化はアミノ酸配列の変化と相関配列が30以上一致していればRMSDは2Å以下

アミノ酸配列の類似度

2つの構造の類似性

ホモロジー (homology 相同)進化的起源を共有することによる類似多くの場合分子機能なども類似している

アナロジー (analogy 相似)進化的起源とは無関係な類似多くの場合分子機能など他の属性は似ていない物理化学的な構造の偏好が原因とされる

イルカの胸びれ サルの前足

チョウの羽 トリの翼

ネコの前足

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C

ldquoFlavodoxin-likerdquo fold (c23)

ldquoFlavoproteinsrdquo superfamily (c235)

ldquoCheY-likerdquosuperfamily(c231)

14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

AnalogyHomology

HomologyHomolo

gy

多く現れるフォールド(出現ドメイン数順)

太字はスーパーフォールド多くのスーパーファミリーを含むフォールド

d58

c1

g3

c23 b34

b1

a4フォールド名 (SCOP173によるクラスfhijkは除く) ドメイ

ンの数

スーパーファミリーの数

a4 DNARNA-binding 3-helical bundle 292 14c1 TIM betaalpha-barrel 269 33d58 Ferredoxin-like 248 55b1 Immunoglobulin-like beta sandwich 246 27c37 P-loop nucleoside triphosphate hydrolase 235 1c2 NAD(P)-binding Rossmann-fold domains 168 1g3 Knottins 154 19d15 Beta-Grasp(ubiquitin-like) 131 13c23 Flavodoxin-like 118 15b34 SH3-like barrel 117 18b40 OB-fold 100 12c66 SAM-dependent methyltransferases 95 1

c37 c2

d15

b40 c66

スーパーフォールド(Superfold)

フォールド名 (SCOP173によるクラスfhijkは除く) その下のスーパーファミリーの数

d58 Ferredoxin-like 55c1 TIM betaalpha-barrel 33b1 Immunoglobulin-like beta sandwich 27a24 Four-helical up-and-down bundle 27a118 Alpha-alpha superhelix 23g3 Knottins 19b34 SH3-like barrel 18g41 Rubredoxin-like 16c23 Flavodoxin-like 15a60 SAM(sterile alpha motif) domain-like 15b69 7-bladed beta-propeller 14a4 DNARNA-binding 3-helical bundle 14

スーパーフォールド多くのスーパーファミリーを含むフォールド

スーパーフォールドは「構造の類似と機能の類似が対応しにくいフォールド」ともいえる

d58

c1

g3a118

c23

a24

a60

b34

b1

g41

b69 a4

三本へリックスバンドルDNARNA‐binding 3‐helical bundle(a4)

Mating type protein A2 yeast(1k61Aa411)

(1gvdAa413)(1wh5Aa411)

三本のへリックスが束になった構造DNAやRNAに結合する蛋白質が多い

DNAと

結合した構造(1k61)

TIMバレルTIM betaalpha barrel (c1)

Triosephosphate isomerase1n55A(c111)

全般に解糖系の酵素が多い基質酵素反応は極めて多彩

八本のβストランドとαへリックスが交互に組み合わさり対称的な樽(barrel)構造を形成す

る中央の樽構造は平行のβシートからなる

Imidazole glycerol phosphate synthasesubunit hisF1thfD(c121)

KHGKDPG aldolase1euaA(c1101)

フェレドキシン様Ferredoxin‐like (d58)

4Fe-4S Ferredoxin(1fxdd581)

1 234 4本の逆平行のβストランドと2本のαへリックスからな

分子機能は極めて多彩

CheY binding domain of CheA(1eayCd5824)

U1A RNA binding domain(1nu4Ad5871)

免疫グロブリン様Immunoglobulin‐like beta sandwich(b1)

Immunoglobulin Heavy chain variabledomain 1mjuH1(b111)

Immunoglobulin Heavy chain constantdomain 1mjuH2(b112)

Macromomycin1noaA (b171)

免疫グロブリン分子はH鎖とL鎖から

なりそれぞれ免疫グロブリン様ドメインからできている

V

C

V

C

C

C

V

CV

CC

C

L鎖

H鎖H鎖 L鎖

細胞表面あるいは分泌蛋白質が多い免疫や分子認識に関する機能を担うことが多い

4本のβストランドからなるβシートが二枚サンドイッチ状に重なった構造をとる逆平行のβシートが主

P‐loop スーパーファミリーP‐loop nucleoside triphosphate hydrolase(c37)

Ras-related protein RAB-5A1r2qA(c3718)

Guanylate kinase1gkyA(c3711)

RecA proteinDomain1 1xmsA1(c37111)

平行のβシートが主トポロジーには様々な変異あり

シグナル伝達DNA結合

モーター機能など多彩な分子機能を担うがATP GTPなどのヌクレオシド

の加水分解を行う点は共通

N C

132 4 5 6

ヌクレオシド結合部GxxxxGKTの

配列モチーフ(P-loop)を持つ

ロスマン フォールドNAD(P)‐binding Rossmann‐fold domains (c2)

Alcohol dehydrogenase gamma chaindomain2 1u3wA(c211)

Aspartate beta-semialdehydedehydrogenase2gz1A1(c213)

L-alanine dehydrogenase1pjcA1(c214)

補酵素を利用したNAD(P)を脱水素酵素を持つ基質を認識するドメインは別に存在する

NC

123 4 5 6

平行のβシートが主

7枚羽 βプロペラ7‐bladed beta‐propeller (b69)

Garactose oxydasedomain3 1k3iA3(b6911)

Guanine nucleotide-bindingprotein subunit beta-11gotB(b6941)

細胞膜付近のシグナル伝達や糖結合に関わることが多い

Influenza Neuraminidase 1f8dA(b6811)

6枚羽 βプロペラ

N C

321 4

のユニットが7回円環状に繰り返しされたフォールド

立体構造比較プログラム1990年ごろから多くの構造比較プログラムが開発されている

WEBアドレス スコア アライメント

DALI httpwwwebiacukdali

距離の差を独自の関数で変換したスコア

局所アライメントをモンテカルロ法でつなぎ合わせる

CE httpclsdsceducehtml

局所的なRMSD 局所アライメントを積み上げていく

MATRAS httpbiunitnaistjpmatras

距離の変化が相同相似で起こる確率の比をスコアとする

SSEで仮アライメント

を生成残基アライメントを収束するまで反復する

タンパク質の相同性の判断基準

100

同一残基率30以上

BLASTのE-value lt 00001

PSI-BLASTのE-value lt 00001

0102030407025 15 535

同一残基率(Sequence Identity)()

立体構造比較が必要

(1)立体構造の類似性が高い(DALIのZスコアMATRASのRdisスコア)(2)同一残基率がそこそこ高い(PSI-BLASTでヒットするSeqIDgt=15ぐらい)

(3)分子機能に類似性がある(補酵素酵素反応基質代謝経路等の共通性等)(4)基質補酵素の結合部位が類似しておりそのアミノ酸が保存(モチーフ)(5)ドメイン構成の共通性(6)スーパーフォールドの場合は特別な注意が必要

配列解析

同一残基率が25以下の場合の相同性の判断基準

50608090

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 17: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

H19 問51

タンパク質などの生体高分子をコンピュータで表示するためのソフトウェア名として適切でないものを選択肢の中から一つ選べ

1RasMol2Chime3TMHMM4Swiss-PdbViewer

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問59

タンパク質の立体構造のグラフィックス表示プログラムではないものを選択肢の中から一つ選べ

1Chime2PyMol3MEGA4MolScript

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問59

タンパク質の立体構造のグラフィックス表示プログラムではないものを選択肢の中から一つ選べ

1Chime2PyMol3MEGA4MolScript

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

PDBコード1fxd(ferredoxin II) Rasmol Chimeプラグインで描画

立体構造の描画スタイル

ワイアフレーム ボールスティック 空間充填

バックボーン リボン 分子表面

1 234

N

H C

O

Ala(A)(疎水性)

Phe(F)(疎水性)

Cys(C)(親水性)

Asp(D)(親水性)

Val(V)(疎水性)

Thr(親水性)

様々な物理化学的な性質を持った側鎖が主鎖のペプチド結合で連なる

Leu(L)(疎水性)

蛋白質ペプチド結合したアミノ酸群

アミノ酸は全部で20種類

I VL

M FYW H

KR

D E

P NSA Q

CG T

疎水性 親水性

脂肪族

芳香族正荷電

負荷電

N末

C末

変性状態(D) 天然状態(N)

フォールディング(折り畳み)という現象

非常に多種の構造の集合大きく広がっている

ほとんど唯一の構造小さくコンパクトに折りたたまっている

温度や変性剤濃度によって可逆に変化

折り畳みは原則としてその蛋白質以外の分子の介助を必要としない

アミノ酸配列の情報だけで天然状態の立体構造が決定される

どうやってコンパクトになるか rarr (1)主鎖の水素結合(2)側鎖間の疎水性相互作用

あるアミノ酸配列がどうやって一つの構造を決めるのか

3次元座標の差のスコア(RMSD)

並進ベクトルt を引いたあと回転行列R をかける

t 二つの分子の重心をあわせるように決めるR 2つの原子群の相関を 大化する行列rarr(1)特異値分解で導出

(2)四元数表現により 適な回転をLagrange未定乗数法で決定

sum=

minusminus=N

iiiN

RMSD1

2)](R[1 tyx

21

20

1

2

3

4

5

1xdaA

1

23

4

21

20

5

yi

)(R ty minusi

xi

1

23

4

21

20

5

原子の対応付けがわかっているとする

RMSD 適に重ね合わせたときのXYZ座標の差(Root Mean Square Deviation)

1benA

WKabsch Acta CrystA 32922-923(1976) 34827-828(1978)ADMclachlan JMolBiol 12874-77 (1979)Charles FF Karney ldquoQuaternions in molecular modelingrdquo E-print arXivphysics0506177

xi分子Xのi番目の原子の位置ベクトル yi分子Yのi番目の原子の位置ベクトル

距離の差のスコア (DRMS)

( )sumsum= ge

minusminus

=N

i

N

ij

Yij

Xij DD

NNDRMS

1

2

)1(2

21

20

1

2

3

4

5

YijD

XijD

1

23

4

21

20

5

yixi

DRMS 対応する原子ペアの距離の差(Distance-based RMSD)

原子の対応付けがわかっているとする

重ね合わせは不要なので計算は簡単

3次元によらない2次元や結合情報にも拡張できる

鏡像の区別はできない

1benA

計算が簡単なので高速な構造比較のアルゴリズムの基盤として使われる

1xdaA

H19 問73立体構造の似ている2つのタンパク質間で対応関係にある原子が分かっている場合にはRMSD(Root Mean Square Deviation)と呼ばれる数値を計算することにより立体構造の重なり合いの程度を数値化することができるRMSDは全ての対応する原子間の距離を

2乗した値の平均値(相加平均)にルートをとったものとして定義されるあるタンパク質における6つの原子ABCDEFと別のタンパク質の6つの原子

ArsquoBrsquoCrsquoDrsquoErsquoFrsquoについて対応関係が分かっており互いにもっともよく重なるように回転して重ねた時の対応原子間の距離は以下の表のようになったこの表からB-Brsquo C-Crsquo D-Drsquo E-Ersquoは正確に重なったが他の原子間ではずれが見られることがわかるここで6つの原子に対するRMSD値はいくらになるか選択肢の中からもっとも適切な値を一つ選べただ

し原子間距離の単位は考慮しないものとする

対応原子 距離

原子A―原子Arsquo 20

原子B―原子Brsquo 00

原子C―原子Crsquo 00

原子D―原子Crsquo 10

原子E―原子Crsquo 00

原子F―原子Crsquo 10

1 052 0663 104 133

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問73立体構造の似ている2つのタンパク質間で対応関係にある原子が分かっている場合にはRMSD(Root Mean Square Deviation)と呼ばれる数値を計算することにより立体構造の重なり合いの程度を数値化することができるRMSDは全ての対応する原子間の距離を

2乗した値の平均値(相加平均)にルートをとったものとして定義されるあるタンパク質における6つの原子ABCDEFと別のタンパク質の6つの原子

ArsquoBrsquoCrsquoDrsquoErsquoFrsquoについて対応関係が分かっており互いにもっともよく重なるように回転して重ねた時の対応原子間の距離は以下の表のようになったこの表からB-Brsquo C-Crsquo D-Drsquo E-Ersquoは正確に重なったが他の原子間ではずれが見られることがわかるここで6つの原子に対するRMSD値はいくらになるか選択肢の中からもっとも適切な値を一つ選べただ

し原子間距離の単位は考慮しないものとする

対応原子 距離

原子A―原子Arsquo 20

原子B―原子Brsquo 00

原子C―原子Crsquo 00

原子D―原子Crsquo 10

原子E―原子Crsquo 00

原子F―原子Crsquo 10

1 052 0663 104 133

RMSDは 適に重ね合わせたときの

「ずれの二乗の平均のルート」であるしたがってずれの二乗平均は

(22+0+0+1+0+1)6=66=1これのルートをとるとradic1=1

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

1

2

3

4

56

7

8

9

10

11

主鎖の水素結合αへリックス

1

2

34

56

78

9

10

11

O

N

CHN

N

H

H

CO Cα

i

i+3

i+4

HN O C

Cαi-1

i番目のCOがi+4番目のNHと水素結合を形成

36残基が1周期の右巻きらせん

NHO=Cが同じ向きに並ぶため

へリックス全体に電気双極子が発生

N末C末

ー +

主鎖の水素結合逆平行βシート

βターン

βターン

βヘアピン

βヘアピン

伸びた構造の1本1本をβストランドと呼ぶ二本以上のβストランドがシート状に並んだ構造をβシートと呼ぶ

βストランド

βストランド

βストランド

主鎖の水素結合平行βシート

βminusαminusβモチーフ

平行βシートがαへリックスで接続された構造モチーフ

βストランド

βストランド

βストランド

伸びた構造の1本1本をβストランドと呼ぶ二本以上のβストランドがシート状に並んだ構造をβシートと呼ぶ

Cαi

Cαi+1Cα

i-1φ ψ

ペプチド結合の平面性とφψの定義

主鎖の原子のXYZ座標はφψの2つ

の角度でほとんど記述できる

φψの角度を2次元にプロットしたものをラマチャンドランプロット(Ramachandran plot)という点が集中する領域は2次構造とよく対応

点が現れない領域は主鎖の原子が衝突する

βシート

αへリックス

左巻きへリックス

平面平面

φ

ψ

H19 問74タンパク質の主鎖に添って定義される二面角のうちφ(窒素原子と炭素原子の間の二面角)とψ(α炭素原子とカルボニル基の炭素原子の間の二面角)の値を各残

基ごとに計算して二次元にプロットしたものをラマチャンドランプロットと呼ぶ以下に示したラマチャンドランプロットに対する説明文の中でもっとも適切なものを一つ選べ

1 (a)(b)はともにαへリックスの領域である2 (a)(b)はともにβストランドの領域である3 (a)はαへリックス(b)はβストランドの領

域である4 (a)はβストランド(b)はαへリックスの領

域である

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問74タンパク質の主鎖に添って定義される二面角のうちφ(窒素原子と炭素原子の間の二面角)とψ(α炭素原子とカルボニル基の炭素原子の間の二面角)の値を各残

基ごとに計算して二次元にプロットしたものをラマチャンドランプロットと呼ぶ以下に示したラマチャンドランプロットに対する説明文の中でもっとも適切なものを一つ選べ

1 (a)(b)はともにαへリックスの領域である2 (a)(b)はともにβストランドの領域である3 (a)はαへリックス(b)はβストランドの領

域である4 (a)はβストランド(b)はαへリックスの領

域である

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

トポロジー図によるβシートの表現

4 23

N

C

1

1ubq (UbiquitinHumand151)

N

C123 4 5 6

1n8k (Alchol dehydrogenase E chain Horse c21)

ロスマンフォールド

βターン

βターン

1cauA1rhdA domain2

TOPSプログラムによる表示httpwwwtopsleedsacuk

1timA

はαへリックスはβストランドとなりあうの向きで平行逆平行を示す

コンタクトマップ

1ubq

C

4 23

N

1

縦横に残基を配置しある残基ペアのCα原子間の距離が10Å以下であれば対応するピクセルに色を塗る

分子描画ソフトVMDを用いて作成

平行のストランド間は方向逆平行ストランド間は方向に線分が観察される

N

C

N C

逆平行

逆平行

平行

αへリックスは太めの対角上の線分

へリックス

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから1か3コンタクトマップから平行シートしかないことがわかるため1であることがわかる

αβ5

αβ3

α

β4α

β1αβ2 β2

β1β3β4

β5

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから2か4コンタクトマップから平行シートしかないことがわかるため2であることがわかる

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

配列比較によるタンパク質分類1970年代から配列の一致度(sequence identity)に基づいてグループを作る作業が

行われてきた

どのくらいの類似性で一つにまとめるかは様々な考えがあるが少なくとも「相同なタンパク質群」を一つのグループにまとめるべき

ファミリー(family 族)

進化的に関係のある(相同な)タンパク質グループのこと

複数のファミリーがあつまった大きなグループ スーパーファミリー(superfamily clan)

一つのファミリーの中の小さなグループ サブファミリー(subfamily)

family

subfamily superfamily

ドメイン単位による分類

A2 B2

B3 C3

A1

配列1

配列2

配列3

配列の部分どうしだけが類似していた場合 部分一致を重視するとすべて一つのグループになるがhellip

配列1

配列2 配列3

Aを共有

Bを共有

1と2が類似2と3が類似していても1と3は類似していない

ドメインに分割すると

A1

A2

B2

B3

C3

A2 B2

B3 C3

A1

きれいに分類することができる

Pfam 蛋白質ファミリのデータベース各蛋白質ファミリのマルチプル

アライメント HMMなどを集めたデータベース

httppfamsangeracuk

Pkinase_Tyrドメインをもつタンパク質の例

ABL_HUMAN

BTK_HUMAN

ILK_HUMAN

MERTK_HUMAN

PGFRB_HUMAN

HCK_HUMAN

Family Pkinase_Tyr (PF07714) Protein tyrosine kinase

Pfamデータベース(httppfamsangeracukSoftwarePfam)からの引用

ドメイン構造と疎水性の関係Tyrosine protein kinase HCK (1ad5A HCK_HUMAN)

SH3 domain

SH2 domain

Tyrosine-kinase domain

3つの分断された疎水性コアrarr ドメイン構造

大きなタンパク質はいくつかの構造上のまとまり(ドメイン)を持つことが多い

立体構造によるタンパク質の分類

bull 配列による分類の延長ドメイン単位の分類進化的に関係のある(相同な)タンパク質を群にする(ファミリー)という考え方は同じ

bull 立体構造の類似性からより遠縁の相同性を見つけより大きな群を作る(スーパーファミリー)

bull スーパーファミリーをまとめたさらに大きなグループ(フォールドクラス)

bull 主にアミノ酸(Cαレベル)のラフな構造の類似性に

着目

bull 分類対象は主に球状タンパク質

立体構造分類データベースSCOPhttpscopmrc-lmbcamacukscop

4階層で分類Class(クラス)

Fold(フォールド)

Superfamily(スーパーファミリー)

Family(ファミリー)

どの階層に分類するかは配列の類似性立体構造の類似性分子機能の類似性機能部位の類似性

を専門家が総合的に判断して決める

1akr

ltホモロジーgt

ltアナロジーgt

他の構造分類データベースとしてCATHが有名

同様に階層的な分類体系を持つがその詳細はSCOPとは異なる

クラス

1mbd

1mqkH

1n55A 1pqwA

1fxd 1a2p

all-α (a)

all-β (b)

αβ (c)

α+β (d)

α-へリックスが中心

β-シートが中心

逆平行が多い

α-へリックスとβ-シートが配列上交互に現れる平行β-シートが中心

α-へリックスとβ-シートが混在配列上の並びの規則はない逆平行と平行のβ-シートが混在

アミノ酸配列と立体構造の関係ピロリ菌と大腸菌のフラボドキシン (同一残基率 SeqID 44)

ピロリ菌(1fueA) 大腸菌(1ag9A)

配列が似ていれば立体構造も似ている

SeqID = 44

RMSD = 12 Å

1fueA 2GKIGIFFGTDSGNAEAIAEKISKAIG--NAEVVDVAKASKEQFNGFTKVILVAPTAGAGD59

1ag9A 2AITGIFFGSDTGNTENIAKMIQKQLGKDVADVHDIAKSSKEDLEAYDILLLGIPTWYYGE61

1fueA 60LQTDWEDFLGTLEASD-FANKTIGLVGLGDQDTYSETFAEGIFHIYEKAK--AGKVVGQT116

1ag9A 62AQCDWDDFFPTLE-EIDFNGKLVALFGCGDQEDYAEYFCDALGTIRDIIEPRGATIVGHW120

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C 14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

BLAST

PSI-BLAST 構造比較

構造比較

アミノ酸配列がほとんど似ていなくても立体構造は似ている場合がある

構造は配列より進化的に保存がよい 構造比較から新たなホモログが発見できる可能性

立体

構造

の変

アミノ酸配列の変化と立体構造の変化の相関(グロビン族)

立体構造の変化はアミノ酸配列の変化と相関配列が30以上一致していればRMSDは2Å以下

アミノ酸配列の類似度

2つの構造の類似性

ホモロジー (homology 相同)進化的起源を共有することによる類似多くの場合分子機能なども類似している

アナロジー (analogy 相似)進化的起源とは無関係な類似多くの場合分子機能など他の属性は似ていない物理化学的な構造の偏好が原因とされる

イルカの胸びれ サルの前足

チョウの羽 トリの翼

ネコの前足

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C

ldquoFlavodoxin-likerdquo fold (c23)

ldquoFlavoproteinsrdquo superfamily (c235)

ldquoCheY-likerdquosuperfamily(c231)

14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

AnalogyHomology

HomologyHomolo

gy

多く現れるフォールド(出現ドメイン数順)

太字はスーパーフォールド多くのスーパーファミリーを含むフォールド

d58

c1

g3

c23 b34

b1

a4フォールド名 (SCOP173によるクラスfhijkは除く) ドメイ

ンの数

スーパーファミリーの数

a4 DNARNA-binding 3-helical bundle 292 14c1 TIM betaalpha-barrel 269 33d58 Ferredoxin-like 248 55b1 Immunoglobulin-like beta sandwich 246 27c37 P-loop nucleoside triphosphate hydrolase 235 1c2 NAD(P)-binding Rossmann-fold domains 168 1g3 Knottins 154 19d15 Beta-Grasp(ubiquitin-like) 131 13c23 Flavodoxin-like 118 15b34 SH3-like barrel 117 18b40 OB-fold 100 12c66 SAM-dependent methyltransferases 95 1

c37 c2

d15

b40 c66

スーパーフォールド(Superfold)

フォールド名 (SCOP173によるクラスfhijkは除く) その下のスーパーファミリーの数

d58 Ferredoxin-like 55c1 TIM betaalpha-barrel 33b1 Immunoglobulin-like beta sandwich 27a24 Four-helical up-and-down bundle 27a118 Alpha-alpha superhelix 23g3 Knottins 19b34 SH3-like barrel 18g41 Rubredoxin-like 16c23 Flavodoxin-like 15a60 SAM(sterile alpha motif) domain-like 15b69 7-bladed beta-propeller 14a4 DNARNA-binding 3-helical bundle 14

スーパーフォールド多くのスーパーファミリーを含むフォールド

スーパーフォールドは「構造の類似と機能の類似が対応しにくいフォールド」ともいえる

d58

c1

g3a118

c23

a24

a60

b34

b1

g41

b69 a4

三本へリックスバンドルDNARNA‐binding 3‐helical bundle(a4)

Mating type protein A2 yeast(1k61Aa411)

(1gvdAa413)(1wh5Aa411)

三本のへリックスが束になった構造DNAやRNAに結合する蛋白質が多い

DNAと

結合した構造(1k61)

TIMバレルTIM betaalpha barrel (c1)

Triosephosphate isomerase1n55A(c111)

全般に解糖系の酵素が多い基質酵素反応は極めて多彩

八本のβストランドとαへリックスが交互に組み合わさり対称的な樽(barrel)構造を形成す

る中央の樽構造は平行のβシートからなる

Imidazole glycerol phosphate synthasesubunit hisF1thfD(c121)

KHGKDPG aldolase1euaA(c1101)

フェレドキシン様Ferredoxin‐like (d58)

4Fe-4S Ferredoxin(1fxdd581)

1 234 4本の逆平行のβストランドと2本のαへリックスからな

分子機能は極めて多彩

CheY binding domain of CheA(1eayCd5824)

U1A RNA binding domain(1nu4Ad5871)

免疫グロブリン様Immunoglobulin‐like beta sandwich(b1)

Immunoglobulin Heavy chain variabledomain 1mjuH1(b111)

Immunoglobulin Heavy chain constantdomain 1mjuH2(b112)

Macromomycin1noaA (b171)

免疫グロブリン分子はH鎖とL鎖から

なりそれぞれ免疫グロブリン様ドメインからできている

V

C

V

C

C

C

V

CV

CC

C

L鎖

H鎖H鎖 L鎖

細胞表面あるいは分泌蛋白質が多い免疫や分子認識に関する機能を担うことが多い

4本のβストランドからなるβシートが二枚サンドイッチ状に重なった構造をとる逆平行のβシートが主

P‐loop スーパーファミリーP‐loop nucleoside triphosphate hydrolase(c37)

Ras-related protein RAB-5A1r2qA(c3718)

Guanylate kinase1gkyA(c3711)

RecA proteinDomain1 1xmsA1(c37111)

平行のβシートが主トポロジーには様々な変異あり

シグナル伝達DNA結合

モーター機能など多彩な分子機能を担うがATP GTPなどのヌクレオシド

の加水分解を行う点は共通

N C

132 4 5 6

ヌクレオシド結合部GxxxxGKTの

配列モチーフ(P-loop)を持つ

ロスマン フォールドNAD(P)‐binding Rossmann‐fold domains (c2)

Alcohol dehydrogenase gamma chaindomain2 1u3wA(c211)

Aspartate beta-semialdehydedehydrogenase2gz1A1(c213)

L-alanine dehydrogenase1pjcA1(c214)

補酵素を利用したNAD(P)を脱水素酵素を持つ基質を認識するドメインは別に存在する

NC

123 4 5 6

平行のβシートが主

7枚羽 βプロペラ7‐bladed beta‐propeller (b69)

Garactose oxydasedomain3 1k3iA3(b6911)

Guanine nucleotide-bindingprotein subunit beta-11gotB(b6941)

細胞膜付近のシグナル伝達や糖結合に関わることが多い

Influenza Neuraminidase 1f8dA(b6811)

6枚羽 βプロペラ

N C

321 4

のユニットが7回円環状に繰り返しされたフォールド

立体構造比較プログラム1990年ごろから多くの構造比較プログラムが開発されている

WEBアドレス スコア アライメント

DALI httpwwwebiacukdali

距離の差を独自の関数で変換したスコア

局所アライメントをモンテカルロ法でつなぎ合わせる

CE httpclsdsceducehtml

局所的なRMSD 局所アライメントを積み上げていく

MATRAS httpbiunitnaistjpmatras

距離の変化が相同相似で起こる確率の比をスコアとする

SSEで仮アライメント

を生成残基アライメントを収束するまで反復する

タンパク質の相同性の判断基準

100

同一残基率30以上

BLASTのE-value lt 00001

PSI-BLASTのE-value lt 00001

0102030407025 15 535

同一残基率(Sequence Identity)()

立体構造比較が必要

(1)立体構造の類似性が高い(DALIのZスコアMATRASのRdisスコア)(2)同一残基率がそこそこ高い(PSI-BLASTでヒットするSeqIDgt=15ぐらい)

(3)分子機能に類似性がある(補酵素酵素反応基質代謝経路等の共通性等)(4)基質補酵素の結合部位が類似しておりそのアミノ酸が保存(モチーフ)(5)ドメイン構成の共通性(6)スーパーフォールドの場合は特別な注意が必要

配列解析

同一残基率が25以下の場合の相同性の判断基準

50608090

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 18: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

H20 問59

タンパク質の立体構造のグラフィックス表示プログラムではないものを選択肢の中から一つ選べ

1Chime2PyMol3MEGA4MolScript

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問59

タンパク質の立体構造のグラフィックス表示プログラムではないものを選択肢の中から一つ選べ

1Chime2PyMol3MEGA4MolScript

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

PDBコード1fxd(ferredoxin II) Rasmol Chimeプラグインで描画

立体構造の描画スタイル

ワイアフレーム ボールスティック 空間充填

バックボーン リボン 分子表面

1 234

N

H C

O

Ala(A)(疎水性)

Phe(F)(疎水性)

Cys(C)(親水性)

Asp(D)(親水性)

Val(V)(疎水性)

Thr(親水性)

様々な物理化学的な性質を持った側鎖が主鎖のペプチド結合で連なる

Leu(L)(疎水性)

蛋白質ペプチド結合したアミノ酸群

アミノ酸は全部で20種類

I VL

M FYW H

KR

D E

P NSA Q

CG T

疎水性 親水性

脂肪族

芳香族正荷電

負荷電

N末

C末

変性状態(D) 天然状態(N)

フォールディング(折り畳み)という現象

非常に多種の構造の集合大きく広がっている

ほとんど唯一の構造小さくコンパクトに折りたたまっている

温度や変性剤濃度によって可逆に変化

折り畳みは原則としてその蛋白質以外の分子の介助を必要としない

アミノ酸配列の情報だけで天然状態の立体構造が決定される

どうやってコンパクトになるか rarr (1)主鎖の水素結合(2)側鎖間の疎水性相互作用

あるアミノ酸配列がどうやって一つの構造を決めるのか

3次元座標の差のスコア(RMSD)

並進ベクトルt を引いたあと回転行列R をかける

t 二つの分子の重心をあわせるように決めるR 2つの原子群の相関を 大化する行列rarr(1)特異値分解で導出

(2)四元数表現により 適な回転をLagrange未定乗数法で決定

sum=

minusminus=N

iiiN

RMSD1

2)](R[1 tyx

21

20

1

2

3

4

5

1xdaA

1

23

4

21

20

5

yi

)(R ty minusi

xi

1

23

4

21

20

5

原子の対応付けがわかっているとする

RMSD 適に重ね合わせたときのXYZ座標の差(Root Mean Square Deviation)

1benA

WKabsch Acta CrystA 32922-923(1976) 34827-828(1978)ADMclachlan JMolBiol 12874-77 (1979)Charles FF Karney ldquoQuaternions in molecular modelingrdquo E-print arXivphysics0506177

xi分子Xのi番目の原子の位置ベクトル yi分子Yのi番目の原子の位置ベクトル

距離の差のスコア (DRMS)

( )sumsum= ge

minusminus

=N

i

N

ij

Yij

Xij DD

NNDRMS

1

2

)1(2

21

20

1

2

3

4

5

YijD

XijD

1

23

4

21

20

5

yixi

DRMS 対応する原子ペアの距離の差(Distance-based RMSD)

原子の対応付けがわかっているとする

重ね合わせは不要なので計算は簡単

3次元によらない2次元や結合情報にも拡張できる

鏡像の区別はできない

1benA

計算が簡単なので高速な構造比較のアルゴリズムの基盤として使われる

1xdaA

H19 問73立体構造の似ている2つのタンパク質間で対応関係にある原子が分かっている場合にはRMSD(Root Mean Square Deviation)と呼ばれる数値を計算することにより立体構造の重なり合いの程度を数値化することができるRMSDは全ての対応する原子間の距離を

2乗した値の平均値(相加平均)にルートをとったものとして定義されるあるタンパク質における6つの原子ABCDEFと別のタンパク質の6つの原子

ArsquoBrsquoCrsquoDrsquoErsquoFrsquoについて対応関係が分かっており互いにもっともよく重なるように回転して重ねた時の対応原子間の距離は以下の表のようになったこの表からB-Brsquo C-Crsquo D-Drsquo E-Ersquoは正確に重なったが他の原子間ではずれが見られることがわかるここで6つの原子に対するRMSD値はいくらになるか選択肢の中からもっとも適切な値を一つ選べただ

し原子間距離の単位は考慮しないものとする

対応原子 距離

原子A―原子Arsquo 20

原子B―原子Brsquo 00

原子C―原子Crsquo 00

原子D―原子Crsquo 10

原子E―原子Crsquo 00

原子F―原子Crsquo 10

1 052 0663 104 133

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問73立体構造の似ている2つのタンパク質間で対応関係にある原子が分かっている場合にはRMSD(Root Mean Square Deviation)と呼ばれる数値を計算することにより立体構造の重なり合いの程度を数値化することができるRMSDは全ての対応する原子間の距離を

2乗した値の平均値(相加平均)にルートをとったものとして定義されるあるタンパク質における6つの原子ABCDEFと別のタンパク質の6つの原子

ArsquoBrsquoCrsquoDrsquoErsquoFrsquoについて対応関係が分かっており互いにもっともよく重なるように回転して重ねた時の対応原子間の距離は以下の表のようになったこの表からB-Brsquo C-Crsquo D-Drsquo E-Ersquoは正確に重なったが他の原子間ではずれが見られることがわかるここで6つの原子に対するRMSD値はいくらになるか選択肢の中からもっとも適切な値を一つ選べただ

し原子間距離の単位は考慮しないものとする

対応原子 距離

原子A―原子Arsquo 20

原子B―原子Brsquo 00

原子C―原子Crsquo 00

原子D―原子Crsquo 10

原子E―原子Crsquo 00

原子F―原子Crsquo 10

1 052 0663 104 133

RMSDは 適に重ね合わせたときの

「ずれの二乗の平均のルート」であるしたがってずれの二乗平均は

(22+0+0+1+0+1)6=66=1これのルートをとるとradic1=1

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

1

2

3

4

56

7

8

9

10

11

主鎖の水素結合αへリックス

1

2

34

56

78

9

10

11

O

N

CHN

N

H

H

CO Cα

i

i+3

i+4

HN O C

Cαi-1

i番目のCOがi+4番目のNHと水素結合を形成

36残基が1周期の右巻きらせん

NHO=Cが同じ向きに並ぶため

へリックス全体に電気双極子が発生

N末C末

ー +

主鎖の水素結合逆平行βシート

βターン

βターン

βヘアピン

βヘアピン

伸びた構造の1本1本をβストランドと呼ぶ二本以上のβストランドがシート状に並んだ構造をβシートと呼ぶ

βストランド

βストランド

βストランド

主鎖の水素結合平行βシート

βminusαminusβモチーフ

平行βシートがαへリックスで接続された構造モチーフ

βストランド

βストランド

βストランド

伸びた構造の1本1本をβストランドと呼ぶ二本以上のβストランドがシート状に並んだ構造をβシートと呼ぶ

Cαi

Cαi+1Cα

i-1φ ψ

ペプチド結合の平面性とφψの定義

主鎖の原子のXYZ座標はφψの2つ

の角度でほとんど記述できる

φψの角度を2次元にプロットしたものをラマチャンドランプロット(Ramachandran plot)という点が集中する領域は2次構造とよく対応

点が現れない領域は主鎖の原子が衝突する

βシート

αへリックス

左巻きへリックス

平面平面

φ

ψ

H19 問74タンパク質の主鎖に添って定義される二面角のうちφ(窒素原子と炭素原子の間の二面角)とψ(α炭素原子とカルボニル基の炭素原子の間の二面角)の値を各残

基ごとに計算して二次元にプロットしたものをラマチャンドランプロットと呼ぶ以下に示したラマチャンドランプロットに対する説明文の中でもっとも適切なものを一つ選べ

1 (a)(b)はともにαへリックスの領域である2 (a)(b)はともにβストランドの領域である3 (a)はαへリックス(b)はβストランドの領

域である4 (a)はβストランド(b)はαへリックスの領

域である

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問74タンパク質の主鎖に添って定義される二面角のうちφ(窒素原子と炭素原子の間の二面角)とψ(α炭素原子とカルボニル基の炭素原子の間の二面角)の値を各残

基ごとに計算して二次元にプロットしたものをラマチャンドランプロットと呼ぶ以下に示したラマチャンドランプロットに対する説明文の中でもっとも適切なものを一つ選べ

1 (a)(b)はともにαへリックスの領域である2 (a)(b)はともにβストランドの領域である3 (a)はαへリックス(b)はβストランドの領

域である4 (a)はβストランド(b)はαへリックスの領

域である

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

トポロジー図によるβシートの表現

4 23

N

C

1

1ubq (UbiquitinHumand151)

N

C123 4 5 6

1n8k (Alchol dehydrogenase E chain Horse c21)

ロスマンフォールド

βターン

βターン

1cauA1rhdA domain2

TOPSプログラムによる表示httpwwwtopsleedsacuk

1timA

はαへリックスはβストランドとなりあうの向きで平行逆平行を示す

コンタクトマップ

1ubq

C

4 23

N

1

縦横に残基を配置しある残基ペアのCα原子間の距離が10Å以下であれば対応するピクセルに色を塗る

分子描画ソフトVMDを用いて作成

平行のストランド間は方向逆平行ストランド間は方向に線分が観察される

N

C

N C

逆平行

逆平行

平行

αへリックスは太めの対角上の線分

へリックス

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから1か3コンタクトマップから平行シートしかないことがわかるため1であることがわかる

αβ5

αβ3

α

β4α

β1αβ2 β2

β1β3β4

β5

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから2か4コンタクトマップから平行シートしかないことがわかるため2であることがわかる

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

配列比較によるタンパク質分類1970年代から配列の一致度(sequence identity)に基づいてグループを作る作業が

行われてきた

どのくらいの類似性で一つにまとめるかは様々な考えがあるが少なくとも「相同なタンパク質群」を一つのグループにまとめるべき

ファミリー(family 族)

進化的に関係のある(相同な)タンパク質グループのこと

複数のファミリーがあつまった大きなグループ スーパーファミリー(superfamily clan)

一つのファミリーの中の小さなグループ サブファミリー(subfamily)

family

subfamily superfamily

ドメイン単位による分類

A2 B2

B3 C3

A1

配列1

配列2

配列3

配列の部分どうしだけが類似していた場合 部分一致を重視するとすべて一つのグループになるがhellip

配列1

配列2 配列3

Aを共有

Bを共有

1と2が類似2と3が類似していても1と3は類似していない

ドメインに分割すると

A1

A2

B2

B3

C3

A2 B2

B3 C3

A1

きれいに分類することができる

Pfam 蛋白質ファミリのデータベース各蛋白質ファミリのマルチプル

アライメント HMMなどを集めたデータベース

httppfamsangeracuk

Pkinase_Tyrドメインをもつタンパク質の例

ABL_HUMAN

BTK_HUMAN

ILK_HUMAN

MERTK_HUMAN

PGFRB_HUMAN

HCK_HUMAN

Family Pkinase_Tyr (PF07714) Protein tyrosine kinase

Pfamデータベース(httppfamsangeracukSoftwarePfam)からの引用

ドメイン構造と疎水性の関係Tyrosine protein kinase HCK (1ad5A HCK_HUMAN)

SH3 domain

SH2 domain

Tyrosine-kinase domain

3つの分断された疎水性コアrarr ドメイン構造

大きなタンパク質はいくつかの構造上のまとまり(ドメイン)を持つことが多い

立体構造によるタンパク質の分類

bull 配列による分類の延長ドメイン単位の分類進化的に関係のある(相同な)タンパク質を群にする(ファミリー)という考え方は同じ

bull 立体構造の類似性からより遠縁の相同性を見つけより大きな群を作る(スーパーファミリー)

bull スーパーファミリーをまとめたさらに大きなグループ(フォールドクラス)

bull 主にアミノ酸(Cαレベル)のラフな構造の類似性に

着目

bull 分類対象は主に球状タンパク質

立体構造分類データベースSCOPhttpscopmrc-lmbcamacukscop

4階層で分類Class(クラス)

Fold(フォールド)

Superfamily(スーパーファミリー)

Family(ファミリー)

どの階層に分類するかは配列の類似性立体構造の類似性分子機能の類似性機能部位の類似性

を専門家が総合的に判断して決める

1akr

ltホモロジーgt

ltアナロジーgt

他の構造分類データベースとしてCATHが有名

同様に階層的な分類体系を持つがその詳細はSCOPとは異なる

クラス

1mbd

1mqkH

1n55A 1pqwA

1fxd 1a2p

all-α (a)

all-β (b)

αβ (c)

α+β (d)

α-へリックスが中心

β-シートが中心

逆平行が多い

α-へリックスとβ-シートが配列上交互に現れる平行β-シートが中心

α-へリックスとβ-シートが混在配列上の並びの規則はない逆平行と平行のβ-シートが混在

アミノ酸配列と立体構造の関係ピロリ菌と大腸菌のフラボドキシン (同一残基率 SeqID 44)

ピロリ菌(1fueA) 大腸菌(1ag9A)

配列が似ていれば立体構造も似ている

SeqID = 44

RMSD = 12 Å

1fueA 2GKIGIFFGTDSGNAEAIAEKISKAIG--NAEVVDVAKASKEQFNGFTKVILVAPTAGAGD59

1ag9A 2AITGIFFGSDTGNTENIAKMIQKQLGKDVADVHDIAKSSKEDLEAYDILLLGIPTWYYGE61

1fueA 60LQTDWEDFLGTLEASD-FANKTIGLVGLGDQDTYSETFAEGIFHIYEKAK--AGKVVGQT116

1ag9A 62AQCDWDDFFPTLE-EIDFNGKLVALFGCGDQEDYAEYFCDALGTIRDIIEPRGATIVGHW120

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C 14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

BLAST

PSI-BLAST 構造比較

構造比較

アミノ酸配列がほとんど似ていなくても立体構造は似ている場合がある

構造は配列より進化的に保存がよい 構造比較から新たなホモログが発見できる可能性

立体

構造

の変

アミノ酸配列の変化と立体構造の変化の相関(グロビン族)

立体構造の変化はアミノ酸配列の変化と相関配列が30以上一致していればRMSDは2Å以下

アミノ酸配列の類似度

2つの構造の類似性

ホモロジー (homology 相同)進化的起源を共有することによる類似多くの場合分子機能なども類似している

アナロジー (analogy 相似)進化的起源とは無関係な類似多くの場合分子機能など他の属性は似ていない物理化学的な構造の偏好が原因とされる

イルカの胸びれ サルの前足

チョウの羽 トリの翼

ネコの前足

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C

ldquoFlavodoxin-likerdquo fold (c23)

ldquoFlavoproteinsrdquo superfamily (c235)

ldquoCheY-likerdquosuperfamily(c231)

14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

AnalogyHomology

HomologyHomolo

gy

多く現れるフォールド(出現ドメイン数順)

太字はスーパーフォールド多くのスーパーファミリーを含むフォールド

d58

c1

g3

c23 b34

b1

a4フォールド名 (SCOP173によるクラスfhijkは除く) ドメイ

ンの数

スーパーファミリーの数

a4 DNARNA-binding 3-helical bundle 292 14c1 TIM betaalpha-barrel 269 33d58 Ferredoxin-like 248 55b1 Immunoglobulin-like beta sandwich 246 27c37 P-loop nucleoside triphosphate hydrolase 235 1c2 NAD(P)-binding Rossmann-fold domains 168 1g3 Knottins 154 19d15 Beta-Grasp(ubiquitin-like) 131 13c23 Flavodoxin-like 118 15b34 SH3-like barrel 117 18b40 OB-fold 100 12c66 SAM-dependent methyltransferases 95 1

c37 c2

d15

b40 c66

スーパーフォールド(Superfold)

フォールド名 (SCOP173によるクラスfhijkは除く) その下のスーパーファミリーの数

d58 Ferredoxin-like 55c1 TIM betaalpha-barrel 33b1 Immunoglobulin-like beta sandwich 27a24 Four-helical up-and-down bundle 27a118 Alpha-alpha superhelix 23g3 Knottins 19b34 SH3-like barrel 18g41 Rubredoxin-like 16c23 Flavodoxin-like 15a60 SAM(sterile alpha motif) domain-like 15b69 7-bladed beta-propeller 14a4 DNARNA-binding 3-helical bundle 14

スーパーフォールド多くのスーパーファミリーを含むフォールド

スーパーフォールドは「構造の類似と機能の類似が対応しにくいフォールド」ともいえる

d58

c1

g3a118

c23

a24

a60

b34

b1

g41

b69 a4

三本へリックスバンドルDNARNA‐binding 3‐helical bundle(a4)

Mating type protein A2 yeast(1k61Aa411)

(1gvdAa413)(1wh5Aa411)

三本のへリックスが束になった構造DNAやRNAに結合する蛋白質が多い

DNAと

結合した構造(1k61)

TIMバレルTIM betaalpha barrel (c1)

Triosephosphate isomerase1n55A(c111)

全般に解糖系の酵素が多い基質酵素反応は極めて多彩

八本のβストランドとαへリックスが交互に組み合わさり対称的な樽(barrel)構造を形成す

る中央の樽構造は平行のβシートからなる

Imidazole glycerol phosphate synthasesubunit hisF1thfD(c121)

KHGKDPG aldolase1euaA(c1101)

フェレドキシン様Ferredoxin‐like (d58)

4Fe-4S Ferredoxin(1fxdd581)

1 234 4本の逆平行のβストランドと2本のαへリックスからな

分子機能は極めて多彩

CheY binding domain of CheA(1eayCd5824)

U1A RNA binding domain(1nu4Ad5871)

免疫グロブリン様Immunoglobulin‐like beta sandwich(b1)

Immunoglobulin Heavy chain variabledomain 1mjuH1(b111)

Immunoglobulin Heavy chain constantdomain 1mjuH2(b112)

Macromomycin1noaA (b171)

免疫グロブリン分子はH鎖とL鎖から

なりそれぞれ免疫グロブリン様ドメインからできている

V

C

V

C

C

C

V

CV

CC

C

L鎖

H鎖H鎖 L鎖

細胞表面あるいは分泌蛋白質が多い免疫や分子認識に関する機能を担うことが多い

4本のβストランドからなるβシートが二枚サンドイッチ状に重なった構造をとる逆平行のβシートが主

P‐loop スーパーファミリーP‐loop nucleoside triphosphate hydrolase(c37)

Ras-related protein RAB-5A1r2qA(c3718)

Guanylate kinase1gkyA(c3711)

RecA proteinDomain1 1xmsA1(c37111)

平行のβシートが主トポロジーには様々な変異あり

シグナル伝達DNA結合

モーター機能など多彩な分子機能を担うがATP GTPなどのヌクレオシド

の加水分解を行う点は共通

N C

132 4 5 6

ヌクレオシド結合部GxxxxGKTの

配列モチーフ(P-loop)を持つ

ロスマン フォールドNAD(P)‐binding Rossmann‐fold domains (c2)

Alcohol dehydrogenase gamma chaindomain2 1u3wA(c211)

Aspartate beta-semialdehydedehydrogenase2gz1A1(c213)

L-alanine dehydrogenase1pjcA1(c214)

補酵素を利用したNAD(P)を脱水素酵素を持つ基質を認識するドメインは別に存在する

NC

123 4 5 6

平行のβシートが主

7枚羽 βプロペラ7‐bladed beta‐propeller (b69)

Garactose oxydasedomain3 1k3iA3(b6911)

Guanine nucleotide-bindingprotein subunit beta-11gotB(b6941)

細胞膜付近のシグナル伝達や糖結合に関わることが多い

Influenza Neuraminidase 1f8dA(b6811)

6枚羽 βプロペラ

N C

321 4

のユニットが7回円環状に繰り返しされたフォールド

立体構造比較プログラム1990年ごろから多くの構造比較プログラムが開発されている

WEBアドレス スコア アライメント

DALI httpwwwebiacukdali

距離の差を独自の関数で変換したスコア

局所アライメントをモンテカルロ法でつなぎ合わせる

CE httpclsdsceducehtml

局所的なRMSD 局所アライメントを積み上げていく

MATRAS httpbiunitnaistjpmatras

距離の変化が相同相似で起こる確率の比をスコアとする

SSEで仮アライメント

を生成残基アライメントを収束するまで反復する

タンパク質の相同性の判断基準

100

同一残基率30以上

BLASTのE-value lt 00001

PSI-BLASTのE-value lt 00001

0102030407025 15 535

同一残基率(Sequence Identity)()

立体構造比較が必要

(1)立体構造の類似性が高い(DALIのZスコアMATRASのRdisスコア)(2)同一残基率がそこそこ高い(PSI-BLASTでヒットするSeqIDgt=15ぐらい)

(3)分子機能に類似性がある(補酵素酵素反応基質代謝経路等の共通性等)(4)基質補酵素の結合部位が類似しておりそのアミノ酸が保存(モチーフ)(5)ドメイン構成の共通性(6)スーパーフォールドの場合は特別な注意が必要

配列解析

同一残基率が25以下の場合の相同性の判断基準

50608090

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 19: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

H20 問59

タンパク質の立体構造のグラフィックス表示プログラムではないものを選択肢の中から一つ選べ

1Chime2PyMol3MEGA4MolScript

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

PDBコード1fxd(ferredoxin II) Rasmol Chimeプラグインで描画

立体構造の描画スタイル

ワイアフレーム ボールスティック 空間充填

バックボーン リボン 分子表面

1 234

N

H C

O

Ala(A)(疎水性)

Phe(F)(疎水性)

Cys(C)(親水性)

Asp(D)(親水性)

Val(V)(疎水性)

Thr(親水性)

様々な物理化学的な性質を持った側鎖が主鎖のペプチド結合で連なる

Leu(L)(疎水性)

蛋白質ペプチド結合したアミノ酸群

アミノ酸は全部で20種類

I VL

M FYW H

KR

D E

P NSA Q

CG T

疎水性 親水性

脂肪族

芳香族正荷電

負荷電

N末

C末

変性状態(D) 天然状態(N)

フォールディング(折り畳み)という現象

非常に多種の構造の集合大きく広がっている

ほとんど唯一の構造小さくコンパクトに折りたたまっている

温度や変性剤濃度によって可逆に変化

折り畳みは原則としてその蛋白質以外の分子の介助を必要としない

アミノ酸配列の情報だけで天然状態の立体構造が決定される

どうやってコンパクトになるか rarr (1)主鎖の水素結合(2)側鎖間の疎水性相互作用

あるアミノ酸配列がどうやって一つの構造を決めるのか

3次元座標の差のスコア(RMSD)

並進ベクトルt を引いたあと回転行列R をかける

t 二つの分子の重心をあわせるように決めるR 2つの原子群の相関を 大化する行列rarr(1)特異値分解で導出

(2)四元数表現により 適な回転をLagrange未定乗数法で決定

sum=

minusminus=N

iiiN

RMSD1

2)](R[1 tyx

21

20

1

2

3

4

5

1xdaA

1

23

4

21

20

5

yi

)(R ty minusi

xi

1

23

4

21

20

5

原子の対応付けがわかっているとする

RMSD 適に重ね合わせたときのXYZ座標の差(Root Mean Square Deviation)

1benA

WKabsch Acta CrystA 32922-923(1976) 34827-828(1978)ADMclachlan JMolBiol 12874-77 (1979)Charles FF Karney ldquoQuaternions in molecular modelingrdquo E-print arXivphysics0506177

xi分子Xのi番目の原子の位置ベクトル yi分子Yのi番目の原子の位置ベクトル

距離の差のスコア (DRMS)

( )sumsum= ge

minusminus

=N

i

N

ij

Yij

Xij DD

NNDRMS

1

2

)1(2

21

20

1

2

3

4

5

YijD

XijD

1

23

4

21

20

5

yixi

DRMS 対応する原子ペアの距離の差(Distance-based RMSD)

原子の対応付けがわかっているとする

重ね合わせは不要なので計算は簡単

3次元によらない2次元や結合情報にも拡張できる

鏡像の区別はできない

1benA

計算が簡単なので高速な構造比較のアルゴリズムの基盤として使われる

1xdaA

H19 問73立体構造の似ている2つのタンパク質間で対応関係にある原子が分かっている場合にはRMSD(Root Mean Square Deviation)と呼ばれる数値を計算することにより立体構造の重なり合いの程度を数値化することができるRMSDは全ての対応する原子間の距離を

2乗した値の平均値(相加平均)にルートをとったものとして定義されるあるタンパク質における6つの原子ABCDEFと別のタンパク質の6つの原子

ArsquoBrsquoCrsquoDrsquoErsquoFrsquoについて対応関係が分かっており互いにもっともよく重なるように回転して重ねた時の対応原子間の距離は以下の表のようになったこの表からB-Brsquo C-Crsquo D-Drsquo E-Ersquoは正確に重なったが他の原子間ではずれが見られることがわかるここで6つの原子に対するRMSD値はいくらになるか選択肢の中からもっとも適切な値を一つ選べただ

し原子間距離の単位は考慮しないものとする

対応原子 距離

原子A―原子Arsquo 20

原子B―原子Brsquo 00

原子C―原子Crsquo 00

原子D―原子Crsquo 10

原子E―原子Crsquo 00

原子F―原子Crsquo 10

1 052 0663 104 133

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問73立体構造の似ている2つのタンパク質間で対応関係にある原子が分かっている場合にはRMSD(Root Mean Square Deviation)と呼ばれる数値を計算することにより立体構造の重なり合いの程度を数値化することができるRMSDは全ての対応する原子間の距離を

2乗した値の平均値(相加平均)にルートをとったものとして定義されるあるタンパク質における6つの原子ABCDEFと別のタンパク質の6つの原子

ArsquoBrsquoCrsquoDrsquoErsquoFrsquoについて対応関係が分かっており互いにもっともよく重なるように回転して重ねた時の対応原子間の距離は以下の表のようになったこの表からB-Brsquo C-Crsquo D-Drsquo E-Ersquoは正確に重なったが他の原子間ではずれが見られることがわかるここで6つの原子に対するRMSD値はいくらになるか選択肢の中からもっとも適切な値を一つ選べただ

し原子間距離の単位は考慮しないものとする

対応原子 距離

原子A―原子Arsquo 20

原子B―原子Brsquo 00

原子C―原子Crsquo 00

原子D―原子Crsquo 10

原子E―原子Crsquo 00

原子F―原子Crsquo 10

1 052 0663 104 133

RMSDは 適に重ね合わせたときの

「ずれの二乗の平均のルート」であるしたがってずれの二乗平均は

(22+0+0+1+0+1)6=66=1これのルートをとるとradic1=1

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

1

2

3

4

56

7

8

9

10

11

主鎖の水素結合αへリックス

1

2

34

56

78

9

10

11

O

N

CHN

N

H

H

CO Cα

i

i+3

i+4

HN O C

Cαi-1

i番目のCOがi+4番目のNHと水素結合を形成

36残基が1周期の右巻きらせん

NHO=Cが同じ向きに並ぶため

へリックス全体に電気双極子が発生

N末C末

ー +

主鎖の水素結合逆平行βシート

βターン

βターン

βヘアピン

βヘアピン

伸びた構造の1本1本をβストランドと呼ぶ二本以上のβストランドがシート状に並んだ構造をβシートと呼ぶ

βストランド

βストランド

βストランド

主鎖の水素結合平行βシート

βminusαminusβモチーフ

平行βシートがαへリックスで接続された構造モチーフ

βストランド

βストランド

βストランド

伸びた構造の1本1本をβストランドと呼ぶ二本以上のβストランドがシート状に並んだ構造をβシートと呼ぶ

Cαi

Cαi+1Cα

i-1φ ψ

ペプチド結合の平面性とφψの定義

主鎖の原子のXYZ座標はφψの2つ

の角度でほとんど記述できる

φψの角度を2次元にプロットしたものをラマチャンドランプロット(Ramachandran plot)という点が集中する領域は2次構造とよく対応

点が現れない領域は主鎖の原子が衝突する

βシート

αへリックス

左巻きへリックス

平面平面

φ

ψ

H19 問74タンパク質の主鎖に添って定義される二面角のうちφ(窒素原子と炭素原子の間の二面角)とψ(α炭素原子とカルボニル基の炭素原子の間の二面角)の値を各残

基ごとに計算して二次元にプロットしたものをラマチャンドランプロットと呼ぶ以下に示したラマチャンドランプロットに対する説明文の中でもっとも適切なものを一つ選べ

1 (a)(b)はともにαへリックスの領域である2 (a)(b)はともにβストランドの領域である3 (a)はαへリックス(b)はβストランドの領

域である4 (a)はβストランド(b)はαへリックスの領

域である

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問74タンパク質の主鎖に添って定義される二面角のうちφ(窒素原子と炭素原子の間の二面角)とψ(α炭素原子とカルボニル基の炭素原子の間の二面角)の値を各残

基ごとに計算して二次元にプロットしたものをラマチャンドランプロットと呼ぶ以下に示したラマチャンドランプロットに対する説明文の中でもっとも適切なものを一つ選べ

1 (a)(b)はともにαへリックスの領域である2 (a)(b)はともにβストランドの領域である3 (a)はαへリックス(b)はβストランドの領

域である4 (a)はβストランド(b)はαへリックスの領

域である

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

トポロジー図によるβシートの表現

4 23

N

C

1

1ubq (UbiquitinHumand151)

N

C123 4 5 6

1n8k (Alchol dehydrogenase E chain Horse c21)

ロスマンフォールド

βターン

βターン

1cauA1rhdA domain2

TOPSプログラムによる表示httpwwwtopsleedsacuk

1timA

はαへリックスはβストランドとなりあうの向きで平行逆平行を示す

コンタクトマップ

1ubq

C

4 23

N

1

縦横に残基を配置しある残基ペアのCα原子間の距離が10Å以下であれば対応するピクセルに色を塗る

分子描画ソフトVMDを用いて作成

平行のストランド間は方向逆平行ストランド間は方向に線分が観察される

N

C

N C

逆平行

逆平行

平行

αへリックスは太めの対角上の線分

へリックス

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから1か3コンタクトマップから平行シートしかないことがわかるため1であることがわかる

αβ5

αβ3

α

β4α

β1αβ2 β2

β1β3β4

β5

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから2か4コンタクトマップから平行シートしかないことがわかるため2であることがわかる

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

配列比較によるタンパク質分類1970年代から配列の一致度(sequence identity)に基づいてグループを作る作業が

行われてきた

どのくらいの類似性で一つにまとめるかは様々な考えがあるが少なくとも「相同なタンパク質群」を一つのグループにまとめるべき

ファミリー(family 族)

進化的に関係のある(相同な)タンパク質グループのこと

複数のファミリーがあつまった大きなグループ スーパーファミリー(superfamily clan)

一つのファミリーの中の小さなグループ サブファミリー(subfamily)

family

subfamily superfamily

ドメイン単位による分類

A2 B2

B3 C3

A1

配列1

配列2

配列3

配列の部分どうしだけが類似していた場合 部分一致を重視するとすべて一つのグループになるがhellip

配列1

配列2 配列3

Aを共有

Bを共有

1と2が類似2と3が類似していても1と3は類似していない

ドメインに分割すると

A1

A2

B2

B3

C3

A2 B2

B3 C3

A1

きれいに分類することができる

Pfam 蛋白質ファミリのデータベース各蛋白質ファミリのマルチプル

アライメント HMMなどを集めたデータベース

httppfamsangeracuk

Pkinase_Tyrドメインをもつタンパク質の例

ABL_HUMAN

BTK_HUMAN

ILK_HUMAN

MERTK_HUMAN

PGFRB_HUMAN

HCK_HUMAN

Family Pkinase_Tyr (PF07714) Protein tyrosine kinase

Pfamデータベース(httppfamsangeracukSoftwarePfam)からの引用

ドメイン構造と疎水性の関係Tyrosine protein kinase HCK (1ad5A HCK_HUMAN)

SH3 domain

SH2 domain

Tyrosine-kinase domain

3つの分断された疎水性コアrarr ドメイン構造

大きなタンパク質はいくつかの構造上のまとまり(ドメイン)を持つことが多い

立体構造によるタンパク質の分類

bull 配列による分類の延長ドメイン単位の分類進化的に関係のある(相同な)タンパク質を群にする(ファミリー)という考え方は同じ

bull 立体構造の類似性からより遠縁の相同性を見つけより大きな群を作る(スーパーファミリー)

bull スーパーファミリーをまとめたさらに大きなグループ(フォールドクラス)

bull 主にアミノ酸(Cαレベル)のラフな構造の類似性に

着目

bull 分類対象は主に球状タンパク質

立体構造分類データベースSCOPhttpscopmrc-lmbcamacukscop

4階層で分類Class(クラス)

Fold(フォールド)

Superfamily(スーパーファミリー)

Family(ファミリー)

どの階層に分類するかは配列の類似性立体構造の類似性分子機能の類似性機能部位の類似性

を専門家が総合的に判断して決める

1akr

ltホモロジーgt

ltアナロジーgt

他の構造分類データベースとしてCATHが有名

同様に階層的な分類体系を持つがその詳細はSCOPとは異なる

クラス

1mbd

1mqkH

1n55A 1pqwA

1fxd 1a2p

all-α (a)

all-β (b)

αβ (c)

α+β (d)

α-へリックスが中心

β-シートが中心

逆平行が多い

α-へリックスとβ-シートが配列上交互に現れる平行β-シートが中心

α-へリックスとβ-シートが混在配列上の並びの規則はない逆平行と平行のβ-シートが混在

アミノ酸配列と立体構造の関係ピロリ菌と大腸菌のフラボドキシン (同一残基率 SeqID 44)

ピロリ菌(1fueA) 大腸菌(1ag9A)

配列が似ていれば立体構造も似ている

SeqID = 44

RMSD = 12 Å

1fueA 2GKIGIFFGTDSGNAEAIAEKISKAIG--NAEVVDVAKASKEQFNGFTKVILVAPTAGAGD59

1ag9A 2AITGIFFGSDTGNTENIAKMIQKQLGKDVADVHDIAKSSKEDLEAYDILLLGIPTWYYGE61

1fueA 60LQTDWEDFLGTLEASD-FANKTIGLVGLGDQDTYSETFAEGIFHIYEKAK--AGKVVGQT116

1ag9A 62AQCDWDDFFPTLE-EIDFNGKLVALFGCGDQEDYAEYFCDALGTIRDIIEPRGATIVGHW120

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C 14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

BLAST

PSI-BLAST 構造比較

構造比較

アミノ酸配列がほとんど似ていなくても立体構造は似ている場合がある

構造は配列より進化的に保存がよい 構造比較から新たなホモログが発見できる可能性

立体

構造

の変

アミノ酸配列の変化と立体構造の変化の相関(グロビン族)

立体構造の変化はアミノ酸配列の変化と相関配列が30以上一致していればRMSDは2Å以下

アミノ酸配列の類似度

2つの構造の類似性

ホモロジー (homology 相同)進化的起源を共有することによる類似多くの場合分子機能なども類似している

アナロジー (analogy 相似)進化的起源とは無関係な類似多くの場合分子機能など他の属性は似ていない物理化学的な構造の偏好が原因とされる

イルカの胸びれ サルの前足

チョウの羽 トリの翼

ネコの前足

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C

ldquoFlavodoxin-likerdquo fold (c23)

ldquoFlavoproteinsrdquo superfamily (c235)

ldquoCheY-likerdquosuperfamily(c231)

14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

AnalogyHomology

HomologyHomolo

gy

多く現れるフォールド(出現ドメイン数順)

太字はスーパーフォールド多くのスーパーファミリーを含むフォールド

d58

c1

g3

c23 b34

b1

a4フォールド名 (SCOP173によるクラスfhijkは除く) ドメイ

ンの数

スーパーファミリーの数

a4 DNARNA-binding 3-helical bundle 292 14c1 TIM betaalpha-barrel 269 33d58 Ferredoxin-like 248 55b1 Immunoglobulin-like beta sandwich 246 27c37 P-loop nucleoside triphosphate hydrolase 235 1c2 NAD(P)-binding Rossmann-fold domains 168 1g3 Knottins 154 19d15 Beta-Grasp(ubiquitin-like) 131 13c23 Flavodoxin-like 118 15b34 SH3-like barrel 117 18b40 OB-fold 100 12c66 SAM-dependent methyltransferases 95 1

c37 c2

d15

b40 c66

スーパーフォールド(Superfold)

フォールド名 (SCOP173によるクラスfhijkは除く) その下のスーパーファミリーの数

d58 Ferredoxin-like 55c1 TIM betaalpha-barrel 33b1 Immunoglobulin-like beta sandwich 27a24 Four-helical up-and-down bundle 27a118 Alpha-alpha superhelix 23g3 Knottins 19b34 SH3-like barrel 18g41 Rubredoxin-like 16c23 Flavodoxin-like 15a60 SAM(sterile alpha motif) domain-like 15b69 7-bladed beta-propeller 14a4 DNARNA-binding 3-helical bundle 14

スーパーフォールド多くのスーパーファミリーを含むフォールド

スーパーフォールドは「構造の類似と機能の類似が対応しにくいフォールド」ともいえる

d58

c1

g3a118

c23

a24

a60

b34

b1

g41

b69 a4

三本へリックスバンドルDNARNA‐binding 3‐helical bundle(a4)

Mating type protein A2 yeast(1k61Aa411)

(1gvdAa413)(1wh5Aa411)

三本のへリックスが束になった構造DNAやRNAに結合する蛋白質が多い

DNAと

結合した構造(1k61)

TIMバレルTIM betaalpha barrel (c1)

Triosephosphate isomerase1n55A(c111)

全般に解糖系の酵素が多い基質酵素反応は極めて多彩

八本のβストランドとαへリックスが交互に組み合わさり対称的な樽(barrel)構造を形成す

る中央の樽構造は平行のβシートからなる

Imidazole glycerol phosphate synthasesubunit hisF1thfD(c121)

KHGKDPG aldolase1euaA(c1101)

フェレドキシン様Ferredoxin‐like (d58)

4Fe-4S Ferredoxin(1fxdd581)

1 234 4本の逆平行のβストランドと2本のαへリックスからな

分子機能は極めて多彩

CheY binding domain of CheA(1eayCd5824)

U1A RNA binding domain(1nu4Ad5871)

免疫グロブリン様Immunoglobulin‐like beta sandwich(b1)

Immunoglobulin Heavy chain variabledomain 1mjuH1(b111)

Immunoglobulin Heavy chain constantdomain 1mjuH2(b112)

Macromomycin1noaA (b171)

免疫グロブリン分子はH鎖とL鎖から

なりそれぞれ免疫グロブリン様ドメインからできている

V

C

V

C

C

C

V

CV

CC

C

L鎖

H鎖H鎖 L鎖

細胞表面あるいは分泌蛋白質が多い免疫や分子認識に関する機能を担うことが多い

4本のβストランドからなるβシートが二枚サンドイッチ状に重なった構造をとる逆平行のβシートが主

P‐loop スーパーファミリーP‐loop nucleoside triphosphate hydrolase(c37)

Ras-related protein RAB-5A1r2qA(c3718)

Guanylate kinase1gkyA(c3711)

RecA proteinDomain1 1xmsA1(c37111)

平行のβシートが主トポロジーには様々な変異あり

シグナル伝達DNA結合

モーター機能など多彩な分子機能を担うがATP GTPなどのヌクレオシド

の加水分解を行う点は共通

N C

132 4 5 6

ヌクレオシド結合部GxxxxGKTの

配列モチーフ(P-loop)を持つ

ロスマン フォールドNAD(P)‐binding Rossmann‐fold domains (c2)

Alcohol dehydrogenase gamma chaindomain2 1u3wA(c211)

Aspartate beta-semialdehydedehydrogenase2gz1A1(c213)

L-alanine dehydrogenase1pjcA1(c214)

補酵素を利用したNAD(P)を脱水素酵素を持つ基質を認識するドメインは別に存在する

NC

123 4 5 6

平行のβシートが主

7枚羽 βプロペラ7‐bladed beta‐propeller (b69)

Garactose oxydasedomain3 1k3iA3(b6911)

Guanine nucleotide-bindingprotein subunit beta-11gotB(b6941)

細胞膜付近のシグナル伝達や糖結合に関わることが多い

Influenza Neuraminidase 1f8dA(b6811)

6枚羽 βプロペラ

N C

321 4

のユニットが7回円環状に繰り返しされたフォールド

立体構造比較プログラム1990年ごろから多くの構造比較プログラムが開発されている

WEBアドレス スコア アライメント

DALI httpwwwebiacukdali

距離の差を独自の関数で変換したスコア

局所アライメントをモンテカルロ法でつなぎ合わせる

CE httpclsdsceducehtml

局所的なRMSD 局所アライメントを積み上げていく

MATRAS httpbiunitnaistjpmatras

距離の変化が相同相似で起こる確率の比をスコアとする

SSEで仮アライメント

を生成残基アライメントを収束するまで反復する

タンパク質の相同性の判断基準

100

同一残基率30以上

BLASTのE-value lt 00001

PSI-BLASTのE-value lt 00001

0102030407025 15 535

同一残基率(Sequence Identity)()

立体構造比較が必要

(1)立体構造の類似性が高い(DALIのZスコアMATRASのRdisスコア)(2)同一残基率がそこそこ高い(PSI-BLASTでヒットするSeqIDgt=15ぐらい)

(3)分子機能に類似性がある(補酵素酵素反応基質代謝経路等の共通性等)(4)基質補酵素の結合部位が類似しておりそのアミノ酸が保存(モチーフ)(5)ドメイン構成の共通性(6)スーパーフォールドの場合は特別な注意が必要

配列解析

同一残基率が25以下の場合の相同性の判断基準

50608090

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 20: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

PDBコード1fxd(ferredoxin II) Rasmol Chimeプラグインで描画

立体構造の描画スタイル

ワイアフレーム ボールスティック 空間充填

バックボーン リボン 分子表面

1 234

N

H C

O

Ala(A)(疎水性)

Phe(F)(疎水性)

Cys(C)(親水性)

Asp(D)(親水性)

Val(V)(疎水性)

Thr(親水性)

様々な物理化学的な性質を持った側鎖が主鎖のペプチド結合で連なる

Leu(L)(疎水性)

蛋白質ペプチド結合したアミノ酸群

アミノ酸は全部で20種類

I VL

M FYW H

KR

D E

P NSA Q

CG T

疎水性 親水性

脂肪族

芳香族正荷電

負荷電

N末

C末

変性状態(D) 天然状態(N)

フォールディング(折り畳み)という現象

非常に多種の構造の集合大きく広がっている

ほとんど唯一の構造小さくコンパクトに折りたたまっている

温度や変性剤濃度によって可逆に変化

折り畳みは原則としてその蛋白質以外の分子の介助を必要としない

アミノ酸配列の情報だけで天然状態の立体構造が決定される

どうやってコンパクトになるか rarr (1)主鎖の水素結合(2)側鎖間の疎水性相互作用

あるアミノ酸配列がどうやって一つの構造を決めるのか

3次元座標の差のスコア(RMSD)

並進ベクトルt を引いたあと回転行列R をかける

t 二つの分子の重心をあわせるように決めるR 2つの原子群の相関を 大化する行列rarr(1)特異値分解で導出

(2)四元数表現により 適な回転をLagrange未定乗数法で決定

sum=

minusminus=N

iiiN

RMSD1

2)](R[1 tyx

21

20

1

2

3

4

5

1xdaA

1

23

4

21

20

5

yi

)(R ty minusi

xi

1

23

4

21

20

5

原子の対応付けがわかっているとする

RMSD 適に重ね合わせたときのXYZ座標の差(Root Mean Square Deviation)

1benA

WKabsch Acta CrystA 32922-923(1976) 34827-828(1978)ADMclachlan JMolBiol 12874-77 (1979)Charles FF Karney ldquoQuaternions in molecular modelingrdquo E-print arXivphysics0506177

xi分子Xのi番目の原子の位置ベクトル yi分子Yのi番目の原子の位置ベクトル

距離の差のスコア (DRMS)

( )sumsum= ge

minusminus

=N

i

N

ij

Yij

Xij DD

NNDRMS

1

2

)1(2

21

20

1

2

3

4

5

YijD

XijD

1

23

4

21

20

5

yixi

DRMS 対応する原子ペアの距離の差(Distance-based RMSD)

原子の対応付けがわかっているとする

重ね合わせは不要なので計算は簡単

3次元によらない2次元や結合情報にも拡張できる

鏡像の区別はできない

1benA

計算が簡単なので高速な構造比較のアルゴリズムの基盤として使われる

1xdaA

H19 問73立体構造の似ている2つのタンパク質間で対応関係にある原子が分かっている場合にはRMSD(Root Mean Square Deviation)と呼ばれる数値を計算することにより立体構造の重なり合いの程度を数値化することができるRMSDは全ての対応する原子間の距離を

2乗した値の平均値(相加平均)にルートをとったものとして定義されるあるタンパク質における6つの原子ABCDEFと別のタンパク質の6つの原子

ArsquoBrsquoCrsquoDrsquoErsquoFrsquoについて対応関係が分かっており互いにもっともよく重なるように回転して重ねた時の対応原子間の距離は以下の表のようになったこの表からB-Brsquo C-Crsquo D-Drsquo E-Ersquoは正確に重なったが他の原子間ではずれが見られることがわかるここで6つの原子に対するRMSD値はいくらになるか選択肢の中からもっとも適切な値を一つ選べただ

し原子間距離の単位は考慮しないものとする

対応原子 距離

原子A―原子Arsquo 20

原子B―原子Brsquo 00

原子C―原子Crsquo 00

原子D―原子Crsquo 10

原子E―原子Crsquo 00

原子F―原子Crsquo 10

1 052 0663 104 133

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問73立体構造の似ている2つのタンパク質間で対応関係にある原子が分かっている場合にはRMSD(Root Mean Square Deviation)と呼ばれる数値を計算することにより立体構造の重なり合いの程度を数値化することができるRMSDは全ての対応する原子間の距離を

2乗した値の平均値(相加平均)にルートをとったものとして定義されるあるタンパク質における6つの原子ABCDEFと別のタンパク質の6つの原子

ArsquoBrsquoCrsquoDrsquoErsquoFrsquoについて対応関係が分かっており互いにもっともよく重なるように回転して重ねた時の対応原子間の距離は以下の表のようになったこの表からB-Brsquo C-Crsquo D-Drsquo E-Ersquoは正確に重なったが他の原子間ではずれが見られることがわかるここで6つの原子に対するRMSD値はいくらになるか選択肢の中からもっとも適切な値を一つ選べただ

し原子間距離の単位は考慮しないものとする

対応原子 距離

原子A―原子Arsquo 20

原子B―原子Brsquo 00

原子C―原子Crsquo 00

原子D―原子Crsquo 10

原子E―原子Crsquo 00

原子F―原子Crsquo 10

1 052 0663 104 133

RMSDは 適に重ね合わせたときの

「ずれの二乗の平均のルート」であるしたがってずれの二乗平均は

(22+0+0+1+0+1)6=66=1これのルートをとるとradic1=1

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

1

2

3

4

56

7

8

9

10

11

主鎖の水素結合αへリックス

1

2

34

56

78

9

10

11

O

N

CHN

N

H

H

CO Cα

i

i+3

i+4

HN O C

Cαi-1

i番目のCOがi+4番目のNHと水素結合を形成

36残基が1周期の右巻きらせん

NHO=Cが同じ向きに並ぶため

へリックス全体に電気双極子が発生

N末C末

ー +

主鎖の水素結合逆平行βシート

βターン

βターン

βヘアピン

βヘアピン

伸びた構造の1本1本をβストランドと呼ぶ二本以上のβストランドがシート状に並んだ構造をβシートと呼ぶ

βストランド

βストランド

βストランド

主鎖の水素結合平行βシート

βminusαminusβモチーフ

平行βシートがαへリックスで接続された構造モチーフ

βストランド

βストランド

βストランド

伸びた構造の1本1本をβストランドと呼ぶ二本以上のβストランドがシート状に並んだ構造をβシートと呼ぶ

Cαi

Cαi+1Cα

i-1φ ψ

ペプチド結合の平面性とφψの定義

主鎖の原子のXYZ座標はφψの2つ

の角度でほとんど記述できる

φψの角度を2次元にプロットしたものをラマチャンドランプロット(Ramachandran plot)という点が集中する領域は2次構造とよく対応

点が現れない領域は主鎖の原子が衝突する

βシート

αへリックス

左巻きへリックス

平面平面

φ

ψ

H19 問74タンパク質の主鎖に添って定義される二面角のうちφ(窒素原子と炭素原子の間の二面角)とψ(α炭素原子とカルボニル基の炭素原子の間の二面角)の値を各残

基ごとに計算して二次元にプロットしたものをラマチャンドランプロットと呼ぶ以下に示したラマチャンドランプロットに対する説明文の中でもっとも適切なものを一つ選べ

1 (a)(b)はともにαへリックスの領域である2 (a)(b)はともにβストランドの領域である3 (a)はαへリックス(b)はβストランドの領

域である4 (a)はβストランド(b)はαへリックスの領

域である

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問74タンパク質の主鎖に添って定義される二面角のうちφ(窒素原子と炭素原子の間の二面角)とψ(α炭素原子とカルボニル基の炭素原子の間の二面角)の値を各残

基ごとに計算して二次元にプロットしたものをラマチャンドランプロットと呼ぶ以下に示したラマチャンドランプロットに対する説明文の中でもっとも適切なものを一つ選べ

1 (a)(b)はともにαへリックスの領域である2 (a)(b)はともにβストランドの領域である3 (a)はαへリックス(b)はβストランドの領

域である4 (a)はβストランド(b)はαへリックスの領

域である

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

トポロジー図によるβシートの表現

4 23

N

C

1

1ubq (UbiquitinHumand151)

N

C123 4 5 6

1n8k (Alchol dehydrogenase E chain Horse c21)

ロスマンフォールド

βターン

βターン

1cauA1rhdA domain2

TOPSプログラムによる表示httpwwwtopsleedsacuk

1timA

はαへリックスはβストランドとなりあうの向きで平行逆平行を示す

コンタクトマップ

1ubq

C

4 23

N

1

縦横に残基を配置しある残基ペアのCα原子間の距離が10Å以下であれば対応するピクセルに色を塗る

分子描画ソフトVMDを用いて作成

平行のストランド間は方向逆平行ストランド間は方向に線分が観察される

N

C

N C

逆平行

逆平行

平行

αへリックスは太めの対角上の線分

へリックス

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから1か3コンタクトマップから平行シートしかないことがわかるため1であることがわかる

αβ5

αβ3

α

β4α

β1αβ2 β2

β1β3β4

β5

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから2か4コンタクトマップから平行シートしかないことがわかるため2であることがわかる

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

配列比較によるタンパク質分類1970年代から配列の一致度(sequence identity)に基づいてグループを作る作業が

行われてきた

どのくらいの類似性で一つにまとめるかは様々な考えがあるが少なくとも「相同なタンパク質群」を一つのグループにまとめるべき

ファミリー(family 族)

進化的に関係のある(相同な)タンパク質グループのこと

複数のファミリーがあつまった大きなグループ スーパーファミリー(superfamily clan)

一つのファミリーの中の小さなグループ サブファミリー(subfamily)

family

subfamily superfamily

ドメイン単位による分類

A2 B2

B3 C3

A1

配列1

配列2

配列3

配列の部分どうしだけが類似していた場合 部分一致を重視するとすべて一つのグループになるがhellip

配列1

配列2 配列3

Aを共有

Bを共有

1と2が類似2と3が類似していても1と3は類似していない

ドメインに分割すると

A1

A2

B2

B3

C3

A2 B2

B3 C3

A1

きれいに分類することができる

Pfam 蛋白質ファミリのデータベース各蛋白質ファミリのマルチプル

アライメント HMMなどを集めたデータベース

httppfamsangeracuk

Pkinase_Tyrドメインをもつタンパク質の例

ABL_HUMAN

BTK_HUMAN

ILK_HUMAN

MERTK_HUMAN

PGFRB_HUMAN

HCK_HUMAN

Family Pkinase_Tyr (PF07714) Protein tyrosine kinase

Pfamデータベース(httppfamsangeracukSoftwarePfam)からの引用

ドメイン構造と疎水性の関係Tyrosine protein kinase HCK (1ad5A HCK_HUMAN)

SH3 domain

SH2 domain

Tyrosine-kinase domain

3つの分断された疎水性コアrarr ドメイン構造

大きなタンパク質はいくつかの構造上のまとまり(ドメイン)を持つことが多い

立体構造によるタンパク質の分類

bull 配列による分類の延長ドメイン単位の分類進化的に関係のある(相同な)タンパク質を群にする(ファミリー)という考え方は同じ

bull 立体構造の類似性からより遠縁の相同性を見つけより大きな群を作る(スーパーファミリー)

bull スーパーファミリーをまとめたさらに大きなグループ(フォールドクラス)

bull 主にアミノ酸(Cαレベル)のラフな構造の類似性に

着目

bull 分類対象は主に球状タンパク質

立体構造分類データベースSCOPhttpscopmrc-lmbcamacukscop

4階層で分類Class(クラス)

Fold(フォールド)

Superfamily(スーパーファミリー)

Family(ファミリー)

どの階層に分類するかは配列の類似性立体構造の類似性分子機能の類似性機能部位の類似性

を専門家が総合的に判断して決める

1akr

ltホモロジーgt

ltアナロジーgt

他の構造分類データベースとしてCATHが有名

同様に階層的な分類体系を持つがその詳細はSCOPとは異なる

クラス

1mbd

1mqkH

1n55A 1pqwA

1fxd 1a2p

all-α (a)

all-β (b)

αβ (c)

α+β (d)

α-へリックスが中心

β-シートが中心

逆平行が多い

α-へリックスとβ-シートが配列上交互に現れる平行β-シートが中心

α-へリックスとβ-シートが混在配列上の並びの規則はない逆平行と平行のβ-シートが混在

アミノ酸配列と立体構造の関係ピロリ菌と大腸菌のフラボドキシン (同一残基率 SeqID 44)

ピロリ菌(1fueA) 大腸菌(1ag9A)

配列が似ていれば立体構造も似ている

SeqID = 44

RMSD = 12 Å

1fueA 2GKIGIFFGTDSGNAEAIAEKISKAIG--NAEVVDVAKASKEQFNGFTKVILVAPTAGAGD59

1ag9A 2AITGIFFGSDTGNTENIAKMIQKQLGKDVADVHDIAKSSKEDLEAYDILLLGIPTWYYGE61

1fueA 60LQTDWEDFLGTLEASD-FANKTIGLVGLGDQDTYSETFAEGIFHIYEKAK--AGKVVGQT116

1ag9A 62AQCDWDDFFPTLE-EIDFNGKLVALFGCGDQEDYAEYFCDALGTIRDIIEPRGATIVGHW120

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C 14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

BLAST

PSI-BLAST 構造比較

構造比較

アミノ酸配列がほとんど似ていなくても立体構造は似ている場合がある

構造は配列より進化的に保存がよい 構造比較から新たなホモログが発見できる可能性

立体

構造

の変

アミノ酸配列の変化と立体構造の変化の相関(グロビン族)

立体構造の変化はアミノ酸配列の変化と相関配列が30以上一致していればRMSDは2Å以下

アミノ酸配列の類似度

2つの構造の類似性

ホモロジー (homology 相同)進化的起源を共有することによる類似多くの場合分子機能なども類似している

アナロジー (analogy 相似)進化的起源とは無関係な類似多くの場合分子機能など他の属性は似ていない物理化学的な構造の偏好が原因とされる

イルカの胸びれ サルの前足

チョウの羽 トリの翼

ネコの前足

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C

ldquoFlavodoxin-likerdquo fold (c23)

ldquoFlavoproteinsrdquo superfamily (c235)

ldquoCheY-likerdquosuperfamily(c231)

14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

AnalogyHomology

HomologyHomolo

gy

多く現れるフォールド(出現ドメイン数順)

太字はスーパーフォールド多くのスーパーファミリーを含むフォールド

d58

c1

g3

c23 b34

b1

a4フォールド名 (SCOP173によるクラスfhijkは除く) ドメイ

ンの数

スーパーファミリーの数

a4 DNARNA-binding 3-helical bundle 292 14c1 TIM betaalpha-barrel 269 33d58 Ferredoxin-like 248 55b1 Immunoglobulin-like beta sandwich 246 27c37 P-loop nucleoside triphosphate hydrolase 235 1c2 NAD(P)-binding Rossmann-fold domains 168 1g3 Knottins 154 19d15 Beta-Grasp(ubiquitin-like) 131 13c23 Flavodoxin-like 118 15b34 SH3-like barrel 117 18b40 OB-fold 100 12c66 SAM-dependent methyltransferases 95 1

c37 c2

d15

b40 c66

スーパーフォールド(Superfold)

フォールド名 (SCOP173によるクラスfhijkは除く) その下のスーパーファミリーの数

d58 Ferredoxin-like 55c1 TIM betaalpha-barrel 33b1 Immunoglobulin-like beta sandwich 27a24 Four-helical up-and-down bundle 27a118 Alpha-alpha superhelix 23g3 Knottins 19b34 SH3-like barrel 18g41 Rubredoxin-like 16c23 Flavodoxin-like 15a60 SAM(sterile alpha motif) domain-like 15b69 7-bladed beta-propeller 14a4 DNARNA-binding 3-helical bundle 14

スーパーフォールド多くのスーパーファミリーを含むフォールド

スーパーフォールドは「構造の類似と機能の類似が対応しにくいフォールド」ともいえる

d58

c1

g3a118

c23

a24

a60

b34

b1

g41

b69 a4

三本へリックスバンドルDNARNA‐binding 3‐helical bundle(a4)

Mating type protein A2 yeast(1k61Aa411)

(1gvdAa413)(1wh5Aa411)

三本のへリックスが束になった構造DNAやRNAに結合する蛋白質が多い

DNAと

結合した構造(1k61)

TIMバレルTIM betaalpha barrel (c1)

Triosephosphate isomerase1n55A(c111)

全般に解糖系の酵素が多い基質酵素反応は極めて多彩

八本のβストランドとαへリックスが交互に組み合わさり対称的な樽(barrel)構造を形成す

る中央の樽構造は平行のβシートからなる

Imidazole glycerol phosphate synthasesubunit hisF1thfD(c121)

KHGKDPG aldolase1euaA(c1101)

フェレドキシン様Ferredoxin‐like (d58)

4Fe-4S Ferredoxin(1fxdd581)

1 234 4本の逆平行のβストランドと2本のαへリックスからな

分子機能は極めて多彩

CheY binding domain of CheA(1eayCd5824)

U1A RNA binding domain(1nu4Ad5871)

免疫グロブリン様Immunoglobulin‐like beta sandwich(b1)

Immunoglobulin Heavy chain variabledomain 1mjuH1(b111)

Immunoglobulin Heavy chain constantdomain 1mjuH2(b112)

Macromomycin1noaA (b171)

免疫グロブリン分子はH鎖とL鎖から

なりそれぞれ免疫グロブリン様ドメインからできている

V

C

V

C

C

C

V

CV

CC

C

L鎖

H鎖H鎖 L鎖

細胞表面あるいは分泌蛋白質が多い免疫や分子認識に関する機能を担うことが多い

4本のβストランドからなるβシートが二枚サンドイッチ状に重なった構造をとる逆平行のβシートが主

P‐loop スーパーファミリーP‐loop nucleoside triphosphate hydrolase(c37)

Ras-related protein RAB-5A1r2qA(c3718)

Guanylate kinase1gkyA(c3711)

RecA proteinDomain1 1xmsA1(c37111)

平行のβシートが主トポロジーには様々な変異あり

シグナル伝達DNA結合

モーター機能など多彩な分子機能を担うがATP GTPなどのヌクレオシド

の加水分解を行う点は共通

N C

132 4 5 6

ヌクレオシド結合部GxxxxGKTの

配列モチーフ(P-loop)を持つ

ロスマン フォールドNAD(P)‐binding Rossmann‐fold domains (c2)

Alcohol dehydrogenase gamma chaindomain2 1u3wA(c211)

Aspartate beta-semialdehydedehydrogenase2gz1A1(c213)

L-alanine dehydrogenase1pjcA1(c214)

補酵素を利用したNAD(P)を脱水素酵素を持つ基質を認識するドメインは別に存在する

NC

123 4 5 6

平行のβシートが主

7枚羽 βプロペラ7‐bladed beta‐propeller (b69)

Garactose oxydasedomain3 1k3iA3(b6911)

Guanine nucleotide-bindingprotein subunit beta-11gotB(b6941)

細胞膜付近のシグナル伝達や糖結合に関わることが多い

Influenza Neuraminidase 1f8dA(b6811)

6枚羽 βプロペラ

N C

321 4

のユニットが7回円環状に繰り返しされたフォールド

立体構造比較プログラム1990年ごろから多くの構造比較プログラムが開発されている

WEBアドレス スコア アライメント

DALI httpwwwebiacukdali

距離の差を独自の関数で変換したスコア

局所アライメントをモンテカルロ法でつなぎ合わせる

CE httpclsdsceducehtml

局所的なRMSD 局所アライメントを積み上げていく

MATRAS httpbiunitnaistjpmatras

距離の変化が相同相似で起こる確率の比をスコアとする

SSEで仮アライメント

を生成残基アライメントを収束するまで反復する

タンパク質の相同性の判断基準

100

同一残基率30以上

BLASTのE-value lt 00001

PSI-BLASTのE-value lt 00001

0102030407025 15 535

同一残基率(Sequence Identity)()

立体構造比較が必要

(1)立体構造の類似性が高い(DALIのZスコアMATRASのRdisスコア)(2)同一残基率がそこそこ高い(PSI-BLASTでヒットするSeqIDgt=15ぐらい)

(3)分子機能に類似性がある(補酵素酵素反応基質代謝経路等の共通性等)(4)基質補酵素の結合部位が類似しておりそのアミノ酸が保存(モチーフ)(5)ドメイン構成の共通性(6)スーパーフォールドの場合は特別な注意が必要

配列解析

同一残基率が25以下の場合の相同性の判断基準

50608090

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 21: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

N

H C

O

Ala(A)(疎水性)

Phe(F)(疎水性)

Cys(C)(親水性)

Asp(D)(親水性)

Val(V)(疎水性)

Thr(親水性)

様々な物理化学的な性質を持った側鎖が主鎖のペプチド結合で連なる

Leu(L)(疎水性)

蛋白質ペプチド結合したアミノ酸群

アミノ酸は全部で20種類

I VL

M FYW H

KR

D E

P NSA Q

CG T

疎水性 親水性

脂肪族

芳香族正荷電

負荷電

N末

C末

変性状態(D) 天然状態(N)

フォールディング(折り畳み)という現象

非常に多種の構造の集合大きく広がっている

ほとんど唯一の構造小さくコンパクトに折りたたまっている

温度や変性剤濃度によって可逆に変化

折り畳みは原則としてその蛋白質以外の分子の介助を必要としない

アミノ酸配列の情報だけで天然状態の立体構造が決定される

どうやってコンパクトになるか rarr (1)主鎖の水素結合(2)側鎖間の疎水性相互作用

あるアミノ酸配列がどうやって一つの構造を決めるのか

3次元座標の差のスコア(RMSD)

並進ベクトルt を引いたあと回転行列R をかける

t 二つの分子の重心をあわせるように決めるR 2つの原子群の相関を 大化する行列rarr(1)特異値分解で導出

(2)四元数表現により 適な回転をLagrange未定乗数法で決定

sum=

minusminus=N

iiiN

RMSD1

2)](R[1 tyx

21

20

1

2

3

4

5

1xdaA

1

23

4

21

20

5

yi

)(R ty minusi

xi

1

23

4

21

20

5

原子の対応付けがわかっているとする

RMSD 適に重ね合わせたときのXYZ座標の差(Root Mean Square Deviation)

1benA

WKabsch Acta CrystA 32922-923(1976) 34827-828(1978)ADMclachlan JMolBiol 12874-77 (1979)Charles FF Karney ldquoQuaternions in molecular modelingrdquo E-print arXivphysics0506177

xi分子Xのi番目の原子の位置ベクトル yi分子Yのi番目の原子の位置ベクトル

距離の差のスコア (DRMS)

( )sumsum= ge

minusminus

=N

i

N

ij

Yij

Xij DD

NNDRMS

1

2

)1(2

21

20

1

2

3

4

5

YijD

XijD

1

23

4

21

20

5

yixi

DRMS 対応する原子ペアの距離の差(Distance-based RMSD)

原子の対応付けがわかっているとする

重ね合わせは不要なので計算は簡単

3次元によらない2次元や結合情報にも拡張できる

鏡像の区別はできない

1benA

計算が簡単なので高速な構造比較のアルゴリズムの基盤として使われる

1xdaA

H19 問73立体構造の似ている2つのタンパク質間で対応関係にある原子が分かっている場合にはRMSD(Root Mean Square Deviation)と呼ばれる数値を計算することにより立体構造の重なり合いの程度を数値化することができるRMSDは全ての対応する原子間の距離を

2乗した値の平均値(相加平均)にルートをとったものとして定義されるあるタンパク質における6つの原子ABCDEFと別のタンパク質の6つの原子

ArsquoBrsquoCrsquoDrsquoErsquoFrsquoについて対応関係が分かっており互いにもっともよく重なるように回転して重ねた時の対応原子間の距離は以下の表のようになったこの表からB-Brsquo C-Crsquo D-Drsquo E-Ersquoは正確に重なったが他の原子間ではずれが見られることがわかるここで6つの原子に対するRMSD値はいくらになるか選択肢の中からもっとも適切な値を一つ選べただ

し原子間距離の単位は考慮しないものとする

対応原子 距離

原子A―原子Arsquo 20

原子B―原子Brsquo 00

原子C―原子Crsquo 00

原子D―原子Crsquo 10

原子E―原子Crsquo 00

原子F―原子Crsquo 10

1 052 0663 104 133

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問73立体構造の似ている2つのタンパク質間で対応関係にある原子が分かっている場合にはRMSD(Root Mean Square Deviation)と呼ばれる数値を計算することにより立体構造の重なり合いの程度を数値化することができるRMSDは全ての対応する原子間の距離を

2乗した値の平均値(相加平均)にルートをとったものとして定義されるあるタンパク質における6つの原子ABCDEFと別のタンパク質の6つの原子

ArsquoBrsquoCrsquoDrsquoErsquoFrsquoについて対応関係が分かっており互いにもっともよく重なるように回転して重ねた時の対応原子間の距離は以下の表のようになったこの表からB-Brsquo C-Crsquo D-Drsquo E-Ersquoは正確に重なったが他の原子間ではずれが見られることがわかるここで6つの原子に対するRMSD値はいくらになるか選択肢の中からもっとも適切な値を一つ選べただ

し原子間距離の単位は考慮しないものとする

対応原子 距離

原子A―原子Arsquo 20

原子B―原子Brsquo 00

原子C―原子Crsquo 00

原子D―原子Crsquo 10

原子E―原子Crsquo 00

原子F―原子Crsquo 10

1 052 0663 104 133

RMSDは 適に重ね合わせたときの

「ずれの二乗の平均のルート」であるしたがってずれの二乗平均は

(22+0+0+1+0+1)6=66=1これのルートをとるとradic1=1

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

1

2

3

4

56

7

8

9

10

11

主鎖の水素結合αへリックス

1

2

34

56

78

9

10

11

O

N

CHN

N

H

H

CO Cα

i

i+3

i+4

HN O C

Cαi-1

i番目のCOがi+4番目のNHと水素結合を形成

36残基が1周期の右巻きらせん

NHO=Cが同じ向きに並ぶため

へリックス全体に電気双極子が発生

N末C末

ー +

主鎖の水素結合逆平行βシート

βターン

βターン

βヘアピン

βヘアピン

伸びた構造の1本1本をβストランドと呼ぶ二本以上のβストランドがシート状に並んだ構造をβシートと呼ぶ

βストランド

βストランド

βストランド

主鎖の水素結合平行βシート

βminusαminusβモチーフ

平行βシートがαへリックスで接続された構造モチーフ

βストランド

βストランド

βストランド

伸びた構造の1本1本をβストランドと呼ぶ二本以上のβストランドがシート状に並んだ構造をβシートと呼ぶ

Cαi

Cαi+1Cα

i-1φ ψ

ペプチド結合の平面性とφψの定義

主鎖の原子のXYZ座標はφψの2つ

の角度でほとんど記述できる

φψの角度を2次元にプロットしたものをラマチャンドランプロット(Ramachandran plot)という点が集中する領域は2次構造とよく対応

点が現れない領域は主鎖の原子が衝突する

βシート

αへリックス

左巻きへリックス

平面平面

φ

ψ

H19 問74タンパク質の主鎖に添って定義される二面角のうちφ(窒素原子と炭素原子の間の二面角)とψ(α炭素原子とカルボニル基の炭素原子の間の二面角)の値を各残

基ごとに計算して二次元にプロットしたものをラマチャンドランプロットと呼ぶ以下に示したラマチャンドランプロットに対する説明文の中でもっとも適切なものを一つ選べ

1 (a)(b)はともにαへリックスの領域である2 (a)(b)はともにβストランドの領域である3 (a)はαへリックス(b)はβストランドの領

域である4 (a)はβストランド(b)はαへリックスの領

域である

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問74タンパク質の主鎖に添って定義される二面角のうちφ(窒素原子と炭素原子の間の二面角)とψ(α炭素原子とカルボニル基の炭素原子の間の二面角)の値を各残

基ごとに計算して二次元にプロットしたものをラマチャンドランプロットと呼ぶ以下に示したラマチャンドランプロットに対する説明文の中でもっとも適切なものを一つ選べ

1 (a)(b)はともにαへリックスの領域である2 (a)(b)はともにβストランドの領域である3 (a)はαへリックス(b)はβストランドの領

域である4 (a)はβストランド(b)はαへリックスの領

域である

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

トポロジー図によるβシートの表現

4 23

N

C

1

1ubq (UbiquitinHumand151)

N

C123 4 5 6

1n8k (Alchol dehydrogenase E chain Horse c21)

ロスマンフォールド

βターン

βターン

1cauA1rhdA domain2

TOPSプログラムによる表示httpwwwtopsleedsacuk

1timA

はαへリックスはβストランドとなりあうの向きで平行逆平行を示す

コンタクトマップ

1ubq

C

4 23

N

1

縦横に残基を配置しある残基ペアのCα原子間の距離が10Å以下であれば対応するピクセルに色を塗る

分子描画ソフトVMDを用いて作成

平行のストランド間は方向逆平行ストランド間は方向に線分が観察される

N

C

N C

逆平行

逆平行

平行

αへリックスは太めの対角上の線分

へリックス

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから1か3コンタクトマップから平行シートしかないことがわかるため1であることがわかる

αβ5

αβ3

α

β4α

β1αβ2 β2

β1β3β4

β5

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから2か4コンタクトマップから平行シートしかないことがわかるため2であることがわかる

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

配列比較によるタンパク質分類1970年代から配列の一致度(sequence identity)に基づいてグループを作る作業が

行われてきた

どのくらいの類似性で一つにまとめるかは様々な考えがあるが少なくとも「相同なタンパク質群」を一つのグループにまとめるべき

ファミリー(family 族)

進化的に関係のある(相同な)タンパク質グループのこと

複数のファミリーがあつまった大きなグループ スーパーファミリー(superfamily clan)

一つのファミリーの中の小さなグループ サブファミリー(subfamily)

family

subfamily superfamily

ドメイン単位による分類

A2 B2

B3 C3

A1

配列1

配列2

配列3

配列の部分どうしだけが類似していた場合 部分一致を重視するとすべて一つのグループになるがhellip

配列1

配列2 配列3

Aを共有

Bを共有

1と2が類似2と3が類似していても1と3は類似していない

ドメインに分割すると

A1

A2

B2

B3

C3

A2 B2

B3 C3

A1

きれいに分類することができる

Pfam 蛋白質ファミリのデータベース各蛋白質ファミリのマルチプル

アライメント HMMなどを集めたデータベース

httppfamsangeracuk

Pkinase_Tyrドメインをもつタンパク質の例

ABL_HUMAN

BTK_HUMAN

ILK_HUMAN

MERTK_HUMAN

PGFRB_HUMAN

HCK_HUMAN

Family Pkinase_Tyr (PF07714) Protein tyrosine kinase

Pfamデータベース(httppfamsangeracukSoftwarePfam)からの引用

ドメイン構造と疎水性の関係Tyrosine protein kinase HCK (1ad5A HCK_HUMAN)

SH3 domain

SH2 domain

Tyrosine-kinase domain

3つの分断された疎水性コアrarr ドメイン構造

大きなタンパク質はいくつかの構造上のまとまり(ドメイン)を持つことが多い

立体構造によるタンパク質の分類

bull 配列による分類の延長ドメイン単位の分類進化的に関係のある(相同な)タンパク質を群にする(ファミリー)という考え方は同じ

bull 立体構造の類似性からより遠縁の相同性を見つけより大きな群を作る(スーパーファミリー)

bull スーパーファミリーをまとめたさらに大きなグループ(フォールドクラス)

bull 主にアミノ酸(Cαレベル)のラフな構造の類似性に

着目

bull 分類対象は主に球状タンパク質

立体構造分類データベースSCOPhttpscopmrc-lmbcamacukscop

4階層で分類Class(クラス)

Fold(フォールド)

Superfamily(スーパーファミリー)

Family(ファミリー)

どの階層に分類するかは配列の類似性立体構造の類似性分子機能の類似性機能部位の類似性

を専門家が総合的に判断して決める

1akr

ltホモロジーgt

ltアナロジーgt

他の構造分類データベースとしてCATHが有名

同様に階層的な分類体系を持つがその詳細はSCOPとは異なる

クラス

1mbd

1mqkH

1n55A 1pqwA

1fxd 1a2p

all-α (a)

all-β (b)

αβ (c)

α+β (d)

α-へリックスが中心

β-シートが中心

逆平行が多い

α-へリックスとβ-シートが配列上交互に現れる平行β-シートが中心

α-へリックスとβ-シートが混在配列上の並びの規則はない逆平行と平行のβ-シートが混在

アミノ酸配列と立体構造の関係ピロリ菌と大腸菌のフラボドキシン (同一残基率 SeqID 44)

ピロリ菌(1fueA) 大腸菌(1ag9A)

配列が似ていれば立体構造も似ている

SeqID = 44

RMSD = 12 Å

1fueA 2GKIGIFFGTDSGNAEAIAEKISKAIG--NAEVVDVAKASKEQFNGFTKVILVAPTAGAGD59

1ag9A 2AITGIFFGSDTGNTENIAKMIQKQLGKDVADVHDIAKSSKEDLEAYDILLLGIPTWYYGE61

1fueA 60LQTDWEDFLGTLEASD-FANKTIGLVGLGDQDTYSETFAEGIFHIYEKAK--AGKVVGQT116

1ag9A 62AQCDWDDFFPTLE-EIDFNGKLVALFGCGDQEDYAEYFCDALGTIRDIIEPRGATIVGHW120

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C 14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

BLAST

PSI-BLAST 構造比較

構造比較

アミノ酸配列がほとんど似ていなくても立体構造は似ている場合がある

構造は配列より進化的に保存がよい 構造比較から新たなホモログが発見できる可能性

立体

構造

の変

アミノ酸配列の変化と立体構造の変化の相関(グロビン族)

立体構造の変化はアミノ酸配列の変化と相関配列が30以上一致していればRMSDは2Å以下

アミノ酸配列の類似度

2つの構造の類似性

ホモロジー (homology 相同)進化的起源を共有することによる類似多くの場合分子機能なども類似している

アナロジー (analogy 相似)進化的起源とは無関係な類似多くの場合分子機能など他の属性は似ていない物理化学的な構造の偏好が原因とされる

イルカの胸びれ サルの前足

チョウの羽 トリの翼

ネコの前足

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C

ldquoFlavodoxin-likerdquo fold (c23)

ldquoFlavoproteinsrdquo superfamily (c235)

ldquoCheY-likerdquosuperfamily(c231)

14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

AnalogyHomology

HomologyHomolo

gy

多く現れるフォールド(出現ドメイン数順)

太字はスーパーフォールド多くのスーパーファミリーを含むフォールド

d58

c1

g3

c23 b34

b1

a4フォールド名 (SCOP173によるクラスfhijkは除く) ドメイ

ンの数

スーパーファミリーの数

a4 DNARNA-binding 3-helical bundle 292 14c1 TIM betaalpha-barrel 269 33d58 Ferredoxin-like 248 55b1 Immunoglobulin-like beta sandwich 246 27c37 P-loop nucleoside triphosphate hydrolase 235 1c2 NAD(P)-binding Rossmann-fold domains 168 1g3 Knottins 154 19d15 Beta-Grasp(ubiquitin-like) 131 13c23 Flavodoxin-like 118 15b34 SH3-like barrel 117 18b40 OB-fold 100 12c66 SAM-dependent methyltransferases 95 1

c37 c2

d15

b40 c66

スーパーフォールド(Superfold)

フォールド名 (SCOP173によるクラスfhijkは除く) その下のスーパーファミリーの数

d58 Ferredoxin-like 55c1 TIM betaalpha-barrel 33b1 Immunoglobulin-like beta sandwich 27a24 Four-helical up-and-down bundle 27a118 Alpha-alpha superhelix 23g3 Knottins 19b34 SH3-like barrel 18g41 Rubredoxin-like 16c23 Flavodoxin-like 15a60 SAM(sterile alpha motif) domain-like 15b69 7-bladed beta-propeller 14a4 DNARNA-binding 3-helical bundle 14

スーパーフォールド多くのスーパーファミリーを含むフォールド

スーパーフォールドは「構造の類似と機能の類似が対応しにくいフォールド」ともいえる

d58

c1

g3a118

c23

a24

a60

b34

b1

g41

b69 a4

三本へリックスバンドルDNARNA‐binding 3‐helical bundle(a4)

Mating type protein A2 yeast(1k61Aa411)

(1gvdAa413)(1wh5Aa411)

三本のへリックスが束になった構造DNAやRNAに結合する蛋白質が多い

DNAと

結合した構造(1k61)

TIMバレルTIM betaalpha barrel (c1)

Triosephosphate isomerase1n55A(c111)

全般に解糖系の酵素が多い基質酵素反応は極めて多彩

八本のβストランドとαへリックスが交互に組み合わさり対称的な樽(barrel)構造を形成す

る中央の樽構造は平行のβシートからなる

Imidazole glycerol phosphate synthasesubunit hisF1thfD(c121)

KHGKDPG aldolase1euaA(c1101)

フェレドキシン様Ferredoxin‐like (d58)

4Fe-4S Ferredoxin(1fxdd581)

1 234 4本の逆平行のβストランドと2本のαへリックスからな

分子機能は極めて多彩

CheY binding domain of CheA(1eayCd5824)

U1A RNA binding domain(1nu4Ad5871)

免疫グロブリン様Immunoglobulin‐like beta sandwich(b1)

Immunoglobulin Heavy chain variabledomain 1mjuH1(b111)

Immunoglobulin Heavy chain constantdomain 1mjuH2(b112)

Macromomycin1noaA (b171)

免疫グロブリン分子はH鎖とL鎖から

なりそれぞれ免疫グロブリン様ドメインからできている

V

C

V

C

C

C

V

CV

CC

C

L鎖

H鎖H鎖 L鎖

細胞表面あるいは分泌蛋白質が多い免疫や分子認識に関する機能を担うことが多い

4本のβストランドからなるβシートが二枚サンドイッチ状に重なった構造をとる逆平行のβシートが主

P‐loop スーパーファミリーP‐loop nucleoside triphosphate hydrolase(c37)

Ras-related protein RAB-5A1r2qA(c3718)

Guanylate kinase1gkyA(c3711)

RecA proteinDomain1 1xmsA1(c37111)

平行のβシートが主トポロジーには様々な変異あり

シグナル伝達DNA結合

モーター機能など多彩な分子機能を担うがATP GTPなどのヌクレオシド

の加水分解を行う点は共通

N C

132 4 5 6

ヌクレオシド結合部GxxxxGKTの

配列モチーフ(P-loop)を持つ

ロスマン フォールドNAD(P)‐binding Rossmann‐fold domains (c2)

Alcohol dehydrogenase gamma chaindomain2 1u3wA(c211)

Aspartate beta-semialdehydedehydrogenase2gz1A1(c213)

L-alanine dehydrogenase1pjcA1(c214)

補酵素を利用したNAD(P)を脱水素酵素を持つ基質を認識するドメインは別に存在する

NC

123 4 5 6

平行のβシートが主

7枚羽 βプロペラ7‐bladed beta‐propeller (b69)

Garactose oxydasedomain3 1k3iA3(b6911)

Guanine nucleotide-bindingprotein subunit beta-11gotB(b6941)

細胞膜付近のシグナル伝達や糖結合に関わることが多い

Influenza Neuraminidase 1f8dA(b6811)

6枚羽 βプロペラ

N C

321 4

のユニットが7回円環状に繰り返しされたフォールド

立体構造比較プログラム1990年ごろから多くの構造比較プログラムが開発されている

WEBアドレス スコア アライメント

DALI httpwwwebiacukdali

距離の差を独自の関数で変換したスコア

局所アライメントをモンテカルロ法でつなぎ合わせる

CE httpclsdsceducehtml

局所的なRMSD 局所アライメントを積み上げていく

MATRAS httpbiunitnaistjpmatras

距離の変化が相同相似で起こる確率の比をスコアとする

SSEで仮アライメント

を生成残基アライメントを収束するまで反復する

タンパク質の相同性の判断基準

100

同一残基率30以上

BLASTのE-value lt 00001

PSI-BLASTのE-value lt 00001

0102030407025 15 535

同一残基率(Sequence Identity)()

立体構造比較が必要

(1)立体構造の類似性が高い(DALIのZスコアMATRASのRdisスコア)(2)同一残基率がそこそこ高い(PSI-BLASTでヒットするSeqIDgt=15ぐらい)

(3)分子機能に類似性がある(補酵素酵素反応基質代謝経路等の共通性等)(4)基質補酵素の結合部位が類似しておりそのアミノ酸が保存(モチーフ)(5)ドメイン構成の共通性(6)スーパーフォールドの場合は特別な注意が必要

配列解析

同一残基率が25以下の場合の相同性の判断基準

50608090

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 22: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

変性状態(D) 天然状態(N)

フォールディング(折り畳み)という現象

非常に多種の構造の集合大きく広がっている

ほとんど唯一の構造小さくコンパクトに折りたたまっている

温度や変性剤濃度によって可逆に変化

折り畳みは原則としてその蛋白質以外の分子の介助を必要としない

アミノ酸配列の情報だけで天然状態の立体構造が決定される

どうやってコンパクトになるか rarr (1)主鎖の水素結合(2)側鎖間の疎水性相互作用

あるアミノ酸配列がどうやって一つの構造を決めるのか

3次元座標の差のスコア(RMSD)

並進ベクトルt を引いたあと回転行列R をかける

t 二つの分子の重心をあわせるように決めるR 2つの原子群の相関を 大化する行列rarr(1)特異値分解で導出

(2)四元数表現により 適な回転をLagrange未定乗数法で決定

sum=

minusminus=N

iiiN

RMSD1

2)](R[1 tyx

21

20

1

2

3

4

5

1xdaA

1

23

4

21

20

5

yi

)(R ty minusi

xi

1

23

4

21

20

5

原子の対応付けがわかっているとする

RMSD 適に重ね合わせたときのXYZ座標の差(Root Mean Square Deviation)

1benA

WKabsch Acta CrystA 32922-923(1976) 34827-828(1978)ADMclachlan JMolBiol 12874-77 (1979)Charles FF Karney ldquoQuaternions in molecular modelingrdquo E-print arXivphysics0506177

xi分子Xのi番目の原子の位置ベクトル yi分子Yのi番目の原子の位置ベクトル

距離の差のスコア (DRMS)

( )sumsum= ge

minusminus

=N

i

N

ij

Yij

Xij DD

NNDRMS

1

2

)1(2

21

20

1

2

3

4

5

YijD

XijD

1

23

4

21

20

5

yixi

DRMS 対応する原子ペアの距離の差(Distance-based RMSD)

原子の対応付けがわかっているとする

重ね合わせは不要なので計算は簡単

3次元によらない2次元や結合情報にも拡張できる

鏡像の区別はできない

1benA

計算が簡単なので高速な構造比較のアルゴリズムの基盤として使われる

1xdaA

H19 問73立体構造の似ている2つのタンパク質間で対応関係にある原子が分かっている場合にはRMSD(Root Mean Square Deviation)と呼ばれる数値を計算することにより立体構造の重なり合いの程度を数値化することができるRMSDは全ての対応する原子間の距離を

2乗した値の平均値(相加平均)にルートをとったものとして定義されるあるタンパク質における6つの原子ABCDEFと別のタンパク質の6つの原子

ArsquoBrsquoCrsquoDrsquoErsquoFrsquoについて対応関係が分かっており互いにもっともよく重なるように回転して重ねた時の対応原子間の距離は以下の表のようになったこの表からB-Brsquo C-Crsquo D-Drsquo E-Ersquoは正確に重なったが他の原子間ではずれが見られることがわかるここで6つの原子に対するRMSD値はいくらになるか選択肢の中からもっとも適切な値を一つ選べただ

し原子間距離の単位は考慮しないものとする

対応原子 距離

原子A―原子Arsquo 20

原子B―原子Brsquo 00

原子C―原子Crsquo 00

原子D―原子Crsquo 10

原子E―原子Crsquo 00

原子F―原子Crsquo 10

1 052 0663 104 133

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問73立体構造の似ている2つのタンパク質間で対応関係にある原子が分かっている場合にはRMSD(Root Mean Square Deviation)と呼ばれる数値を計算することにより立体構造の重なり合いの程度を数値化することができるRMSDは全ての対応する原子間の距離を

2乗した値の平均値(相加平均)にルートをとったものとして定義されるあるタンパク質における6つの原子ABCDEFと別のタンパク質の6つの原子

ArsquoBrsquoCrsquoDrsquoErsquoFrsquoについて対応関係が分かっており互いにもっともよく重なるように回転して重ねた時の対応原子間の距離は以下の表のようになったこの表からB-Brsquo C-Crsquo D-Drsquo E-Ersquoは正確に重なったが他の原子間ではずれが見られることがわかるここで6つの原子に対するRMSD値はいくらになるか選択肢の中からもっとも適切な値を一つ選べただ

し原子間距離の単位は考慮しないものとする

対応原子 距離

原子A―原子Arsquo 20

原子B―原子Brsquo 00

原子C―原子Crsquo 00

原子D―原子Crsquo 10

原子E―原子Crsquo 00

原子F―原子Crsquo 10

1 052 0663 104 133

RMSDは 適に重ね合わせたときの

「ずれの二乗の平均のルート」であるしたがってずれの二乗平均は

(22+0+0+1+0+1)6=66=1これのルートをとるとradic1=1

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

1

2

3

4

56

7

8

9

10

11

主鎖の水素結合αへリックス

1

2

34

56

78

9

10

11

O

N

CHN

N

H

H

CO Cα

i

i+3

i+4

HN O C

Cαi-1

i番目のCOがi+4番目のNHと水素結合を形成

36残基が1周期の右巻きらせん

NHO=Cが同じ向きに並ぶため

へリックス全体に電気双極子が発生

N末C末

ー +

主鎖の水素結合逆平行βシート

βターン

βターン

βヘアピン

βヘアピン

伸びた構造の1本1本をβストランドと呼ぶ二本以上のβストランドがシート状に並んだ構造をβシートと呼ぶ

βストランド

βストランド

βストランド

主鎖の水素結合平行βシート

βminusαminusβモチーフ

平行βシートがαへリックスで接続された構造モチーフ

βストランド

βストランド

βストランド

伸びた構造の1本1本をβストランドと呼ぶ二本以上のβストランドがシート状に並んだ構造をβシートと呼ぶ

Cαi

Cαi+1Cα

i-1φ ψ

ペプチド結合の平面性とφψの定義

主鎖の原子のXYZ座標はφψの2つ

の角度でほとんど記述できる

φψの角度を2次元にプロットしたものをラマチャンドランプロット(Ramachandran plot)という点が集中する領域は2次構造とよく対応

点が現れない領域は主鎖の原子が衝突する

βシート

αへリックス

左巻きへリックス

平面平面

φ

ψ

H19 問74タンパク質の主鎖に添って定義される二面角のうちφ(窒素原子と炭素原子の間の二面角)とψ(α炭素原子とカルボニル基の炭素原子の間の二面角)の値を各残

基ごとに計算して二次元にプロットしたものをラマチャンドランプロットと呼ぶ以下に示したラマチャンドランプロットに対する説明文の中でもっとも適切なものを一つ選べ

1 (a)(b)はともにαへリックスの領域である2 (a)(b)はともにβストランドの領域である3 (a)はαへリックス(b)はβストランドの領

域である4 (a)はβストランド(b)はαへリックスの領

域である

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問74タンパク質の主鎖に添って定義される二面角のうちφ(窒素原子と炭素原子の間の二面角)とψ(α炭素原子とカルボニル基の炭素原子の間の二面角)の値を各残

基ごとに計算して二次元にプロットしたものをラマチャンドランプロットと呼ぶ以下に示したラマチャンドランプロットに対する説明文の中でもっとも適切なものを一つ選べ

1 (a)(b)はともにαへリックスの領域である2 (a)(b)はともにβストランドの領域である3 (a)はαへリックス(b)はβストランドの領

域である4 (a)はβストランド(b)はαへリックスの領

域である

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

トポロジー図によるβシートの表現

4 23

N

C

1

1ubq (UbiquitinHumand151)

N

C123 4 5 6

1n8k (Alchol dehydrogenase E chain Horse c21)

ロスマンフォールド

βターン

βターン

1cauA1rhdA domain2

TOPSプログラムによる表示httpwwwtopsleedsacuk

1timA

はαへリックスはβストランドとなりあうの向きで平行逆平行を示す

コンタクトマップ

1ubq

C

4 23

N

1

縦横に残基を配置しある残基ペアのCα原子間の距離が10Å以下であれば対応するピクセルに色を塗る

分子描画ソフトVMDを用いて作成

平行のストランド間は方向逆平行ストランド間は方向に線分が観察される

N

C

N C

逆平行

逆平行

平行

αへリックスは太めの対角上の線分

へリックス

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから1か3コンタクトマップから平行シートしかないことがわかるため1であることがわかる

αβ5

αβ3

α

β4α

β1αβ2 β2

β1β3β4

β5

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから2か4コンタクトマップから平行シートしかないことがわかるため2であることがわかる

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

配列比較によるタンパク質分類1970年代から配列の一致度(sequence identity)に基づいてグループを作る作業が

行われてきた

どのくらいの類似性で一つにまとめるかは様々な考えがあるが少なくとも「相同なタンパク質群」を一つのグループにまとめるべき

ファミリー(family 族)

進化的に関係のある(相同な)タンパク質グループのこと

複数のファミリーがあつまった大きなグループ スーパーファミリー(superfamily clan)

一つのファミリーの中の小さなグループ サブファミリー(subfamily)

family

subfamily superfamily

ドメイン単位による分類

A2 B2

B3 C3

A1

配列1

配列2

配列3

配列の部分どうしだけが類似していた場合 部分一致を重視するとすべて一つのグループになるがhellip

配列1

配列2 配列3

Aを共有

Bを共有

1と2が類似2と3が類似していても1と3は類似していない

ドメインに分割すると

A1

A2

B2

B3

C3

A2 B2

B3 C3

A1

きれいに分類することができる

Pfam 蛋白質ファミリのデータベース各蛋白質ファミリのマルチプル

アライメント HMMなどを集めたデータベース

httppfamsangeracuk

Pkinase_Tyrドメインをもつタンパク質の例

ABL_HUMAN

BTK_HUMAN

ILK_HUMAN

MERTK_HUMAN

PGFRB_HUMAN

HCK_HUMAN

Family Pkinase_Tyr (PF07714) Protein tyrosine kinase

Pfamデータベース(httppfamsangeracukSoftwarePfam)からの引用

ドメイン構造と疎水性の関係Tyrosine protein kinase HCK (1ad5A HCK_HUMAN)

SH3 domain

SH2 domain

Tyrosine-kinase domain

3つの分断された疎水性コアrarr ドメイン構造

大きなタンパク質はいくつかの構造上のまとまり(ドメイン)を持つことが多い

立体構造によるタンパク質の分類

bull 配列による分類の延長ドメイン単位の分類進化的に関係のある(相同な)タンパク質を群にする(ファミリー)という考え方は同じ

bull 立体構造の類似性からより遠縁の相同性を見つけより大きな群を作る(スーパーファミリー)

bull スーパーファミリーをまとめたさらに大きなグループ(フォールドクラス)

bull 主にアミノ酸(Cαレベル)のラフな構造の類似性に

着目

bull 分類対象は主に球状タンパク質

立体構造分類データベースSCOPhttpscopmrc-lmbcamacukscop

4階層で分類Class(クラス)

Fold(フォールド)

Superfamily(スーパーファミリー)

Family(ファミリー)

どの階層に分類するかは配列の類似性立体構造の類似性分子機能の類似性機能部位の類似性

を専門家が総合的に判断して決める

1akr

ltホモロジーgt

ltアナロジーgt

他の構造分類データベースとしてCATHが有名

同様に階層的な分類体系を持つがその詳細はSCOPとは異なる

クラス

1mbd

1mqkH

1n55A 1pqwA

1fxd 1a2p

all-α (a)

all-β (b)

αβ (c)

α+β (d)

α-へリックスが中心

β-シートが中心

逆平行が多い

α-へリックスとβ-シートが配列上交互に現れる平行β-シートが中心

α-へリックスとβ-シートが混在配列上の並びの規則はない逆平行と平行のβ-シートが混在

アミノ酸配列と立体構造の関係ピロリ菌と大腸菌のフラボドキシン (同一残基率 SeqID 44)

ピロリ菌(1fueA) 大腸菌(1ag9A)

配列が似ていれば立体構造も似ている

SeqID = 44

RMSD = 12 Å

1fueA 2GKIGIFFGTDSGNAEAIAEKISKAIG--NAEVVDVAKASKEQFNGFTKVILVAPTAGAGD59

1ag9A 2AITGIFFGSDTGNTENIAKMIQKQLGKDVADVHDIAKSSKEDLEAYDILLLGIPTWYYGE61

1fueA 60LQTDWEDFLGTLEASD-FANKTIGLVGLGDQDTYSETFAEGIFHIYEKAK--AGKVVGQT116

1ag9A 62AQCDWDDFFPTLE-EIDFNGKLVALFGCGDQEDYAEYFCDALGTIRDIIEPRGATIVGHW120

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C 14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

BLAST

PSI-BLAST 構造比較

構造比較

アミノ酸配列がほとんど似ていなくても立体構造は似ている場合がある

構造は配列より進化的に保存がよい 構造比較から新たなホモログが発見できる可能性

立体

構造

の変

アミノ酸配列の変化と立体構造の変化の相関(グロビン族)

立体構造の変化はアミノ酸配列の変化と相関配列が30以上一致していればRMSDは2Å以下

アミノ酸配列の類似度

2つの構造の類似性

ホモロジー (homology 相同)進化的起源を共有することによる類似多くの場合分子機能なども類似している

アナロジー (analogy 相似)進化的起源とは無関係な類似多くの場合分子機能など他の属性は似ていない物理化学的な構造の偏好が原因とされる

イルカの胸びれ サルの前足

チョウの羽 トリの翼

ネコの前足

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C

ldquoFlavodoxin-likerdquo fold (c23)

ldquoFlavoproteinsrdquo superfamily (c235)

ldquoCheY-likerdquosuperfamily(c231)

14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

AnalogyHomology

HomologyHomolo

gy

多く現れるフォールド(出現ドメイン数順)

太字はスーパーフォールド多くのスーパーファミリーを含むフォールド

d58

c1

g3

c23 b34

b1

a4フォールド名 (SCOP173によるクラスfhijkは除く) ドメイ

ンの数

スーパーファミリーの数

a4 DNARNA-binding 3-helical bundle 292 14c1 TIM betaalpha-barrel 269 33d58 Ferredoxin-like 248 55b1 Immunoglobulin-like beta sandwich 246 27c37 P-loop nucleoside triphosphate hydrolase 235 1c2 NAD(P)-binding Rossmann-fold domains 168 1g3 Knottins 154 19d15 Beta-Grasp(ubiquitin-like) 131 13c23 Flavodoxin-like 118 15b34 SH3-like barrel 117 18b40 OB-fold 100 12c66 SAM-dependent methyltransferases 95 1

c37 c2

d15

b40 c66

スーパーフォールド(Superfold)

フォールド名 (SCOP173によるクラスfhijkは除く) その下のスーパーファミリーの数

d58 Ferredoxin-like 55c1 TIM betaalpha-barrel 33b1 Immunoglobulin-like beta sandwich 27a24 Four-helical up-and-down bundle 27a118 Alpha-alpha superhelix 23g3 Knottins 19b34 SH3-like barrel 18g41 Rubredoxin-like 16c23 Flavodoxin-like 15a60 SAM(sterile alpha motif) domain-like 15b69 7-bladed beta-propeller 14a4 DNARNA-binding 3-helical bundle 14

スーパーフォールド多くのスーパーファミリーを含むフォールド

スーパーフォールドは「構造の類似と機能の類似が対応しにくいフォールド」ともいえる

d58

c1

g3a118

c23

a24

a60

b34

b1

g41

b69 a4

三本へリックスバンドルDNARNA‐binding 3‐helical bundle(a4)

Mating type protein A2 yeast(1k61Aa411)

(1gvdAa413)(1wh5Aa411)

三本のへリックスが束になった構造DNAやRNAに結合する蛋白質が多い

DNAと

結合した構造(1k61)

TIMバレルTIM betaalpha barrel (c1)

Triosephosphate isomerase1n55A(c111)

全般に解糖系の酵素が多い基質酵素反応は極めて多彩

八本のβストランドとαへリックスが交互に組み合わさり対称的な樽(barrel)構造を形成す

る中央の樽構造は平行のβシートからなる

Imidazole glycerol phosphate synthasesubunit hisF1thfD(c121)

KHGKDPG aldolase1euaA(c1101)

フェレドキシン様Ferredoxin‐like (d58)

4Fe-4S Ferredoxin(1fxdd581)

1 234 4本の逆平行のβストランドと2本のαへリックスからな

分子機能は極めて多彩

CheY binding domain of CheA(1eayCd5824)

U1A RNA binding domain(1nu4Ad5871)

免疫グロブリン様Immunoglobulin‐like beta sandwich(b1)

Immunoglobulin Heavy chain variabledomain 1mjuH1(b111)

Immunoglobulin Heavy chain constantdomain 1mjuH2(b112)

Macromomycin1noaA (b171)

免疫グロブリン分子はH鎖とL鎖から

なりそれぞれ免疫グロブリン様ドメインからできている

V

C

V

C

C

C

V

CV

CC

C

L鎖

H鎖H鎖 L鎖

細胞表面あるいは分泌蛋白質が多い免疫や分子認識に関する機能を担うことが多い

4本のβストランドからなるβシートが二枚サンドイッチ状に重なった構造をとる逆平行のβシートが主

P‐loop スーパーファミリーP‐loop nucleoside triphosphate hydrolase(c37)

Ras-related protein RAB-5A1r2qA(c3718)

Guanylate kinase1gkyA(c3711)

RecA proteinDomain1 1xmsA1(c37111)

平行のβシートが主トポロジーには様々な変異あり

シグナル伝達DNA結合

モーター機能など多彩な分子機能を担うがATP GTPなどのヌクレオシド

の加水分解を行う点は共通

N C

132 4 5 6

ヌクレオシド結合部GxxxxGKTの

配列モチーフ(P-loop)を持つ

ロスマン フォールドNAD(P)‐binding Rossmann‐fold domains (c2)

Alcohol dehydrogenase gamma chaindomain2 1u3wA(c211)

Aspartate beta-semialdehydedehydrogenase2gz1A1(c213)

L-alanine dehydrogenase1pjcA1(c214)

補酵素を利用したNAD(P)を脱水素酵素を持つ基質を認識するドメインは別に存在する

NC

123 4 5 6

平行のβシートが主

7枚羽 βプロペラ7‐bladed beta‐propeller (b69)

Garactose oxydasedomain3 1k3iA3(b6911)

Guanine nucleotide-bindingprotein subunit beta-11gotB(b6941)

細胞膜付近のシグナル伝達や糖結合に関わることが多い

Influenza Neuraminidase 1f8dA(b6811)

6枚羽 βプロペラ

N C

321 4

のユニットが7回円環状に繰り返しされたフォールド

立体構造比較プログラム1990年ごろから多くの構造比較プログラムが開発されている

WEBアドレス スコア アライメント

DALI httpwwwebiacukdali

距離の差を独自の関数で変換したスコア

局所アライメントをモンテカルロ法でつなぎ合わせる

CE httpclsdsceducehtml

局所的なRMSD 局所アライメントを積み上げていく

MATRAS httpbiunitnaistjpmatras

距離の変化が相同相似で起こる確率の比をスコアとする

SSEで仮アライメント

を生成残基アライメントを収束するまで反復する

タンパク質の相同性の判断基準

100

同一残基率30以上

BLASTのE-value lt 00001

PSI-BLASTのE-value lt 00001

0102030407025 15 535

同一残基率(Sequence Identity)()

立体構造比較が必要

(1)立体構造の類似性が高い(DALIのZスコアMATRASのRdisスコア)(2)同一残基率がそこそこ高い(PSI-BLASTでヒットするSeqIDgt=15ぐらい)

(3)分子機能に類似性がある(補酵素酵素反応基質代謝経路等の共通性等)(4)基質補酵素の結合部位が類似しておりそのアミノ酸が保存(モチーフ)(5)ドメイン構成の共通性(6)スーパーフォールドの場合は特別な注意が必要

配列解析

同一残基率が25以下の場合の相同性の判断基準

50608090

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 23: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

3次元座標の差のスコア(RMSD)

並進ベクトルt を引いたあと回転行列R をかける

t 二つの分子の重心をあわせるように決めるR 2つの原子群の相関を 大化する行列rarr(1)特異値分解で導出

(2)四元数表現により 適な回転をLagrange未定乗数法で決定

sum=

minusminus=N

iiiN

RMSD1

2)](R[1 tyx

21

20

1

2

3

4

5

1xdaA

1

23

4

21

20

5

yi

)(R ty minusi

xi

1

23

4

21

20

5

原子の対応付けがわかっているとする

RMSD 適に重ね合わせたときのXYZ座標の差(Root Mean Square Deviation)

1benA

WKabsch Acta CrystA 32922-923(1976) 34827-828(1978)ADMclachlan JMolBiol 12874-77 (1979)Charles FF Karney ldquoQuaternions in molecular modelingrdquo E-print arXivphysics0506177

xi分子Xのi番目の原子の位置ベクトル yi分子Yのi番目の原子の位置ベクトル

距離の差のスコア (DRMS)

( )sumsum= ge

minusminus

=N

i

N

ij

Yij

Xij DD

NNDRMS

1

2

)1(2

21

20

1

2

3

4

5

YijD

XijD

1

23

4

21

20

5

yixi

DRMS 対応する原子ペアの距離の差(Distance-based RMSD)

原子の対応付けがわかっているとする

重ね合わせは不要なので計算は簡単

3次元によらない2次元や結合情報にも拡張できる

鏡像の区別はできない

1benA

計算が簡単なので高速な構造比較のアルゴリズムの基盤として使われる

1xdaA

H19 問73立体構造の似ている2つのタンパク質間で対応関係にある原子が分かっている場合にはRMSD(Root Mean Square Deviation)と呼ばれる数値を計算することにより立体構造の重なり合いの程度を数値化することができるRMSDは全ての対応する原子間の距離を

2乗した値の平均値(相加平均)にルートをとったものとして定義されるあるタンパク質における6つの原子ABCDEFと別のタンパク質の6つの原子

ArsquoBrsquoCrsquoDrsquoErsquoFrsquoについて対応関係が分かっており互いにもっともよく重なるように回転して重ねた時の対応原子間の距離は以下の表のようになったこの表からB-Brsquo C-Crsquo D-Drsquo E-Ersquoは正確に重なったが他の原子間ではずれが見られることがわかるここで6つの原子に対するRMSD値はいくらになるか選択肢の中からもっとも適切な値を一つ選べただ

し原子間距離の単位は考慮しないものとする

対応原子 距離

原子A―原子Arsquo 20

原子B―原子Brsquo 00

原子C―原子Crsquo 00

原子D―原子Crsquo 10

原子E―原子Crsquo 00

原子F―原子Crsquo 10

1 052 0663 104 133

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問73立体構造の似ている2つのタンパク質間で対応関係にある原子が分かっている場合にはRMSD(Root Mean Square Deviation)と呼ばれる数値を計算することにより立体構造の重なり合いの程度を数値化することができるRMSDは全ての対応する原子間の距離を

2乗した値の平均値(相加平均)にルートをとったものとして定義されるあるタンパク質における6つの原子ABCDEFと別のタンパク質の6つの原子

ArsquoBrsquoCrsquoDrsquoErsquoFrsquoについて対応関係が分かっており互いにもっともよく重なるように回転して重ねた時の対応原子間の距離は以下の表のようになったこの表からB-Brsquo C-Crsquo D-Drsquo E-Ersquoは正確に重なったが他の原子間ではずれが見られることがわかるここで6つの原子に対するRMSD値はいくらになるか選択肢の中からもっとも適切な値を一つ選べただ

し原子間距離の単位は考慮しないものとする

対応原子 距離

原子A―原子Arsquo 20

原子B―原子Brsquo 00

原子C―原子Crsquo 00

原子D―原子Crsquo 10

原子E―原子Crsquo 00

原子F―原子Crsquo 10

1 052 0663 104 133

RMSDは 適に重ね合わせたときの

「ずれの二乗の平均のルート」であるしたがってずれの二乗平均は

(22+0+0+1+0+1)6=66=1これのルートをとるとradic1=1

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

1

2

3

4

56

7

8

9

10

11

主鎖の水素結合αへリックス

1

2

34

56

78

9

10

11

O

N

CHN

N

H

H

CO Cα

i

i+3

i+4

HN O C

Cαi-1

i番目のCOがi+4番目のNHと水素結合を形成

36残基が1周期の右巻きらせん

NHO=Cが同じ向きに並ぶため

へリックス全体に電気双極子が発生

N末C末

ー +

主鎖の水素結合逆平行βシート

βターン

βターン

βヘアピン

βヘアピン

伸びた構造の1本1本をβストランドと呼ぶ二本以上のβストランドがシート状に並んだ構造をβシートと呼ぶ

βストランド

βストランド

βストランド

主鎖の水素結合平行βシート

βminusαminusβモチーフ

平行βシートがαへリックスで接続された構造モチーフ

βストランド

βストランド

βストランド

伸びた構造の1本1本をβストランドと呼ぶ二本以上のβストランドがシート状に並んだ構造をβシートと呼ぶ

Cαi

Cαi+1Cα

i-1φ ψ

ペプチド結合の平面性とφψの定義

主鎖の原子のXYZ座標はφψの2つ

の角度でほとんど記述できる

φψの角度を2次元にプロットしたものをラマチャンドランプロット(Ramachandran plot)という点が集中する領域は2次構造とよく対応

点が現れない領域は主鎖の原子が衝突する

βシート

αへリックス

左巻きへリックス

平面平面

φ

ψ

H19 問74タンパク質の主鎖に添って定義される二面角のうちφ(窒素原子と炭素原子の間の二面角)とψ(α炭素原子とカルボニル基の炭素原子の間の二面角)の値を各残

基ごとに計算して二次元にプロットしたものをラマチャンドランプロットと呼ぶ以下に示したラマチャンドランプロットに対する説明文の中でもっとも適切なものを一つ選べ

1 (a)(b)はともにαへリックスの領域である2 (a)(b)はともにβストランドの領域である3 (a)はαへリックス(b)はβストランドの領

域である4 (a)はβストランド(b)はαへリックスの領

域である

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問74タンパク質の主鎖に添って定義される二面角のうちφ(窒素原子と炭素原子の間の二面角)とψ(α炭素原子とカルボニル基の炭素原子の間の二面角)の値を各残

基ごとに計算して二次元にプロットしたものをラマチャンドランプロットと呼ぶ以下に示したラマチャンドランプロットに対する説明文の中でもっとも適切なものを一つ選べ

1 (a)(b)はともにαへリックスの領域である2 (a)(b)はともにβストランドの領域である3 (a)はαへリックス(b)はβストランドの領

域である4 (a)はβストランド(b)はαへリックスの領

域である

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

トポロジー図によるβシートの表現

4 23

N

C

1

1ubq (UbiquitinHumand151)

N

C123 4 5 6

1n8k (Alchol dehydrogenase E chain Horse c21)

ロスマンフォールド

βターン

βターン

1cauA1rhdA domain2

TOPSプログラムによる表示httpwwwtopsleedsacuk

1timA

はαへリックスはβストランドとなりあうの向きで平行逆平行を示す

コンタクトマップ

1ubq

C

4 23

N

1

縦横に残基を配置しある残基ペアのCα原子間の距離が10Å以下であれば対応するピクセルに色を塗る

分子描画ソフトVMDを用いて作成

平行のストランド間は方向逆平行ストランド間は方向に線分が観察される

N

C

N C

逆平行

逆平行

平行

αへリックスは太めの対角上の線分

へリックス

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから1か3コンタクトマップから平行シートしかないことがわかるため1であることがわかる

αβ5

αβ3

α

β4α

β1αβ2 β2

β1β3β4

β5

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから2か4コンタクトマップから平行シートしかないことがわかるため2であることがわかる

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

配列比較によるタンパク質分類1970年代から配列の一致度(sequence identity)に基づいてグループを作る作業が

行われてきた

どのくらいの類似性で一つにまとめるかは様々な考えがあるが少なくとも「相同なタンパク質群」を一つのグループにまとめるべき

ファミリー(family 族)

進化的に関係のある(相同な)タンパク質グループのこと

複数のファミリーがあつまった大きなグループ スーパーファミリー(superfamily clan)

一つのファミリーの中の小さなグループ サブファミリー(subfamily)

family

subfamily superfamily

ドメイン単位による分類

A2 B2

B3 C3

A1

配列1

配列2

配列3

配列の部分どうしだけが類似していた場合 部分一致を重視するとすべて一つのグループになるがhellip

配列1

配列2 配列3

Aを共有

Bを共有

1と2が類似2と3が類似していても1と3は類似していない

ドメインに分割すると

A1

A2

B2

B3

C3

A2 B2

B3 C3

A1

きれいに分類することができる

Pfam 蛋白質ファミリのデータベース各蛋白質ファミリのマルチプル

アライメント HMMなどを集めたデータベース

httppfamsangeracuk

Pkinase_Tyrドメインをもつタンパク質の例

ABL_HUMAN

BTK_HUMAN

ILK_HUMAN

MERTK_HUMAN

PGFRB_HUMAN

HCK_HUMAN

Family Pkinase_Tyr (PF07714) Protein tyrosine kinase

Pfamデータベース(httppfamsangeracukSoftwarePfam)からの引用

ドメイン構造と疎水性の関係Tyrosine protein kinase HCK (1ad5A HCK_HUMAN)

SH3 domain

SH2 domain

Tyrosine-kinase domain

3つの分断された疎水性コアrarr ドメイン構造

大きなタンパク質はいくつかの構造上のまとまり(ドメイン)を持つことが多い

立体構造によるタンパク質の分類

bull 配列による分類の延長ドメイン単位の分類進化的に関係のある(相同な)タンパク質を群にする(ファミリー)という考え方は同じ

bull 立体構造の類似性からより遠縁の相同性を見つけより大きな群を作る(スーパーファミリー)

bull スーパーファミリーをまとめたさらに大きなグループ(フォールドクラス)

bull 主にアミノ酸(Cαレベル)のラフな構造の類似性に

着目

bull 分類対象は主に球状タンパク質

立体構造分類データベースSCOPhttpscopmrc-lmbcamacukscop

4階層で分類Class(クラス)

Fold(フォールド)

Superfamily(スーパーファミリー)

Family(ファミリー)

どの階層に分類するかは配列の類似性立体構造の類似性分子機能の類似性機能部位の類似性

を専門家が総合的に判断して決める

1akr

ltホモロジーgt

ltアナロジーgt

他の構造分類データベースとしてCATHが有名

同様に階層的な分類体系を持つがその詳細はSCOPとは異なる

クラス

1mbd

1mqkH

1n55A 1pqwA

1fxd 1a2p

all-α (a)

all-β (b)

αβ (c)

α+β (d)

α-へリックスが中心

β-シートが中心

逆平行が多い

α-へリックスとβ-シートが配列上交互に現れる平行β-シートが中心

α-へリックスとβ-シートが混在配列上の並びの規則はない逆平行と平行のβ-シートが混在

アミノ酸配列と立体構造の関係ピロリ菌と大腸菌のフラボドキシン (同一残基率 SeqID 44)

ピロリ菌(1fueA) 大腸菌(1ag9A)

配列が似ていれば立体構造も似ている

SeqID = 44

RMSD = 12 Å

1fueA 2GKIGIFFGTDSGNAEAIAEKISKAIG--NAEVVDVAKASKEQFNGFTKVILVAPTAGAGD59

1ag9A 2AITGIFFGSDTGNTENIAKMIQKQLGKDVADVHDIAKSSKEDLEAYDILLLGIPTWYYGE61

1fueA 60LQTDWEDFLGTLEASD-FANKTIGLVGLGDQDTYSETFAEGIFHIYEKAK--AGKVVGQT116

1ag9A 62AQCDWDDFFPTLE-EIDFNGKLVALFGCGDQEDYAEYFCDALGTIRDIIEPRGATIVGHW120

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C 14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

BLAST

PSI-BLAST 構造比較

構造比較

アミノ酸配列がほとんど似ていなくても立体構造は似ている場合がある

構造は配列より進化的に保存がよい 構造比較から新たなホモログが発見できる可能性

立体

構造

の変

アミノ酸配列の変化と立体構造の変化の相関(グロビン族)

立体構造の変化はアミノ酸配列の変化と相関配列が30以上一致していればRMSDは2Å以下

アミノ酸配列の類似度

2つの構造の類似性

ホモロジー (homology 相同)進化的起源を共有することによる類似多くの場合分子機能なども類似している

アナロジー (analogy 相似)進化的起源とは無関係な類似多くの場合分子機能など他の属性は似ていない物理化学的な構造の偏好が原因とされる

イルカの胸びれ サルの前足

チョウの羽 トリの翼

ネコの前足

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C

ldquoFlavodoxin-likerdquo fold (c23)

ldquoFlavoproteinsrdquo superfamily (c235)

ldquoCheY-likerdquosuperfamily(c231)

14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

AnalogyHomology

HomologyHomolo

gy

多く現れるフォールド(出現ドメイン数順)

太字はスーパーフォールド多くのスーパーファミリーを含むフォールド

d58

c1

g3

c23 b34

b1

a4フォールド名 (SCOP173によるクラスfhijkは除く) ドメイ

ンの数

スーパーファミリーの数

a4 DNARNA-binding 3-helical bundle 292 14c1 TIM betaalpha-barrel 269 33d58 Ferredoxin-like 248 55b1 Immunoglobulin-like beta sandwich 246 27c37 P-loop nucleoside triphosphate hydrolase 235 1c2 NAD(P)-binding Rossmann-fold domains 168 1g3 Knottins 154 19d15 Beta-Grasp(ubiquitin-like) 131 13c23 Flavodoxin-like 118 15b34 SH3-like barrel 117 18b40 OB-fold 100 12c66 SAM-dependent methyltransferases 95 1

c37 c2

d15

b40 c66

スーパーフォールド(Superfold)

フォールド名 (SCOP173によるクラスfhijkは除く) その下のスーパーファミリーの数

d58 Ferredoxin-like 55c1 TIM betaalpha-barrel 33b1 Immunoglobulin-like beta sandwich 27a24 Four-helical up-and-down bundle 27a118 Alpha-alpha superhelix 23g3 Knottins 19b34 SH3-like barrel 18g41 Rubredoxin-like 16c23 Flavodoxin-like 15a60 SAM(sterile alpha motif) domain-like 15b69 7-bladed beta-propeller 14a4 DNARNA-binding 3-helical bundle 14

スーパーフォールド多くのスーパーファミリーを含むフォールド

スーパーフォールドは「構造の類似と機能の類似が対応しにくいフォールド」ともいえる

d58

c1

g3a118

c23

a24

a60

b34

b1

g41

b69 a4

三本へリックスバンドルDNARNA‐binding 3‐helical bundle(a4)

Mating type protein A2 yeast(1k61Aa411)

(1gvdAa413)(1wh5Aa411)

三本のへリックスが束になった構造DNAやRNAに結合する蛋白質が多い

DNAと

結合した構造(1k61)

TIMバレルTIM betaalpha barrel (c1)

Triosephosphate isomerase1n55A(c111)

全般に解糖系の酵素が多い基質酵素反応は極めて多彩

八本のβストランドとαへリックスが交互に組み合わさり対称的な樽(barrel)構造を形成す

る中央の樽構造は平行のβシートからなる

Imidazole glycerol phosphate synthasesubunit hisF1thfD(c121)

KHGKDPG aldolase1euaA(c1101)

フェレドキシン様Ferredoxin‐like (d58)

4Fe-4S Ferredoxin(1fxdd581)

1 234 4本の逆平行のβストランドと2本のαへリックスからな

分子機能は極めて多彩

CheY binding domain of CheA(1eayCd5824)

U1A RNA binding domain(1nu4Ad5871)

免疫グロブリン様Immunoglobulin‐like beta sandwich(b1)

Immunoglobulin Heavy chain variabledomain 1mjuH1(b111)

Immunoglobulin Heavy chain constantdomain 1mjuH2(b112)

Macromomycin1noaA (b171)

免疫グロブリン分子はH鎖とL鎖から

なりそれぞれ免疫グロブリン様ドメインからできている

V

C

V

C

C

C

V

CV

CC

C

L鎖

H鎖H鎖 L鎖

細胞表面あるいは分泌蛋白質が多い免疫や分子認識に関する機能を担うことが多い

4本のβストランドからなるβシートが二枚サンドイッチ状に重なった構造をとる逆平行のβシートが主

P‐loop スーパーファミリーP‐loop nucleoside triphosphate hydrolase(c37)

Ras-related protein RAB-5A1r2qA(c3718)

Guanylate kinase1gkyA(c3711)

RecA proteinDomain1 1xmsA1(c37111)

平行のβシートが主トポロジーには様々な変異あり

シグナル伝達DNA結合

モーター機能など多彩な分子機能を担うがATP GTPなどのヌクレオシド

の加水分解を行う点は共通

N C

132 4 5 6

ヌクレオシド結合部GxxxxGKTの

配列モチーフ(P-loop)を持つ

ロスマン フォールドNAD(P)‐binding Rossmann‐fold domains (c2)

Alcohol dehydrogenase gamma chaindomain2 1u3wA(c211)

Aspartate beta-semialdehydedehydrogenase2gz1A1(c213)

L-alanine dehydrogenase1pjcA1(c214)

補酵素を利用したNAD(P)を脱水素酵素を持つ基質を認識するドメインは別に存在する

NC

123 4 5 6

平行のβシートが主

7枚羽 βプロペラ7‐bladed beta‐propeller (b69)

Garactose oxydasedomain3 1k3iA3(b6911)

Guanine nucleotide-bindingprotein subunit beta-11gotB(b6941)

細胞膜付近のシグナル伝達や糖結合に関わることが多い

Influenza Neuraminidase 1f8dA(b6811)

6枚羽 βプロペラ

N C

321 4

のユニットが7回円環状に繰り返しされたフォールド

立体構造比較プログラム1990年ごろから多くの構造比較プログラムが開発されている

WEBアドレス スコア アライメント

DALI httpwwwebiacukdali

距離の差を独自の関数で変換したスコア

局所アライメントをモンテカルロ法でつなぎ合わせる

CE httpclsdsceducehtml

局所的なRMSD 局所アライメントを積み上げていく

MATRAS httpbiunitnaistjpmatras

距離の変化が相同相似で起こる確率の比をスコアとする

SSEで仮アライメント

を生成残基アライメントを収束するまで反復する

タンパク質の相同性の判断基準

100

同一残基率30以上

BLASTのE-value lt 00001

PSI-BLASTのE-value lt 00001

0102030407025 15 535

同一残基率(Sequence Identity)()

立体構造比較が必要

(1)立体構造の類似性が高い(DALIのZスコアMATRASのRdisスコア)(2)同一残基率がそこそこ高い(PSI-BLASTでヒットするSeqIDgt=15ぐらい)

(3)分子機能に類似性がある(補酵素酵素反応基質代謝経路等の共通性等)(4)基質補酵素の結合部位が類似しておりそのアミノ酸が保存(モチーフ)(5)ドメイン構成の共通性(6)スーパーフォールドの場合は特別な注意が必要

配列解析

同一残基率が25以下の場合の相同性の判断基準

50608090

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 24: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

距離の差のスコア (DRMS)

( )sumsum= ge

minusminus

=N

i

N

ij

Yij

Xij DD

NNDRMS

1

2

)1(2

21

20

1

2

3

4

5

YijD

XijD

1

23

4

21

20

5

yixi

DRMS 対応する原子ペアの距離の差(Distance-based RMSD)

原子の対応付けがわかっているとする

重ね合わせは不要なので計算は簡単

3次元によらない2次元や結合情報にも拡張できる

鏡像の区別はできない

1benA

計算が簡単なので高速な構造比較のアルゴリズムの基盤として使われる

1xdaA

H19 問73立体構造の似ている2つのタンパク質間で対応関係にある原子が分かっている場合にはRMSD(Root Mean Square Deviation)と呼ばれる数値を計算することにより立体構造の重なり合いの程度を数値化することができるRMSDは全ての対応する原子間の距離を

2乗した値の平均値(相加平均)にルートをとったものとして定義されるあるタンパク質における6つの原子ABCDEFと別のタンパク質の6つの原子

ArsquoBrsquoCrsquoDrsquoErsquoFrsquoについて対応関係が分かっており互いにもっともよく重なるように回転して重ねた時の対応原子間の距離は以下の表のようになったこの表からB-Brsquo C-Crsquo D-Drsquo E-Ersquoは正確に重なったが他の原子間ではずれが見られることがわかるここで6つの原子に対するRMSD値はいくらになるか選択肢の中からもっとも適切な値を一つ選べただ

し原子間距離の単位は考慮しないものとする

対応原子 距離

原子A―原子Arsquo 20

原子B―原子Brsquo 00

原子C―原子Crsquo 00

原子D―原子Crsquo 10

原子E―原子Crsquo 00

原子F―原子Crsquo 10

1 052 0663 104 133

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問73立体構造の似ている2つのタンパク質間で対応関係にある原子が分かっている場合にはRMSD(Root Mean Square Deviation)と呼ばれる数値を計算することにより立体構造の重なり合いの程度を数値化することができるRMSDは全ての対応する原子間の距離を

2乗した値の平均値(相加平均)にルートをとったものとして定義されるあるタンパク質における6つの原子ABCDEFと別のタンパク質の6つの原子

ArsquoBrsquoCrsquoDrsquoErsquoFrsquoについて対応関係が分かっており互いにもっともよく重なるように回転して重ねた時の対応原子間の距離は以下の表のようになったこの表からB-Brsquo C-Crsquo D-Drsquo E-Ersquoは正確に重なったが他の原子間ではずれが見られることがわかるここで6つの原子に対するRMSD値はいくらになるか選択肢の中からもっとも適切な値を一つ選べただ

し原子間距離の単位は考慮しないものとする

対応原子 距離

原子A―原子Arsquo 20

原子B―原子Brsquo 00

原子C―原子Crsquo 00

原子D―原子Crsquo 10

原子E―原子Crsquo 00

原子F―原子Crsquo 10

1 052 0663 104 133

RMSDは 適に重ね合わせたときの

「ずれの二乗の平均のルート」であるしたがってずれの二乗平均は

(22+0+0+1+0+1)6=66=1これのルートをとるとradic1=1

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

1

2

3

4

56

7

8

9

10

11

主鎖の水素結合αへリックス

1

2

34

56

78

9

10

11

O

N

CHN

N

H

H

CO Cα

i

i+3

i+4

HN O C

Cαi-1

i番目のCOがi+4番目のNHと水素結合を形成

36残基が1周期の右巻きらせん

NHO=Cが同じ向きに並ぶため

へリックス全体に電気双極子が発生

N末C末

ー +

主鎖の水素結合逆平行βシート

βターン

βターン

βヘアピン

βヘアピン

伸びた構造の1本1本をβストランドと呼ぶ二本以上のβストランドがシート状に並んだ構造をβシートと呼ぶ

βストランド

βストランド

βストランド

主鎖の水素結合平行βシート

βminusαminusβモチーフ

平行βシートがαへリックスで接続された構造モチーフ

βストランド

βストランド

βストランド

伸びた構造の1本1本をβストランドと呼ぶ二本以上のβストランドがシート状に並んだ構造をβシートと呼ぶ

Cαi

Cαi+1Cα

i-1φ ψ

ペプチド結合の平面性とφψの定義

主鎖の原子のXYZ座標はφψの2つ

の角度でほとんど記述できる

φψの角度を2次元にプロットしたものをラマチャンドランプロット(Ramachandran plot)という点が集中する領域は2次構造とよく対応

点が現れない領域は主鎖の原子が衝突する

βシート

αへリックス

左巻きへリックス

平面平面

φ

ψ

H19 問74タンパク質の主鎖に添って定義される二面角のうちφ(窒素原子と炭素原子の間の二面角)とψ(α炭素原子とカルボニル基の炭素原子の間の二面角)の値を各残

基ごとに計算して二次元にプロットしたものをラマチャンドランプロットと呼ぶ以下に示したラマチャンドランプロットに対する説明文の中でもっとも適切なものを一つ選べ

1 (a)(b)はともにαへリックスの領域である2 (a)(b)はともにβストランドの領域である3 (a)はαへリックス(b)はβストランドの領

域である4 (a)はβストランド(b)はαへリックスの領

域である

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問74タンパク質の主鎖に添って定義される二面角のうちφ(窒素原子と炭素原子の間の二面角)とψ(α炭素原子とカルボニル基の炭素原子の間の二面角)の値を各残

基ごとに計算して二次元にプロットしたものをラマチャンドランプロットと呼ぶ以下に示したラマチャンドランプロットに対する説明文の中でもっとも適切なものを一つ選べ

1 (a)(b)はともにαへリックスの領域である2 (a)(b)はともにβストランドの領域である3 (a)はαへリックス(b)はβストランドの領

域である4 (a)はβストランド(b)はαへリックスの領

域である

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

トポロジー図によるβシートの表現

4 23

N

C

1

1ubq (UbiquitinHumand151)

N

C123 4 5 6

1n8k (Alchol dehydrogenase E chain Horse c21)

ロスマンフォールド

βターン

βターン

1cauA1rhdA domain2

TOPSプログラムによる表示httpwwwtopsleedsacuk

1timA

はαへリックスはβストランドとなりあうの向きで平行逆平行を示す

コンタクトマップ

1ubq

C

4 23

N

1

縦横に残基を配置しある残基ペアのCα原子間の距離が10Å以下であれば対応するピクセルに色を塗る

分子描画ソフトVMDを用いて作成

平行のストランド間は方向逆平行ストランド間は方向に線分が観察される

N

C

N C

逆平行

逆平行

平行

αへリックスは太めの対角上の線分

へリックス

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから1か3コンタクトマップから平行シートしかないことがわかるため1であることがわかる

αβ5

αβ3

α

β4α

β1αβ2 β2

β1β3β4

β5

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから2か4コンタクトマップから平行シートしかないことがわかるため2であることがわかる

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

配列比較によるタンパク質分類1970年代から配列の一致度(sequence identity)に基づいてグループを作る作業が

行われてきた

どのくらいの類似性で一つにまとめるかは様々な考えがあるが少なくとも「相同なタンパク質群」を一つのグループにまとめるべき

ファミリー(family 族)

進化的に関係のある(相同な)タンパク質グループのこと

複数のファミリーがあつまった大きなグループ スーパーファミリー(superfamily clan)

一つのファミリーの中の小さなグループ サブファミリー(subfamily)

family

subfamily superfamily

ドメイン単位による分類

A2 B2

B3 C3

A1

配列1

配列2

配列3

配列の部分どうしだけが類似していた場合 部分一致を重視するとすべて一つのグループになるがhellip

配列1

配列2 配列3

Aを共有

Bを共有

1と2が類似2と3が類似していても1と3は類似していない

ドメインに分割すると

A1

A2

B2

B3

C3

A2 B2

B3 C3

A1

きれいに分類することができる

Pfam 蛋白質ファミリのデータベース各蛋白質ファミリのマルチプル

アライメント HMMなどを集めたデータベース

httppfamsangeracuk

Pkinase_Tyrドメインをもつタンパク質の例

ABL_HUMAN

BTK_HUMAN

ILK_HUMAN

MERTK_HUMAN

PGFRB_HUMAN

HCK_HUMAN

Family Pkinase_Tyr (PF07714) Protein tyrosine kinase

Pfamデータベース(httppfamsangeracukSoftwarePfam)からの引用

ドメイン構造と疎水性の関係Tyrosine protein kinase HCK (1ad5A HCK_HUMAN)

SH3 domain

SH2 domain

Tyrosine-kinase domain

3つの分断された疎水性コアrarr ドメイン構造

大きなタンパク質はいくつかの構造上のまとまり(ドメイン)を持つことが多い

立体構造によるタンパク質の分類

bull 配列による分類の延長ドメイン単位の分類進化的に関係のある(相同な)タンパク質を群にする(ファミリー)という考え方は同じ

bull 立体構造の類似性からより遠縁の相同性を見つけより大きな群を作る(スーパーファミリー)

bull スーパーファミリーをまとめたさらに大きなグループ(フォールドクラス)

bull 主にアミノ酸(Cαレベル)のラフな構造の類似性に

着目

bull 分類対象は主に球状タンパク質

立体構造分類データベースSCOPhttpscopmrc-lmbcamacukscop

4階層で分類Class(クラス)

Fold(フォールド)

Superfamily(スーパーファミリー)

Family(ファミリー)

どの階層に分類するかは配列の類似性立体構造の類似性分子機能の類似性機能部位の類似性

を専門家が総合的に判断して決める

1akr

ltホモロジーgt

ltアナロジーgt

他の構造分類データベースとしてCATHが有名

同様に階層的な分類体系を持つがその詳細はSCOPとは異なる

クラス

1mbd

1mqkH

1n55A 1pqwA

1fxd 1a2p

all-α (a)

all-β (b)

αβ (c)

α+β (d)

α-へリックスが中心

β-シートが中心

逆平行が多い

α-へリックスとβ-シートが配列上交互に現れる平行β-シートが中心

α-へリックスとβ-シートが混在配列上の並びの規則はない逆平行と平行のβ-シートが混在

アミノ酸配列と立体構造の関係ピロリ菌と大腸菌のフラボドキシン (同一残基率 SeqID 44)

ピロリ菌(1fueA) 大腸菌(1ag9A)

配列が似ていれば立体構造も似ている

SeqID = 44

RMSD = 12 Å

1fueA 2GKIGIFFGTDSGNAEAIAEKISKAIG--NAEVVDVAKASKEQFNGFTKVILVAPTAGAGD59

1ag9A 2AITGIFFGSDTGNTENIAKMIQKQLGKDVADVHDIAKSSKEDLEAYDILLLGIPTWYYGE61

1fueA 60LQTDWEDFLGTLEASD-FANKTIGLVGLGDQDTYSETFAEGIFHIYEKAK--AGKVVGQT116

1ag9A 62AQCDWDDFFPTLE-EIDFNGKLVALFGCGDQEDYAEYFCDALGTIRDIIEPRGATIVGHW120

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C 14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

BLAST

PSI-BLAST 構造比較

構造比較

アミノ酸配列がほとんど似ていなくても立体構造は似ている場合がある

構造は配列より進化的に保存がよい 構造比較から新たなホモログが発見できる可能性

立体

構造

の変

アミノ酸配列の変化と立体構造の変化の相関(グロビン族)

立体構造の変化はアミノ酸配列の変化と相関配列が30以上一致していればRMSDは2Å以下

アミノ酸配列の類似度

2つの構造の類似性

ホモロジー (homology 相同)進化的起源を共有することによる類似多くの場合分子機能なども類似している

アナロジー (analogy 相似)進化的起源とは無関係な類似多くの場合分子機能など他の属性は似ていない物理化学的な構造の偏好が原因とされる

イルカの胸びれ サルの前足

チョウの羽 トリの翼

ネコの前足

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C

ldquoFlavodoxin-likerdquo fold (c23)

ldquoFlavoproteinsrdquo superfamily (c235)

ldquoCheY-likerdquosuperfamily(c231)

14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

AnalogyHomology

HomologyHomolo

gy

多く現れるフォールド(出現ドメイン数順)

太字はスーパーフォールド多くのスーパーファミリーを含むフォールド

d58

c1

g3

c23 b34

b1

a4フォールド名 (SCOP173によるクラスfhijkは除く) ドメイ

ンの数

スーパーファミリーの数

a4 DNARNA-binding 3-helical bundle 292 14c1 TIM betaalpha-barrel 269 33d58 Ferredoxin-like 248 55b1 Immunoglobulin-like beta sandwich 246 27c37 P-loop nucleoside triphosphate hydrolase 235 1c2 NAD(P)-binding Rossmann-fold domains 168 1g3 Knottins 154 19d15 Beta-Grasp(ubiquitin-like) 131 13c23 Flavodoxin-like 118 15b34 SH3-like barrel 117 18b40 OB-fold 100 12c66 SAM-dependent methyltransferases 95 1

c37 c2

d15

b40 c66

スーパーフォールド(Superfold)

フォールド名 (SCOP173によるクラスfhijkは除く) その下のスーパーファミリーの数

d58 Ferredoxin-like 55c1 TIM betaalpha-barrel 33b1 Immunoglobulin-like beta sandwich 27a24 Four-helical up-and-down bundle 27a118 Alpha-alpha superhelix 23g3 Knottins 19b34 SH3-like barrel 18g41 Rubredoxin-like 16c23 Flavodoxin-like 15a60 SAM(sterile alpha motif) domain-like 15b69 7-bladed beta-propeller 14a4 DNARNA-binding 3-helical bundle 14

スーパーフォールド多くのスーパーファミリーを含むフォールド

スーパーフォールドは「構造の類似と機能の類似が対応しにくいフォールド」ともいえる

d58

c1

g3a118

c23

a24

a60

b34

b1

g41

b69 a4

三本へリックスバンドルDNARNA‐binding 3‐helical bundle(a4)

Mating type protein A2 yeast(1k61Aa411)

(1gvdAa413)(1wh5Aa411)

三本のへリックスが束になった構造DNAやRNAに結合する蛋白質が多い

DNAと

結合した構造(1k61)

TIMバレルTIM betaalpha barrel (c1)

Triosephosphate isomerase1n55A(c111)

全般に解糖系の酵素が多い基質酵素反応は極めて多彩

八本のβストランドとαへリックスが交互に組み合わさり対称的な樽(barrel)構造を形成す

る中央の樽構造は平行のβシートからなる

Imidazole glycerol phosphate synthasesubunit hisF1thfD(c121)

KHGKDPG aldolase1euaA(c1101)

フェレドキシン様Ferredoxin‐like (d58)

4Fe-4S Ferredoxin(1fxdd581)

1 234 4本の逆平行のβストランドと2本のαへリックスからな

分子機能は極めて多彩

CheY binding domain of CheA(1eayCd5824)

U1A RNA binding domain(1nu4Ad5871)

免疫グロブリン様Immunoglobulin‐like beta sandwich(b1)

Immunoglobulin Heavy chain variabledomain 1mjuH1(b111)

Immunoglobulin Heavy chain constantdomain 1mjuH2(b112)

Macromomycin1noaA (b171)

免疫グロブリン分子はH鎖とL鎖から

なりそれぞれ免疫グロブリン様ドメインからできている

V

C

V

C

C

C

V

CV

CC

C

L鎖

H鎖H鎖 L鎖

細胞表面あるいは分泌蛋白質が多い免疫や分子認識に関する機能を担うことが多い

4本のβストランドからなるβシートが二枚サンドイッチ状に重なった構造をとる逆平行のβシートが主

P‐loop スーパーファミリーP‐loop nucleoside triphosphate hydrolase(c37)

Ras-related protein RAB-5A1r2qA(c3718)

Guanylate kinase1gkyA(c3711)

RecA proteinDomain1 1xmsA1(c37111)

平行のβシートが主トポロジーには様々な変異あり

シグナル伝達DNA結合

モーター機能など多彩な分子機能を担うがATP GTPなどのヌクレオシド

の加水分解を行う点は共通

N C

132 4 5 6

ヌクレオシド結合部GxxxxGKTの

配列モチーフ(P-loop)を持つ

ロスマン フォールドNAD(P)‐binding Rossmann‐fold domains (c2)

Alcohol dehydrogenase gamma chaindomain2 1u3wA(c211)

Aspartate beta-semialdehydedehydrogenase2gz1A1(c213)

L-alanine dehydrogenase1pjcA1(c214)

補酵素を利用したNAD(P)を脱水素酵素を持つ基質を認識するドメインは別に存在する

NC

123 4 5 6

平行のβシートが主

7枚羽 βプロペラ7‐bladed beta‐propeller (b69)

Garactose oxydasedomain3 1k3iA3(b6911)

Guanine nucleotide-bindingprotein subunit beta-11gotB(b6941)

細胞膜付近のシグナル伝達や糖結合に関わることが多い

Influenza Neuraminidase 1f8dA(b6811)

6枚羽 βプロペラ

N C

321 4

のユニットが7回円環状に繰り返しされたフォールド

立体構造比較プログラム1990年ごろから多くの構造比較プログラムが開発されている

WEBアドレス スコア アライメント

DALI httpwwwebiacukdali

距離の差を独自の関数で変換したスコア

局所アライメントをモンテカルロ法でつなぎ合わせる

CE httpclsdsceducehtml

局所的なRMSD 局所アライメントを積み上げていく

MATRAS httpbiunitnaistjpmatras

距離の変化が相同相似で起こる確率の比をスコアとする

SSEで仮アライメント

を生成残基アライメントを収束するまで反復する

タンパク質の相同性の判断基準

100

同一残基率30以上

BLASTのE-value lt 00001

PSI-BLASTのE-value lt 00001

0102030407025 15 535

同一残基率(Sequence Identity)()

立体構造比較が必要

(1)立体構造の類似性が高い(DALIのZスコアMATRASのRdisスコア)(2)同一残基率がそこそこ高い(PSI-BLASTでヒットするSeqIDgt=15ぐらい)

(3)分子機能に類似性がある(補酵素酵素反応基質代謝経路等の共通性等)(4)基質補酵素の結合部位が類似しておりそのアミノ酸が保存(モチーフ)(5)ドメイン構成の共通性(6)スーパーフォールドの場合は特別な注意が必要

配列解析

同一残基率が25以下の場合の相同性の判断基準

50608090

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 25: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

H19 問73立体構造の似ている2つのタンパク質間で対応関係にある原子が分かっている場合にはRMSD(Root Mean Square Deviation)と呼ばれる数値を計算することにより立体構造の重なり合いの程度を数値化することができるRMSDは全ての対応する原子間の距離を

2乗した値の平均値(相加平均)にルートをとったものとして定義されるあるタンパク質における6つの原子ABCDEFと別のタンパク質の6つの原子

ArsquoBrsquoCrsquoDrsquoErsquoFrsquoについて対応関係が分かっており互いにもっともよく重なるように回転して重ねた時の対応原子間の距離は以下の表のようになったこの表からB-Brsquo C-Crsquo D-Drsquo E-Ersquoは正確に重なったが他の原子間ではずれが見られることがわかるここで6つの原子に対するRMSD値はいくらになるか選択肢の中からもっとも適切な値を一つ選べただ

し原子間距離の単位は考慮しないものとする

対応原子 距離

原子A―原子Arsquo 20

原子B―原子Brsquo 00

原子C―原子Crsquo 00

原子D―原子Crsquo 10

原子E―原子Crsquo 00

原子F―原子Crsquo 10

1 052 0663 104 133

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問73立体構造の似ている2つのタンパク質間で対応関係にある原子が分かっている場合にはRMSD(Root Mean Square Deviation)と呼ばれる数値を計算することにより立体構造の重なり合いの程度を数値化することができるRMSDは全ての対応する原子間の距離を

2乗した値の平均値(相加平均)にルートをとったものとして定義されるあるタンパク質における6つの原子ABCDEFと別のタンパク質の6つの原子

ArsquoBrsquoCrsquoDrsquoErsquoFrsquoについて対応関係が分かっており互いにもっともよく重なるように回転して重ねた時の対応原子間の距離は以下の表のようになったこの表からB-Brsquo C-Crsquo D-Drsquo E-Ersquoは正確に重なったが他の原子間ではずれが見られることがわかるここで6つの原子に対するRMSD値はいくらになるか選択肢の中からもっとも適切な値を一つ選べただ

し原子間距離の単位は考慮しないものとする

対応原子 距離

原子A―原子Arsquo 20

原子B―原子Brsquo 00

原子C―原子Crsquo 00

原子D―原子Crsquo 10

原子E―原子Crsquo 00

原子F―原子Crsquo 10

1 052 0663 104 133

RMSDは 適に重ね合わせたときの

「ずれの二乗の平均のルート」であるしたがってずれの二乗平均は

(22+0+0+1+0+1)6=66=1これのルートをとるとradic1=1

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

1

2

3

4

56

7

8

9

10

11

主鎖の水素結合αへリックス

1

2

34

56

78

9

10

11

O

N

CHN

N

H

H

CO Cα

i

i+3

i+4

HN O C

Cαi-1

i番目のCOがi+4番目のNHと水素結合を形成

36残基が1周期の右巻きらせん

NHO=Cが同じ向きに並ぶため

へリックス全体に電気双極子が発生

N末C末

ー +

主鎖の水素結合逆平行βシート

βターン

βターン

βヘアピン

βヘアピン

伸びた構造の1本1本をβストランドと呼ぶ二本以上のβストランドがシート状に並んだ構造をβシートと呼ぶ

βストランド

βストランド

βストランド

主鎖の水素結合平行βシート

βminusαminusβモチーフ

平行βシートがαへリックスで接続された構造モチーフ

βストランド

βストランド

βストランド

伸びた構造の1本1本をβストランドと呼ぶ二本以上のβストランドがシート状に並んだ構造をβシートと呼ぶ

Cαi

Cαi+1Cα

i-1φ ψ

ペプチド結合の平面性とφψの定義

主鎖の原子のXYZ座標はφψの2つ

の角度でほとんど記述できる

φψの角度を2次元にプロットしたものをラマチャンドランプロット(Ramachandran plot)という点が集中する領域は2次構造とよく対応

点が現れない領域は主鎖の原子が衝突する

βシート

αへリックス

左巻きへリックス

平面平面

φ

ψ

H19 問74タンパク質の主鎖に添って定義される二面角のうちφ(窒素原子と炭素原子の間の二面角)とψ(α炭素原子とカルボニル基の炭素原子の間の二面角)の値を各残

基ごとに計算して二次元にプロットしたものをラマチャンドランプロットと呼ぶ以下に示したラマチャンドランプロットに対する説明文の中でもっとも適切なものを一つ選べ

1 (a)(b)はともにαへリックスの領域である2 (a)(b)はともにβストランドの領域である3 (a)はαへリックス(b)はβストランドの領

域である4 (a)はβストランド(b)はαへリックスの領

域である

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問74タンパク質の主鎖に添って定義される二面角のうちφ(窒素原子と炭素原子の間の二面角)とψ(α炭素原子とカルボニル基の炭素原子の間の二面角)の値を各残

基ごとに計算して二次元にプロットしたものをラマチャンドランプロットと呼ぶ以下に示したラマチャンドランプロットに対する説明文の中でもっとも適切なものを一つ選べ

1 (a)(b)はともにαへリックスの領域である2 (a)(b)はともにβストランドの領域である3 (a)はαへリックス(b)はβストランドの領

域である4 (a)はβストランド(b)はαへリックスの領

域である

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

トポロジー図によるβシートの表現

4 23

N

C

1

1ubq (UbiquitinHumand151)

N

C123 4 5 6

1n8k (Alchol dehydrogenase E chain Horse c21)

ロスマンフォールド

βターン

βターン

1cauA1rhdA domain2

TOPSプログラムによる表示httpwwwtopsleedsacuk

1timA

はαへリックスはβストランドとなりあうの向きで平行逆平行を示す

コンタクトマップ

1ubq

C

4 23

N

1

縦横に残基を配置しある残基ペアのCα原子間の距離が10Å以下であれば対応するピクセルに色を塗る

分子描画ソフトVMDを用いて作成

平行のストランド間は方向逆平行ストランド間は方向に線分が観察される

N

C

N C

逆平行

逆平行

平行

αへリックスは太めの対角上の線分

へリックス

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから1か3コンタクトマップから平行シートしかないことがわかるため1であることがわかる

αβ5

αβ3

α

β4α

β1αβ2 β2

β1β3β4

β5

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから2か4コンタクトマップから平行シートしかないことがわかるため2であることがわかる

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

配列比較によるタンパク質分類1970年代から配列の一致度(sequence identity)に基づいてグループを作る作業が

行われてきた

どのくらいの類似性で一つにまとめるかは様々な考えがあるが少なくとも「相同なタンパク質群」を一つのグループにまとめるべき

ファミリー(family 族)

進化的に関係のある(相同な)タンパク質グループのこと

複数のファミリーがあつまった大きなグループ スーパーファミリー(superfamily clan)

一つのファミリーの中の小さなグループ サブファミリー(subfamily)

family

subfamily superfamily

ドメイン単位による分類

A2 B2

B3 C3

A1

配列1

配列2

配列3

配列の部分どうしだけが類似していた場合 部分一致を重視するとすべて一つのグループになるがhellip

配列1

配列2 配列3

Aを共有

Bを共有

1と2が類似2と3が類似していても1と3は類似していない

ドメインに分割すると

A1

A2

B2

B3

C3

A2 B2

B3 C3

A1

きれいに分類することができる

Pfam 蛋白質ファミリのデータベース各蛋白質ファミリのマルチプル

アライメント HMMなどを集めたデータベース

httppfamsangeracuk

Pkinase_Tyrドメインをもつタンパク質の例

ABL_HUMAN

BTK_HUMAN

ILK_HUMAN

MERTK_HUMAN

PGFRB_HUMAN

HCK_HUMAN

Family Pkinase_Tyr (PF07714) Protein tyrosine kinase

Pfamデータベース(httppfamsangeracukSoftwarePfam)からの引用

ドメイン構造と疎水性の関係Tyrosine protein kinase HCK (1ad5A HCK_HUMAN)

SH3 domain

SH2 domain

Tyrosine-kinase domain

3つの分断された疎水性コアrarr ドメイン構造

大きなタンパク質はいくつかの構造上のまとまり(ドメイン)を持つことが多い

立体構造によるタンパク質の分類

bull 配列による分類の延長ドメイン単位の分類進化的に関係のある(相同な)タンパク質を群にする(ファミリー)という考え方は同じ

bull 立体構造の類似性からより遠縁の相同性を見つけより大きな群を作る(スーパーファミリー)

bull スーパーファミリーをまとめたさらに大きなグループ(フォールドクラス)

bull 主にアミノ酸(Cαレベル)のラフな構造の類似性に

着目

bull 分類対象は主に球状タンパク質

立体構造分類データベースSCOPhttpscopmrc-lmbcamacukscop

4階層で分類Class(クラス)

Fold(フォールド)

Superfamily(スーパーファミリー)

Family(ファミリー)

どの階層に分類するかは配列の類似性立体構造の類似性分子機能の類似性機能部位の類似性

を専門家が総合的に判断して決める

1akr

ltホモロジーgt

ltアナロジーgt

他の構造分類データベースとしてCATHが有名

同様に階層的な分類体系を持つがその詳細はSCOPとは異なる

クラス

1mbd

1mqkH

1n55A 1pqwA

1fxd 1a2p

all-α (a)

all-β (b)

αβ (c)

α+β (d)

α-へリックスが中心

β-シートが中心

逆平行が多い

α-へリックスとβ-シートが配列上交互に現れる平行β-シートが中心

α-へリックスとβ-シートが混在配列上の並びの規則はない逆平行と平行のβ-シートが混在

アミノ酸配列と立体構造の関係ピロリ菌と大腸菌のフラボドキシン (同一残基率 SeqID 44)

ピロリ菌(1fueA) 大腸菌(1ag9A)

配列が似ていれば立体構造も似ている

SeqID = 44

RMSD = 12 Å

1fueA 2GKIGIFFGTDSGNAEAIAEKISKAIG--NAEVVDVAKASKEQFNGFTKVILVAPTAGAGD59

1ag9A 2AITGIFFGSDTGNTENIAKMIQKQLGKDVADVHDIAKSSKEDLEAYDILLLGIPTWYYGE61

1fueA 60LQTDWEDFLGTLEASD-FANKTIGLVGLGDQDTYSETFAEGIFHIYEKAK--AGKVVGQT116

1ag9A 62AQCDWDDFFPTLE-EIDFNGKLVALFGCGDQEDYAEYFCDALGTIRDIIEPRGATIVGHW120

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C 14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

BLAST

PSI-BLAST 構造比較

構造比較

アミノ酸配列がほとんど似ていなくても立体構造は似ている場合がある

構造は配列より進化的に保存がよい 構造比較から新たなホモログが発見できる可能性

立体

構造

の変

アミノ酸配列の変化と立体構造の変化の相関(グロビン族)

立体構造の変化はアミノ酸配列の変化と相関配列が30以上一致していればRMSDは2Å以下

アミノ酸配列の類似度

2つの構造の類似性

ホモロジー (homology 相同)進化的起源を共有することによる類似多くの場合分子機能なども類似している

アナロジー (analogy 相似)進化的起源とは無関係な類似多くの場合分子機能など他の属性は似ていない物理化学的な構造の偏好が原因とされる

イルカの胸びれ サルの前足

チョウの羽 トリの翼

ネコの前足

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C

ldquoFlavodoxin-likerdquo fold (c23)

ldquoFlavoproteinsrdquo superfamily (c235)

ldquoCheY-likerdquosuperfamily(c231)

14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

AnalogyHomology

HomologyHomolo

gy

多く現れるフォールド(出現ドメイン数順)

太字はスーパーフォールド多くのスーパーファミリーを含むフォールド

d58

c1

g3

c23 b34

b1

a4フォールド名 (SCOP173によるクラスfhijkは除く) ドメイ

ンの数

スーパーファミリーの数

a4 DNARNA-binding 3-helical bundle 292 14c1 TIM betaalpha-barrel 269 33d58 Ferredoxin-like 248 55b1 Immunoglobulin-like beta sandwich 246 27c37 P-loop nucleoside triphosphate hydrolase 235 1c2 NAD(P)-binding Rossmann-fold domains 168 1g3 Knottins 154 19d15 Beta-Grasp(ubiquitin-like) 131 13c23 Flavodoxin-like 118 15b34 SH3-like barrel 117 18b40 OB-fold 100 12c66 SAM-dependent methyltransferases 95 1

c37 c2

d15

b40 c66

スーパーフォールド(Superfold)

フォールド名 (SCOP173によるクラスfhijkは除く) その下のスーパーファミリーの数

d58 Ferredoxin-like 55c1 TIM betaalpha-barrel 33b1 Immunoglobulin-like beta sandwich 27a24 Four-helical up-and-down bundle 27a118 Alpha-alpha superhelix 23g3 Knottins 19b34 SH3-like barrel 18g41 Rubredoxin-like 16c23 Flavodoxin-like 15a60 SAM(sterile alpha motif) domain-like 15b69 7-bladed beta-propeller 14a4 DNARNA-binding 3-helical bundle 14

スーパーフォールド多くのスーパーファミリーを含むフォールド

スーパーフォールドは「構造の類似と機能の類似が対応しにくいフォールド」ともいえる

d58

c1

g3a118

c23

a24

a60

b34

b1

g41

b69 a4

三本へリックスバンドルDNARNA‐binding 3‐helical bundle(a4)

Mating type protein A2 yeast(1k61Aa411)

(1gvdAa413)(1wh5Aa411)

三本のへリックスが束になった構造DNAやRNAに結合する蛋白質が多い

DNAと

結合した構造(1k61)

TIMバレルTIM betaalpha barrel (c1)

Triosephosphate isomerase1n55A(c111)

全般に解糖系の酵素が多い基質酵素反応は極めて多彩

八本のβストランドとαへリックスが交互に組み合わさり対称的な樽(barrel)構造を形成す

る中央の樽構造は平行のβシートからなる

Imidazole glycerol phosphate synthasesubunit hisF1thfD(c121)

KHGKDPG aldolase1euaA(c1101)

フェレドキシン様Ferredoxin‐like (d58)

4Fe-4S Ferredoxin(1fxdd581)

1 234 4本の逆平行のβストランドと2本のαへリックスからな

分子機能は極めて多彩

CheY binding domain of CheA(1eayCd5824)

U1A RNA binding domain(1nu4Ad5871)

免疫グロブリン様Immunoglobulin‐like beta sandwich(b1)

Immunoglobulin Heavy chain variabledomain 1mjuH1(b111)

Immunoglobulin Heavy chain constantdomain 1mjuH2(b112)

Macromomycin1noaA (b171)

免疫グロブリン分子はH鎖とL鎖から

なりそれぞれ免疫グロブリン様ドメインからできている

V

C

V

C

C

C

V

CV

CC

C

L鎖

H鎖H鎖 L鎖

細胞表面あるいは分泌蛋白質が多い免疫や分子認識に関する機能を担うことが多い

4本のβストランドからなるβシートが二枚サンドイッチ状に重なった構造をとる逆平行のβシートが主

P‐loop スーパーファミリーP‐loop nucleoside triphosphate hydrolase(c37)

Ras-related protein RAB-5A1r2qA(c3718)

Guanylate kinase1gkyA(c3711)

RecA proteinDomain1 1xmsA1(c37111)

平行のβシートが主トポロジーには様々な変異あり

シグナル伝達DNA結合

モーター機能など多彩な分子機能を担うがATP GTPなどのヌクレオシド

の加水分解を行う点は共通

N C

132 4 5 6

ヌクレオシド結合部GxxxxGKTの

配列モチーフ(P-loop)を持つ

ロスマン フォールドNAD(P)‐binding Rossmann‐fold domains (c2)

Alcohol dehydrogenase gamma chaindomain2 1u3wA(c211)

Aspartate beta-semialdehydedehydrogenase2gz1A1(c213)

L-alanine dehydrogenase1pjcA1(c214)

補酵素を利用したNAD(P)を脱水素酵素を持つ基質を認識するドメインは別に存在する

NC

123 4 5 6

平行のβシートが主

7枚羽 βプロペラ7‐bladed beta‐propeller (b69)

Garactose oxydasedomain3 1k3iA3(b6911)

Guanine nucleotide-bindingprotein subunit beta-11gotB(b6941)

細胞膜付近のシグナル伝達や糖結合に関わることが多い

Influenza Neuraminidase 1f8dA(b6811)

6枚羽 βプロペラ

N C

321 4

のユニットが7回円環状に繰り返しされたフォールド

立体構造比較プログラム1990年ごろから多くの構造比較プログラムが開発されている

WEBアドレス スコア アライメント

DALI httpwwwebiacukdali

距離の差を独自の関数で変換したスコア

局所アライメントをモンテカルロ法でつなぎ合わせる

CE httpclsdsceducehtml

局所的なRMSD 局所アライメントを積み上げていく

MATRAS httpbiunitnaistjpmatras

距離の変化が相同相似で起こる確率の比をスコアとする

SSEで仮アライメント

を生成残基アライメントを収束するまで反復する

タンパク質の相同性の判断基準

100

同一残基率30以上

BLASTのE-value lt 00001

PSI-BLASTのE-value lt 00001

0102030407025 15 535

同一残基率(Sequence Identity)()

立体構造比較が必要

(1)立体構造の類似性が高い(DALIのZスコアMATRASのRdisスコア)(2)同一残基率がそこそこ高い(PSI-BLASTでヒットするSeqIDgt=15ぐらい)

(3)分子機能に類似性がある(補酵素酵素反応基質代謝経路等の共通性等)(4)基質補酵素の結合部位が類似しておりそのアミノ酸が保存(モチーフ)(5)ドメイン構成の共通性(6)スーパーフォールドの場合は特別な注意が必要

配列解析

同一残基率が25以下の場合の相同性の判断基準

50608090

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 26: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

H19 問73立体構造の似ている2つのタンパク質間で対応関係にある原子が分かっている場合にはRMSD(Root Mean Square Deviation)と呼ばれる数値を計算することにより立体構造の重なり合いの程度を数値化することができるRMSDは全ての対応する原子間の距離を

2乗した値の平均値(相加平均)にルートをとったものとして定義されるあるタンパク質における6つの原子ABCDEFと別のタンパク質の6つの原子

ArsquoBrsquoCrsquoDrsquoErsquoFrsquoについて対応関係が分かっており互いにもっともよく重なるように回転して重ねた時の対応原子間の距離は以下の表のようになったこの表からB-Brsquo C-Crsquo D-Drsquo E-Ersquoは正確に重なったが他の原子間ではずれが見られることがわかるここで6つの原子に対するRMSD値はいくらになるか選択肢の中からもっとも適切な値を一つ選べただ

し原子間距離の単位は考慮しないものとする

対応原子 距離

原子A―原子Arsquo 20

原子B―原子Brsquo 00

原子C―原子Crsquo 00

原子D―原子Crsquo 10

原子E―原子Crsquo 00

原子F―原子Crsquo 10

1 052 0663 104 133

RMSDは 適に重ね合わせたときの

「ずれの二乗の平均のルート」であるしたがってずれの二乗平均は

(22+0+0+1+0+1)6=66=1これのルートをとるとradic1=1

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

1

2

3

4

56

7

8

9

10

11

主鎖の水素結合αへリックス

1

2

34

56

78

9

10

11

O

N

CHN

N

H

H

CO Cα

i

i+3

i+4

HN O C

Cαi-1

i番目のCOがi+4番目のNHと水素結合を形成

36残基が1周期の右巻きらせん

NHO=Cが同じ向きに並ぶため

へリックス全体に電気双極子が発生

N末C末

ー +

主鎖の水素結合逆平行βシート

βターン

βターン

βヘアピン

βヘアピン

伸びた構造の1本1本をβストランドと呼ぶ二本以上のβストランドがシート状に並んだ構造をβシートと呼ぶ

βストランド

βストランド

βストランド

主鎖の水素結合平行βシート

βminusαminusβモチーフ

平行βシートがαへリックスで接続された構造モチーフ

βストランド

βストランド

βストランド

伸びた構造の1本1本をβストランドと呼ぶ二本以上のβストランドがシート状に並んだ構造をβシートと呼ぶ

Cαi

Cαi+1Cα

i-1φ ψ

ペプチド結合の平面性とφψの定義

主鎖の原子のXYZ座標はφψの2つ

の角度でほとんど記述できる

φψの角度を2次元にプロットしたものをラマチャンドランプロット(Ramachandran plot)という点が集中する領域は2次構造とよく対応

点が現れない領域は主鎖の原子が衝突する

βシート

αへリックス

左巻きへリックス

平面平面

φ

ψ

H19 問74タンパク質の主鎖に添って定義される二面角のうちφ(窒素原子と炭素原子の間の二面角)とψ(α炭素原子とカルボニル基の炭素原子の間の二面角)の値を各残

基ごとに計算して二次元にプロットしたものをラマチャンドランプロットと呼ぶ以下に示したラマチャンドランプロットに対する説明文の中でもっとも適切なものを一つ選べ

1 (a)(b)はともにαへリックスの領域である2 (a)(b)はともにβストランドの領域である3 (a)はαへリックス(b)はβストランドの領

域である4 (a)はβストランド(b)はαへリックスの領

域である

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問74タンパク質の主鎖に添って定義される二面角のうちφ(窒素原子と炭素原子の間の二面角)とψ(α炭素原子とカルボニル基の炭素原子の間の二面角)の値を各残

基ごとに計算して二次元にプロットしたものをラマチャンドランプロットと呼ぶ以下に示したラマチャンドランプロットに対する説明文の中でもっとも適切なものを一つ選べ

1 (a)(b)はともにαへリックスの領域である2 (a)(b)はともにβストランドの領域である3 (a)はαへリックス(b)はβストランドの領

域である4 (a)はβストランド(b)はαへリックスの領

域である

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

トポロジー図によるβシートの表現

4 23

N

C

1

1ubq (UbiquitinHumand151)

N

C123 4 5 6

1n8k (Alchol dehydrogenase E chain Horse c21)

ロスマンフォールド

βターン

βターン

1cauA1rhdA domain2

TOPSプログラムによる表示httpwwwtopsleedsacuk

1timA

はαへリックスはβストランドとなりあうの向きで平行逆平行を示す

コンタクトマップ

1ubq

C

4 23

N

1

縦横に残基を配置しある残基ペアのCα原子間の距離が10Å以下であれば対応するピクセルに色を塗る

分子描画ソフトVMDを用いて作成

平行のストランド間は方向逆平行ストランド間は方向に線分が観察される

N

C

N C

逆平行

逆平行

平行

αへリックスは太めの対角上の線分

へリックス

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから1か3コンタクトマップから平行シートしかないことがわかるため1であることがわかる

αβ5

αβ3

α

β4α

β1αβ2 β2

β1β3β4

β5

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから2か4コンタクトマップから平行シートしかないことがわかるため2であることがわかる

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

配列比較によるタンパク質分類1970年代から配列の一致度(sequence identity)に基づいてグループを作る作業が

行われてきた

どのくらいの類似性で一つにまとめるかは様々な考えがあるが少なくとも「相同なタンパク質群」を一つのグループにまとめるべき

ファミリー(family 族)

進化的に関係のある(相同な)タンパク質グループのこと

複数のファミリーがあつまった大きなグループ スーパーファミリー(superfamily clan)

一つのファミリーの中の小さなグループ サブファミリー(subfamily)

family

subfamily superfamily

ドメイン単位による分類

A2 B2

B3 C3

A1

配列1

配列2

配列3

配列の部分どうしだけが類似していた場合 部分一致を重視するとすべて一つのグループになるがhellip

配列1

配列2 配列3

Aを共有

Bを共有

1と2が類似2と3が類似していても1と3は類似していない

ドメインに分割すると

A1

A2

B2

B3

C3

A2 B2

B3 C3

A1

きれいに分類することができる

Pfam 蛋白質ファミリのデータベース各蛋白質ファミリのマルチプル

アライメント HMMなどを集めたデータベース

httppfamsangeracuk

Pkinase_Tyrドメインをもつタンパク質の例

ABL_HUMAN

BTK_HUMAN

ILK_HUMAN

MERTK_HUMAN

PGFRB_HUMAN

HCK_HUMAN

Family Pkinase_Tyr (PF07714) Protein tyrosine kinase

Pfamデータベース(httppfamsangeracukSoftwarePfam)からの引用

ドメイン構造と疎水性の関係Tyrosine protein kinase HCK (1ad5A HCK_HUMAN)

SH3 domain

SH2 domain

Tyrosine-kinase domain

3つの分断された疎水性コアrarr ドメイン構造

大きなタンパク質はいくつかの構造上のまとまり(ドメイン)を持つことが多い

立体構造によるタンパク質の分類

bull 配列による分類の延長ドメイン単位の分類進化的に関係のある(相同な)タンパク質を群にする(ファミリー)という考え方は同じ

bull 立体構造の類似性からより遠縁の相同性を見つけより大きな群を作る(スーパーファミリー)

bull スーパーファミリーをまとめたさらに大きなグループ(フォールドクラス)

bull 主にアミノ酸(Cαレベル)のラフな構造の類似性に

着目

bull 分類対象は主に球状タンパク質

立体構造分類データベースSCOPhttpscopmrc-lmbcamacukscop

4階層で分類Class(クラス)

Fold(フォールド)

Superfamily(スーパーファミリー)

Family(ファミリー)

どの階層に分類するかは配列の類似性立体構造の類似性分子機能の類似性機能部位の類似性

を専門家が総合的に判断して決める

1akr

ltホモロジーgt

ltアナロジーgt

他の構造分類データベースとしてCATHが有名

同様に階層的な分類体系を持つがその詳細はSCOPとは異なる

クラス

1mbd

1mqkH

1n55A 1pqwA

1fxd 1a2p

all-α (a)

all-β (b)

αβ (c)

α+β (d)

α-へリックスが中心

β-シートが中心

逆平行が多い

α-へリックスとβ-シートが配列上交互に現れる平行β-シートが中心

α-へリックスとβ-シートが混在配列上の並びの規則はない逆平行と平行のβ-シートが混在

アミノ酸配列と立体構造の関係ピロリ菌と大腸菌のフラボドキシン (同一残基率 SeqID 44)

ピロリ菌(1fueA) 大腸菌(1ag9A)

配列が似ていれば立体構造も似ている

SeqID = 44

RMSD = 12 Å

1fueA 2GKIGIFFGTDSGNAEAIAEKISKAIG--NAEVVDVAKASKEQFNGFTKVILVAPTAGAGD59

1ag9A 2AITGIFFGSDTGNTENIAKMIQKQLGKDVADVHDIAKSSKEDLEAYDILLLGIPTWYYGE61

1fueA 60LQTDWEDFLGTLEASD-FANKTIGLVGLGDQDTYSETFAEGIFHIYEKAK--AGKVVGQT116

1ag9A 62AQCDWDDFFPTLE-EIDFNGKLVALFGCGDQEDYAEYFCDALGTIRDIIEPRGATIVGHW120

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C 14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

BLAST

PSI-BLAST 構造比較

構造比較

アミノ酸配列がほとんど似ていなくても立体構造は似ている場合がある

構造は配列より進化的に保存がよい 構造比較から新たなホモログが発見できる可能性

立体

構造

の変

アミノ酸配列の変化と立体構造の変化の相関(グロビン族)

立体構造の変化はアミノ酸配列の変化と相関配列が30以上一致していればRMSDは2Å以下

アミノ酸配列の類似度

2つの構造の類似性

ホモロジー (homology 相同)進化的起源を共有することによる類似多くの場合分子機能なども類似している

アナロジー (analogy 相似)進化的起源とは無関係な類似多くの場合分子機能など他の属性は似ていない物理化学的な構造の偏好が原因とされる

イルカの胸びれ サルの前足

チョウの羽 トリの翼

ネコの前足

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C

ldquoFlavodoxin-likerdquo fold (c23)

ldquoFlavoproteinsrdquo superfamily (c235)

ldquoCheY-likerdquosuperfamily(c231)

14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

AnalogyHomology

HomologyHomolo

gy

多く現れるフォールド(出現ドメイン数順)

太字はスーパーフォールド多くのスーパーファミリーを含むフォールド

d58

c1

g3

c23 b34

b1

a4フォールド名 (SCOP173によるクラスfhijkは除く) ドメイ

ンの数

スーパーファミリーの数

a4 DNARNA-binding 3-helical bundle 292 14c1 TIM betaalpha-barrel 269 33d58 Ferredoxin-like 248 55b1 Immunoglobulin-like beta sandwich 246 27c37 P-loop nucleoside triphosphate hydrolase 235 1c2 NAD(P)-binding Rossmann-fold domains 168 1g3 Knottins 154 19d15 Beta-Grasp(ubiquitin-like) 131 13c23 Flavodoxin-like 118 15b34 SH3-like barrel 117 18b40 OB-fold 100 12c66 SAM-dependent methyltransferases 95 1

c37 c2

d15

b40 c66

スーパーフォールド(Superfold)

フォールド名 (SCOP173によるクラスfhijkは除く) その下のスーパーファミリーの数

d58 Ferredoxin-like 55c1 TIM betaalpha-barrel 33b1 Immunoglobulin-like beta sandwich 27a24 Four-helical up-and-down bundle 27a118 Alpha-alpha superhelix 23g3 Knottins 19b34 SH3-like barrel 18g41 Rubredoxin-like 16c23 Flavodoxin-like 15a60 SAM(sterile alpha motif) domain-like 15b69 7-bladed beta-propeller 14a4 DNARNA-binding 3-helical bundle 14

スーパーフォールド多くのスーパーファミリーを含むフォールド

スーパーフォールドは「構造の類似と機能の類似が対応しにくいフォールド」ともいえる

d58

c1

g3a118

c23

a24

a60

b34

b1

g41

b69 a4

三本へリックスバンドルDNARNA‐binding 3‐helical bundle(a4)

Mating type protein A2 yeast(1k61Aa411)

(1gvdAa413)(1wh5Aa411)

三本のへリックスが束になった構造DNAやRNAに結合する蛋白質が多い

DNAと

結合した構造(1k61)

TIMバレルTIM betaalpha barrel (c1)

Triosephosphate isomerase1n55A(c111)

全般に解糖系の酵素が多い基質酵素反応は極めて多彩

八本のβストランドとαへリックスが交互に組み合わさり対称的な樽(barrel)構造を形成す

る中央の樽構造は平行のβシートからなる

Imidazole glycerol phosphate synthasesubunit hisF1thfD(c121)

KHGKDPG aldolase1euaA(c1101)

フェレドキシン様Ferredoxin‐like (d58)

4Fe-4S Ferredoxin(1fxdd581)

1 234 4本の逆平行のβストランドと2本のαへリックスからな

分子機能は極めて多彩

CheY binding domain of CheA(1eayCd5824)

U1A RNA binding domain(1nu4Ad5871)

免疫グロブリン様Immunoglobulin‐like beta sandwich(b1)

Immunoglobulin Heavy chain variabledomain 1mjuH1(b111)

Immunoglobulin Heavy chain constantdomain 1mjuH2(b112)

Macromomycin1noaA (b171)

免疫グロブリン分子はH鎖とL鎖から

なりそれぞれ免疫グロブリン様ドメインからできている

V

C

V

C

C

C

V

CV

CC

C

L鎖

H鎖H鎖 L鎖

細胞表面あるいは分泌蛋白質が多い免疫や分子認識に関する機能を担うことが多い

4本のβストランドからなるβシートが二枚サンドイッチ状に重なった構造をとる逆平行のβシートが主

P‐loop スーパーファミリーP‐loop nucleoside triphosphate hydrolase(c37)

Ras-related protein RAB-5A1r2qA(c3718)

Guanylate kinase1gkyA(c3711)

RecA proteinDomain1 1xmsA1(c37111)

平行のβシートが主トポロジーには様々な変異あり

シグナル伝達DNA結合

モーター機能など多彩な分子機能を担うがATP GTPなどのヌクレオシド

の加水分解を行う点は共通

N C

132 4 5 6

ヌクレオシド結合部GxxxxGKTの

配列モチーフ(P-loop)を持つ

ロスマン フォールドNAD(P)‐binding Rossmann‐fold domains (c2)

Alcohol dehydrogenase gamma chaindomain2 1u3wA(c211)

Aspartate beta-semialdehydedehydrogenase2gz1A1(c213)

L-alanine dehydrogenase1pjcA1(c214)

補酵素を利用したNAD(P)を脱水素酵素を持つ基質を認識するドメインは別に存在する

NC

123 4 5 6

平行のβシートが主

7枚羽 βプロペラ7‐bladed beta‐propeller (b69)

Garactose oxydasedomain3 1k3iA3(b6911)

Guanine nucleotide-bindingprotein subunit beta-11gotB(b6941)

細胞膜付近のシグナル伝達や糖結合に関わることが多い

Influenza Neuraminidase 1f8dA(b6811)

6枚羽 βプロペラ

N C

321 4

のユニットが7回円環状に繰り返しされたフォールド

立体構造比較プログラム1990年ごろから多くの構造比較プログラムが開発されている

WEBアドレス スコア アライメント

DALI httpwwwebiacukdali

距離の差を独自の関数で変換したスコア

局所アライメントをモンテカルロ法でつなぎ合わせる

CE httpclsdsceducehtml

局所的なRMSD 局所アライメントを積み上げていく

MATRAS httpbiunitnaistjpmatras

距離の変化が相同相似で起こる確率の比をスコアとする

SSEで仮アライメント

を生成残基アライメントを収束するまで反復する

タンパク質の相同性の判断基準

100

同一残基率30以上

BLASTのE-value lt 00001

PSI-BLASTのE-value lt 00001

0102030407025 15 535

同一残基率(Sequence Identity)()

立体構造比較が必要

(1)立体構造の類似性が高い(DALIのZスコアMATRASのRdisスコア)(2)同一残基率がそこそこ高い(PSI-BLASTでヒットするSeqIDgt=15ぐらい)

(3)分子機能に類似性がある(補酵素酵素反応基質代謝経路等の共通性等)(4)基質補酵素の結合部位が類似しておりそのアミノ酸が保存(モチーフ)(5)ドメイン構成の共通性(6)スーパーフォールドの場合は特別な注意が必要

配列解析

同一残基率が25以下の場合の相同性の判断基準

50608090

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 27: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

1

2

3

4

56

7

8

9

10

11

主鎖の水素結合αへリックス

1

2

34

56

78

9

10

11

O

N

CHN

N

H

H

CO Cα

i

i+3

i+4

HN O C

Cαi-1

i番目のCOがi+4番目のNHと水素結合を形成

36残基が1周期の右巻きらせん

NHO=Cが同じ向きに並ぶため

へリックス全体に電気双極子が発生

N末C末

ー +

主鎖の水素結合逆平行βシート

βターン

βターン

βヘアピン

βヘアピン

伸びた構造の1本1本をβストランドと呼ぶ二本以上のβストランドがシート状に並んだ構造をβシートと呼ぶ

βストランド

βストランド

βストランド

主鎖の水素結合平行βシート

βminusαminusβモチーフ

平行βシートがαへリックスで接続された構造モチーフ

βストランド

βストランド

βストランド

伸びた構造の1本1本をβストランドと呼ぶ二本以上のβストランドがシート状に並んだ構造をβシートと呼ぶ

Cαi

Cαi+1Cα

i-1φ ψ

ペプチド結合の平面性とφψの定義

主鎖の原子のXYZ座標はφψの2つ

の角度でほとんど記述できる

φψの角度を2次元にプロットしたものをラマチャンドランプロット(Ramachandran plot)という点が集中する領域は2次構造とよく対応

点が現れない領域は主鎖の原子が衝突する

βシート

αへリックス

左巻きへリックス

平面平面

φ

ψ

H19 問74タンパク質の主鎖に添って定義される二面角のうちφ(窒素原子と炭素原子の間の二面角)とψ(α炭素原子とカルボニル基の炭素原子の間の二面角)の値を各残

基ごとに計算して二次元にプロットしたものをラマチャンドランプロットと呼ぶ以下に示したラマチャンドランプロットに対する説明文の中でもっとも適切なものを一つ選べ

1 (a)(b)はともにαへリックスの領域である2 (a)(b)はともにβストランドの領域である3 (a)はαへリックス(b)はβストランドの領

域である4 (a)はβストランド(b)はαへリックスの領

域である

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問74タンパク質の主鎖に添って定義される二面角のうちφ(窒素原子と炭素原子の間の二面角)とψ(α炭素原子とカルボニル基の炭素原子の間の二面角)の値を各残

基ごとに計算して二次元にプロットしたものをラマチャンドランプロットと呼ぶ以下に示したラマチャンドランプロットに対する説明文の中でもっとも適切なものを一つ選べ

1 (a)(b)はともにαへリックスの領域である2 (a)(b)はともにβストランドの領域である3 (a)はαへリックス(b)はβストランドの領

域である4 (a)はβストランド(b)はαへリックスの領

域である

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

トポロジー図によるβシートの表現

4 23

N

C

1

1ubq (UbiquitinHumand151)

N

C123 4 5 6

1n8k (Alchol dehydrogenase E chain Horse c21)

ロスマンフォールド

βターン

βターン

1cauA1rhdA domain2

TOPSプログラムによる表示httpwwwtopsleedsacuk

1timA

はαへリックスはβストランドとなりあうの向きで平行逆平行を示す

コンタクトマップ

1ubq

C

4 23

N

1

縦横に残基を配置しある残基ペアのCα原子間の距離が10Å以下であれば対応するピクセルに色を塗る

分子描画ソフトVMDを用いて作成

平行のストランド間は方向逆平行ストランド間は方向に線分が観察される

N

C

N C

逆平行

逆平行

平行

αへリックスは太めの対角上の線分

へリックス

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから1か3コンタクトマップから平行シートしかないことがわかるため1であることがわかる

αβ5

αβ3

α

β4α

β1αβ2 β2

β1β3β4

β5

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから2か4コンタクトマップから平行シートしかないことがわかるため2であることがわかる

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

配列比較によるタンパク質分類1970年代から配列の一致度(sequence identity)に基づいてグループを作る作業が

行われてきた

どのくらいの類似性で一つにまとめるかは様々な考えがあるが少なくとも「相同なタンパク質群」を一つのグループにまとめるべき

ファミリー(family 族)

進化的に関係のある(相同な)タンパク質グループのこと

複数のファミリーがあつまった大きなグループ スーパーファミリー(superfamily clan)

一つのファミリーの中の小さなグループ サブファミリー(subfamily)

family

subfamily superfamily

ドメイン単位による分類

A2 B2

B3 C3

A1

配列1

配列2

配列3

配列の部分どうしだけが類似していた場合 部分一致を重視するとすべて一つのグループになるがhellip

配列1

配列2 配列3

Aを共有

Bを共有

1と2が類似2と3が類似していても1と3は類似していない

ドメインに分割すると

A1

A2

B2

B3

C3

A2 B2

B3 C3

A1

きれいに分類することができる

Pfam 蛋白質ファミリのデータベース各蛋白質ファミリのマルチプル

アライメント HMMなどを集めたデータベース

httppfamsangeracuk

Pkinase_Tyrドメインをもつタンパク質の例

ABL_HUMAN

BTK_HUMAN

ILK_HUMAN

MERTK_HUMAN

PGFRB_HUMAN

HCK_HUMAN

Family Pkinase_Tyr (PF07714) Protein tyrosine kinase

Pfamデータベース(httppfamsangeracukSoftwarePfam)からの引用

ドメイン構造と疎水性の関係Tyrosine protein kinase HCK (1ad5A HCK_HUMAN)

SH3 domain

SH2 domain

Tyrosine-kinase domain

3つの分断された疎水性コアrarr ドメイン構造

大きなタンパク質はいくつかの構造上のまとまり(ドメイン)を持つことが多い

立体構造によるタンパク質の分類

bull 配列による分類の延長ドメイン単位の分類進化的に関係のある(相同な)タンパク質を群にする(ファミリー)という考え方は同じ

bull 立体構造の類似性からより遠縁の相同性を見つけより大きな群を作る(スーパーファミリー)

bull スーパーファミリーをまとめたさらに大きなグループ(フォールドクラス)

bull 主にアミノ酸(Cαレベル)のラフな構造の類似性に

着目

bull 分類対象は主に球状タンパク質

立体構造分類データベースSCOPhttpscopmrc-lmbcamacukscop

4階層で分類Class(クラス)

Fold(フォールド)

Superfamily(スーパーファミリー)

Family(ファミリー)

どの階層に分類するかは配列の類似性立体構造の類似性分子機能の類似性機能部位の類似性

を専門家が総合的に判断して決める

1akr

ltホモロジーgt

ltアナロジーgt

他の構造分類データベースとしてCATHが有名

同様に階層的な分類体系を持つがその詳細はSCOPとは異なる

クラス

1mbd

1mqkH

1n55A 1pqwA

1fxd 1a2p

all-α (a)

all-β (b)

αβ (c)

α+β (d)

α-へリックスが中心

β-シートが中心

逆平行が多い

α-へリックスとβ-シートが配列上交互に現れる平行β-シートが中心

α-へリックスとβ-シートが混在配列上の並びの規則はない逆平行と平行のβ-シートが混在

アミノ酸配列と立体構造の関係ピロリ菌と大腸菌のフラボドキシン (同一残基率 SeqID 44)

ピロリ菌(1fueA) 大腸菌(1ag9A)

配列が似ていれば立体構造も似ている

SeqID = 44

RMSD = 12 Å

1fueA 2GKIGIFFGTDSGNAEAIAEKISKAIG--NAEVVDVAKASKEQFNGFTKVILVAPTAGAGD59

1ag9A 2AITGIFFGSDTGNTENIAKMIQKQLGKDVADVHDIAKSSKEDLEAYDILLLGIPTWYYGE61

1fueA 60LQTDWEDFLGTLEASD-FANKTIGLVGLGDQDTYSETFAEGIFHIYEKAK--AGKVVGQT116

1ag9A 62AQCDWDDFFPTLE-EIDFNGKLVALFGCGDQEDYAEYFCDALGTIRDIIEPRGATIVGHW120

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C 14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

BLAST

PSI-BLAST 構造比較

構造比較

アミノ酸配列がほとんど似ていなくても立体構造は似ている場合がある

構造は配列より進化的に保存がよい 構造比較から新たなホモログが発見できる可能性

立体

構造

の変

アミノ酸配列の変化と立体構造の変化の相関(グロビン族)

立体構造の変化はアミノ酸配列の変化と相関配列が30以上一致していればRMSDは2Å以下

アミノ酸配列の類似度

2つの構造の類似性

ホモロジー (homology 相同)進化的起源を共有することによる類似多くの場合分子機能なども類似している

アナロジー (analogy 相似)進化的起源とは無関係な類似多くの場合分子機能など他の属性は似ていない物理化学的な構造の偏好が原因とされる

イルカの胸びれ サルの前足

チョウの羽 トリの翼

ネコの前足

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C

ldquoFlavodoxin-likerdquo fold (c23)

ldquoFlavoproteinsrdquo superfamily (c235)

ldquoCheY-likerdquosuperfamily(c231)

14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

AnalogyHomology

HomologyHomolo

gy

多く現れるフォールド(出現ドメイン数順)

太字はスーパーフォールド多くのスーパーファミリーを含むフォールド

d58

c1

g3

c23 b34

b1

a4フォールド名 (SCOP173によるクラスfhijkは除く) ドメイ

ンの数

スーパーファミリーの数

a4 DNARNA-binding 3-helical bundle 292 14c1 TIM betaalpha-barrel 269 33d58 Ferredoxin-like 248 55b1 Immunoglobulin-like beta sandwich 246 27c37 P-loop nucleoside triphosphate hydrolase 235 1c2 NAD(P)-binding Rossmann-fold domains 168 1g3 Knottins 154 19d15 Beta-Grasp(ubiquitin-like) 131 13c23 Flavodoxin-like 118 15b34 SH3-like barrel 117 18b40 OB-fold 100 12c66 SAM-dependent methyltransferases 95 1

c37 c2

d15

b40 c66

スーパーフォールド(Superfold)

フォールド名 (SCOP173によるクラスfhijkは除く) その下のスーパーファミリーの数

d58 Ferredoxin-like 55c1 TIM betaalpha-barrel 33b1 Immunoglobulin-like beta sandwich 27a24 Four-helical up-and-down bundle 27a118 Alpha-alpha superhelix 23g3 Knottins 19b34 SH3-like barrel 18g41 Rubredoxin-like 16c23 Flavodoxin-like 15a60 SAM(sterile alpha motif) domain-like 15b69 7-bladed beta-propeller 14a4 DNARNA-binding 3-helical bundle 14

スーパーフォールド多くのスーパーファミリーを含むフォールド

スーパーフォールドは「構造の類似と機能の類似が対応しにくいフォールド」ともいえる

d58

c1

g3a118

c23

a24

a60

b34

b1

g41

b69 a4

三本へリックスバンドルDNARNA‐binding 3‐helical bundle(a4)

Mating type protein A2 yeast(1k61Aa411)

(1gvdAa413)(1wh5Aa411)

三本のへリックスが束になった構造DNAやRNAに結合する蛋白質が多い

DNAと

結合した構造(1k61)

TIMバレルTIM betaalpha barrel (c1)

Triosephosphate isomerase1n55A(c111)

全般に解糖系の酵素が多い基質酵素反応は極めて多彩

八本のβストランドとαへリックスが交互に組み合わさり対称的な樽(barrel)構造を形成す

る中央の樽構造は平行のβシートからなる

Imidazole glycerol phosphate synthasesubunit hisF1thfD(c121)

KHGKDPG aldolase1euaA(c1101)

フェレドキシン様Ferredoxin‐like (d58)

4Fe-4S Ferredoxin(1fxdd581)

1 234 4本の逆平行のβストランドと2本のαへリックスからな

分子機能は極めて多彩

CheY binding domain of CheA(1eayCd5824)

U1A RNA binding domain(1nu4Ad5871)

免疫グロブリン様Immunoglobulin‐like beta sandwich(b1)

Immunoglobulin Heavy chain variabledomain 1mjuH1(b111)

Immunoglobulin Heavy chain constantdomain 1mjuH2(b112)

Macromomycin1noaA (b171)

免疫グロブリン分子はH鎖とL鎖から

なりそれぞれ免疫グロブリン様ドメインからできている

V

C

V

C

C

C

V

CV

CC

C

L鎖

H鎖H鎖 L鎖

細胞表面あるいは分泌蛋白質が多い免疫や分子認識に関する機能を担うことが多い

4本のβストランドからなるβシートが二枚サンドイッチ状に重なった構造をとる逆平行のβシートが主

P‐loop スーパーファミリーP‐loop nucleoside triphosphate hydrolase(c37)

Ras-related protein RAB-5A1r2qA(c3718)

Guanylate kinase1gkyA(c3711)

RecA proteinDomain1 1xmsA1(c37111)

平行のβシートが主トポロジーには様々な変異あり

シグナル伝達DNA結合

モーター機能など多彩な分子機能を担うがATP GTPなどのヌクレオシド

の加水分解を行う点は共通

N C

132 4 5 6

ヌクレオシド結合部GxxxxGKTの

配列モチーフ(P-loop)を持つ

ロスマン フォールドNAD(P)‐binding Rossmann‐fold domains (c2)

Alcohol dehydrogenase gamma chaindomain2 1u3wA(c211)

Aspartate beta-semialdehydedehydrogenase2gz1A1(c213)

L-alanine dehydrogenase1pjcA1(c214)

補酵素を利用したNAD(P)を脱水素酵素を持つ基質を認識するドメインは別に存在する

NC

123 4 5 6

平行のβシートが主

7枚羽 βプロペラ7‐bladed beta‐propeller (b69)

Garactose oxydasedomain3 1k3iA3(b6911)

Guanine nucleotide-bindingprotein subunit beta-11gotB(b6941)

細胞膜付近のシグナル伝達や糖結合に関わることが多い

Influenza Neuraminidase 1f8dA(b6811)

6枚羽 βプロペラ

N C

321 4

のユニットが7回円環状に繰り返しされたフォールド

立体構造比較プログラム1990年ごろから多くの構造比較プログラムが開発されている

WEBアドレス スコア アライメント

DALI httpwwwebiacukdali

距離の差を独自の関数で変換したスコア

局所アライメントをモンテカルロ法でつなぎ合わせる

CE httpclsdsceducehtml

局所的なRMSD 局所アライメントを積み上げていく

MATRAS httpbiunitnaistjpmatras

距離の変化が相同相似で起こる確率の比をスコアとする

SSEで仮アライメント

を生成残基アライメントを収束するまで反復する

タンパク質の相同性の判断基準

100

同一残基率30以上

BLASTのE-value lt 00001

PSI-BLASTのE-value lt 00001

0102030407025 15 535

同一残基率(Sequence Identity)()

立体構造比較が必要

(1)立体構造の類似性が高い(DALIのZスコアMATRASのRdisスコア)(2)同一残基率がそこそこ高い(PSI-BLASTでヒットするSeqIDgt=15ぐらい)

(3)分子機能に類似性がある(補酵素酵素反応基質代謝経路等の共通性等)(4)基質補酵素の結合部位が類似しておりそのアミノ酸が保存(モチーフ)(5)ドメイン構成の共通性(6)スーパーフォールドの場合は特別な注意が必要

配列解析

同一残基率が25以下の場合の相同性の判断基準

50608090

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 28: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

主鎖の水素結合逆平行βシート

βターン

βターン

βヘアピン

βヘアピン

伸びた構造の1本1本をβストランドと呼ぶ二本以上のβストランドがシート状に並んだ構造をβシートと呼ぶ

βストランド

βストランド

βストランド

主鎖の水素結合平行βシート

βminusαminusβモチーフ

平行βシートがαへリックスで接続された構造モチーフ

βストランド

βストランド

βストランド

伸びた構造の1本1本をβストランドと呼ぶ二本以上のβストランドがシート状に並んだ構造をβシートと呼ぶ

Cαi

Cαi+1Cα

i-1φ ψ

ペプチド結合の平面性とφψの定義

主鎖の原子のXYZ座標はφψの2つ

の角度でほとんど記述できる

φψの角度を2次元にプロットしたものをラマチャンドランプロット(Ramachandran plot)という点が集中する領域は2次構造とよく対応

点が現れない領域は主鎖の原子が衝突する

βシート

αへリックス

左巻きへリックス

平面平面

φ

ψ

H19 問74タンパク質の主鎖に添って定義される二面角のうちφ(窒素原子と炭素原子の間の二面角)とψ(α炭素原子とカルボニル基の炭素原子の間の二面角)の値を各残

基ごとに計算して二次元にプロットしたものをラマチャンドランプロットと呼ぶ以下に示したラマチャンドランプロットに対する説明文の中でもっとも適切なものを一つ選べ

1 (a)(b)はともにαへリックスの領域である2 (a)(b)はともにβストランドの領域である3 (a)はαへリックス(b)はβストランドの領

域である4 (a)はβストランド(b)はαへリックスの領

域である

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問74タンパク質の主鎖に添って定義される二面角のうちφ(窒素原子と炭素原子の間の二面角)とψ(α炭素原子とカルボニル基の炭素原子の間の二面角)の値を各残

基ごとに計算して二次元にプロットしたものをラマチャンドランプロットと呼ぶ以下に示したラマチャンドランプロットに対する説明文の中でもっとも適切なものを一つ選べ

1 (a)(b)はともにαへリックスの領域である2 (a)(b)はともにβストランドの領域である3 (a)はαへリックス(b)はβストランドの領

域である4 (a)はβストランド(b)はαへリックスの領

域である

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

トポロジー図によるβシートの表現

4 23

N

C

1

1ubq (UbiquitinHumand151)

N

C123 4 5 6

1n8k (Alchol dehydrogenase E chain Horse c21)

ロスマンフォールド

βターン

βターン

1cauA1rhdA domain2

TOPSプログラムによる表示httpwwwtopsleedsacuk

1timA

はαへリックスはβストランドとなりあうの向きで平行逆平行を示す

コンタクトマップ

1ubq

C

4 23

N

1

縦横に残基を配置しある残基ペアのCα原子間の距離が10Å以下であれば対応するピクセルに色を塗る

分子描画ソフトVMDを用いて作成

平行のストランド間は方向逆平行ストランド間は方向に線分が観察される

N

C

N C

逆平行

逆平行

平行

αへリックスは太めの対角上の線分

へリックス

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから1か3コンタクトマップから平行シートしかないことがわかるため1であることがわかる

αβ5

αβ3

α

β4α

β1αβ2 β2

β1β3β4

β5

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから2か4コンタクトマップから平行シートしかないことがわかるため2であることがわかる

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

配列比較によるタンパク質分類1970年代から配列の一致度(sequence identity)に基づいてグループを作る作業が

行われてきた

どのくらいの類似性で一つにまとめるかは様々な考えがあるが少なくとも「相同なタンパク質群」を一つのグループにまとめるべき

ファミリー(family 族)

進化的に関係のある(相同な)タンパク質グループのこと

複数のファミリーがあつまった大きなグループ スーパーファミリー(superfamily clan)

一つのファミリーの中の小さなグループ サブファミリー(subfamily)

family

subfamily superfamily

ドメイン単位による分類

A2 B2

B3 C3

A1

配列1

配列2

配列3

配列の部分どうしだけが類似していた場合 部分一致を重視するとすべて一つのグループになるがhellip

配列1

配列2 配列3

Aを共有

Bを共有

1と2が類似2と3が類似していても1と3は類似していない

ドメインに分割すると

A1

A2

B2

B3

C3

A2 B2

B3 C3

A1

きれいに分類することができる

Pfam 蛋白質ファミリのデータベース各蛋白質ファミリのマルチプル

アライメント HMMなどを集めたデータベース

httppfamsangeracuk

Pkinase_Tyrドメインをもつタンパク質の例

ABL_HUMAN

BTK_HUMAN

ILK_HUMAN

MERTK_HUMAN

PGFRB_HUMAN

HCK_HUMAN

Family Pkinase_Tyr (PF07714) Protein tyrosine kinase

Pfamデータベース(httppfamsangeracukSoftwarePfam)からの引用

ドメイン構造と疎水性の関係Tyrosine protein kinase HCK (1ad5A HCK_HUMAN)

SH3 domain

SH2 domain

Tyrosine-kinase domain

3つの分断された疎水性コアrarr ドメイン構造

大きなタンパク質はいくつかの構造上のまとまり(ドメイン)を持つことが多い

立体構造によるタンパク質の分類

bull 配列による分類の延長ドメイン単位の分類進化的に関係のある(相同な)タンパク質を群にする(ファミリー)という考え方は同じ

bull 立体構造の類似性からより遠縁の相同性を見つけより大きな群を作る(スーパーファミリー)

bull スーパーファミリーをまとめたさらに大きなグループ(フォールドクラス)

bull 主にアミノ酸(Cαレベル)のラフな構造の類似性に

着目

bull 分類対象は主に球状タンパク質

立体構造分類データベースSCOPhttpscopmrc-lmbcamacukscop

4階層で分類Class(クラス)

Fold(フォールド)

Superfamily(スーパーファミリー)

Family(ファミリー)

どの階層に分類するかは配列の類似性立体構造の類似性分子機能の類似性機能部位の類似性

を専門家が総合的に判断して決める

1akr

ltホモロジーgt

ltアナロジーgt

他の構造分類データベースとしてCATHが有名

同様に階層的な分類体系を持つがその詳細はSCOPとは異なる

クラス

1mbd

1mqkH

1n55A 1pqwA

1fxd 1a2p

all-α (a)

all-β (b)

αβ (c)

α+β (d)

α-へリックスが中心

β-シートが中心

逆平行が多い

α-へリックスとβ-シートが配列上交互に現れる平行β-シートが中心

α-へリックスとβ-シートが混在配列上の並びの規則はない逆平行と平行のβ-シートが混在

アミノ酸配列と立体構造の関係ピロリ菌と大腸菌のフラボドキシン (同一残基率 SeqID 44)

ピロリ菌(1fueA) 大腸菌(1ag9A)

配列が似ていれば立体構造も似ている

SeqID = 44

RMSD = 12 Å

1fueA 2GKIGIFFGTDSGNAEAIAEKISKAIG--NAEVVDVAKASKEQFNGFTKVILVAPTAGAGD59

1ag9A 2AITGIFFGSDTGNTENIAKMIQKQLGKDVADVHDIAKSSKEDLEAYDILLLGIPTWYYGE61

1fueA 60LQTDWEDFLGTLEASD-FANKTIGLVGLGDQDTYSETFAEGIFHIYEKAK--AGKVVGQT116

1ag9A 62AQCDWDDFFPTLE-EIDFNGKLVALFGCGDQEDYAEYFCDALGTIRDIIEPRGATIVGHW120

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C 14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

BLAST

PSI-BLAST 構造比較

構造比較

アミノ酸配列がほとんど似ていなくても立体構造は似ている場合がある

構造は配列より進化的に保存がよい 構造比較から新たなホモログが発見できる可能性

立体

構造

の変

アミノ酸配列の変化と立体構造の変化の相関(グロビン族)

立体構造の変化はアミノ酸配列の変化と相関配列が30以上一致していればRMSDは2Å以下

アミノ酸配列の類似度

2つの構造の類似性

ホモロジー (homology 相同)進化的起源を共有することによる類似多くの場合分子機能なども類似している

アナロジー (analogy 相似)進化的起源とは無関係な類似多くの場合分子機能など他の属性は似ていない物理化学的な構造の偏好が原因とされる

イルカの胸びれ サルの前足

チョウの羽 トリの翼

ネコの前足

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C

ldquoFlavodoxin-likerdquo fold (c23)

ldquoFlavoproteinsrdquo superfamily (c235)

ldquoCheY-likerdquosuperfamily(c231)

14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

AnalogyHomology

HomologyHomolo

gy

多く現れるフォールド(出現ドメイン数順)

太字はスーパーフォールド多くのスーパーファミリーを含むフォールド

d58

c1

g3

c23 b34

b1

a4フォールド名 (SCOP173によるクラスfhijkは除く) ドメイ

ンの数

スーパーファミリーの数

a4 DNARNA-binding 3-helical bundle 292 14c1 TIM betaalpha-barrel 269 33d58 Ferredoxin-like 248 55b1 Immunoglobulin-like beta sandwich 246 27c37 P-loop nucleoside triphosphate hydrolase 235 1c2 NAD(P)-binding Rossmann-fold domains 168 1g3 Knottins 154 19d15 Beta-Grasp(ubiquitin-like) 131 13c23 Flavodoxin-like 118 15b34 SH3-like barrel 117 18b40 OB-fold 100 12c66 SAM-dependent methyltransferases 95 1

c37 c2

d15

b40 c66

スーパーフォールド(Superfold)

フォールド名 (SCOP173によるクラスfhijkは除く) その下のスーパーファミリーの数

d58 Ferredoxin-like 55c1 TIM betaalpha-barrel 33b1 Immunoglobulin-like beta sandwich 27a24 Four-helical up-and-down bundle 27a118 Alpha-alpha superhelix 23g3 Knottins 19b34 SH3-like barrel 18g41 Rubredoxin-like 16c23 Flavodoxin-like 15a60 SAM(sterile alpha motif) domain-like 15b69 7-bladed beta-propeller 14a4 DNARNA-binding 3-helical bundle 14

スーパーフォールド多くのスーパーファミリーを含むフォールド

スーパーフォールドは「構造の類似と機能の類似が対応しにくいフォールド」ともいえる

d58

c1

g3a118

c23

a24

a60

b34

b1

g41

b69 a4

三本へリックスバンドルDNARNA‐binding 3‐helical bundle(a4)

Mating type protein A2 yeast(1k61Aa411)

(1gvdAa413)(1wh5Aa411)

三本のへリックスが束になった構造DNAやRNAに結合する蛋白質が多い

DNAと

結合した構造(1k61)

TIMバレルTIM betaalpha barrel (c1)

Triosephosphate isomerase1n55A(c111)

全般に解糖系の酵素が多い基質酵素反応は極めて多彩

八本のβストランドとαへリックスが交互に組み合わさり対称的な樽(barrel)構造を形成す

る中央の樽構造は平行のβシートからなる

Imidazole glycerol phosphate synthasesubunit hisF1thfD(c121)

KHGKDPG aldolase1euaA(c1101)

フェレドキシン様Ferredoxin‐like (d58)

4Fe-4S Ferredoxin(1fxdd581)

1 234 4本の逆平行のβストランドと2本のαへリックスからな

分子機能は極めて多彩

CheY binding domain of CheA(1eayCd5824)

U1A RNA binding domain(1nu4Ad5871)

免疫グロブリン様Immunoglobulin‐like beta sandwich(b1)

Immunoglobulin Heavy chain variabledomain 1mjuH1(b111)

Immunoglobulin Heavy chain constantdomain 1mjuH2(b112)

Macromomycin1noaA (b171)

免疫グロブリン分子はH鎖とL鎖から

なりそれぞれ免疫グロブリン様ドメインからできている

V

C

V

C

C

C

V

CV

CC

C

L鎖

H鎖H鎖 L鎖

細胞表面あるいは分泌蛋白質が多い免疫や分子認識に関する機能を担うことが多い

4本のβストランドからなるβシートが二枚サンドイッチ状に重なった構造をとる逆平行のβシートが主

P‐loop スーパーファミリーP‐loop nucleoside triphosphate hydrolase(c37)

Ras-related protein RAB-5A1r2qA(c3718)

Guanylate kinase1gkyA(c3711)

RecA proteinDomain1 1xmsA1(c37111)

平行のβシートが主トポロジーには様々な変異あり

シグナル伝達DNA結合

モーター機能など多彩な分子機能を担うがATP GTPなどのヌクレオシド

の加水分解を行う点は共通

N C

132 4 5 6

ヌクレオシド結合部GxxxxGKTの

配列モチーフ(P-loop)を持つ

ロスマン フォールドNAD(P)‐binding Rossmann‐fold domains (c2)

Alcohol dehydrogenase gamma chaindomain2 1u3wA(c211)

Aspartate beta-semialdehydedehydrogenase2gz1A1(c213)

L-alanine dehydrogenase1pjcA1(c214)

補酵素を利用したNAD(P)を脱水素酵素を持つ基質を認識するドメインは別に存在する

NC

123 4 5 6

平行のβシートが主

7枚羽 βプロペラ7‐bladed beta‐propeller (b69)

Garactose oxydasedomain3 1k3iA3(b6911)

Guanine nucleotide-bindingprotein subunit beta-11gotB(b6941)

細胞膜付近のシグナル伝達や糖結合に関わることが多い

Influenza Neuraminidase 1f8dA(b6811)

6枚羽 βプロペラ

N C

321 4

のユニットが7回円環状に繰り返しされたフォールド

立体構造比較プログラム1990年ごろから多くの構造比較プログラムが開発されている

WEBアドレス スコア アライメント

DALI httpwwwebiacukdali

距離の差を独自の関数で変換したスコア

局所アライメントをモンテカルロ法でつなぎ合わせる

CE httpclsdsceducehtml

局所的なRMSD 局所アライメントを積み上げていく

MATRAS httpbiunitnaistjpmatras

距離の変化が相同相似で起こる確率の比をスコアとする

SSEで仮アライメント

を生成残基アライメントを収束するまで反復する

タンパク質の相同性の判断基準

100

同一残基率30以上

BLASTのE-value lt 00001

PSI-BLASTのE-value lt 00001

0102030407025 15 535

同一残基率(Sequence Identity)()

立体構造比較が必要

(1)立体構造の類似性が高い(DALIのZスコアMATRASのRdisスコア)(2)同一残基率がそこそこ高い(PSI-BLASTでヒットするSeqIDgt=15ぐらい)

(3)分子機能に類似性がある(補酵素酵素反応基質代謝経路等の共通性等)(4)基質補酵素の結合部位が類似しておりそのアミノ酸が保存(モチーフ)(5)ドメイン構成の共通性(6)スーパーフォールドの場合は特別な注意が必要

配列解析

同一残基率が25以下の場合の相同性の判断基準

50608090

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 29: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

主鎖の水素結合平行βシート

βminusαminusβモチーフ

平行βシートがαへリックスで接続された構造モチーフ

βストランド

βストランド

βストランド

伸びた構造の1本1本をβストランドと呼ぶ二本以上のβストランドがシート状に並んだ構造をβシートと呼ぶ

Cαi

Cαi+1Cα

i-1φ ψ

ペプチド結合の平面性とφψの定義

主鎖の原子のXYZ座標はφψの2つ

の角度でほとんど記述できる

φψの角度を2次元にプロットしたものをラマチャンドランプロット(Ramachandran plot)という点が集中する領域は2次構造とよく対応

点が現れない領域は主鎖の原子が衝突する

βシート

αへリックス

左巻きへリックス

平面平面

φ

ψ

H19 問74タンパク質の主鎖に添って定義される二面角のうちφ(窒素原子と炭素原子の間の二面角)とψ(α炭素原子とカルボニル基の炭素原子の間の二面角)の値を各残

基ごとに計算して二次元にプロットしたものをラマチャンドランプロットと呼ぶ以下に示したラマチャンドランプロットに対する説明文の中でもっとも適切なものを一つ選べ

1 (a)(b)はともにαへリックスの領域である2 (a)(b)はともにβストランドの領域である3 (a)はαへリックス(b)はβストランドの領

域である4 (a)はβストランド(b)はαへリックスの領

域である

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問74タンパク質の主鎖に添って定義される二面角のうちφ(窒素原子と炭素原子の間の二面角)とψ(α炭素原子とカルボニル基の炭素原子の間の二面角)の値を各残

基ごとに計算して二次元にプロットしたものをラマチャンドランプロットと呼ぶ以下に示したラマチャンドランプロットに対する説明文の中でもっとも適切なものを一つ選べ

1 (a)(b)はともにαへリックスの領域である2 (a)(b)はともにβストランドの領域である3 (a)はαへリックス(b)はβストランドの領

域である4 (a)はβストランド(b)はαへリックスの領

域である

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

トポロジー図によるβシートの表現

4 23

N

C

1

1ubq (UbiquitinHumand151)

N

C123 4 5 6

1n8k (Alchol dehydrogenase E chain Horse c21)

ロスマンフォールド

βターン

βターン

1cauA1rhdA domain2

TOPSプログラムによる表示httpwwwtopsleedsacuk

1timA

はαへリックスはβストランドとなりあうの向きで平行逆平行を示す

コンタクトマップ

1ubq

C

4 23

N

1

縦横に残基を配置しある残基ペアのCα原子間の距離が10Å以下であれば対応するピクセルに色を塗る

分子描画ソフトVMDを用いて作成

平行のストランド間は方向逆平行ストランド間は方向に線分が観察される

N

C

N C

逆平行

逆平行

平行

αへリックスは太めの対角上の線分

へリックス

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから1か3コンタクトマップから平行シートしかないことがわかるため1であることがわかる

αβ5

αβ3

α

β4α

β1αβ2 β2

β1β3β4

β5

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから2か4コンタクトマップから平行シートしかないことがわかるため2であることがわかる

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

配列比較によるタンパク質分類1970年代から配列の一致度(sequence identity)に基づいてグループを作る作業が

行われてきた

どのくらいの類似性で一つにまとめるかは様々な考えがあるが少なくとも「相同なタンパク質群」を一つのグループにまとめるべき

ファミリー(family 族)

進化的に関係のある(相同な)タンパク質グループのこと

複数のファミリーがあつまった大きなグループ スーパーファミリー(superfamily clan)

一つのファミリーの中の小さなグループ サブファミリー(subfamily)

family

subfamily superfamily

ドメイン単位による分類

A2 B2

B3 C3

A1

配列1

配列2

配列3

配列の部分どうしだけが類似していた場合 部分一致を重視するとすべて一つのグループになるがhellip

配列1

配列2 配列3

Aを共有

Bを共有

1と2が類似2と3が類似していても1と3は類似していない

ドメインに分割すると

A1

A2

B2

B3

C3

A2 B2

B3 C3

A1

きれいに分類することができる

Pfam 蛋白質ファミリのデータベース各蛋白質ファミリのマルチプル

アライメント HMMなどを集めたデータベース

httppfamsangeracuk

Pkinase_Tyrドメインをもつタンパク質の例

ABL_HUMAN

BTK_HUMAN

ILK_HUMAN

MERTK_HUMAN

PGFRB_HUMAN

HCK_HUMAN

Family Pkinase_Tyr (PF07714) Protein tyrosine kinase

Pfamデータベース(httppfamsangeracukSoftwarePfam)からの引用

ドメイン構造と疎水性の関係Tyrosine protein kinase HCK (1ad5A HCK_HUMAN)

SH3 domain

SH2 domain

Tyrosine-kinase domain

3つの分断された疎水性コアrarr ドメイン構造

大きなタンパク質はいくつかの構造上のまとまり(ドメイン)を持つことが多い

立体構造によるタンパク質の分類

bull 配列による分類の延長ドメイン単位の分類進化的に関係のある(相同な)タンパク質を群にする(ファミリー)という考え方は同じ

bull 立体構造の類似性からより遠縁の相同性を見つけより大きな群を作る(スーパーファミリー)

bull スーパーファミリーをまとめたさらに大きなグループ(フォールドクラス)

bull 主にアミノ酸(Cαレベル)のラフな構造の類似性に

着目

bull 分類対象は主に球状タンパク質

立体構造分類データベースSCOPhttpscopmrc-lmbcamacukscop

4階層で分類Class(クラス)

Fold(フォールド)

Superfamily(スーパーファミリー)

Family(ファミリー)

どの階層に分類するかは配列の類似性立体構造の類似性分子機能の類似性機能部位の類似性

を専門家が総合的に判断して決める

1akr

ltホモロジーgt

ltアナロジーgt

他の構造分類データベースとしてCATHが有名

同様に階層的な分類体系を持つがその詳細はSCOPとは異なる

クラス

1mbd

1mqkH

1n55A 1pqwA

1fxd 1a2p

all-α (a)

all-β (b)

αβ (c)

α+β (d)

α-へリックスが中心

β-シートが中心

逆平行が多い

α-へリックスとβ-シートが配列上交互に現れる平行β-シートが中心

α-へリックスとβ-シートが混在配列上の並びの規則はない逆平行と平行のβ-シートが混在

アミノ酸配列と立体構造の関係ピロリ菌と大腸菌のフラボドキシン (同一残基率 SeqID 44)

ピロリ菌(1fueA) 大腸菌(1ag9A)

配列が似ていれば立体構造も似ている

SeqID = 44

RMSD = 12 Å

1fueA 2GKIGIFFGTDSGNAEAIAEKISKAIG--NAEVVDVAKASKEQFNGFTKVILVAPTAGAGD59

1ag9A 2AITGIFFGSDTGNTENIAKMIQKQLGKDVADVHDIAKSSKEDLEAYDILLLGIPTWYYGE61

1fueA 60LQTDWEDFLGTLEASD-FANKTIGLVGLGDQDTYSETFAEGIFHIYEKAK--AGKVVGQT116

1ag9A 62AQCDWDDFFPTLE-EIDFNGKLVALFGCGDQEDYAEYFCDALGTIRDIIEPRGATIVGHW120

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C 14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

BLAST

PSI-BLAST 構造比較

構造比較

アミノ酸配列がほとんど似ていなくても立体構造は似ている場合がある

構造は配列より進化的に保存がよい 構造比較から新たなホモログが発見できる可能性

立体

構造

の変

アミノ酸配列の変化と立体構造の変化の相関(グロビン族)

立体構造の変化はアミノ酸配列の変化と相関配列が30以上一致していればRMSDは2Å以下

アミノ酸配列の類似度

2つの構造の類似性

ホモロジー (homology 相同)進化的起源を共有することによる類似多くの場合分子機能なども類似している

アナロジー (analogy 相似)進化的起源とは無関係な類似多くの場合分子機能など他の属性は似ていない物理化学的な構造の偏好が原因とされる

イルカの胸びれ サルの前足

チョウの羽 トリの翼

ネコの前足

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C

ldquoFlavodoxin-likerdquo fold (c23)

ldquoFlavoproteinsrdquo superfamily (c235)

ldquoCheY-likerdquosuperfamily(c231)

14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

AnalogyHomology

HomologyHomolo

gy

多く現れるフォールド(出現ドメイン数順)

太字はスーパーフォールド多くのスーパーファミリーを含むフォールド

d58

c1

g3

c23 b34

b1

a4フォールド名 (SCOP173によるクラスfhijkは除く) ドメイ

ンの数

スーパーファミリーの数

a4 DNARNA-binding 3-helical bundle 292 14c1 TIM betaalpha-barrel 269 33d58 Ferredoxin-like 248 55b1 Immunoglobulin-like beta sandwich 246 27c37 P-loop nucleoside triphosphate hydrolase 235 1c2 NAD(P)-binding Rossmann-fold domains 168 1g3 Knottins 154 19d15 Beta-Grasp(ubiquitin-like) 131 13c23 Flavodoxin-like 118 15b34 SH3-like barrel 117 18b40 OB-fold 100 12c66 SAM-dependent methyltransferases 95 1

c37 c2

d15

b40 c66

スーパーフォールド(Superfold)

フォールド名 (SCOP173によるクラスfhijkは除く) その下のスーパーファミリーの数

d58 Ferredoxin-like 55c1 TIM betaalpha-barrel 33b1 Immunoglobulin-like beta sandwich 27a24 Four-helical up-and-down bundle 27a118 Alpha-alpha superhelix 23g3 Knottins 19b34 SH3-like barrel 18g41 Rubredoxin-like 16c23 Flavodoxin-like 15a60 SAM(sterile alpha motif) domain-like 15b69 7-bladed beta-propeller 14a4 DNARNA-binding 3-helical bundle 14

スーパーフォールド多くのスーパーファミリーを含むフォールド

スーパーフォールドは「構造の類似と機能の類似が対応しにくいフォールド」ともいえる

d58

c1

g3a118

c23

a24

a60

b34

b1

g41

b69 a4

三本へリックスバンドルDNARNA‐binding 3‐helical bundle(a4)

Mating type protein A2 yeast(1k61Aa411)

(1gvdAa413)(1wh5Aa411)

三本のへリックスが束になった構造DNAやRNAに結合する蛋白質が多い

DNAと

結合した構造(1k61)

TIMバレルTIM betaalpha barrel (c1)

Triosephosphate isomerase1n55A(c111)

全般に解糖系の酵素が多い基質酵素反応は極めて多彩

八本のβストランドとαへリックスが交互に組み合わさり対称的な樽(barrel)構造を形成す

る中央の樽構造は平行のβシートからなる

Imidazole glycerol phosphate synthasesubunit hisF1thfD(c121)

KHGKDPG aldolase1euaA(c1101)

フェレドキシン様Ferredoxin‐like (d58)

4Fe-4S Ferredoxin(1fxdd581)

1 234 4本の逆平行のβストランドと2本のαへリックスからな

分子機能は極めて多彩

CheY binding domain of CheA(1eayCd5824)

U1A RNA binding domain(1nu4Ad5871)

免疫グロブリン様Immunoglobulin‐like beta sandwich(b1)

Immunoglobulin Heavy chain variabledomain 1mjuH1(b111)

Immunoglobulin Heavy chain constantdomain 1mjuH2(b112)

Macromomycin1noaA (b171)

免疫グロブリン分子はH鎖とL鎖から

なりそれぞれ免疫グロブリン様ドメインからできている

V

C

V

C

C

C

V

CV

CC

C

L鎖

H鎖H鎖 L鎖

細胞表面あるいは分泌蛋白質が多い免疫や分子認識に関する機能を担うことが多い

4本のβストランドからなるβシートが二枚サンドイッチ状に重なった構造をとる逆平行のβシートが主

P‐loop スーパーファミリーP‐loop nucleoside triphosphate hydrolase(c37)

Ras-related protein RAB-5A1r2qA(c3718)

Guanylate kinase1gkyA(c3711)

RecA proteinDomain1 1xmsA1(c37111)

平行のβシートが主トポロジーには様々な変異あり

シグナル伝達DNA結合

モーター機能など多彩な分子機能を担うがATP GTPなどのヌクレオシド

の加水分解を行う点は共通

N C

132 4 5 6

ヌクレオシド結合部GxxxxGKTの

配列モチーフ(P-loop)を持つ

ロスマン フォールドNAD(P)‐binding Rossmann‐fold domains (c2)

Alcohol dehydrogenase gamma chaindomain2 1u3wA(c211)

Aspartate beta-semialdehydedehydrogenase2gz1A1(c213)

L-alanine dehydrogenase1pjcA1(c214)

補酵素を利用したNAD(P)を脱水素酵素を持つ基質を認識するドメインは別に存在する

NC

123 4 5 6

平行のβシートが主

7枚羽 βプロペラ7‐bladed beta‐propeller (b69)

Garactose oxydasedomain3 1k3iA3(b6911)

Guanine nucleotide-bindingprotein subunit beta-11gotB(b6941)

細胞膜付近のシグナル伝達や糖結合に関わることが多い

Influenza Neuraminidase 1f8dA(b6811)

6枚羽 βプロペラ

N C

321 4

のユニットが7回円環状に繰り返しされたフォールド

立体構造比較プログラム1990年ごろから多くの構造比較プログラムが開発されている

WEBアドレス スコア アライメント

DALI httpwwwebiacukdali

距離の差を独自の関数で変換したスコア

局所アライメントをモンテカルロ法でつなぎ合わせる

CE httpclsdsceducehtml

局所的なRMSD 局所アライメントを積み上げていく

MATRAS httpbiunitnaistjpmatras

距離の変化が相同相似で起こる確率の比をスコアとする

SSEで仮アライメント

を生成残基アライメントを収束するまで反復する

タンパク質の相同性の判断基準

100

同一残基率30以上

BLASTのE-value lt 00001

PSI-BLASTのE-value lt 00001

0102030407025 15 535

同一残基率(Sequence Identity)()

立体構造比較が必要

(1)立体構造の類似性が高い(DALIのZスコアMATRASのRdisスコア)(2)同一残基率がそこそこ高い(PSI-BLASTでヒットするSeqIDgt=15ぐらい)

(3)分子機能に類似性がある(補酵素酵素反応基質代謝経路等の共通性等)(4)基質補酵素の結合部位が類似しておりそのアミノ酸が保存(モチーフ)(5)ドメイン構成の共通性(6)スーパーフォールドの場合は特別な注意が必要

配列解析

同一残基率が25以下の場合の相同性の判断基準

50608090

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 30: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

Cαi

Cαi+1Cα

i-1φ ψ

ペプチド結合の平面性とφψの定義

主鎖の原子のXYZ座標はφψの2つ

の角度でほとんど記述できる

φψの角度を2次元にプロットしたものをラマチャンドランプロット(Ramachandran plot)という点が集中する領域は2次構造とよく対応

点が現れない領域は主鎖の原子が衝突する

βシート

αへリックス

左巻きへリックス

平面平面

φ

ψ

H19 問74タンパク質の主鎖に添って定義される二面角のうちφ(窒素原子と炭素原子の間の二面角)とψ(α炭素原子とカルボニル基の炭素原子の間の二面角)の値を各残

基ごとに計算して二次元にプロットしたものをラマチャンドランプロットと呼ぶ以下に示したラマチャンドランプロットに対する説明文の中でもっとも適切なものを一つ選べ

1 (a)(b)はともにαへリックスの領域である2 (a)(b)はともにβストランドの領域である3 (a)はαへリックス(b)はβストランドの領

域である4 (a)はβストランド(b)はαへリックスの領

域である

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問74タンパク質の主鎖に添って定義される二面角のうちφ(窒素原子と炭素原子の間の二面角)とψ(α炭素原子とカルボニル基の炭素原子の間の二面角)の値を各残

基ごとに計算して二次元にプロットしたものをラマチャンドランプロットと呼ぶ以下に示したラマチャンドランプロットに対する説明文の中でもっとも適切なものを一つ選べ

1 (a)(b)はともにαへリックスの領域である2 (a)(b)はともにβストランドの領域である3 (a)はαへリックス(b)はβストランドの領

域である4 (a)はβストランド(b)はαへリックスの領

域である

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

トポロジー図によるβシートの表現

4 23

N

C

1

1ubq (UbiquitinHumand151)

N

C123 4 5 6

1n8k (Alchol dehydrogenase E chain Horse c21)

ロスマンフォールド

βターン

βターン

1cauA1rhdA domain2

TOPSプログラムによる表示httpwwwtopsleedsacuk

1timA

はαへリックスはβストランドとなりあうの向きで平行逆平行を示す

コンタクトマップ

1ubq

C

4 23

N

1

縦横に残基を配置しある残基ペアのCα原子間の距離が10Å以下であれば対応するピクセルに色を塗る

分子描画ソフトVMDを用いて作成

平行のストランド間は方向逆平行ストランド間は方向に線分が観察される

N

C

N C

逆平行

逆平行

平行

αへリックスは太めの対角上の線分

へリックス

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから1か3コンタクトマップから平行シートしかないことがわかるため1であることがわかる

αβ5

αβ3

α

β4α

β1αβ2 β2

β1β3β4

β5

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから2か4コンタクトマップから平行シートしかないことがわかるため2であることがわかる

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

配列比較によるタンパク質分類1970年代から配列の一致度(sequence identity)に基づいてグループを作る作業が

行われてきた

どのくらいの類似性で一つにまとめるかは様々な考えがあるが少なくとも「相同なタンパク質群」を一つのグループにまとめるべき

ファミリー(family 族)

進化的に関係のある(相同な)タンパク質グループのこと

複数のファミリーがあつまった大きなグループ スーパーファミリー(superfamily clan)

一つのファミリーの中の小さなグループ サブファミリー(subfamily)

family

subfamily superfamily

ドメイン単位による分類

A2 B2

B3 C3

A1

配列1

配列2

配列3

配列の部分どうしだけが類似していた場合 部分一致を重視するとすべて一つのグループになるがhellip

配列1

配列2 配列3

Aを共有

Bを共有

1と2が類似2と3が類似していても1と3は類似していない

ドメインに分割すると

A1

A2

B2

B3

C3

A2 B2

B3 C3

A1

きれいに分類することができる

Pfam 蛋白質ファミリのデータベース各蛋白質ファミリのマルチプル

アライメント HMMなどを集めたデータベース

httppfamsangeracuk

Pkinase_Tyrドメインをもつタンパク質の例

ABL_HUMAN

BTK_HUMAN

ILK_HUMAN

MERTK_HUMAN

PGFRB_HUMAN

HCK_HUMAN

Family Pkinase_Tyr (PF07714) Protein tyrosine kinase

Pfamデータベース(httppfamsangeracukSoftwarePfam)からの引用

ドメイン構造と疎水性の関係Tyrosine protein kinase HCK (1ad5A HCK_HUMAN)

SH3 domain

SH2 domain

Tyrosine-kinase domain

3つの分断された疎水性コアrarr ドメイン構造

大きなタンパク質はいくつかの構造上のまとまり(ドメイン)を持つことが多い

立体構造によるタンパク質の分類

bull 配列による分類の延長ドメイン単位の分類進化的に関係のある(相同な)タンパク質を群にする(ファミリー)という考え方は同じ

bull 立体構造の類似性からより遠縁の相同性を見つけより大きな群を作る(スーパーファミリー)

bull スーパーファミリーをまとめたさらに大きなグループ(フォールドクラス)

bull 主にアミノ酸(Cαレベル)のラフな構造の類似性に

着目

bull 分類対象は主に球状タンパク質

立体構造分類データベースSCOPhttpscopmrc-lmbcamacukscop

4階層で分類Class(クラス)

Fold(フォールド)

Superfamily(スーパーファミリー)

Family(ファミリー)

どの階層に分類するかは配列の類似性立体構造の類似性分子機能の類似性機能部位の類似性

を専門家が総合的に判断して決める

1akr

ltホモロジーgt

ltアナロジーgt

他の構造分類データベースとしてCATHが有名

同様に階層的な分類体系を持つがその詳細はSCOPとは異なる

クラス

1mbd

1mqkH

1n55A 1pqwA

1fxd 1a2p

all-α (a)

all-β (b)

αβ (c)

α+β (d)

α-へリックスが中心

β-シートが中心

逆平行が多い

α-へリックスとβ-シートが配列上交互に現れる平行β-シートが中心

α-へリックスとβ-シートが混在配列上の並びの規則はない逆平行と平行のβ-シートが混在

アミノ酸配列と立体構造の関係ピロリ菌と大腸菌のフラボドキシン (同一残基率 SeqID 44)

ピロリ菌(1fueA) 大腸菌(1ag9A)

配列が似ていれば立体構造も似ている

SeqID = 44

RMSD = 12 Å

1fueA 2GKIGIFFGTDSGNAEAIAEKISKAIG--NAEVVDVAKASKEQFNGFTKVILVAPTAGAGD59

1ag9A 2AITGIFFGSDTGNTENIAKMIQKQLGKDVADVHDIAKSSKEDLEAYDILLLGIPTWYYGE61

1fueA 60LQTDWEDFLGTLEASD-FANKTIGLVGLGDQDTYSETFAEGIFHIYEKAK--AGKVVGQT116

1ag9A 62AQCDWDDFFPTLE-EIDFNGKLVALFGCGDQEDYAEYFCDALGTIRDIIEPRGATIVGHW120

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C 14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

BLAST

PSI-BLAST 構造比較

構造比較

アミノ酸配列がほとんど似ていなくても立体構造は似ている場合がある

構造は配列より進化的に保存がよい 構造比較から新たなホモログが発見できる可能性

立体

構造

の変

アミノ酸配列の変化と立体構造の変化の相関(グロビン族)

立体構造の変化はアミノ酸配列の変化と相関配列が30以上一致していればRMSDは2Å以下

アミノ酸配列の類似度

2つの構造の類似性

ホモロジー (homology 相同)進化的起源を共有することによる類似多くの場合分子機能なども類似している

アナロジー (analogy 相似)進化的起源とは無関係な類似多くの場合分子機能など他の属性は似ていない物理化学的な構造の偏好が原因とされる

イルカの胸びれ サルの前足

チョウの羽 トリの翼

ネコの前足

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C

ldquoFlavodoxin-likerdquo fold (c23)

ldquoFlavoproteinsrdquo superfamily (c235)

ldquoCheY-likerdquosuperfamily(c231)

14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

AnalogyHomology

HomologyHomolo

gy

多く現れるフォールド(出現ドメイン数順)

太字はスーパーフォールド多くのスーパーファミリーを含むフォールド

d58

c1

g3

c23 b34

b1

a4フォールド名 (SCOP173によるクラスfhijkは除く) ドメイ

ンの数

スーパーファミリーの数

a4 DNARNA-binding 3-helical bundle 292 14c1 TIM betaalpha-barrel 269 33d58 Ferredoxin-like 248 55b1 Immunoglobulin-like beta sandwich 246 27c37 P-loop nucleoside triphosphate hydrolase 235 1c2 NAD(P)-binding Rossmann-fold domains 168 1g3 Knottins 154 19d15 Beta-Grasp(ubiquitin-like) 131 13c23 Flavodoxin-like 118 15b34 SH3-like barrel 117 18b40 OB-fold 100 12c66 SAM-dependent methyltransferases 95 1

c37 c2

d15

b40 c66

スーパーフォールド(Superfold)

フォールド名 (SCOP173によるクラスfhijkは除く) その下のスーパーファミリーの数

d58 Ferredoxin-like 55c1 TIM betaalpha-barrel 33b1 Immunoglobulin-like beta sandwich 27a24 Four-helical up-and-down bundle 27a118 Alpha-alpha superhelix 23g3 Knottins 19b34 SH3-like barrel 18g41 Rubredoxin-like 16c23 Flavodoxin-like 15a60 SAM(sterile alpha motif) domain-like 15b69 7-bladed beta-propeller 14a4 DNARNA-binding 3-helical bundle 14

スーパーフォールド多くのスーパーファミリーを含むフォールド

スーパーフォールドは「構造の類似と機能の類似が対応しにくいフォールド」ともいえる

d58

c1

g3a118

c23

a24

a60

b34

b1

g41

b69 a4

三本へリックスバンドルDNARNA‐binding 3‐helical bundle(a4)

Mating type protein A2 yeast(1k61Aa411)

(1gvdAa413)(1wh5Aa411)

三本のへリックスが束になった構造DNAやRNAに結合する蛋白質が多い

DNAと

結合した構造(1k61)

TIMバレルTIM betaalpha barrel (c1)

Triosephosphate isomerase1n55A(c111)

全般に解糖系の酵素が多い基質酵素反応は極めて多彩

八本のβストランドとαへリックスが交互に組み合わさり対称的な樽(barrel)構造を形成す

る中央の樽構造は平行のβシートからなる

Imidazole glycerol phosphate synthasesubunit hisF1thfD(c121)

KHGKDPG aldolase1euaA(c1101)

フェレドキシン様Ferredoxin‐like (d58)

4Fe-4S Ferredoxin(1fxdd581)

1 234 4本の逆平行のβストランドと2本のαへリックスからな

分子機能は極めて多彩

CheY binding domain of CheA(1eayCd5824)

U1A RNA binding domain(1nu4Ad5871)

免疫グロブリン様Immunoglobulin‐like beta sandwich(b1)

Immunoglobulin Heavy chain variabledomain 1mjuH1(b111)

Immunoglobulin Heavy chain constantdomain 1mjuH2(b112)

Macromomycin1noaA (b171)

免疫グロブリン分子はH鎖とL鎖から

なりそれぞれ免疫グロブリン様ドメインからできている

V

C

V

C

C

C

V

CV

CC

C

L鎖

H鎖H鎖 L鎖

細胞表面あるいは分泌蛋白質が多い免疫や分子認識に関する機能を担うことが多い

4本のβストランドからなるβシートが二枚サンドイッチ状に重なった構造をとる逆平行のβシートが主

P‐loop スーパーファミリーP‐loop nucleoside triphosphate hydrolase(c37)

Ras-related protein RAB-5A1r2qA(c3718)

Guanylate kinase1gkyA(c3711)

RecA proteinDomain1 1xmsA1(c37111)

平行のβシートが主トポロジーには様々な変異あり

シグナル伝達DNA結合

モーター機能など多彩な分子機能を担うがATP GTPなどのヌクレオシド

の加水分解を行う点は共通

N C

132 4 5 6

ヌクレオシド結合部GxxxxGKTの

配列モチーフ(P-loop)を持つ

ロスマン フォールドNAD(P)‐binding Rossmann‐fold domains (c2)

Alcohol dehydrogenase gamma chaindomain2 1u3wA(c211)

Aspartate beta-semialdehydedehydrogenase2gz1A1(c213)

L-alanine dehydrogenase1pjcA1(c214)

補酵素を利用したNAD(P)を脱水素酵素を持つ基質を認識するドメインは別に存在する

NC

123 4 5 6

平行のβシートが主

7枚羽 βプロペラ7‐bladed beta‐propeller (b69)

Garactose oxydasedomain3 1k3iA3(b6911)

Guanine nucleotide-bindingprotein subunit beta-11gotB(b6941)

細胞膜付近のシグナル伝達や糖結合に関わることが多い

Influenza Neuraminidase 1f8dA(b6811)

6枚羽 βプロペラ

N C

321 4

のユニットが7回円環状に繰り返しされたフォールド

立体構造比較プログラム1990年ごろから多くの構造比較プログラムが開発されている

WEBアドレス スコア アライメント

DALI httpwwwebiacukdali

距離の差を独自の関数で変換したスコア

局所アライメントをモンテカルロ法でつなぎ合わせる

CE httpclsdsceducehtml

局所的なRMSD 局所アライメントを積み上げていく

MATRAS httpbiunitnaistjpmatras

距離の変化が相同相似で起こる確率の比をスコアとする

SSEで仮アライメント

を生成残基アライメントを収束するまで反復する

タンパク質の相同性の判断基準

100

同一残基率30以上

BLASTのE-value lt 00001

PSI-BLASTのE-value lt 00001

0102030407025 15 535

同一残基率(Sequence Identity)()

立体構造比較が必要

(1)立体構造の類似性が高い(DALIのZスコアMATRASのRdisスコア)(2)同一残基率がそこそこ高い(PSI-BLASTでヒットするSeqIDgt=15ぐらい)

(3)分子機能に類似性がある(補酵素酵素反応基質代謝経路等の共通性等)(4)基質補酵素の結合部位が類似しておりそのアミノ酸が保存(モチーフ)(5)ドメイン構成の共通性(6)スーパーフォールドの場合は特別な注意が必要

配列解析

同一残基率が25以下の場合の相同性の判断基準

50608090

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 31: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

H19 問74タンパク質の主鎖に添って定義される二面角のうちφ(窒素原子と炭素原子の間の二面角)とψ(α炭素原子とカルボニル基の炭素原子の間の二面角)の値を各残

基ごとに計算して二次元にプロットしたものをラマチャンドランプロットと呼ぶ以下に示したラマチャンドランプロットに対する説明文の中でもっとも適切なものを一つ選べ

1 (a)(b)はともにαへリックスの領域である2 (a)(b)はともにβストランドの領域である3 (a)はαへリックス(b)はβストランドの領

域である4 (a)はβストランド(b)はαへリックスの領

域である

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問74タンパク質の主鎖に添って定義される二面角のうちφ(窒素原子と炭素原子の間の二面角)とψ(α炭素原子とカルボニル基の炭素原子の間の二面角)の値を各残

基ごとに計算して二次元にプロットしたものをラマチャンドランプロットと呼ぶ以下に示したラマチャンドランプロットに対する説明文の中でもっとも適切なものを一つ選べ

1 (a)(b)はともにαへリックスの領域である2 (a)(b)はともにβストランドの領域である3 (a)はαへリックス(b)はβストランドの領

域である4 (a)はβストランド(b)はαへリックスの領

域である

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

トポロジー図によるβシートの表現

4 23

N

C

1

1ubq (UbiquitinHumand151)

N

C123 4 5 6

1n8k (Alchol dehydrogenase E chain Horse c21)

ロスマンフォールド

βターン

βターン

1cauA1rhdA domain2

TOPSプログラムによる表示httpwwwtopsleedsacuk

1timA

はαへリックスはβストランドとなりあうの向きで平行逆平行を示す

コンタクトマップ

1ubq

C

4 23

N

1

縦横に残基を配置しある残基ペアのCα原子間の距離が10Å以下であれば対応するピクセルに色を塗る

分子描画ソフトVMDを用いて作成

平行のストランド間は方向逆平行ストランド間は方向に線分が観察される

N

C

N C

逆平行

逆平行

平行

αへリックスは太めの対角上の線分

へリックス

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから1か3コンタクトマップから平行シートしかないことがわかるため1であることがわかる

αβ5

αβ3

α

β4α

β1αβ2 β2

β1β3β4

β5

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから2か4コンタクトマップから平行シートしかないことがわかるため2であることがわかる

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

配列比較によるタンパク質分類1970年代から配列の一致度(sequence identity)に基づいてグループを作る作業が

行われてきた

どのくらいの類似性で一つにまとめるかは様々な考えがあるが少なくとも「相同なタンパク質群」を一つのグループにまとめるべき

ファミリー(family 族)

進化的に関係のある(相同な)タンパク質グループのこと

複数のファミリーがあつまった大きなグループ スーパーファミリー(superfamily clan)

一つのファミリーの中の小さなグループ サブファミリー(subfamily)

family

subfamily superfamily

ドメイン単位による分類

A2 B2

B3 C3

A1

配列1

配列2

配列3

配列の部分どうしだけが類似していた場合 部分一致を重視するとすべて一つのグループになるがhellip

配列1

配列2 配列3

Aを共有

Bを共有

1と2が類似2と3が類似していても1と3は類似していない

ドメインに分割すると

A1

A2

B2

B3

C3

A2 B2

B3 C3

A1

きれいに分類することができる

Pfam 蛋白質ファミリのデータベース各蛋白質ファミリのマルチプル

アライメント HMMなどを集めたデータベース

httppfamsangeracuk

Pkinase_Tyrドメインをもつタンパク質の例

ABL_HUMAN

BTK_HUMAN

ILK_HUMAN

MERTK_HUMAN

PGFRB_HUMAN

HCK_HUMAN

Family Pkinase_Tyr (PF07714) Protein tyrosine kinase

Pfamデータベース(httppfamsangeracukSoftwarePfam)からの引用

ドメイン構造と疎水性の関係Tyrosine protein kinase HCK (1ad5A HCK_HUMAN)

SH3 domain

SH2 domain

Tyrosine-kinase domain

3つの分断された疎水性コアrarr ドメイン構造

大きなタンパク質はいくつかの構造上のまとまり(ドメイン)を持つことが多い

立体構造によるタンパク質の分類

bull 配列による分類の延長ドメイン単位の分類進化的に関係のある(相同な)タンパク質を群にする(ファミリー)という考え方は同じ

bull 立体構造の類似性からより遠縁の相同性を見つけより大きな群を作る(スーパーファミリー)

bull スーパーファミリーをまとめたさらに大きなグループ(フォールドクラス)

bull 主にアミノ酸(Cαレベル)のラフな構造の類似性に

着目

bull 分類対象は主に球状タンパク質

立体構造分類データベースSCOPhttpscopmrc-lmbcamacukscop

4階層で分類Class(クラス)

Fold(フォールド)

Superfamily(スーパーファミリー)

Family(ファミリー)

どの階層に分類するかは配列の類似性立体構造の類似性分子機能の類似性機能部位の類似性

を専門家が総合的に判断して決める

1akr

ltホモロジーgt

ltアナロジーgt

他の構造分類データベースとしてCATHが有名

同様に階層的な分類体系を持つがその詳細はSCOPとは異なる

クラス

1mbd

1mqkH

1n55A 1pqwA

1fxd 1a2p

all-α (a)

all-β (b)

αβ (c)

α+β (d)

α-へリックスが中心

β-シートが中心

逆平行が多い

α-へリックスとβ-シートが配列上交互に現れる平行β-シートが中心

α-へリックスとβ-シートが混在配列上の並びの規則はない逆平行と平行のβ-シートが混在

アミノ酸配列と立体構造の関係ピロリ菌と大腸菌のフラボドキシン (同一残基率 SeqID 44)

ピロリ菌(1fueA) 大腸菌(1ag9A)

配列が似ていれば立体構造も似ている

SeqID = 44

RMSD = 12 Å

1fueA 2GKIGIFFGTDSGNAEAIAEKISKAIG--NAEVVDVAKASKEQFNGFTKVILVAPTAGAGD59

1ag9A 2AITGIFFGSDTGNTENIAKMIQKQLGKDVADVHDIAKSSKEDLEAYDILLLGIPTWYYGE61

1fueA 60LQTDWEDFLGTLEASD-FANKTIGLVGLGDQDTYSETFAEGIFHIYEKAK--AGKVVGQT116

1ag9A 62AQCDWDDFFPTLE-EIDFNGKLVALFGCGDQEDYAEYFCDALGTIRDIIEPRGATIVGHW120

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C 14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

BLAST

PSI-BLAST 構造比較

構造比較

アミノ酸配列がほとんど似ていなくても立体構造は似ている場合がある

構造は配列より進化的に保存がよい 構造比較から新たなホモログが発見できる可能性

立体

構造

の変

アミノ酸配列の変化と立体構造の変化の相関(グロビン族)

立体構造の変化はアミノ酸配列の変化と相関配列が30以上一致していればRMSDは2Å以下

アミノ酸配列の類似度

2つの構造の類似性

ホモロジー (homology 相同)進化的起源を共有することによる類似多くの場合分子機能なども類似している

アナロジー (analogy 相似)進化的起源とは無関係な類似多くの場合分子機能など他の属性は似ていない物理化学的な構造の偏好が原因とされる

イルカの胸びれ サルの前足

チョウの羽 トリの翼

ネコの前足

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C

ldquoFlavodoxin-likerdquo fold (c23)

ldquoFlavoproteinsrdquo superfamily (c235)

ldquoCheY-likerdquosuperfamily(c231)

14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

AnalogyHomology

HomologyHomolo

gy

多く現れるフォールド(出現ドメイン数順)

太字はスーパーフォールド多くのスーパーファミリーを含むフォールド

d58

c1

g3

c23 b34

b1

a4フォールド名 (SCOP173によるクラスfhijkは除く) ドメイ

ンの数

スーパーファミリーの数

a4 DNARNA-binding 3-helical bundle 292 14c1 TIM betaalpha-barrel 269 33d58 Ferredoxin-like 248 55b1 Immunoglobulin-like beta sandwich 246 27c37 P-loop nucleoside triphosphate hydrolase 235 1c2 NAD(P)-binding Rossmann-fold domains 168 1g3 Knottins 154 19d15 Beta-Grasp(ubiquitin-like) 131 13c23 Flavodoxin-like 118 15b34 SH3-like barrel 117 18b40 OB-fold 100 12c66 SAM-dependent methyltransferases 95 1

c37 c2

d15

b40 c66

スーパーフォールド(Superfold)

フォールド名 (SCOP173によるクラスfhijkは除く) その下のスーパーファミリーの数

d58 Ferredoxin-like 55c1 TIM betaalpha-barrel 33b1 Immunoglobulin-like beta sandwich 27a24 Four-helical up-and-down bundle 27a118 Alpha-alpha superhelix 23g3 Knottins 19b34 SH3-like barrel 18g41 Rubredoxin-like 16c23 Flavodoxin-like 15a60 SAM(sterile alpha motif) domain-like 15b69 7-bladed beta-propeller 14a4 DNARNA-binding 3-helical bundle 14

スーパーフォールド多くのスーパーファミリーを含むフォールド

スーパーフォールドは「構造の類似と機能の類似が対応しにくいフォールド」ともいえる

d58

c1

g3a118

c23

a24

a60

b34

b1

g41

b69 a4

三本へリックスバンドルDNARNA‐binding 3‐helical bundle(a4)

Mating type protein A2 yeast(1k61Aa411)

(1gvdAa413)(1wh5Aa411)

三本のへリックスが束になった構造DNAやRNAに結合する蛋白質が多い

DNAと

結合した構造(1k61)

TIMバレルTIM betaalpha barrel (c1)

Triosephosphate isomerase1n55A(c111)

全般に解糖系の酵素が多い基質酵素反応は極めて多彩

八本のβストランドとαへリックスが交互に組み合わさり対称的な樽(barrel)構造を形成す

る中央の樽構造は平行のβシートからなる

Imidazole glycerol phosphate synthasesubunit hisF1thfD(c121)

KHGKDPG aldolase1euaA(c1101)

フェレドキシン様Ferredoxin‐like (d58)

4Fe-4S Ferredoxin(1fxdd581)

1 234 4本の逆平行のβストランドと2本のαへリックスからな

分子機能は極めて多彩

CheY binding domain of CheA(1eayCd5824)

U1A RNA binding domain(1nu4Ad5871)

免疫グロブリン様Immunoglobulin‐like beta sandwich(b1)

Immunoglobulin Heavy chain variabledomain 1mjuH1(b111)

Immunoglobulin Heavy chain constantdomain 1mjuH2(b112)

Macromomycin1noaA (b171)

免疫グロブリン分子はH鎖とL鎖から

なりそれぞれ免疫グロブリン様ドメインからできている

V

C

V

C

C

C

V

CV

CC

C

L鎖

H鎖H鎖 L鎖

細胞表面あるいは分泌蛋白質が多い免疫や分子認識に関する機能を担うことが多い

4本のβストランドからなるβシートが二枚サンドイッチ状に重なった構造をとる逆平行のβシートが主

P‐loop スーパーファミリーP‐loop nucleoside triphosphate hydrolase(c37)

Ras-related protein RAB-5A1r2qA(c3718)

Guanylate kinase1gkyA(c3711)

RecA proteinDomain1 1xmsA1(c37111)

平行のβシートが主トポロジーには様々な変異あり

シグナル伝達DNA結合

モーター機能など多彩な分子機能を担うがATP GTPなどのヌクレオシド

の加水分解を行う点は共通

N C

132 4 5 6

ヌクレオシド結合部GxxxxGKTの

配列モチーフ(P-loop)を持つ

ロスマン フォールドNAD(P)‐binding Rossmann‐fold domains (c2)

Alcohol dehydrogenase gamma chaindomain2 1u3wA(c211)

Aspartate beta-semialdehydedehydrogenase2gz1A1(c213)

L-alanine dehydrogenase1pjcA1(c214)

補酵素を利用したNAD(P)を脱水素酵素を持つ基質を認識するドメインは別に存在する

NC

123 4 5 6

平行のβシートが主

7枚羽 βプロペラ7‐bladed beta‐propeller (b69)

Garactose oxydasedomain3 1k3iA3(b6911)

Guanine nucleotide-bindingprotein subunit beta-11gotB(b6941)

細胞膜付近のシグナル伝達や糖結合に関わることが多い

Influenza Neuraminidase 1f8dA(b6811)

6枚羽 βプロペラ

N C

321 4

のユニットが7回円環状に繰り返しされたフォールド

立体構造比較プログラム1990年ごろから多くの構造比較プログラムが開発されている

WEBアドレス スコア アライメント

DALI httpwwwebiacukdali

距離の差を独自の関数で変換したスコア

局所アライメントをモンテカルロ法でつなぎ合わせる

CE httpclsdsceducehtml

局所的なRMSD 局所アライメントを積み上げていく

MATRAS httpbiunitnaistjpmatras

距離の変化が相同相似で起こる確率の比をスコアとする

SSEで仮アライメント

を生成残基アライメントを収束するまで反復する

タンパク質の相同性の判断基準

100

同一残基率30以上

BLASTのE-value lt 00001

PSI-BLASTのE-value lt 00001

0102030407025 15 535

同一残基率(Sequence Identity)()

立体構造比較が必要

(1)立体構造の類似性が高い(DALIのZスコアMATRASのRdisスコア)(2)同一残基率がそこそこ高い(PSI-BLASTでヒットするSeqIDgt=15ぐらい)

(3)分子機能に類似性がある(補酵素酵素反応基質代謝経路等の共通性等)(4)基質補酵素の結合部位が類似しておりそのアミノ酸が保存(モチーフ)(5)ドメイン構成の共通性(6)スーパーフォールドの場合は特別な注意が必要

配列解析

同一残基率が25以下の場合の相同性の判断基準

50608090

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 32: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

H19 問74タンパク質の主鎖に添って定義される二面角のうちφ(窒素原子と炭素原子の間の二面角)とψ(α炭素原子とカルボニル基の炭素原子の間の二面角)の値を各残

基ごとに計算して二次元にプロットしたものをラマチャンドランプロットと呼ぶ以下に示したラマチャンドランプロットに対する説明文の中でもっとも適切なものを一つ選べ

1 (a)(b)はともにαへリックスの領域である2 (a)(b)はともにβストランドの領域である3 (a)はαへリックス(b)はβストランドの領

域である4 (a)はβストランド(b)はαへリックスの領

域である

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

トポロジー図によるβシートの表現

4 23

N

C

1

1ubq (UbiquitinHumand151)

N

C123 4 5 6

1n8k (Alchol dehydrogenase E chain Horse c21)

ロスマンフォールド

βターン

βターン

1cauA1rhdA domain2

TOPSプログラムによる表示httpwwwtopsleedsacuk

1timA

はαへリックスはβストランドとなりあうの向きで平行逆平行を示す

コンタクトマップ

1ubq

C

4 23

N

1

縦横に残基を配置しある残基ペアのCα原子間の距離が10Å以下であれば対応するピクセルに色を塗る

分子描画ソフトVMDを用いて作成

平行のストランド間は方向逆平行ストランド間は方向に線分が観察される

N

C

N C

逆平行

逆平行

平行

αへリックスは太めの対角上の線分

へリックス

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから1か3コンタクトマップから平行シートしかないことがわかるため1であることがわかる

αβ5

αβ3

α

β4α

β1αβ2 β2

β1β3β4

β5

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから2か4コンタクトマップから平行シートしかないことがわかるため2であることがわかる

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

配列比較によるタンパク質分類1970年代から配列の一致度(sequence identity)に基づいてグループを作る作業が

行われてきた

どのくらいの類似性で一つにまとめるかは様々な考えがあるが少なくとも「相同なタンパク質群」を一つのグループにまとめるべき

ファミリー(family 族)

進化的に関係のある(相同な)タンパク質グループのこと

複数のファミリーがあつまった大きなグループ スーパーファミリー(superfamily clan)

一つのファミリーの中の小さなグループ サブファミリー(subfamily)

family

subfamily superfamily

ドメイン単位による分類

A2 B2

B3 C3

A1

配列1

配列2

配列3

配列の部分どうしだけが類似していた場合 部分一致を重視するとすべて一つのグループになるがhellip

配列1

配列2 配列3

Aを共有

Bを共有

1と2が類似2と3が類似していても1と3は類似していない

ドメインに分割すると

A1

A2

B2

B3

C3

A2 B2

B3 C3

A1

きれいに分類することができる

Pfam 蛋白質ファミリのデータベース各蛋白質ファミリのマルチプル

アライメント HMMなどを集めたデータベース

httppfamsangeracuk

Pkinase_Tyrドメインをもつタンパク質の例

ABL_HUMAN

BTK_HUMAN

ILK_HUMAN

MERTK_HUMAN

PGFRB_HUMAN

HCK_HUMAN

Family Pkinase_Tyr (PF07714) Protein tyrosine kinase

Pfamデータベース(httppfamsangeracukSoftwarePfam)からの引用

ドメイン構造と疎水性の関係Tyrosine protein kinase HCK (1ad5A HCK_HUMAN)

SH3 domain

SH2 domain

Tyrosine-kinase domain

3つの分断された疎水性コアrarr ドメイン構造

大きなタンパク質はいくつかの構造上のまとまり(ドメイン)を持つことが多い

立体構造によるタンパク質の分類

bull 配列による分類の延長ドメイン単位の分類進化的に関係のある(相同な)タンパク質を群にする(ファミリー)という考え方は同じ

bull 立体構造の類似性からより遠縁の相同性を見つけより大きな群を作る(スーパーファミリー)

bull スーパーファミリーをまとめたさらに大きなグループ(フォールドクラス)

bull 主にアミノ酸(Cαレベル)のラフな構造の類似性に

着目

bull 分類対象は主に球状タンパク質

立体構造分類データベースSCOPhttpscopmrc-lmbcamacukscop

4階層で分類Class(クラス)

Fold(フォールド)

Superfamily(スーパーファミリー)

Family(ファミリー)

どの階層に分類するかは配列の類似性立体構造の類似性分子機能の類似性機能部位の類似性

を専門家が総合的に判断して決める

1akr

ltホモロジーgt

ltアナロジーgt

他の構造分類データベースとしてCATHが有名

同様に階層的な分類体系を持つがその詳細はSCOPとは異なる

クラス

1mbd

1mqkH

1n55A 1pqwA

1fxd 1a2p

all-α (a)

all-β (b)

αβ (c)

α+β (d)

α-へリックスが中心

β-シートが中心

逆平行が多い

α-へリックスとβ-シートが配列上交互に現れる平行β-シートが中心

α-へリックスとβ-シートが混在配列上の並びの規則はない逆平行と平行のβ-シートが混在

アミノ酸配列と立体構造の関係ピロリ菌と大腸菌のフラボドキシン (同一残基率 SeqID 44)

ピロリ菌(1fueA) 大腸菌(1ag9A)

配列が似ていれば立体構造も似ている

SeqID = 44

RMSD = 12 Å

1fueA 2GKIGIFFGTDSGNAEAIAEKISKAIG--NAEVVDVAKASKEQFNGFTKVILVAPTAGAGD59

1ag9A 2AITGIFFGSDTGNTENIAKMIQKQLGKDVADVHDIAKSSKEDLEAYDILLLGIPTWYYGE61

1fueA 60LQTDWEDFLGTLEASD-FANKTIGLVGLGDQDTYSETFAEGIFHIYEKAK--AGKVVGQT116

1ag9A 62AQCDWDDFFPTLE-EIDFNGKLVALFGCGDQEDYAEYFCDALGTIRDIIEPRGATIVGHW120

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C 14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

BLAST

PSI-BLAST 構造比較

構造比較

アミノ酸配列がほとんど似ていなくても立体構造は似ている場合がある

構造は配列より進化的に保存がよい 構造比較から新たなホモログが発見できる可能性

立体

構造

の変

アミノ酸配列の変化と立体構造の変化の相関(グロビン族)

立体構造の変化はアミノ酸配列の変化と相関配列が30以上一致していればRMSDは2Å以下

アミノ酸配列の類似度

2つの構造の類似性

ホモロジー (homology 相同)進化的起源を共有することによる類似多くの場合分子機能なども類似している

アナロジー (analogy 相似)進化的起源とは無関係な類似多くの場合分子機能など他の属性は似ていない物理化学的な構造の偏好が原因とされる

イルカの胸びれ サルの前足

チョウの羽 トリの翼

ネコの前足

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C

ldquoFlavodoxin-likerdquo fold (c23)

ldquoFlavoproteinsrdquo superfamily (c235)

ldquoCheY-likerdquosuperfamily(c231)

14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

AnalogyHomology

HomologyHomolo

gy

多く現れるフォールド(出現ドメイン数順)

太字はスーパーフォールド多くのスーパーファミリーを含むフォールド

d58

c1

g3

c23 b34

b1

a4フォールド名 (SCOP173によるクラスfhijkは除く) ドメイ

ンの数

スーパーファミリーの数

a4 DNARNA-binding 3-helical bundle 292 14c1 TIM betaalpha-barrel 269 33d58 Ferredoxin-like 248 55b1 Immunoglobulin-like beta sandwich 246 27c37 P-loop nucleoside triphosphate hydrolase 235 1c2 NAD(P)-binding Rossmann-fold domains 168 1g3 Knottins 154 19d15 Beta-Grasp(ubiquitin-like) 131 13c23 Flavodoxin-like 118 15b34 SH3-like barrel 117 18b40 OB-fold 100 12c66 SAM-dependent methyltransferases 95 1

c37 c2

d15

b40 c66

スーパーフォールド(Superfold)

フォールド名 (SCOP173によるクラスfhijkは除く) その下のスーパーファミリーの数

d58 Ferredoxin-like 55c1 TIM betaalpha-barrel 33b1 Immunoglobulin-like beta sandwich 27a24 Four-helical up-and-down bundle 27a118 Alpha-alpha superhelix 23g3 Knottins 19b34 SH3-like barrel 18g41 Rubredoxin-like 16c23 Flavodoxin-like 15a60 SAM(sterile alpha motif) domain-like 15b69 7-bladed beta-propeller 14a4 DNARNA-binding 3-helical bundle 14

スーパーフォールド多くのスーパーファミリーを含むフォールド

スーパーフォールドは「構造の類似と機能の類似が対応しにくいフォールド」ともいえる

d58

c1

g3a118

c23

a24

a60

b34

b1

g41

b69 a4

三本へリックスバンドルDNARNA‐binding 3‐helical bundle(a4)

Mating type protein A2 yeast(1k61Aa411)

(1gvdAa413)(1wh5Aa411)

三本のへリックスが束になった構造DNAやRNAに結合する蛋白質が多い

DNAと

結合した構造(1k61)

TIMバレルTIM betaalpha barrel (c1)

Triosephosphate isomerase1n55A(c111)

全般に解糖系の酵素が多い基質酵素反応は極めて多彩

八本のβストランドとαへリックスが交互に組み合わさり対称的な樽(barrel)構造を形成す

る中央の樽構造は平行のβシートからなる

Imidazole glycerol phosphate synthasesubunit hisF1thfD(c121)

KHGKDPG aldolase1euaA(c1101)

フェレドキシン様Ferredoxin‐like (d58)

4Fe-4S Ferredoxin(1fxdd581)

1 234 4本の逆平行のβストランドと2本のαへリックスからな

分子機能は極めて多彩

CheY binding domain of CheA(1eayCd5824)

U1A RNA binding domain(1nu4Ad5871)

免疫グロブリン様Immunoglobulin‐like beta sandwich(b1)

Immunoglobulin Heavy chain variabledomain 1mjuH1(b111)

Immunoglobulin Heavy chain constantdomain 1mjuH2(b112)

Macromomycin1noaA (b171)

免疫グロブリン分子はH鎖とL鎖から

なりそれぞれ免疫グロブリン様ドメインからできている

V

C

V

C

C

C

V

CV

CC

C

L鎖

H鎖H鎖 L鎖

細胞表面あるいは分泌蛋白質が多い免疫や分子認識に関する機能を担うことが多い

4本のβストランドからなるβシートが二枚サンドイッチ状に重なった構造をとる逆平行のβシートが主

P‐loop スーパーファミリーP‐loop nucleoside triphosphate hydrolase(c37)

Ras-related protein RAB-5A1r2qA(c3718)

Guanylate kinase1gkyA(c3711)

RecA proteinDomain1 1xmsA1(c37111)

平行のβシートが主トポロジーには様々な変異あり

シグナル伝達DNA結合

モーター機能など多彩な分子機能を担うがATP GTPなどのヌクレオシド

の加水分解を行う点は共通

N C

132 4 5 6

ヌクレオシド結合部GxxxxGKTの

配列モチーフ(P-loop)を持つ

ロスマン フォールドNAD(P)‐binding Rossmann‐fold domains (c2)

Alcohol dehydrogenase gamma chaindomain2 1u3wA(c211)

Aspartate beta-semialdehydedehydrogenase2gz1A1(c213)

L-alanine dehydrogenase1pjcA1(c214)

補酵素を利用したNAD(P)を脱水素酵素を持つ基質を認識するドメインは別に存在する

NC

123 4 5 6

平行のβシートが主

7枚羽 βプロペラ7‐bladed beta‐propeller (b69)

Garactose oxydasedomain3 1k3iA3(b6911)

Guanine nucleotide-bindingprotein subunit beta-11gotB(b6941)

細胞膜付近のシグナル伝達や糖結合に関わることが多い

Influenza Neuraminidase 1f8dA(b6811)

6枚羽 βプロペラ

N C

321 4

のユニットが7回円環状に繰り返しされたフォールド

立体構造比較プログラム1990年ごろから多くの構造比較プログラムが開発されている

WEBアドレス スコア アライメント

DALI httpwwwebiacukdali

距離の差を独自の関数で変換したスコア

局所アライメントをモンテカルロ法でつなぎ合わせる

CE httpclsdsceducehtml

局所的なRMSD 局所アライメントを積み上げていく

MATRAS httpbiunitnaistjpmatras

距離の変化が相同相似で起こる確率の比をスコアとする

SSEで仮アライメント

を生成残基アライメントを収束するまで反復する

タンパク質の相同性の判断基準

100

同一残基率30以上

BLASTのE-value lt 00001

PSI-BLASTのE-value lt 00001

0102030407025 15 535

同一残基率(Sequence Identity)()

立体構造比較が必要

(1)立体構造の類似性が高い(DALIのZスコアMATRASのRdisスコア)(2)同一残基率がそこそこ高い(PSI-BLASTでヒットするSeqIDgt=15ぐらい)

(3)分子機能に類似性がある(補酵素酵素反応基質代謝経路等の共通性等)(4)基質補酵素の結合部位が類似しておりそのアミノ酸が保存(モチーフ)(5)ドメイン構成の共通性(6)スーパーフォールドの場合は特別な注意が必要

配列解析

同一残基率が25以下の場合の相同性の判断基準

50608090

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 33: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

トポロジー図によるβシートの表現

4 23

N

C

1

1ubq (UbiquitinHumand151)

N

C123 4 5 6

1n8k (Alchol dehydrogenase E chain Horse c21)

ロスマンフォールド

βターン

βターン

1cauA1rhdA domain2

TOPSプログラムによる表示httpwwwtopsleedsacuk

1timA

はαへリックスはβストランドとなりあうの向きで平行逆平行を示す

コンタクトマップ

1ubq

C

4 23

N

1

縦横に残基を配置しある残基ペアのCα原子間の距離が10Å以下であれば対応するピクセルに色を塗る

分子描画ソフトVMDを用いて作成

平行のストランド間は方向逆平行ストランド間は方向に線分が観察される

N

C

N C

逆平行

逆平行

平行

αへリックスは太めの対角上の線分

へリックス

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから1か3コンタクトマップから平行シートしかないことがわかるため1であることがわかる

αβ5

αβ3

α

β4α

β1αβ2 β2

β1β3β4

β5

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから2か4コンタクトマップから平行シートしかないことがわかるため2であることがわかる

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

配列比較によるタンパク質分類1970年代から配列の一致度(sequence identity)に基づいてグループを作る作業が

行われてきた

どのくらいの類似性で一つにまとめるかは様々な考えがあるが少なくとも「相同なタンパク質群」を一つのグループにまとめるべき

ファミリー(family 族)

進化的に関係のある(相同な)タンパク質グループのこと

複数のファミリーがあつまった大きなグループ スーパーファミリー(superfamily clan)

一つのファミリーの中の小さなグループ サブファミリー(subfamily)

family

subfamily superfamily

ドメイン単位による分類

A2 B2

B3 C3

A1

配列1

配列2

配列3

配列の部分どうしだけが類似していた場合 部分一致を重視するとすべて一つのグループになるがhellip

配列1

配列2 配列3

Aを共有

Bを共有

1と2が類似2と3が類似していても1と3は類似していない

ドメインに分割すると

A1

A2

B2

B3

C3

A2 B2

B3 C3

A1

きれいに分類することができる

Pfam 蛋白質ファミリのデータベース各蛋白質ファミリのマルチプル

アライメント HMMなどを集めたデータベース

httppfamsangeracuk

Pkinase_Tyrドメインをもつタンパク質の例

ABL_HUMAN

BTK_HUMAN

ILK_HUMAN

MERTK_HUMAN

PGFRB_HUMAN

HCK_HUMAN

Family Pkinase_Tyr (PF07714) Protein tyrosine kinase

Pfamデータベース(httppfamsangeracukSoftwarePfam)からの引用

ドメイン構造と疎水性の関係Tyrosine protein kinase HCK (1ad5A HCK_HUMAN)

SH3 domain

SH2 domain

Tyrosine-kinase domain

3つの分断された疎水性コアrarr ドメイン構造

大きなタンパク質はいくつかの構造上のまとまり(ドメイン)を持つことが多い

立体構造によるタンパク質の分類

bull 配列による分類の延長ドメイン単位の分類進化的に関係のある(相同な)タンパク質を群にする(ファミリー)という考え方は同じ

bull 立体構造の類似性からより遠縁の相同性を見つけより大きな群を作る(スーパーファミリー)

bull スーパーファミリーをまとめたさらに大きなグループ(フォールドクラス)

bull 主にアミノ酸(Cαレベル)のラフな構造の類似性に

着目

bull 分類対象は主に球状タンパク質

立体構造分類データベースSCOPhttpscopmrc-lmbcamacukscop

4階層で分類Class(クラス)

Fold(フォールド)

Superfamily(スーパーファミリー)

Family(ファミリー)

どの階層に分類するかは配列の類似性立体構造の類似性分子機能の類似性機能部位の類似性

を専門家が総合的に判断して決める

1akr

ltホモロジーgt

ltアナロジーgt

他の構造分類データベースとしてCATHが有名

同様に階層的な分類体系を持つがその詳細はSCOPとは異なる

クラス

1mbd

1mqkH

1n55A 1pqwA

1fxd 1a2p

all-α (a)

all-β (b)

αβ (c)

α+β (d)

α-へリックスが中心

β-シートが中心

逆平行が多い

α-へリックスとβ-シートが配列上交互に現れる平行β-シートが中心

α-へリックスとβ-シートが混在配列上の並びの規則はない逆平行と平行のβ-シートが混在

アミノ酸配列と立体構造の関係ピロリ菌と大腸菌のフラボドキシン (同一残基率 SeqID 44)

ピロリ菌(1fueA) 大腸菌(1ag9A)

配列が似ていれば立体構造も似ている

SeqID = 44

RMSD = 12 Å

1fueA 2GKIGIFFGTDSGNAEAIAEKISKAIG--NAEVVDVAKASKEQFNGFTKVILVAPTAGAGD59

1ag9A 2AITGIFFGSDTGNTENIAKMIQKQLGKDVADVHDIAKSSKEDLEAYDILLLGIPTWYYGE61

1fueA 60LQTDWEDFLGTLEASD-FANKTIGLVGLGDQDTYSETFAEGIFHIYEKAK--AGKVVGQT116

1ag9A 62AQCDWDDFFPTLE-EIDFNGKLVALFGCGDQEDYAEYFCDALGTIRDIIEPRGATIVGHW120

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C 14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

BLAST

PSI-BLAST 構造比較

構造比較

アミノ酸配列がほとんど似ていなくても立体構造は似ている場合がある

構造は配列より進化的に保存がよい 構造比較から新たなホモログが発見できる可能性

立体

構造

の変

アミノ酸配列の変化と立体構造の変化の相関(グロビン族)

立体構造の変化はアミノ酸配列の変化と相関配列が30以上一致していればRMSDは2Å以下

アミノ酸配列の類似度

2つの構造の類似性

ホモロジー (homology 相同)進化的起源を共有することによる類似多くの場合分子機能なども類似している

アナロジー (analogy 相似)進化的起源とは無関係な類似多くの場合分子機能など他の属性は似ていない物理化学的な構造の偏好が原因とされる

イルカの胸びれ サルの前足

チョウの羽 トリの翼

ネコの前足

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C

ldquoFlavodoxin-likerdquo fold (c23)

ldquoFlavoproteinsrdquo superfamily (c235)

ldquoCheY-likerdquosuperfamily(c231)

14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

AnalogyHomology

HomologyHomolo

gy

多く現れるフォールド(出現ドメイン数順)

太字はスーパーフォールド多くのスーパーファミリーを含むフォールド

d58

c1

g3

c23 b34

b1

a4フォールド名 (SCOP173によるクラスfhijkは除く) ドメイ

ンの数

スーパーファミリーの数

a4 DNARNA-binding 3-helical bundle 292 14c1 TIM betaalpha-barrel 269 33d58 Ferredoxin-like 248 55b1 Immunoglobulin-like beta sandwich 246 27c37 P-loop nucleoside triphosphate hydrolase 235 1c2 NAD(P)-binding Rossmann-fold domains 168 1g3 Knottins 154 19d15 Beta-Grasp(ubiquitin-like) 131 13c23 Flavodoxin-like 118 15b34 SH3-like barrel 117 18b40 OB-fold 100 12c66 SAM-dependent methyltransferases 95 1

c37 c2

d15

b40 c66

スーパーフォールド(Superfold)

フォールド名 (SCOP173によるクラスfhijkは除く) その下のスーパーファミリーの数

d58 Ferredoxin-like 55c1 TIM betaalpha-barrel 33b1 Immunoglobulin-like beta sandwich 27a24 Four-helical up-and-down bundle 27a118 Alpha-alpha superhelix 23g3 Knottins 19b34 SH3-like barrel 18g41 Rubredoxin-like 16c23 Flavodoxin-like 15a60 SAM(sterile alpha motif) domain-like 15b69 7-bladed beta-propeller 14a4 DNARNA-binding 3-helical bundle 14

スーパーフォールド多くのスーパーファミリーを含むフォールド

スーパーフォールドは「構造の類似と機能の類似が対応しにくいフォールド」ともいえる

d58

c1

g3a118

c23

a24

a60

b34

b1

g41

b69 a4

三本へリックスバンドルDNARNA‐binding 3‐helical bundle(a4)

Mating type protein A2 yeast(1k61Aa411)

(1gvdAa413)(1wh5Aa411)

三本のへリックスが束になった構造DNAやRNAに結合する蛋白質が多い

DNAと

結合した構造(1k61)

TIMバレルTIM betaalpha barrel (c1)

Triosephosphate isomerase1n55A(c111)

全般に解糖系の酵素が多い基質酵素反応は極めて多彩

八本のβストランドとαへリックスが交互に組み合わさり対称的な樽(barrel)構造を形成す

る中央の樽構造は平行のβシートからなる

Imidazole glycerol phosphate synthasesubunit hisF1thfD(c121)

KHGKDPG aldolase1euaA(c1101)

フェレドキシン様Ferredoxin‐like (d58)

4Fe-4S Ferredoxin(1fxdd581)

1 234 4本の逆平行のβストランドと2本のαへリックスからな

分子機能は極めて多彩

CheY binding domain of CheA(1eayCd5824)

U1A RNA binding domain(1nu4Ad5871)

免疫グロブリン様Immunoglobulin‐like beta sandwich(b1)

Immunoglobulin Heavy chain variabledomain 1mjuH1(b111)

Immunoglobulin Heavy chain constantdomain 1mjuH2(b112)

Macromomycin1noaA (b171)

免疫グロブリン分子はH鎖とL鎖から

なりそれぞれ免疫グロブリン様ドメインからできている

V

C

V

C

C

C

V

CV

CC

C

L鎖

H鎖H鎖 L鎖

細胞表面あるいは分泌蛋白質が多い免疫や分子認識に関する機能を担うことが多い

4本のβストランドからなるβシートが二枚サンドイッチ状に重なった構造をとる逆平行のβシートが主

P‐loop スーパーファミリーP‐loop nucleoside triphosphate hydrolase(c37)

Ras-related protein RAB-5A1r2qA(c3718)

Guanylate kinase1gkyA(c3711)

RecA proteinDomain1 1xmsA1(c37111)

平行のβシートが主トポロジーには様々な変異あり

シグナル伝達DNA結合

モーター機能など多彩な分子機能を担うがATP GTPなどのヌクレオシド

の加水分解を行う点は共通

N C

132 4 5 6

ヌクレオシド結合部GxxxxGKTの

配列モチーフ(P-loop)を持つ

ロスマン フォールドNAD(P)‐binding Rossmann‐fold domains (c2)

Alcohol dehydrogenase gamma chaindomain2 1u3wA(c211)

Aspartate beta-semialdehydedehydrogenase2gz1A1(c213)

L-alanine dehydrogenase1pjcA1(c214)

補酵素を利用したNAD(P)を脱水素酵素を持つ基質を認識するドメインは別に存在する

NC

123 4 5 6

平行のβシートが主

7枚羽 βプロペラ7‐bladed beta‐propeller (b69)

Garactose oxydasedomain3 1k3iA3(b6911)

Guanine nucleotide-bindingprotein subunit beta-11gotB(b6941)

細胞膜付近のシグナル伝達や糖結合に関わることが多い

Influenza Neuraminidase 1f8dA(b6811)

6枚羽 βプロペラ

N C

321 4

のユニットが7回円環状に繰り返しされたフォールド

立体構造比較プログラム1990年ごろから多くの構造比較プログラムが開発されている

WEBアドレス スコア アライメント

DALI httpwwwebiacukdali

距離の差を独自の関数で変換したスコア

局所アライメントをモンテカルロ法でつなぎ合わせる

CE httpclsdsceducehtml

局所的なRMSD 局所アライメントを積み上げていく

MATRAS httpbiunitnaistjpmatras

距離の変化が相同相似で起こる確率の比をスコアとする

SSEで仮アライメント

を生成残基アライメントを収束するまで反復する

タンパク質の相同性の判断基準

100

同一残基率30以上

BLASTのE-value lt 00001

PSI-BLASTのE-value lt 00001

0102030407025 15 535

同一残基率(Sequence Identity)()

立体構造比較が必要

(1)立体構造の類似性が高い(DALIのZスコアMATRASのRdisスコア)(2)同一残基率がそこそこ高い(PSI-BLASTでヒットするSeqIDgt=15ぐらい)

(3)分子機能に類似性がある(補酵素酵素反応基質代謝経路等の共通性等)(4)基質補酵素の結合部位が類似しておりそのアミノ酸が保存(モチーフ)(5)ドメイン構成の共通性(6)スーパーフォールドの場合は特別な注意が必要

配列解析

同一残基率が25以下の場合の相同性の判断基準

50608090

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 34: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

1cauA1rhdA domain2

TOPSプログラムによる表示httpwwwtopsleedsacuk

1timA

はαへリックスはβストランドとなりあうの向きで平行逆平行を示す

コンタクトマップ

1ubq

C

4 23

N

1

縦横に残基を配置しある残基ペアのCα原子間の距離が10Å以下であれば対応するピクセルに色を塗る

分子描画ソフトVMDを用いて作成

平行のストランド間は方向逆平行ストランド間は方向に線分が観察される

N

C

N C

逆平行

逆平行

平行

αへリックスは太めの対角上の線分

へリックス

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから1か3コンタクトマップから平行シートしかないことがわかるため1であることがわかる

αβ5

αβ3

α

β4α

β1αβ2 β2

β1β3β4

β5

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから2か4コンタクトマップから平行シートしかないことがわかるため2であることがわかる

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

配列比較によるタンパク質分類1970年代から配列の一致度(sequence identity)に基づいてグループを作る作業が

行われてきた

どのくらいの類似性で一つにまとめるかは様々な考えがあるが少なくとも「相同なタンパク質群」を一つのグループにまとめるべき

ファミリー(family 族)

進化的に関係のある(相同な)タンパク質グループのこと

複数のファミリーがあつまった大きなグループ スーパーファミリー(superfamily clan)

一つのファミリーの中の小さなグループ サブファミリー(subfamily)

family

subfamily superfamily

ドメイン単位による分類

A2 B2

B3 C3

A1

配列1

配列2

配列3

配列の部分どうしだけが類似していた場合 部分一致を重視するとすべて一つのグループになるがhellip

配列1

配列2 配列3

Aを共有

Bを共有

1と2が類似2と3が類似していても1と3は類似していない

ドメインに分割すると

A1

A2

B2

B3

C3

A2 B2

B3 C3

A1

きれいに分類することができる

Pfam 蛋白質ファミリのデータベース各蛋白質ファミリのマルチプル

アライメント HMMなどを集めたデータベース

httppfamsangeracuk

Pkinase_Tyrドメインをもつタンパク質の例

ABL_HUMAN

BTK_HUMAN

ILK_HUMAN

MERTK_HUMAN

PGFRB_HUMAN

HCK_HUMAN

Family Pkinase_Tyr (PF07714) Protein tyrosine kinase

Pfamデータベース(httppfamsangeracukSoftwarePfam)からの引用

ドメイン構造と疎水性の関係Tyrosine protein kinase HCK (1ad5A HCK_HUMAN)

SH3 domain

SH2 domain

Tyrosine-kinase domain

3つの分断された疎水性コアrarr ドメイン構造

大きなタンパク質はいくつかの構造上のまとまり(ドメイン)を持つことが多い

立体構造によるタンパク質の分類

bull 配列による分類の延長ドメイン単位の分類進化的に関係のある(相同な)タンパク質を群にする(ファミリー)という考え方は同じ

bull 立体構造の類似性からより遠縁の相同性を見つけより大きな群を作る(スーパーファミリー)

bull スーパーファミリーをまとめたさらに大きなグループ(フォールドクラス)

bull 主にアミノ酸(Cαレベル)のラフな構造の類似性に

着目

bull 分類対象は主に球状タンパク質

立体構造分類データベースSCOPhttpscopmrc-lmbcamacukscop

4階層で分類Class(クラス)

Fold(フォールド)

Superfamily(スーパーファミリー)

Family(ファミリー)

どの階層に分類するかは配列の類似性立体構造の類似性分子機能の類似性機能部位の類似性

を専門家が総合的に判断して決める

1akr

ltホモロジーgt

ltアナロジーgt

他の構造分類データベースとしてCATHが有名

同様に階層的な分類体系を持つがその詳細はSCOPとは異なる

クラス

1mbd

1mqkH

1n55A 1pqwA

1fxd 1a2p

all-α (a)

all-β (b)

αβ (c)

α+β (d)

α-へリックスが中心

β-シートが中心

逆平行が多い

α-へリックスとβ-シートが配列上交互に現れる平行β-シートが中心

α-へリックスとβ-シートが混在配列上の並びの規則はない逆平行と平行のβ-シートが混在

アミノ酸配列と立体構造の関係ピロリ菌と大腸菌のフラボドキシン (同一残基率 SeqID 44)

ピロリ菌(1fueA) 大腸菌(1ag9A)

配列が似ていれば立体構造も似ている

SeqID = 44

RMSD = 12 Å

1fueA 2GKIGIFFGTDSGNAEAIAEKISKAIG--NAEVVDVAKASKEQFNGFTKVILVAPTAGAGD59

1ag9A 2AITGIFFGSDTGNTENIAKMIQKQLGKDVADVHDIAKSSKEDLEAYDILLLGIPTWYYGE61

1fueA 60LQTDWEDFLGTLEASD-FANKTIGLVGLGDQDTYSETFAEGIFHIYEKAK--AGKVVGQT116

1ag9A 62AQCDWDDFFPTLE-EIDFNGKLVALFGCGDQEDYAEYFCDALGTIRDIIEPRGATIVGHW120

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C 14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

BLAST

PSI-BLAST 構造比較

構造比較

アミノ酸配列がほとんど似ていなくても立体構造は似ている場合がある

構造は配列より進化的に保存がよい 構造比較から新たなホモログが発見できる可能性

立体

構造

の変

アミノ酸配列の変化と立体構造の変化の相関(グロビン族)

立体構造の変化はアミノ酸配列の変化と相関配列が30以上一致していればRMSDは2Å以下

アミノ酸配列の類似度

2つの構造の類似性

ホモロジー (homology 相同)進化的起源を共有することによる類似多くの場合分子機能なども類似している

アナロジー (analogy 相似)進化的起源とは無関係な類似多くの場合分子機能など他の属性は似ていない物理化学的な構造の偏好が原因とされる

イルカの胸びれ サルの前足

チョウの羽 トリの翼

ネコの前足

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C

ldquoFlavodoxin-likerdquo fold (c23)

ldquoFlavoproteinsrdquo superfamily (c235)

ldquoCheY-likerdquosuperfamily(c231)

14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

AnalogyHomology

HomologyHomolo

gy

多く現れるフォールド(出現ドメイン数順)

太字はスーパーフォールド多くのスーパーファミリーを含むフォールド

d58

c1

g3

c23 b34

b1

a4フォールド名 (SCOP173によるクラスfhijkは除く) ドメイ

ンの数

スーパーファミリーの数

a4 DNARNA-binding 3-helical bundle 292 14c1 TIM betaalpha-barrel 269 33d58 Ferredoxin-like 248 55b1 Immunoglobulin-like beta sandwich 246 27c37 P-loop nucleoside triphosphate hydrolase 235 1c2 NAD(P)-binding Rossmann-fold domains 168 1g3 Knottins 154 19d15 Beta-Grasp(ubiquitin-like) 131 13c23 Flavodoxin-like 118 15b34 SH3-like barrel 117 18b40 OB-fold 100 12c66 SAM-dependent methyltransferases 95 1

c37 c2

d15

b40 c66

スーパーフォールド(Superfold)

フォールド名 (SCOP173によるクラスfhijkは除く) その下のスーパーファミリーの数

d58 Ferredoxin-like 55c1 TIM betaalpha-barrel 33b1 Immunoglobulin-like beta sandwich 27a24 Four-helical up-and-down bundle 27a118 Alpha-alpha superhelix 23g3 Knottins 19b34 SH3-like barrel 18g41 Rubredoxin-like 16c23 Flavodoxin-like 15a60 SAM(sterile alpha motif) domain-like 15b69 7-bladed beta-propeller 14a4 DNARNA-binding 3-helical bundle 14

スーパーフォールド多くのスーパーファミリーを含むフォールド

スーパーフォールドは「構造の類似と機能の類似が対応しにくいフォールド」ともいえる

d58

c1

g3a118

c23

a24

a60

b34

b1

g41

b69 a4

三本へリックスバンドルDNARNA‐binding 3‐helical bundle(a4)

Mating type protein A2 yeast(1k61Aa411)

(1gvdAa413)(1wh5Aa411)

三本のへリックスが束になった構造DNAやRNAに結合する蛋白質が多い

DNAと

結合した構造(1k61)

TIMバレルTIM betaalpha barrel (c1)

Triosephosphate isomerase1n55A(c111)

全般に解糖系の酵素が多い基質酵素反応は極めて多彩

八本のβストランドとαへリックスが交互に組み合わさり対称的な樽(barrel)構造を形成す

る中央の樽構造は平行のβシートからなる

Imidazole glycerol phosphate synthasesubunit hisF1thfD(c121)

KHGKDPG aldolase1euaA(c1101)

フェレドキシン様Ferredoxin‐like (d58)

4Fe-4S Ferredoxin(1fxdd581)

1 234 4本の逆平行のβストランドと2本のαへリックスからな

分子機能は極めて多彩

CheY binding domain of CheA(1eayCd5824)

U1A RNA binding domain(1nu4Ad5871)

免疫グロブリン様Immunoglobulin‐like beta sandwich(b1)

Immunoglobulin Heavy chain variabledomain 1mjuH1(b111)

Immunoglobulin Heavy chain constantdomain 1mjuH2(b112)

Macromomycin1noaA (b171)

免疫グロブリン分子はH鎖とL鎖から

なりそれぞれ免疫グロブリン様ドメインからできている

V

C

V

C

C

C

V

CV

CC

C

L鎖

H鎖H鎖 L鎖

細胞表面あるいは分泌蛋白質が多い免疫や分子認識に関する機能を担うことが多い

4本のβストランドからなるβシートが二枚サンドイッチ状に重なった構造をとる逆平行のβシートが主

P‐loop スーパーファミリーP‐loop nucleoside triphosphate hydrolase(c37)

Ras-related protein RAB-5A1r2qA(c3718)

Guanylate kinase1gkyA(c3711)

RecA proteinDomain1 1xmsA1(c37111)

平行のβシートが主トポロジーには様々な変異あり

シグナル伝達DNA結合

モーター機能など多彩な分子機能を担うがATP GTPなどのヌクレオシド

の加水分解を行う点は共通

N C

132 4 5 6

ヌクレオシド結合部GxxxxGKTの

配列モチーフ(P-loop)を持つ

ロスマン フォールドNAD(P)‐binding Rossmann‐fold domains (c2)

Alcohol dehydrogenase gamma chaindomain2 1u3wA(c211)

Aspartate beta-semialdehydedehydrogenase2gz1A1(c213)

L-alanine dehydrogenase1pjcA1(c214)

補酵素を利用したNAD(P)を脱水素酵素を持つ基質を認識するドメインは別に存在する

NC

123 4 5 6

平行のβシートが主

7枚羽 βプロペラ7‐bladed beta‐propeller (b69)

Garactose oxydasedomain3 1k3iA3(b6911)

Guanine nucleotide-bindingprotein subunit beta-11gotB(b6941)

細胞膜付近のシグナル伝達や糖結合に関わることが多い

Influenza Neuraminidase 1f8dA(b6811)

6枚羽 βプロペラ

N C

321 4

のユニットが7回円環状に繰り返しされたフォールド

立体構造比較プログラム1990年ごろから多くの構造比較プログラムが開発されている

WEBアドレス スコア アライメント

DALI httpwwwebiacukdali

距離の差を独自の関数で変換したスコア

局所アライメントをモンテカルロ法でつなぎ合わせる

CE httpclsdsceducehtml

局所的なRMSD 局所アライメントを積み上げていく

MATRAS httpbiunitnaistjpmatras

距離の変化が相同相似で起こる確率の比をスコアとする

SSEで仮アライメント

を生成残基アライメントを収束するまで反復する

タンパク質の相同性の判断基準

100

同一残基率30以上

BLASTのE-value lt 00001

PSI-BLASTのE-value lt 00001

0102030407025 15 535

同一残基率(Sequence Identity)()

立体構造比較が必要

(1)立体構造の類似性が高い(DALIのZスコアMATRASのRdisスコア)(2)同一残基率がそこそこ高い(PSI-BLASTでヒットするSeqIDgt=15ぐらい)

(3)分子機能に類似性がある(補酵素酵素反応基質代謝経路等の共通性等)(4)基質補酵素の結合部位が類似しておりそのアミノ酸が保存(モチーフ)(5)ドメイン構成の共通性(6)スーパーフォールドの場合は特別な注意が必要

配列解析

同一残基率が25以下の場合の相同性の判断基準

50608090

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 35: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

コンタクトマップ

1ubq

C

4 23

N

1

縦横に残基を配置しある残基ペアのCα原子間の距離が10Å以下であれば対応するピクセルに色を塗る

分子描画ソフトVMDを用いて作成

平行のストランド間は方向逆平行ストランド間は方向に線分が観察される

N

C

N C

逆平行

逆平行

平行

αへリックスは太めの対角上の線分

へリックス

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから1か3コンタクトマップから平行シートしかないことがわかるため1であることがわかる

αβ5

αβ3

α

β4α

β1αβ2 β2

β1β3β4

β5

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから2か4コンタクトマップから平行シートしかないことがわかるため2であることがわかる

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

配列比較によるタンパク質分類1970年代から配列の一致度(sequence identity)に基づいてグループを作る作業が

行われてきた

どのくらいの類似性で一つにまとめるかは様々な考えがあるが少なくとも「相同なタンパク質群」を一つのグループにまとめるべき

ファミリー(family 族)

進化的に関係のある(相同な)タンパク質グループのこと

複数のファミリーがあつまった大きなグループ スーパーファミリー(superfamily clan)

一つのファミリーの中の小さなグループ サブファミリー(subfamily)

family

subfamily superfamily

ドメイン単位による分類

A2 B2

B3 C3

A1

配列1

配列2

配列3

配列の部分どうしだけが類似していた場合 部分一致を重視するとすべて一つのグループになるがhellip

配列1

配列2 配列3

Aを共有

Bを共有

1と2が類似2と3が類似していても1と3は類似していない

ドメインに分割すると

A1

A2

B2

B3

C3

A2 B2

B3 C3

A1

きれいに分類することができる

Pfam 蛋白質ファミリのデータベース各蛋白質ファミリのマルチプル

アライメント HMMなどを集めたデータベース

httppfamsangeracuk

Pkinase_Tyrドメインをもつタンパク質の例

ABL_HUMAN

BTK_HUMAN

ILK_HUMAN

MERTK_HUMAN

PGFRB_HUMAN

HCK_HUMAN

Family Pkinase_Tyr (PF07714) Protein tyrosine kinase

Pfamデータベース(httppfamsangeracukSoftwarePfam)からの引用

ドメイン構造と疎水性の関係Tyrosine protein kinase HCK (1ad5A HCK_HUMAN)

SH3 domain

SH2 domain

Tyrosine-kinase domain

3つの分断された疎水性コアrarr ドメイン構造

大きなタンパク質はいくつかの構造上のまとまり(ドメイン)を持つことが多い

立体構造によるタンパク質の分類

bull 配列による分類の延長ドメイン単位の分類進化的に関係のある(相同な)タンパク質を群にする(ファミリー)という考え方は同じ

bull 立体構造の類似性からより遠縁の相同性を見つけより大きな群を作る(スーパーファミリー)

bull スーパーファミリーをまとめたさらに大きなグループ(フォールドクラス)

bull 主にアミノ酸(Cαレベル)のラフな構造の類似性に

着目

bull 分類対象は主に球状タンパク質

立体構造分類データベースSCOPhttpscopmrc-lmbcamacukscop

4階層で分類Class(クラス)

Fold(フォールド)

Superfamily(スーパーファミリー)

Family(ファミリー)

どの階層に分類するかは配列の類似性立体構造の類似性分子機能の類似性機能部位の類似性

を専門家が総合的に判断して決める

1akr

ltホモロジーgt

ltアナロジーgt

他の構造分類データベースとしてCATHが有名

同様に階層的な分類体系を持つがその詳細はSCOPとは異なる

クラス

1mbd

1mqkH

1n55A 1pqwA

1fxd 1a2p

all-α (a)

all-β (b)

αβ (c)

α+β (d)

α-へリックスが中心

β-シートが中心

逆平行が多い

α-へリックスとβ-シートが配列上交互に現れる平行β-シートが中心

α-へリックスとβ-シートが混在配列上の並びの規則はない逆平行と平行のβ-シートが混在

アミノ酸配列と立体構造の関係ピロリ菌と大腸菌のフラボドキシン (同一残基率 SeqID 44)

ピロリ菌(1fueA) 大腸菌(1ag9A)

配列が似ていれば立体構造も似ている

SeqID = 44

RMSD = 12 Å

1fueA 2GKIGIFFGTDSGNAEAIAEKISKAIG--NAEVVDVAKASKEQFNGFTKVILVAPTAGAGD59

1ag9A 2AITGIFFGSDTGNTENIAKMIQKQLGKDVADVHDIAKSSKEDLEAYDILLLGIPTWYYGE61

1fueA 60LQTDWEDFLGTLEASD-FANKTIGLVGLGDQDTYSETFAEGIFHIYEKAK--AGKVVGQT116

1ag9A 62AQCDWDDFFPTLE-EIDFNGKLVALFGCGDQEDYAEYFCDALGTIRDIIEPRGATIVGHW120

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C 14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

BLAST

PSI-BLAST 構造比較

構造比較

アミノ酸配列がほとんど似ていなくても立体構造は似ている場合がある

構造は配列より進化的に保存がよい 構造比較から新たなホモログが発見できる可能性

立体

構造

の変

アミノ酸配列の変化と立体構造の変化の相関(グロビン族)

立体構造の変化はアミノ酸配列の変化と相関配列が30以上一致していればRMSDは2Å以下

アミノ酸配列の類似度

2つの構造の類似性

ホモロジー (homology 相同)進化的起源を共有することによる類似多くの場合分子機能なども類似している

アナロジー (analogy 相似)進化的起源とは無関係な類似多くの場合分子機能など他の属性は似ていない物理化学的な構造の偏好が原因とされる

イルカの胸びれ サルの前足

チョウの羽 トリの翼

ネコの前足

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C

ldquoFlavodoxin-likerdquo fold (c23)

ldquoFlavoproteinsrdquo superfamily (c235)

ldquoCheY-likerdquosuperfamily(c231)

14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

AnalogyHomology

HomologyHomolo

gy

多く現れるフォールド(出現ドメイン数順)

太字はスーパーフォールド多くのスーパーファミリーを含むフォールド

d58

c1

g3

c23 b34

b1

a4フォールド名 (SCOP173によるクラスfhijkは除く) ドメイ

ンの数

スーパーファミリーの数

a4 DNARNA-binding 3-helical bundle 292 14c1 TIM betaalpha-barrel 269 33d58 Ferredoxin-like 248 55b1 Immunoglobulin-like beta sandwich 246 27c37 P-loop nucleoside triphosphate hydrolase 235 1c2 NAD(P)-binding Rossmann-fold domains 168 1g3 Knottins 154 19d15 Beta-Grasp(ubiquitin-like) 131 13c23 Flavodoxin-like 118 15b34 SH3-like barrel 117 18b40 OB-fold 100 12c66 SAM-dependent methyltransferases 95 1

c37 c2

d15

b40 c66

スーパーフォールド(Superfold)

フォールド名 (SCOP173によるクラスfhijkは除く) その下のスーパーファミリーの数

d58 Ferredoxin-like 55c1 TIM betaalpha-barrel 33b1 Immunoglobulin-like beta sandwich 27a24 Four-helical up-and-down bundle 27a118 Alpha-alpha superhelix 23g3 Knottins 19b34 SH3-like barrel 18g41 Rubredoxin-like 16c23 Flavodoxin-like 15a60 SAM(sterile alpha motif) domain-like 15b69 7-bladed beta-propeller 14a4 DNARNA-binding 3-helical bundle 14

スーパーフォールド多くのスーパーファミリーを含むフォールド

スーパーフォールドは「構造の類似と機能の類似が対応しにくいフォールド」ともいえる

d58

c1

g3a118

c23

a24

a60

b34

b1

g41

b69 a4

三本へリックスバンドルDNARNA‐binding 3‐helical bundle(a4)

Mating type protein A2 yeast(1k61Aa411)

(1gvdAa413)(1wh5Aa411)

三本のへリックスが束になった構造DNAやRNAに結合する蛋白質が多い

DNAと

結合した構造(1k61)

TIMバレルTIM betaalpha barrel (c1)

Triosephosphate isomerase1n55A(c111)

全般に解糖系の酵素が多い基質酵素反応は極めて多彩

八本のβストランドとαへリックスが交互に組み合わさり対称的な樽(barrel)構造を形成す

る中央の樽構造は平行のβシートからなる

Imidazole glycerol phosphate synthasesubunit hisF1thfD(c121)

KHGKDPG aldolase1euaA(c1101)

フェレドキシン様Ferredoxin‐like (d58)

4Fe-4S Ferredoxin(1fxdd581)

1 234 4本の逆平行のβストランドと2本のαへリックスからな

分子機能は極めて多彩

CheY binding domain of CheA(1eayCd5824)

U1A RNA binding domain(1nu4Ad5871)

免疫グロブリン様Immunoglobulin‐like beta sandwich(b1)

Immunoglobulin Heavy chain variabledomain 1mjuH1(b111)

Immunoglobulin Heavy chain constantdomain 1mjuH2(b112)

Macromomycin1noaA (b171)

免疫グロブリン分子はH鎖とL鎖から

なりそれぞれ免疫グロブリン様ドメインからできている

V

C

V

C

C

C

V

CV

CC

C

L鎖

H鎖H鎖 L鎖

細胞表面あるいは分泌蛋白質が多い免疫や分子認識に関する機能を担うことが多い

4本のβストランドからなるβシートが二枚サンドイッチ状に重なった構造をとる逆平行のβシートが主

P‐loop スーパーファミリーP‐loop nucleoside triphosphate hydrolase(c37)

Ras-related protein RAB-5A1r2qA(c3718)

Guanylate kinase1gkyA(c3711)

RecA proteinDomain1 1xmsA1(c37111)

平行のβシートが主トポロジーには様々な変異あり

シグナル伝達DNA結合

モーター機能など多彩な分子機能を担うがATP GTPなどのヌクレオシド

の加水分解を行う点は共通

N C

132 4 5 6

ヌクレオシド結合部GxxxxGKTの

配列モチーフ(P-loop)を持つ

ロスマン フォールドNAD(P)‐binding Rossmann‐fold domains (c2)

Alcohol dehydrogenase gamma chaindomain2 1u3wA(c211)

Aspartate beta-semialdehydedehydrogenase2gz1A1(c213)

L-alanine dehydrogenase1pjcA1(c214)

補酵素を利用したNAD(P)を脱水素酵素を持つ基質を認識するドメインは別に存在する

NC

123 4 5 6

平行のβシートが主

7枚羽 βプロペラ7‐bladed beta‐propeller (b69)

Garactose oxydasedomain3 1k3iA3(b6911)

Guanine nucleotide-bindingprotein subunit beta-11gotB(b6941)

細胞膜付近のシグナル伝達や糖結合に関わることが多い

Influenza Neuraminidase 1f8dA(b6811)

6枚羽 βプロペラ

N C

321 4

のユニットが7回円環状に繰り返しされたフォールド

立体構造比較プログラム1990年ごろから多くの構造比較プログラムが開発されている

WEBアドレス スコア アライメント

DALI httpwwwebiacukdali

距離の差を独自の関数で変換したスコア

局所アライメントをモンテカルロ法でつなぎ合わせる

CE httpclsdsceducehtml

局所的なRMSD 局所アライメントを積み上げていく

MATRAS httpbiunitnaistjpmatras

距離の変化が相同相似で起こる確率の比をスコアとする

SSEで仮アライメント

を生成残基アライメントを収束するまで反復する

タンパク質の相同性の判断基準

100

同一残基率30以上

BLASTのE-value lt 00001

PSI-BLASTのE-value lt 00001

0102030407025 15 535

同一残基率(Sequence Identity)()

立体構造比較が必要

(1)立体構造の類似性が高い(DALIのZスコアMATRASのRdisスコア)(2)同一残基率がそこそこ高い(PSI-BLASTでヒットするSeqIDgt=15ぐらい)

(3)分子機能に類似性がある(補酵素酵素反応基質代謝経路等の共通性等)(4)基質補酵素の結合部位が類似しておりそのアミノ酸が保存(モチーフ)(5)ドメイン構成の共通性(6)スーパーフォールドの場合は特別な注意が必要

配列解析

同一残基率が25以下の場合の相同性の判断基準

50608090

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 36: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから1か3コンタクトマップから平行シートしかないことがわかるため1であることがわかる

αβ5

αβ3

α

β4α

β1αβ2 β2

β1β3β4

β5

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから2か4コンタクトマップから平行シートしかないことがわかるため2であることがわかる

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

配列比較によるタンパク質分類1970年代から配列の一致度(sequence identity)に基づいてグループを作る作業が

行われてきた

どのくらいの類似性で一つにまとめるかは様々な考えがあるが少なくとも「相同なタンパク質群」を一つのグループにまとめるべき

ファミリー(family 族)

進化的に関係のある(相同な)タンパク質グループのこと

複数のファミリーがあつまった大きなグループ スーパーファミリー(superfamily clan)

一つのファミリーの中の小さなグループ サブファミリー(subfamily)

family

subfamily superfamily

ドメイン単位による分類

A2 B2

B3 C3

A1

配列1

配列2

配列3

配列の部分どうしだけが類似していた場合 部分一致を重視するとすべて一つのグループになるがhellip

配列1

配列2 配列3

Aを共有

Bを共有

1と2が類似2と3が類似していても1と3は類似していない

ドメインに分割すると

A1

A2

B2

B3

C3

A2 B2

B3 C3

A1

きれいに分類することができる

Pfam 蛋白質ファミリのデータベース各蛋白質ファミリのマルチプル

アライメント HMMなどを集めたデータベース

httppfamsangeracuk

Pkinase_Tyrドメインをもつタンパク質の例

ABL_HUMAN

BTK_HUMAN

ILK_HUMAN

MERTK_HUMAN

PGFRB_HUMAN

HCK_HUMAN

Family Pkinase_Tyr (PF07714) Protein tyrosine kinase

Pfamデータベース(httppfamsangeracukSoftwarePfam)からの引用

ドメイン構造と疎水性の関係Tyrosine protein kinase HCK (1ad5A HCK_HUMAN)

SH3 domain

SH2 domain

Tyrosine-kinase domain

3つの分断された疎水性コアrarr ドメイン構造

大きなタンパク質はいくつかの構造上のまとまり(ドメイン)を持つことが多い

立体構造によるタンパク質の分類

bull 配列による分類の延長ドメイン単位の分類進化的に関係のある(相同な)タンパク質を群にする(ファミリー)という考え方は同じ

bull 立体構造の類似性からより遠縁の相同性を見つけより大きな群を作る(スーパーファミリー)

bull スーパーファミリーをまとめたさらに大きなグループ(フォールドクラス)

bull 主にアミノ酸(Cαレベル)のラフな構造の類似性に

着目

bull 分類対象は主に球状タンパク質

立体構造分類データベースSCOPhttpscopmrc-lmbcamacukscop

4階層で分類Class(クラス)

Fold(フォールド)

Superfamily(スーパーファミリー)

Family(ファミリー)

どの階層に分類するかは配列の類似性立体構造の類似性分子機能の類似性機能部位の類似性

を専門家が総合的に判断して決める

1akr

ltホモロジーgt

ltアナロジーgt

他の構造分類データベースとしてCATHが有名

同様に階層的な分類体系を持つがその詳細はSCOPとは異なる

クラス

1mbd

1mqkH

1n55A 1pqwA

1fxd 1a2p

all-α (a)

all-β (b)

αβ (c)

α+β (d)

α-へリックスが中心

β-シートが中心

逆平行が多い

α-へリックスとβ-シートが配列上交互に現れる平行β-シートが中心

α-へリックスとβ-シートが混在配列上の並びの規則はない逆平行と平行のβ-シートが混在

アミノ酸配列と立体構造の関係ピロリ菌と大腸菌のフラボドキシン (同一残基率 SeqID 44)

ピロリ菌(1fueA) 大腸菌(1ag9A)

配列が似ていれば立体構造も似ている

SeqID = 44

RMSD = 12 Å

1fueA 2GKIGIFFGTDSGNAEAIAEKISKAIG--NAEVVDVAKASKEQFNGFTKVILVAPTAGAGD59

1ag9A 2AITGIFFGSDTGNTENIAKMIQKQLGKDVADVHDIAKSSKEDLEAYDILLLGIPTWYYGE61

1fueA 60LQTDWEDFLGTLEASD-FANKTIGLVGLGDQDTYSETFAEGIFHIYEKAK--AGKVVGQT116

1ag9A 62AQCDWDDFFPTLE-EIDFNGKLVALFGCGDQEDYAEYFCDALGTIRDIIEPRGATIVGHW120

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C 14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

BLAST

PSI-BLAST 構造比較

構造比較

アミノ酸配列がほとんど似ていなくても立体構造は似ている場合がある

構造は配列より進化的に保存がよい 構造比較から新たなホモログが発見できる可能性

立体

構造

の変

アミノ酸配列の変化と立体構造の変化の相関(グロビン族)

立体構造の変化はアミノ酸配列の変化と相関配列が30以上一致していればRMSDは2Å以下

アミノ酸配列の類似度

2つの構造の類似性

ホモロジー (homology 相同)進化的起源を共有することによる類似多くの場合分子機能なども類似している

アナロジー (analogy 相似)進化的起源とは無関係な類似多くの場合分子機能など他の属性は似ていない物理化学的な構造の偏好が原因とされる

イルカの胸びれ サルの前足

チョウの羽 トリの翼

ネコの前足

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C

ldquoFlavodoxin-likerdquo fold (c23)

ldquoFlavoproteinsrdquo superfamily (c235)

ldquoCheY-likerdquosuperfamily(c231)

14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

AnalogyHomology

HomologyHomolo

gy

多く現れるフォールド(出現ドメイン数順)

太字はスーパーフォールド多くのスーパーファミリーを含むフォールド

d58

c1

g3

c23 b34

b1

a4フォールド名 (SCOP173によるクラスfhijkは除く) ドメイ

ンの数

スーパーファミリーの数

a4 DNARNA-binding 3-helical bundle 292 14c1 TIM betaalpha-barrel 269 33d58 Ferredoxin-like 248 55b1 Immunoglobulin-like beta sandwich 246 27c37 P-loop nucleoside triphosphate hydrolase 235 1c2 NAD(P)-binding Rossmann-fold domains 168 1g3 Knottins 154 19d15 Beta-Grasp(ubiquitin-like) 131 13c23 Flavodoxin-like 118 15b34 SH3-like barrel 117 18b40 OB-fold 100 12c66 SAM-dependent methyltransferases 95 1

c37 c2

d15

b40 c66

スーパーフォールド(Superfold)

フォールド名 (SCOP173によるクラスfhijkは除く) その下のスーパーファミリーの数

d58 Ferredoxin-like 55c1 TIM betaalpha-barrel 33b1 Immunoglobulin-like beta sandwich 27a24 Four-helical up-and-down bundle 27a118 Alpha-alpha superhelix 23g3 Knottins 19b34 SH3-like barrel 18g41 Rubredoxin-like 16c23 Flavodoxin-like 15a60 SAM(sterile alpha motif) domain-like 15b69 7-bladed beta-propeller 14a4 DNARNA-binding 3-helical bundle 14

スーパーフォールド多くのスーパーファミリーを含むフォールド

スーパーフォールドは「構造の類似と機能の類似が対応しにくいフォールド」ともいえる

d58

c1

g3a118

c23

a24

a60

b34

b1

g41

b69 a4

三本へリックスバンドルDNARNA‐binding 3‐helical bundle(a4)

Mating type protein A2 yeast(1k61Aa411)

(1gvdAa413)(1wh5Aa411)

三本のへリックスが束になった構造DNAやRNAに結合する蛋白質が多い

DNAと

結合した構造(1k61)

TIMバレルTIM betaalpha barrel (c1)

Triosephosphate isomerase1n55A(c111)

全般に解糖系の酵素が多い基質酵素反応は極めて多彩

八本のβストランドとαへリックスが交互に組み合わさり対称的な樽(barrel)構造を形成す

る中央の樽構造は平行のβシートからなる

Imidazole glycerol phosphate synthasesubunit hisF1thfD(c121)

KHGKDPG aldolase1euaA(c1101)

フェレドキシン様Ferredoxin‐like (d58)

4Fe-4S Ferredoxin(1fxdd581)

1 234 4本の逆平行のβストランドと2本のαへリックスからな

分子機能は極めて多彩

CheY binding domain of CheA(1eayCd5824)

U1A RNA binding domain(1nu4Ad5871)

免疫グロブリン様Immunoglobulin‐like beta sandwich(b1)

Immunoglobulin Heavy chain variabledomain 1mjuH1(b111)

Immunoglobulin Heavy chain constantdomain 1mjuH2(b112)

Macromomycin1noaA (b171)

免疫グロブリン分子はH鎖とL鎖から

なりそれぞれ免疫グロブリン様ドメインからできている

V

C

V

C

C

C

V

CV

CC

C

L鎖

H鎖H鎖 L鎖

細胞表面あるいは分泌蛋白質が多い免疫や分子認識に関する機能を担うことが多い

4本のβストランドからなるβシートが二枚サンドイッチ状に重なった構造をとる逆平行のβシートが主

P‐loop スーパーファミリーP‐loop nucleoside triphosphate hydrolase(c37)

Ras-related protein RAB-5A1r2qA(c3718)

Guanylate kinase1gkyA(c3711)

RecA proteinDomain1 1xmsA1(c37111)

平行のβシートが主トポロジーには様々な変異あり

シグナル伝達DNA結合

モーター機能など多彩な分子機能を担うがATP GTPなどのヌクレオシド

の加水分解を行う点は共通

N C

132 4 5 6

ヌクレオシド結合部GxxxxGKTの

配列モチーフ(P-loop)を持つ

ロスマン フォールドNAD(P)‐binding Rossmann‐fold domains (c2)

Alcohol dehydrogenase gamma chaindomain2 1u3wA(c211)

Aspartate beta-semialdehydedehydrogenase2gz1A1(c213)

L-alanine dehydrogenase1pjcA1(c214)

補酵素を利用したNAD(P)を脱水素酵素を持つ基質を認識するドメインは別に存在する

NC

123 4 5 6

平行のβシートが主

7枚羽 βプロペラ7‐bladed beta‐propeller (b69)

Garactose oxydasedomain3 1k3iA3(b6911)

Guanine nucleotide-bindingprotein subunit beta-11gotB(b6941)

細胞膜付近のシグナル伝達や糖結合に関わることが多い

Influenza Neuraminidase 1f8dA(b6811)

6枚羽 βプロペラ

N C

321 4

のユニットが7回円環状に繰り返しされたフォールド

立体構造比較プログラム1990年ごろから多くの構造比較プログラムが開発されている

WEBアドレス スコア アライメント

DALI httpwwwebiacukdali

距離の差を独自の関数で変換したスコア

局所アライメントをモンテカルロ法でつなぎ合わせる

CE httpclsdsceducehtml

局所的なRMSD 局所アライメントを積み上げていく

MATRAS httpbiunitnaistjpmatras

距離の変化が相同相似で起こる確率の比をスコアとする

SSEで仮アライメント

を生成残基アライメントを収束するまで反復する

タンパク質の相同性の判断基準

100

同一残基率30以上

BLASTのE-value lt 00001

PSI-BLASTのE-value lt 00001

0102030407025 15 535

同一残基率(Sequence Identity)()

立体構造比較が必要

(1)立体構造の類似性が高い(DALIのZスコアMATRASのRdisスコア)(2)同一残基率がそこそこ高い(PSI-BLASTでヒットするSeqIDgt=15ぐらい)

(3)分子機能に類似性がある(補酵素酵素反応基質代謝経路等の共通性等)(4)基質補酵素の結合部位が類似しておりそのアミノ酸が保存(モチーフ)(5)ドメイン構成の共通性(6)スーパーフォールドの場合は特別な注意が必要

配列解析

同一残基率が25以下の場合の相同性の判断基準

50608090

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 37: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

H19 問75次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっている選択肢に示した二次

構造要素の配置の中でβストランドの配向に注目した時にこのタンパク質の構造として適切なものはどれか一つ選べただし選択肢中の「」はへリックス「」はストランドであり同じ向きの「」の隣接は平行シート逆向きの「」の隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから1か3コンタクトマップから平行シートしかないことがわかるため1であることがわかる

αβ5

αβ3

α

β4α

β1αβ2 β2

β1β3β4

β5

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから2か4コンタクトマップから平行シートしかないことがわかるため2であることがわかる

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

配列比較によるタンパク質分類1970年代から配列の一致度(sequence identity)に基づいてグループを作る作業が

行われてきた

どのくらいの類似性で一つにまとめるかは様々な考えがあるが少なくとも「相同なタンパク質群」を一つのグループにまとめるべき

ファミリー(family 族)

進化的に関係のある(相同な)タンパク質グループのこと

複数のファミリーがあつまった大きなグループ スーパーファミリー(superfamily clan)

一つのファミリーの中の小さなグループ サブファミリー(subfamily)

family

subfamily superfamily

ドメイン単位による分類

A2 B2

B3 C3

A1

配列1

配列2

配列3

配列の部分どうしだけが類似していた場合 部分一致を重視するとすべて一つのグループになるがhellip

配列1

配列2 配列3

Aを共有

Bを共有

1と2が類似2と3が類似していても1と3は類似していない

ドメインに分割すると

A1

A2

B2

B3

C3

A2 B2

B3 C3

A1

きれいに分類することができる

Pfam 蛋白質ファミリのデータベース各蛋白質ファミリのマルチプル

アライメント HMMなどを集めたデータベース

httppfamsangeracuk

Pkinase_Tyrドメインをもつタンパク質の例

ABL_HUMAN

BTK_HUMAN

ILK_HUMAN

MERTK_HUMAN

PGFRB_HUMAN

HCK_HUMAN

Family Pkinase_Tyr (PF07714) Protein tyrosine kinase

Pfamデータベース(httppfamsangeracukSoftwarePfam)からの引用

ドメイン構造と疎水性の関係Tyrosine protein kinase HCK (1ad5A HCK_HUMAN)

SH3 domain

SH2 domain

Tyrosine-kinase domain

3つの分断された疎水性コアrarr ドメイン構造

大きなタンパク質はいくつかの構造上のまとまり(ドメイン)を持つことが多い

立体構造によるタンパク質の分類

bull 配列による分類の延長ドメイン単位の分類進化的に関係のある(相同な)タンパク質を群にする(ファミリー)という考え方は同じ

bull 立体構造の類似性からより遠縁の相同性を見つけより大きな群を作る(スーパーファミリー)

bull スーパーファミリーをまとめたさらに大きなグループ(フォールドクラス)

bull 主にアミノ酸(Cαレベル)のラフな構造の類似性に

着目

bull 分類対象は主に球状タンパク質

立体構造分類データベースSCOPhttpscopmrc-lmbcamacukscop

4階層で分類Class(クラス)

Fold(フォールド)

Superfamily(スーパーファミリー)

Family(ファミリー)

どの階層に分類するかは配列の類似性立体構造の類似性分子機能の類似性機能部位の類似性

を専門家が総合的に判断して決める

1akr

ltホモロジーgt

ltアナロジーgt

他の構造分類データベースとしてCATHが有名

同様に階層的な分類体系を持つがその詳細はSCOPとは異なる

クラス

1mbd

1mqkH

1n55A 1pqwA

1fxd 1a2p

all-α (a)

all-β (b)

αβ (c)

α+β (d)

α-へリックスが中心

β-シートが中心

逆平行が多い

α-へリックスとβ-シートが配列上交互に現れる平行β-シートが中心

α-へリックスとβ-シートが混在配列上の並びの規則はない逆平行と平行のβ-シートが混在

アミノ酸配列と立体構造の関係ピロリ菌と大腸菌のフラボドキシン (同一残基率 SeqID 44)

ピロリ菌(1fueA) 大腸菌(1ag9A)

配列が似ていれば立体構造も似ている

SeqID = 44

RMSD = 12 Å

1fueA 2GKIGIFFGTDSGNAEAIAEKISKAIG--NAEVVDVAKASKEQFNGFTKVILVAPTAGAGD59

1ag9A 2AITGIFFGSDTGNTENIAKMIQKQLGKDVADVHDIAKSSKEDLEAYDILLLGIPTWYYGE61

1fueA 60LQTDWEDFLGTLEASD-FANKTIGLVGLGDQDTYSETFAEGIFHIYEKAK--AGKVVGQT116

1ag9A 62AQCDWDDFFPTLE-EIDFNGKLVALFGCGDQEDYAEYFCDALGTIRDIIEPRGATIVGHW120

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C 14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

BLAST

PSI-BLAST 構造比較

構造比較

アミノ酸配列がほとんど似ていなくても立体構造は似ている場合がある

構造は配列より進化的に保存がよい 構造比較から新たなホモログが発見できる可能性

立体

構造

の変

アミノ酸配列の変化と立体構造の変化の相関(グロビン族)

立体構造の変化はアミノ酸配列の変化と相関配列が30以上一致していればRMSDは2Å以下

アミノ酸配列の類似度

2つの構造の類似性

ホモロジー (homology 相同)進化的起源を共有することによる類似多くの場合分子機能なども類似している

アナロジー (analogy 相似)進化的起源とは無関係な類似多くの場合分子機能など他の属性は似ていない物理化学的な構造の偏好が原因とされる

イルカの胸びれ サルの前足

チョウの羽 トリの翼

ネコの前足

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C

ldquoFlavodoxin-likerdquo fold (c23)

ldquoFlavoproteinsrdquo superfamily (c235)

ldquoCheY-likerdquosuperfamily(c231)

14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

AnalogyHomology

HomologyHomolo

gy

多く現れるフォールド(出現ドメイン数順)

太字はスーパーフォールド多くのスーパーファミリーを含むフォールド

d58

c1

g3

c23 b34

b1

a4フォールド名 (SCOP173によるクラスfhijkは除く) ドメイ

ンの数

スーパーファミリーの数

a4 DNARNA-binding 3-helical bundle 292 14c1 TIM betaalpha-barrel 269 33d58 Ferredoxin-like 248 55b1 Immunoglobulin-like beta sandwich 246 27c37 P-loop nucleoside triphosphate hydrolase 235 1c2 NAD(P)-binding Rossmann-fold domains 168 1g3 Knottins 154 19d15 Beta-Grasp(ubiquitin-like) 131 13c23 Flavodoxin-like 118 15b34 SH3-like barrel 117 18b40 OB-fold 100 12c66 SAM-dependent methyltransferases 95 1

c37 c2

d15

b40 c66

スーパーフォールド(Superfold)

フォールド名 (SCOP173によるクラスfhijkは除く) その下のスーパーファミリーの数

d58 Ferredoxin-like 55c1 TIM betaalpha-barrel 33b1 Immunoglobulin-like beta sandwich 27a24 Four-helical up-and-down bundle 27a118 Alpha-alpha superhelix 23g3 Knottins 19b34 SH3-like barrel 18g41 Rubredoxin-like 16c23 Flavodoxin-like 15a60 SAM(sterile alpha motif) domain-like 15b69 7-bladed beta-propeller 14a4 DNARNA-binding 3-helical bundle 14

スーパーフォールド多くのスーパーファミリーを含むフォールド

スーパーフォールドは「構造の類似と機能の類似が対応しにくいフォールド」ともいえる

d58

c1

g3a118

c23

a24

a60

b34

b1

g41

b69 a4

三本へリックスバンドルDNARNA‐binding 3‐helical bundle(a4)

Mating type protein A2 yeast(1k61Aa411)

(1gvdAa413)(1wh5Aa411)

三本のへリックスが束になった構造DNAやRNAに結合する蛋白質が多い

DNAと

結合した構造(1k61)

TIMバレルTIM betaalpha barrel (c1)

Triosephosphate isomerase1n55A(c111)

全般に解糖系の酵素が多い基質酵素反応は極めて多彩

八本のβストランドとαへリックスが交互に組み合わさり対称的な樽(barrel)構造を形成す

る中央の樽構造は平行のβシートからなる

Imidazole glycerol phosphate synthasesubunit hisF1thfD(c121)

KHGKDPG aldolase1euaA(c1101)

フェレドキシン様Ferredoxin‐like (d58)

4Fe-4S Ferredoxin(1fxdd581)

1 234 4本の逆平行のβストランドと2本のαへリックスからな

分子機能は極めて多彩

CheY binding domain of CheA(1eayCd5824)

U1A RNA binding domain(1nu4Ad5871)

免疫グロブリン様Immunoglobulin‐like beta sandwich(b1)

Immunoglobulin Heavy chain variabledomain 1mjuH1(b111)

Immunoglobulin Heavy chain constantdomain 1mjuH2(b112)

Macromomycin1noaA (b171)

免疫グロブリン分子はH鎖とL鎖から

なりそれぞれ免疫グロブリン様ドメインからできている

V

C

V

C

C

C

V

CV

CC

C

L鎖

H鎖H鎖 L鎖

細胞表面あるいは分泌蛋白質が多い免疫や分子認識に関する機能を担うことが多い

4本のβストランドからなるβシートが二枚サンドイッチ状に重なった構造をとる逆平行のβシートが主

P‐loop スーパーファミリーP‐loop nucleoside triphosphate hydrolase(c37)

Ras-related protein RAB-5A1r2qA(c3718)

Guanylate kinase1gkyA(c3711)

RecA proteinDomain1 1xmsA1(c37111)

平行のβシートが主トポロジーには様々な変異あり

シグナル伝達DNA結合

モーター機能など多彩な分子機能を担うがATP GTPなどのヌクレオシド

の加水分解を行う点は共通

N C

132 4 5 6

ヌクレオシド結合部GxxxxGKTの

配列モチーフ(P-loop)を持つ

ロスマン フォールドNAD(P)‐binding Rossmann‐fold domains (c2)

Alcohol dehydrogenase gamma chaindomain2 1u3wA(c211)

Aspartate beta-semialdehydedehydrogenase2gz1A1(c213)

L-alanine dehydrogenase1pjcA1(c214)

補酵素を利用したNAD(P)を脱水素酵素を持つ基質を認識するドメインは別に存在する

NC

123 4 5 6

平行のβシートが主

7枚羽 βプロペラ7‐bladed beta‐propeller (b69)

Garactose oxydasedomain3 1k3iA3(b6911)

Guanine nucleotide-bindingprotein subunit beta-11gotB(b6941)

細胞膜付近のシグナル伝達や糖結合に関わることが多い

Influenza Neuraminidase 1f8dA(b6811)

6枚羽 βプロペラ

N C

321 4

のユニットが7回円環状に繰り返しされたフォールド

立体構造比較プログラム1990年ごろから多くの構造比較プログラムが開発されている

WEBアドレス スコア アライメント

DALI httpwwwebiacukdali

距離の差を独自の関数で変換したスコア

局所アライメントをモンテカルロ法でつなぎ合わせる

CE httpclsdsceducehtml

局所的なRMSD 局所アライメントを積み上げていく

MATRAS httpbiunitnaistjpmatras

距離の変化が相同相似で起こる確率の比をスコアとする

SSEで仮アライメント

を生成残基アライメントを収束するまで反復する

タンパク質の相同性の判断基準

100

同一残基率30以上

BLASTのE-value lt 00001

PSI-BLASTのE-value lt 00001

0102030407025 15 535

同一残基率(Sequence Identity)()

立体構造比較が必要

(1)立体構造の類似性が高い(DALIのZスコアMATRASのRdisスコア)(2)同一残基率がそこそこ高い(PSI-BLASTでヒットするSeqIDgt=15ぐらい)

(3)分子機能に類似性がある(補酵素酵素反応基質代謝経路等の共通性等)(4)基質補酵素の結合部位が類似しておりそのアミノ酸が保存(モチーフ)(5)ドメイン構成の共通性(6)スーパーフォールドの場合は特別な注意が必要

配列解析

同一残基率が25以下の場合の相同性の判断基準

50608090

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 38: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから2か4コンタクトマップから平行シートしかないことがわかるため2であることがわかる

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

配列比較によるタンパク質分類1970年代から配列の一致度(sequence identity)に基づいてグループを作る作業が

行われてきた

どのくらいの類似性で一つにまとめるかは様々な考えがあるが少なくとも「相同なタンパク質群」を一つのグループにまとめるべき

ファミリー(family 族)

進化的に関係のある(相同な)タンパク質グループのこと

複数のファミリーがあつまった大きなグループ スーパーファミリー(superfamily clan)

一つのファミリーの中の小さなグループ サブファミリー(subfamily)

family

subfamily superfamily

ドメイン単位による分類

A2 B2

B3 C3

A1

配列1

配列2

配列3

配列の部分どうしだけが類似していた場合 部分一致を重視するとすべて一つのグループになるがhellip

配列1

配列2 配列3

Aを共有

Bを共有

1と2が類似2と3が類似していても1と3は類似していない

ドメインに分割すると

A1

A2

B2

B3

C3

A2 B2

B3 C3

A1

きれいに分類することができる

Pfam 蛋白質ファミリのデータベース各蛋白質ファミリのマルチプル

アライメント HMMなどを集めたデータベース

httppfamsangeracuk

Pkinase_Tyrドメインをもつタンパク質の例

ABL_HUMAN

BTK_HUMAN

ILK_HUMAN

MERTK_HUMAN

PGFRB_HUMAN

HCK_HUMAN

Family Pkinase_Tyr (PF07714) Protein tyrosine kinase

Pfamデータベース(httppfamsangeracukSoftwarePfam)からの引用

ドメイン構造と疎水性の関係Tyrosine protein kinase HCK (1ad5A HCK_HUMAN)

SH3 domain

SH2 domain

Tyrosine-kinase domain

3つの分断された疎水性コアrarr ドメイン構造

大きなタンパク質はいくつかの構造上のまとまり(ドメイン)を持つことが多い

立体構造によるタンパク質の分類

bull 配列による分類の延長ドメイン単位の分類進化的に関係のある(相同な)タンパク質を群にする(ファミリー)という考え方は同じ

bull 立体構造の類似性からより遠縁の相同性を見つけより大きな群を作る(スーパーファミリー)

bull スーパーファミリーをまとめたさらに大きなグループ(フォールドクラス)

bull 主にアミノ酸(Cαレベル)のラフな構造の類似性に

着目

bull 分類対象は主に球状タンパク質

立体構造分類データベースSCOPhttpscopmrc-lmbcamacukscop

4階層で分類Class(クラス)

Fold(フォールド)

Superfamily(スーパーファミリー)

Family(ファミリー)

どの階層に分類するかは配列の類似性立体構造の類似性分子機能の類似性機能部位の類似性

を専門家が総合的に判断して決める

1akr

ltホモロジーgt

ltアナロジーgt

他の構造分類データベースとしてCATHが有名

同様に階層的な分類体系を持つがその詳細はSCOPとは異なる

クラス

1mbd

1mqkH

1n55A 1pqwA

1fxd 1a2p

all-α (a)

all-β (b)

αβ (c)

α+β (d)

α-へリックスが中心

β-シートが中心

逆平行が多い

α-へリックスとβ-シートが配列上交互に現れる平行β-シートが中心

α-へリックスとβ-シートが混在配列上の並びの規則はない逆平行と平行のβ-シートが混在

アミノ酸配列と立体構造の関係ピロリ菌と大腸菌のフラボドキシン (同一残基率 SeqID 44)

ピロリ菌(1fueA) 大腸菌(1ag9A)

配列が似ていれば立体構造も似ている

SeqID = 44

RMSD = 12 Å

1fueA 2GKIGIFFGTDSGNAEAIAEKISKAIG--NAEVVDVAKASKEQFNGFTKVILVAPTAGAGD59

1ag9A 2AITGIFFGSDTGNTENIAKMIQKQLGKDVADVHDIAKSSKEDLEAYDILLLGIPTWYYGE61

1fueA 60LQTDWEDFLGTLEASD-FANKTIGLVGLGDQDTYSETFAEGIFHIYEKAK--AGKVVGQT116

1ag9A 62AQCDWDDFFPTLE-EIDFNGKLVALFGCGDQEDYAEYFCDALGTIRDIIEPRGATIVGHW120

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C 14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

BLAST

PSI-BLAST 構造比較

構造比較

アミノ酸配列がほとんど似ていなくても立体構造は似ている場合がある

構造は配列より進化的に保存がよい 構造比較から新たなホモログが発見できる可能性

立体

構造

の変

アミノ酸配列の変化と立体構造の変化の相関(グロビン族)

立体構造の変化はアミノ酸配列の変化と相関配列が30以上一致していればRMSDは2Å以下

アミノ酸配列の類似度

2つの構造の類似性

ホモロジー (homology 相同)進化的起源を共有することによる類似多くの場合分子機能なども類似している

アナロジー (analogy 相似)進化的起源とは無関係な類似多くの場合分子機能など他の属性は似ていない物理化学的な構造の偏好が原因とされる

イルカの胸びれ サルの前足

チョウの羽 トリの翼

ネコの前足

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C

ldquoFlavodoxin-likerdquo fold (c23)

ldquoFlavoproteinsrdquo superfamily (c235)

ldquoCheY-likerdquosuperfamily(c231)

14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

AnalogyHomology

HomologyHomolo

gy

多く現れるフォールド(出現ドメイン数順)

太字はスーパーフォールド多くのスーパーファミリーを含むフォールド

d58

c1

g3

c23 b34

b1

a4フォールド名 (SCOP173によるクラスfhijkは除く) ドメイ

ンの数

スーパーファミリーの数

a4 DNARNA-binding 3-helical bundle 292 14c1 TIM betaalpha-barrel 269 33d58 Ferredoxin-like 248 55b1 Immunoglobulin-like beta sandwich 246 27c37 P-loop nucleoside triphosphate hydrolase 235 1c2 NAD(P)-binding Rossmann-fold domains 168 1g3 Knottins 154 19d15 Beta-Grasp(ubiquitin-like) 131 13c23 Flavodoxin-like 118 15b34 SH3-like barrel 117 18b40 OB-fold 100 12c66 SAM-dependent methyltransferases 95 1

c37 c2

d15

b40 c66

スーパーフォールド(Superfold)

フォールド名 (SCOP173によるクラスfhijkは除く) その下のスーパーファミリーの数

d58 Ferredoxin-like 55c1 TIM betaalpha-barrel 33b1 Immunoglobulin-like beta sandwich 27a24 Four-helical up-and-down bundle 27a118 Alpha-alpha superhelix 23g3 Knottins 19b34 SH3-like barrel 18g41 Rubredoxin-like 16c23 Flavodoxin-like 15a60 SAM(sterile alpha motif) domain-like 15b69 7-bladed beta-propeller 14a4 DNARNA-binding 3-helical bundle 14

スーパーフォールド多くのスーパーファミリーを含むフォールド

スーパーフォールドは「構造の類似と機能の類似が対応しにくいフォールド」ともいえる

d58

c1

g3a118

c23

a24

a60

b34

b1

g41

b69 a4

三本へリックスバンドルDNARNA‐binding 3‐helical bundle(a4)

Mating type protein A2 yeast(1k61Aa411)

(1gvdAa413)(1wh5Aa411)

三本のへリックスが束になった構造DNAやRNAに結合する蛋白質が多い

DNAと

結合した構造(1k61)

TIMバレルTIM betaalpha barrel (c1)

Triosephosphate isomerase1n55A(c111)

全般に解糖系の酵素が多い基質酵素反応は極めて多彩

八本のβストランドとαへリックスが交互に組み合わさり対称的な樽(barrel)構造を形成す

る中央の樽構造は平行のβシートからなる

Imidazole glycerol phosphate synthasesubunit hisF1thfD(c121)

KHGKDPG aldolase1euaA(c1101)

フェレドキシン様Ferredoxin‐like (d58)

4Fe-4S Ferredoxin(1fxdd581)

1 234 4本の逆平行のβストランドと2本のαへリックスからな

分子機能は極めて多彩

CheY binding domain of CheA(1eayCd5824)

U1A RNA binding domain(1nu4Ad5871)

免疫グロブリン様Immunoglobulin‐like beta sandwich(b1)

Immunoglobulin Heavy chain variabledomain 1mjuH1(b111)

Immunoglobulin Heavy chain constantdomain 1mjuH2(b112)

Macromomycin1noaA (b171)

免疫グロブリン分子はH鎖とL鎖から

なりそれぞれ免疫グロブリン様ドメインからできている

V

C

V

C

C

C

V

CV

CC

C

L鎖

H鎖H鎖 L鎖

細胞表面あるいは分泌蛋白質が多い免疫や分子認識に関する機能を担うことが多い

4本のβストランドからなるβシートが二枚サンドイッチ状に重なった構造をとる逆平行のβシートが主

P‐loop スーパーファミリーP‐loop nucleoside triphosphate hydrolase(c37)

Ras-related protein RAB-5A1r2qA(c3718)

Guanylate kinase1gkyA(c3711)

RecA proteinDomain1 1xmsA1(c37111)

平行のβシートが主トポロジーには様々な変異あり

シグナル伝達DNA結合

モーター機能など多彩な分子機能を担うがATP GTPなどのヌクレオシド

の加水分解を行う点は共通

N C

132 4 5 6

ヌクレオシド結合部GxxxxGKTの

配列モチーフ(P-loop)を持つ

ロスマン フォールドNAD(P)‐binding Rossmann‐fold domains (c2)

Alcohol dehydrogenase gamma chaindomain2 1u3wA(c211)

Aspartate beta-semialdehydedehydrogenase2gz1A1(c213)

L-alanine dehydrogenase1pjcA1(c214)

補酵素を利用したNAD(P)を脱水素酵素を持つ基質を認識するドメインは別に存在する

NC

123 4 5 6

平行のβシートが主

7枚羽 βプロペラ7‐bladed beta‐propeller (b69)

Garactose oxydasedomain3 1k3iA3(b6911)

Guanine nucleotide-bindingprotein subunit beta-11gotB(b6941)

細胞膜付近のシグナル伝達や糖結合に関わることが多い

Influenza Neuraminidase 1f8dA(b6811)

6枚羽 βプロペラ

N C

321 4

のユニットが7回円環状に繰り返しされたフォールド

立体構造比較プログラム1990年ごろから多くの構造比較プログラムが開発されている

WEBアドレス スコア アライメント

DALI httpwwwebiacukdali

距離の差を独自の関数で変換したスコア

局所アライメントをモンテカルロ法でつなぎ合わせる

CE httpclsdsceducehtml

局所的なRMSD 局所アライメントを積み上げていく

MATRAS httpbiunitnaistjpmatras

距離の変化が相同相似で起こる確率の比をスコアとする

SSEで仮アライメント

を生成残基アライメントを収束するまで反復する

タンパク質の相同性の判断基準

100

同一残基率30以上

BLASTのE-value lt 00001

PSI-BLASTのE-value lt 00001

0102030407025 15 535

同一残基率(Sequence Identity)()

立体構造比較が必要

(1)立体構造の類似性が高い(DALIのZスコアMATRASのRdisスコア)(2)同一残基率がそこそこ高い(PSI-BLASTでヒットするSeqIDgt=15ぐらい)

(3)分子機能に類似性がある(補酵素酵素反応基質代謝経路等の共通性等)(4)基質補酵素の結合部位が類似しておりそのアミノ酸が保存(モチーフ)(5)ドメイン構成の共通性(6)スーパーフォールドの場合は特別な注意が必要

配列解析

同一残基率が25以下の場合の相同性の判断基準

50608090

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 39: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

H20 問61次の図はあるタンパク質の立体構造のコンタクトマップの模式図である図中斜めの太い線のそれぞれは10Å以内にある残基対の集合を表すこのタンパク質はN末側からβαβαβαβαβαという二次構造の構成をとっているβストランドの配向に

注目した時にこのタンパク質の構造として正しいものを選択肢の中から一つ選べ図中はへリックスはストランドであり同じ向きのの隣接は平行シート逆向きのの隣接は逆平行シートの形成を表しているとする

1 2

3 4

βαβαβαβαβαなのでβストランドが5本αヘリックスが5本のはずこれから2か4コンタクトマップから平行シートしかないことがわかるため2であることがわかる

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

配列比較によるタンパク質分類1970年代から配列の一致度(sequence identity)に基づいてグループを作る作業が

行われてきた

どのくらいの類似性で一つにまとめるかは様々な考えがあるが少なくとも「相同なタンパク質群」を一つのグループにまとめるべき

ファミリー(family 族)

進化的に関係のある(相同な)タンパク質グループのこと

複数のファミリーがあつまった大きなグループ スーパーファミリー(superfamily clan)

一つのファミリーの中の小さなグループ サブファミリー(subfamily)

family

subfamily superfamily

ドメイン単位による分類

A2 B2

B3 C3

A1

配列1

配列2

配列3

配列の部分どうしだけが類似していた場合 部分一致を重視するとすべて一つのグループになるがhellip

配列1

配列2 配列3

Aを共有

Bを共有

1と2が類似2と3が類似していても1と3は類似していない

ドメインに分割すると

A1

A2

B2

B3

C3

A2 B2

B3 C3

A1

きれいに分類することができる

Pfam 蛋白質ファミリのデータベース各蛋白質ファミリのマルチプル

アライメント HMMなどを集めたデータベース

httppfamsangeracuk

Pkinase_Tyrドメインをもつタンパク質の例

ABL_HUMAN

BTK_HUMAN

ILK_HUMAN

MERTK_HUMAN

PGFRB_HUMAN

HCK_HUMAN

Family Pkinase_Tyr (PF07714) Protein tyrosine kinase

Pfamデータベース(httppfamsangeracukSoftwarePfam)からの引用

ドメイン構造と疎水性の関係Tyrosine protein kinase HCK (1ad5A HCK_HUMAN)

SH3 domain

SH2 domain

Tyrosine-kinase domain

3つの分断された疎水性コアrarr ドメイン構造

大きなタンパク質はいくつかの構造上のまとまり(ドメイン)を持つことが多い

立体構造によるタンパク質の分類

bull 配列による分類の延長ドメイン単位の分類進化的に関係のある(相同な)タンパク質を群にする(ファミリー)という考え方は同じ

bull 立体構造の類似性からより遠縁の相同性を見つけより大きな群を作る(スーパーファミリー)

bull スーパーファミリーをまとめたさらに大きなグループ(フォールドクラス)

bull 主にアミノ酸(Cαレベル)のラフな構造の類似性に

着目

bull 分類対象は主に球状タンパク質

立体構造分類データベースSCOPhttpscopmrc-lmbcamacukscop

4階層で分類Class(クラス)

Fold(フォールド)

Superfamily(スーパーファミリー)

Family(ファミリー)

どの階層に分類するかは配列の類似性立体構造の類似性分子機能の類似性機能部位の類似性

を専門家が総合的に判断して決める

1akr

ltホモロジーgt

ltアナロジーgt

他の構造分類データベースとしてCATHが有名

同様に階層的な分類体系を持つがその詳細はSCOPとは異なる

クラス

1mbd

1mqkH

1n55A 1pqwA

1fxd 1a2p

all-α (a)

all-β (b)

αβ (c)

α+β (d)

α-へリックスが中心

β-シートが中心

逆平行が多い

α-へリックスとβ-シートが配列上交互に現れる平行β-シートが中心

α-へリックスとβ-シートが混在配列上の並びの規則はない逆平行と平行のβ-シートが混在

アミノ酸配列と立体構造の関係ピロリ菌と大腸菌のフラボドキシン (同一残基率 SeqID 44)

ピロリ菌(1fueA) 大腸菌(1ag9A)

配列が似ていれば立体構造も似ている

SeqID = 44

RMSD = 12 Å

1fueA 2GKIGIFFGTDSGNAEAIAEKISKAIG--NAEVVDVAKASKEQFNGFTKVILVAPTAGAGD59

1ag9A 2AITGIFFGSDTGNTENIAKMIQKQLGKDVADVHDIAKSSKEDLEAYDILLLGIPTWYYGE61

1fueA 60LQTDWEDFLGTLEASD-FANKTIGLVGLGDQDTYSETFAEGIFHIYEKAK--AGKVVGQT116

1ag9A 62AQCDWDDFFPTLE-EIDFNGKLVALFGCGDQEDYAEYFCDALGTIRDIIEPRGATIVGHW120

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C 14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

BLAST

PSI-BLAST 構造比較

構造比較

アミノ酸配列がほとんど似ていなくても立体構造は似ている場合がある

構造は配列より進化的に保存がよい 構造比較から新たなホモログが発見できる可能性

立体

構造

の変

アミノ酸配列の変化と立体構造の変化の相関(グロビン族)

立体構造の変化はアミノ酸配列の変化と相関配列が30以上一致していればRMSDは2Å以下

アミノ酸配列の類似度

2つの構造の類似性

ホモロジー (homology 相同)進化的起源を共有することによる類似多くの場合分子機能なども類似している

アナロジー (analogy 相似)進化的起源とは無関係な類似多くの場合分子機能など他の属性は似ていない物理化学的な構造の偏好が原因とされる

イルカの胸びれ サルの前足

チョウの羽 トリの翼

ネコの前足

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C

ldquoFlavodoxin-likerdquo fold (c23)

ldquoFlavoproteinsrdquo superfamily (c235)

ldquoCheY-likerdquosuperfamily(c231)

14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

AnalogyHomology

HomologyHomolo

gy

多く現れるフォールド(出現ドメイン数順)

太字はスーパーフォールド多くのスーパーファミリーを含むフォールド

d58

c1

g3

c23 b34

b1

a4フォールド名 (SCOP173によるクラスfhijkは除く) ドメイ

ンの数

スーパーファミリーの数

a4 DNARNA-binding 3-helical bundle 292 14c1 TIM betaalpha-barrel 269 33d58 Ferredoxin-like 248 55b1 Immunoglobulin-like beta sandwich 246 27c37 P-loop nucleoside triphosphate hydrolase 235 1c2 NAD(P)-binding Rossmann-fold domains 168 1g3 Knottins 154 19d15 Beta-Grasp(ubiquitin-like) 131 13c23 Flavodoxin-like 118 15b34 SH3-like barrel 117 18b40 OB-fold 100 12c66 SAM-dependent methyltransferases 95 1

c37 c2

d15

b40 c66

スーパーフォールド(Superfold)

フォールド名 (SCOP173によるクラスfhijkは除く) その下のスーパーファミリーの数

d58 Ferredoxin-like 55c1 TIM betaalpha-barrel 33b1 Immunoglobulin-like beta sandwich 27a24 Four-helical up-and-down bundle 27a118 Alpha-alpha superhelix 23g3 Knottins 19b34 SH3-like barrel 18g41 Rubredoxin-like 16c23 Flavodoxin-like 15a60 SAM(sterile alpha motif) domain-like 15b69 7-bladed beta-propeller 14a4 DNARNA-binding 3-helical bundle 14

スーパーフォールド多くのスーパーファミリーを含むフォールド

スーパーフォールドは「構造の類似と機能の類似が対応しにくいフォールド」ともいえる

d58

c1

g3a118

c23

a24

a60

b34

b1

g41

b69 a4

三本へリックスバンドルDNARNA‐binding 3‐helical bundle(a4)

Mating type protein A2 yeast(1k61Aa411)

(1gvdAa413)(1wh5Aa411)

三本のへリックスが束になった構造DNAやRNAに結合する蛋白質が多い

DNAと

結合した構造(1k61)

TIMバレルTIM betaalpha barrel (c1)

Triosephosphate isomerase1n55A(c111)

全般に解糖系の酵素が多い基質酵素反応は極めて多彩

八本のβストランドとαへリックスが交互に組み合わさり対称的な樽(barrel)構造を形成す

る中央の樽構造は平行のβシートからなる

Imidazole glycerol phosphate synthasesubunit hisF1thfD(c121)

KHGKDPG aldolase1euaA(c1101)

フェレドキシン様Ferredoxin‐like (d58)

4Fe-4S Ferredoxin(1fxdd581)

1 234 4本の逆平行のβストランドと2本のαへリックスからな

分子機能は極めて多彩

CheY binding domain of CheA(1eayCd5824)

U1A RNA binding domain(1nu4Ad5871)

免疫グロブリン様Immunoglobulin‐like beta sandwich(b1)

Immunoglobulin Heavy chain variabledomain 1mjuH1(b111)

Immunoglobulin Heavy chain constantdomain 1mjuH2(b112)

Macromomycin1noaA (b171)

免疫グロブリン分子はH鎖とL鎖から

なりそれぞれ免疫グロブリン様ドメインからできている

V

C

V

C

C

C

V

CV

CC

C

L鎖

H鎖H鎖 L鎖

細胞表面あるいは分泌蛋白質が多い免疫や分子認識に関する機能を担うことが多い

4本のβストランドからなるβシートが二枚サンドイッチ状に重なった構造をとる逆平行のβシートが主

P‐loop スーパーファミリーP‐loop nucleoside triphosphate hydrolase(c37)

Ras-related protein RAB-5A1r2qA(c3718)

Guanylate kinase1gkyA(c3711)

RecA proteinDomain1 1xmsA1(c37111)

平行のβシートが主トポロジーには様々な変異あり

シグナル伝達DNA結合

モーター機能など多彩な分子機能を担うがATP GTPなどのヌクレオシド

の加水分解を行う点は共通

N C

132 4 5 6

ヌクレオシド結合部GxxxxGKTの

配列モチーフ(P-loop)を持つ

ロスマン フォールドNAD(P)‐binding Rossmann‐fold domains (c2)

Alcohol dehydrogenase gamma chaindomain2 1u3wA(c211)

Aspartate beta-semialdehydedehydrogenase2gz1A1(c213)

L-alanine dehydrogenase1pjcA1(c214)

補酵素を利用したNAD(P)を脱水素酵素を持つ基質を認識するドメインは別に存在する

NC

123 4 5 6

平行のβシートが主

7枚羽 βプロペラ7‐bladed beta‐propeller (b69)

Garactose oxydasedomain3 1k3iA3(b6911)

Guanine nucleotide-bindingprotein subunit beta-11gotB(b6941)

細胞膜付近のシグナル伝達や糖結合に関わることが多い

Influenza Neuraminidase 1f8dA(b6811)

6枚羽 βプロペラ

N C

321 4

のユニットが7回円環状に繰り返しされたフォールド

立体構造比較プログラム1990年ごろから多くの構造比較プログラムが開発されている

WEBアドレス スコア アライメント

DALI httpwwwebiacukdali

距離の差を独自の関数で変換したスコア

局所アライメントをモンテカルロ法でつなぎ合わせる

CE httpclsdsceducehtml

局所的なRMSD 局所アライメントを積み上げていく

MATRAS httpbiunitnaistjpmatras

距離の変化が相同相似で起こる確率の比をスコアとする

SSEで仮アライメント

を生成残基アライメントを収束するまで反復する

タンパク質の相同性の判断基準

100

同一残基率30以上

BLASTのE-value lt 00001

PSI-BLASTのE-value lt 00001

0102030407025 15 535

同一残基率(Sequence Identity)()

立体構造比較が必要

(1)立体構造の類似性が高い(DALIのZスコアMATRASのRdisスコア)(2)同一残基率がそこそこ高い(PSI-BLASTでヒットするSeqIDgt=15ぐらい)

(3)分子機能に類似性がある(補酵素酵素反応基質代謝経路等の共通性等)(4)基質補酵素の結合部位が類似しておりそのアミノ酸が保存(モチーフ)(5)ドメイン構成の共通性(6)スーパーフォールドの場合は特別な注意が必要

配列解析

同一残基率が25以下の場合の相同性の判断基準

50608090

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 40: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

配列比較によるタンパク質分類1970年代から配列の一致度(sequence identity)に基づいてグループを作る作業が

行われてきた

どのくらいの類似性で一つにまとめるかは様々な考えがあるが少なくとも「相同なタンパク質群」を一つのグループにまとめるべき

ファミリー(family 族)

進化的に関係のある(相同な)タンパク質グループのこと

複数のファミリーがあつまった大きなグループ スーパーファミリー(superfamily clan)

一つのファミリーの中の小さなグループ サブファミリー(subfamily)

family

subfamily superfamily

ドメイン単位による分類

A2 B2

B3 C3

A1

配列1

配列2

配列3

配列の部分どうしだけが類似していた場合 部分一致を重視するとすべて一つのグループになるがhellip

配列1

配列2 配列3

Aを共有

Bを共有

1と2が類似2と3が類似していても1と3は類似していない

ドメインに分割すると

A1

A2

B2

B3

C3

A2 B2

B3 C3

A1

きれいに分類することができる

Pfam 蛋白質ファミリのデータベース各蛋白質ファミリのマルチプル

アライメント HMMなどを集めたデータベース

httppfamsangeracuk

Pkinase_Tyrドメインをもつタンパク質の例

ABL_HUMAN

BTK_HUMAN

ILK_HUMAN

MERTK_HUMAN

PGFRB_HUMAN

HCK_HUMAN

Family Pkinase_Tyr (PF07714) Protein tyrosine kinase

Pfamデータベース(httppfamsangeracukSoftwarePfam)からの引用

ドメイン構造と疎水性の関係Tyrosine protein kinase HCK (1ad5A HCK_HUMAN)

SH3 domain

SH2 domain

Tyrosine-kinase domain

3つの分断された疎水性コアrarr ドメイン構造

大きなタンパク質はいくつかの構造上のまとまり(ドメイン)を持つことが多い

立体構造によるタンパク質の分類

bull 配列による分類の延長ドメイン単位の分類進化的に関係のある(相同な)タンパク質を群にする(ファミリー)という考え方は同じ

bull 立体構造の類似性からより遠縁の相同性を見つけより大きな群を作る(スーパーファミリー)

bull スーパーファミリーをまとめたさらに大きなグループ(フォールドクラス)

bull 主にアミノ酸(Cαレベル)のラフな構造の類似性に

着目

bull 分類対象は主に球状タンパク質

立体構造分類データベースSCOPhttpscopmrc-lmbcamacukscop

4階層で分類Class(クラス)

Fold(フォールド)

Superfamily(スーパーファミリー)

Family(ファミリー)

どの階層に分類するかは配列の類似性立体構造の類似性分子機能の類似性機能部位の類似性

を専門家が総合的に判断して決める

1akr

ltホモロジーgt

ltアナロジーgt

他の構造分類データベースとしてCATHが有名

同様に階層的な分類体系を持つがその詳細はSCOPとは異なる

クラス

1mbd

1mqkH

1n55A 1pqwA

1fxd 1a2p

all-α (a)

all-β (b)

αβ (c)

α+β (d)

α-へリックスが中心

β-シートが中心

逆平行が多い

α-へリックスとβ-シートが配列上交互に現れる平行β-シートが中心

α-へリックスとβ-シートが混在配列上の並びの規則はない逆平行と平行のβ-シートが混在

アミノ酸配列と立体構造の関係ピロリ菌と大腸菌のフラボドキシン (同一残基率 SeqID 44)

ピロリ菌(1fueA) 大腸菌(1ag9A)

配列が似ていれば立体構造も似ている

SeqID = 44

RMSD = 12 Å

1fueA 2GKIGIFFGTDSGNAEAIAEKISKAIG--NAEVVDVAKASKEQFNGFTKVILVAPTAGAGD59

1ag9A 2AITGIFFGSDTGNTENIAKMIQKQLGKDVADVHDIAKSSKEDLEAYDILLLGIPTWYYGE61

1fueA 60LQTDWEDFLGTLEASD-FANKTIGLVGLGDQDTYSETFAEGIFHIYEKAK--AGKVVGQT116

1ag9A 62AQCDWDDFFPTLE-EIDFNGKLVALFGCGDQEDYAEYFCDALGTIRDIIEPRGATIVGHW120

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C 14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

BLAST

PSI-BLAST 構造比較

構造比較

アミノ酸配列がほとんど似ていなくても立体構造は似ている場合がある

構造は配列より進化的に保存がよい 構造比較から新たなホモログが発見できる可能性

立体

構造

の変

アミノ酸配列の変化と立体構造の変化の相関(グロビン族)

立体構造の変化はアミノ酸配列の変化と相関配列が30以上一致していればRMSDは2Å以下

アミノ酸配列の類似度

2つの構造の類似性

ホモロジー (homology 相同)進化的起源を共有することによる類似多くの場合分子機能なども類似している

アナロジー (analogy 相似)進化的起源とは無関係な類似多くの場合分子機能など他の属性は似ていない物理化学的な構造の偏好が原因とされる

イルカの胸びれ サルの前足

チョウの羽 トリの翼

ネコの前足

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C

ldquoFlavodoxin-likerdquo fold (c23)

ldquoFlavoproteinsrdquo superfamily (c235)

ldquoCheY-likerdquosuperfamily(c231)

14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

AnalogyHomology

HomologyHomolo

gy

多く現れるフォールド(出現ドメイン数順)

太字はスーパーフォールド多くのスーパーファミリーを含むフォールド

d58

c1

g3

c23 b34

b1

a4フォールド名 (SCOP173によるクラスfhijkは除く) ドメイ

ンの数

スーパーファミリーの数

a4 DNARNA-binding 3-helical bundle 292 14c1 TIM betaalpha-barrel 269 33d58 Ferredoxin-like 248 55b1 Immunoglobulin-like beta sandwich 246 27c37 P-loop nucleoside triphosphate hydrolase 235 1c2 NAD(P)-binding Rossmann-fold domains 168 1g3 Knottins 154 19d15 Beta-Grasp(ubiquitin-like) 131 13c23 Flavodoxin-like 118 15b34 SH3-like barrel 117 18b40 OB-fold 100 12c66 SAM-dependent methyltransferases 95 1

c37 c2

d15

b40 c66

スーパーフォールド(Superfold)

フォールド名 (SCOP173によるクラスfhijkは除く) その下のスーパーファミリーの数

d58 Ferredoxin-like 55c1 TIM betaalpha-barrel 33b1 Immunoglobulin-like beta sandwich 27a24 Four-helical up-and-down bundle 27a118 Alpha-alpha superhelix 23g3 Knottins 19b34 SH3-like barrel 18g41 Rubredoxin-like 16c23 Flavodoxin-like 15a60 SAM(sterile alpha motif) domain-like 15b69 7-bladed beta-propeller 14a4 DNARNA-binding 3-helical bundle 14

スーパーフォールド多くのスーパーファミリーを含むフォールド

スーパーフォールドは「構造の類似と機能の類似が対応しにくいフォールド」ともいえる

d58

c1

g3a118

c23

a24

a60

b34

b1

g41

b69 a4

三本へリックスバンドルDNARNA‐binding 3‐helical bundle(a4)

Mating type protein A2 yeast(1k61Aa411)

(1gvdAa413)(1wh5Aa411)

三本のへリックスが束になった構造DNAやRNAに結合する蛋白質が多い

DNAと

結合した構造(1k61)

TIMバレルTIM betaalpha barrel (c1)

Triosephosphate isomerase1n55A(c111)

全般に解糖系の酵素が多い基質酵素反応は極めて多彩

八本のβストランドとαへリックスが交互に組み合わさり対称的な樽(barrel)構造を形成す

る中央の樽構造は平行のβシートからなる

Imidazole glycerol phosphate synthasesubunit hisF1thfD(c121)

KHGKDPG aldolase1euaA(c1101)

フェレドキシン様Ferredoxin‐like (d58)

4Fe-4S Ferredoxin(1fxdd581)

1 234 4本の逆平行のβストランドと2本のαへリックスからな

分子機能は極めて多彩

CheY binding domain of CheA(1eayCd5824)

U1A RNA binding domain(1nu4Ad5871)

免疫グロブリン様Immunoglobulin‐like beta sandwich(b1)

Immunoglobulin Heavy chain variabledomain 1mjuH1(b111)

Immunoglobulin Heavy chain constantdomain 1mjuH2(b112)

Macromomycin1noaA (b171)

免疫グロブリン分子はH鎖とL鎖から

なりそれぞれ免疫グロブリン様ドメインからできている

V

C

V

C

C

C

V

CV

CC

C

L鎖

H鎖H鎖 L鎖

細胞表面あるいは分泌蛋白質が多い免疫や分子認識に関する機能を担うことが多い

4本のβストランドからなるβシートが二枚サンドイッチ状に重なった構造をとる逆平行のβシートが主

P‐loop スーパーファミリーP‐loop nucleoside triphosphate hydrolase(c37)

Ras-related protein RAB-5A1r2qA(c3718)

Guanylate kinase1gkyA(c3711)

RecA proteinDomain1 1xmsA1(c37111)

平行のβシートが主トポロジーには様々な変異あり

シグナル伝達DNA結合

モーター機能など多彩な分子機能を担うがATP GTPなどのヌクレオシド

の加水分解を行う点は共通

N C

132 4 5 6

ヌクレオシド結合部GxxxxGKTの

配列モチーフ(P-loop)を持つ

ロスマン フォールドNAD(P)‐binding Rossmann‐fold domains (c2)

Alcohol dehydrogenase gamma chaindomain2 1u3wA(c211)

Aspartate beta-semialdehydedehydrogenase2gz1A1(c213)

L-alanine dehydrogenase1pjcA1(c214)

補酵素を利用したNAD(P)を脱水素酵素を持つ基質を認識するドメインは別に存在する

NC

123 4 5 6

平行のβシートが主

7枚羽 βプロペラ7‐bladed beta‐propeller (b69)

Garactose oxydasedomain3 1k3iA3(b6911)

Guanine nucleotide-bindingprotein subunit beta-11gotB(b6941)

細胞膜付近のシグナル伝達や糖結合に関わることが多い

Influenza Neuraminidase 1f8dA(b6811)

6枚羽 βプロペラ

N C

321 4

のユニットが7回円環状に繰り返しされたフォールド

立体構造比較プログラム1990年ごろから多くの構造比較プログラムが開発されている

WEBアドレス スコア アライメント

DALI httpwwwebiacukdali

距離の差を独自の関数で変換したスコア

局所アライメントをモンテカルロ法でつなぎ合わせる

CE httpclsdsceducehtml

局所的なRMSD 局所アライメントを積み上げていく

MATRAS httpbiunitnaistjpmatras

距離の変化が相同相似で起こる確率の比をスコアとする

SSEで仮アライメント

を生成残基アライメントを収束するまで反復する

タンパク質の相同性の判断基準

100

同一残基率30以上

BLASTのE-value lt 00001

PSI-BLASTのE-value lt 00001

0102030407025 15 535

同一残基率(Sequence Identity)()

立体構造比較が必要

(1)立体構造の類似性が高い(DALIのZスコアMATRASのRdisスコア)(2)同一残基率がそこそこ高い(PSI-BLASTでヒットするSeqIDgt=15ぐらい)

(3)分子機能に類似性がある(補酵素酵素反応基質代謝経路等の共通性等)(4)基質補酵素の結合部位が類似しておりそのアミノ酸が保存(モチーフ)(5)ドメイン構成の共通性(6)スーパーフォールドの場合は特別な注意が必要

配列解析

同一残基率が25以下の場合の相同性の判断基準

50608090

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 41: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

ドメイン単位による分類

A2 B2

B3 C3

A1

配列1

配列2

配列3

配列の部分どうしだけが類似していた場合 部分一致を重視するとすべて一つのグループになるがhellip

配列1

配列2 配列3

Aを共有

Bを共有

1と2が類似2と3が類似していても1と3は類似していない

ドメインに分割すると

A1

A2

B2

B3

C3

A2 B2

B3 C3

A1

きれいに分類することができる

Pfam 蛋白質ファミリのデータベース各蛋白質ファミリのマルチプル

アライメント HMMなどを集めたデータベース

httppfamsangeracuk

Pkinase_Tyrドメインをもつタンパク質の例

ABL_HUMAN

BTK_HUMAN

ILK_HUMAN

MERTK_HUMAN

PGFRB_HUMAN

HCK_HUMAN

Family Pkinase_Tyr (PF07714) Protein tyrosine kinase

Pfamデータベース(httppfamsangeracukSoftwarePfam)からの引用

ドメイン構造と疎水性の関係Tyrosine protein kinase HCK (1ad5A HCK_HUMAN)

SH3 domain

SH2 domain

Tyrosine-kinase domain

3つの分断された疎水性コアrarr ドメイン構造

大きなタンパク質はいくつかの構造上のまとまり(ドメイン)を持つことが多い

立体構造によるタンパク質の分類

bull 配列による分類の延長ドメイン単位の分類進化的に関係のある(相同な)タンパク質を群にする(ファミリー)という考え方は同じ

bull 立体構造の類似性からより遠縁の相同性を見つけより大きな群を作る(スーパーファミリー)

bull スーパーファミリーをまとめたさらに大きなグループ(フォールドクラス)

bull 主にアミノ酸(Cαレベル)のラフな構造の類似性に

着目

bull 分類対象は主に球状タンパク質

立体構造分類データベースSCOPhttpscopmrc-lmbcamacukscop

4階層で分類Class(クラス)

Fold(フォールド)

Superfamily(スーパーファミリー)

Family(ファミリー)

どの階層に分類するかは配列の類似性立体構造の類似性分子機能の類似性機能部位の類似性

を専門家が総合的に判断して決める

1akr

ltホモロジーgt

ltアナロジーgt

他の構造分類データベースとしてCATHが有名

同様に階層的な分類体系を持つがその詳細はSCOPとは異なる

クラス

1mbd

1mqkH

1n55A 1pqwA

1fxd 1a2p

all-α (a)

all-β (b)

αβ (c)

α+β (d)

α-へリックスが中心

β-シートが中心

逆平行が多い

α-へリックスとβ-シートが配列上交互に現れる平行β-シートが中心

α-へリックスとβ-シートが混在配列上の並びの規則はない逆平行と平行のβ-シートが混在

アミノ酸配列と立体構造の関係ピロリ菌と大腸菌のフラボドキシン (同一残基率 SeqID 44)

ピロリ菌(1fueA) 大腸菌(1ag9A)

配列が似ていれば立体構造も似ている

SeqID = 44

RMSD = 12 Å

1fueA 2GKIGIFFGTDSGNAEAIAEKISKAIG--NAEVVDVAKASKEQFNGFTKVILVAPTAGAGD59

1ag9A 2AITGIFFGSDTGNTENIAKMIQKQLGKDVADVHDIAKSSKEDLEAYDILLLGIPTWYYGE61

1fueA 60LQTDWEDFLGTLEASD-FANKTIGLVGLGDQDTYSETFAEGIFHIYEKAK--AGKVVGQT116

1ag9A 62AQCDWDDFFPTLE-EIDFNGKLVALFGCGDQEDYAEYFCDALGTIRDIIEPRGATIVGHW120

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C 14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

BLAST

PSI-BLAST 構造比較

構造比較

アミノ酸配列がほとんど似ていなくても立体構造は似ている場合がある

構造は配列より進化的に保存がよい 構造比較から新たなホモログが発見できる可能性

立体

構造

の変

アミノ酸配列の変化と立体構造の変化の相関(グロビン族)

立体構造の変化はアミノ酸配列の変化と相関配列が30以上一致していればRMSDは2Å以下

アミノ酸配列の類似度

2つの構造の類似性

ホモロジー (homology 相同)進化的起源を共有することによる類似多くの場合分子機能なども類似している

アナロジー (analogy 相似)進化的起源とは無関係な類似多くの場合分子機能など他の属性は似ていない物理化学的な構造の偏好が原因とされる

イルカの胸びれ サルの前足

チョウの羽 トリの翼

ネコの前足

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C

ldquoFlavodoxin-likerdquo fold (c23)

ldquoFlavoproteinsrdquo superfamily (c235)

ldquoCheY-likerdquosuperfamily(c231)

14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

AnalogyHomology

HomologyHomolo

gy

多く現れるフォールド(出現ドメイン数順)

太字はスーパーフォールド多くのスーパーファミリーを含むフォールド

d58

c1

g3

c23 b34

b1

a4フォールド名 (SCOP173によるクラスfhijkは除く) ドメイ

ンの数

スーパーファミリーの数

a4 DNARNA-binding 3-helical bundle 292 14c1 TIM betaalpha-barrel 269 33d58 Ferredoxin-like 248 55b1 Immunoglobulin-like beta sandwich 246 27c37 P-loop nucleoside triphosphate hydrolase 235 1c2 NAD(P)-binding Rossmann-fold domains 168 1g3 Knottins 154 19d15 Beta-Grasp(ubiquitin-like) 131 13c23 Flavodoxin-like 118 15b34 SH3-like barrel 117 18b40 OB-fold 100 12c66 SAM-dependent methyltransferases 95 1

c37 c2

d15

b40 c66

スーパーフォールド(Superfold)

フォールド名 (SCOP173によるクラスfhijkは除く) その下のスーパーファミリーの数

d58 Ferredoxin-like 55c1 TIM betaalpha-barrel 33b1 Immunoglobulin-like beta sandwich 27a24 Four-helical up-and-down bundle 27a118 Alpha-alpha superhelix 23g3 Knottins 19b34 SH3-like barrel 18g41 Rubredoxin-like 16c23 Flavodoxin-like 15a60 SAM(sterile alpha motif) domain-like 15b69 7-bladed beta-propeller 14a4 DNARNA-binding 3-helical bundle 14

スーパーフォールド多くのスーパーファミリーを含むフォールド

スーパーフォールドは「構造の類似と機能の類似が対応しにくいフォールド」ともいえる

d58

c1

g3a118

c23

a24

a60

b34

b1

g41

b69 a4

三本へリックスバンドルDNARNA‐binding 3‐helical bundle(a4)

Mating type protein A2 yeast(1k61Aa411)

(1gvdAa413)(1wh5Aa411)

三本のへリックスが束になった構造DNAやRNAに結合する蛋白質が多い

DNAと

結合した構造(1k61)

TIMバレルTIM betaalpha barrel (c1)

Triosephosphate isomerase1n55A(c111)

全般に解糖系の酵素が多い基質酵素反応は極めて多彩

八本のβストランドとαへリックスが交互に組み合わさり対称的な樽(barrel)構造を形成す

る中央の樽構造は平行のβシートからなる

Imidazole glycerol phosphate synthasesubunit hisF1thfD(c121)

KHGKDPG aldolase1euaA(c1101)

フェレドキシン様Ferredoxin‐like (d58)

4Fe-4S Ferredoxin(1fxdd581)

1 234 4本の逆平行のβストランドと2本のαへリックスからな

分子機能は極めて多彩

CheY binding domain of CheA(1eayCd5824)

U1A RNA binding domain(1nu4Ad5871)

免疫グロブリン様Immunoglobulin‐like beta sandwich(b1)

Immunoglobulin Heavy chain variabledomain 1mjuH1(b111)

Immunoglobulin Heavy chain constantdomain 1mjuH2(b112)

Macromomycin1noaA (b171)

免疫グロブリン分子はH鎖とL鎖から

なりそれぞれ免疫グロブリン様ドメインからできている

V

C

V

C

C

C

V

CV

CC

C

L鎖

H鎖H鎖 L鎖

細胞表面あるいは分泌蛋白質が多い免疫や分子認識に関する機能を担うことが多い

4本のβストランドからなるβシートが二枚サンドイッチ状に重なった構造をとる逆平行のβシートが主

P‐loop スーパーファミリーP‐loop nucleoside triphosphate hydrolase(c37)

Ras-related protein RAB-5A1r2qA(c3718)

Guanylate kinase1gkyA(c3711)

RecA proteinDomain1 1xmsA1(c37111)

平行のβシートが主トポロジーには様々な変異あり

シグナル伝達DNA結合

モーター機能など多彩な分子機能を担うがATP GTPなどのヌクレオシド

の加水分解を行う点は共通

N C

132 4 5 6

ヌクレオシド結合部GxxxxGKTの

配列モチーフ(P-loop)を持つ

ロスマン フォールドNAD(P)‐binding Rossmann‐fold domains (c2)

Alcohol dehydrogenase gamma chaindomain2 1u3wA(c211)

Aspartate beta-semialdehydedehydrogenase2gz1A1(c213)

L-alanine dehydrogenase1pjcA1(c214)

補酵素を利用したNAD(P)を脱水素酵素を持つ基質を認識するドメインは別に存在する

NC

123 4 5 6

平行のβシートが主

7枚羽 βプロペラ7‐bladed beta‐propeller (b69)

Garactose oxydasedomain3 1k3iA3(b6911)

Guanine nucleotide-bindingprotein subunit beta-11gotB(b6941)

細胞膜付近のシグナル伝達や糖結合に関わることが多い

Influenza Neuraminidase 1f8dA(b6811)

6枚羽 βプロペラ

N C

321 4

のユニットが7回円環状に繰り返しされたフォールド

立体構造比較プログラム1990年ごろから多くの構造比較プログラムが開発されている

WEBアドレス スコア アライメント

DALI httpwwwebiacukdali

距離の差を独自の関数で変換したスコア

局所アライメントをモンテカルロ法でつなぎ合わせる

CE httpclsdsceducehtml

局所的なRMSD 局所アライメントを積み上げていく

MATRAS httpbiunitnaistjpmatras

距離の変化が相同相似で起こる確率の比をスコアとする

SSEで仮アライメント

を生成残基アライメントを収束するまで反復する

タンパク質の相同性の判断基準

100

同一残基率30以上

BLASTのE-value lt 00001

PSI-BLASTのE-value lt 00001

0102030407025 15 535

同一残基率(Sequence Identity)()

立体構造比較が必要

(1)立体構造の類似性が高い(DALIのZスコアMATRASのRdisスコア)(2)同一残基率がそこそこ高い(PSI-BLASTでヒットするSeqIDgt=15ぐらい)

(3)分子機能に類似性がある(補酵素酵素反応基質代謝経路等の共通性等)(4)基質補酵素の結合部位が類似しておりそのアミノ酸が保存(モチーフ)(5)ドメイン構成の共通性(6)スーパーフォールドの場合は特別な注意が必要

配列解析

同一残基率が25以下の場合の相同性の判断基準

50608090

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 42: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

Pfam 蛋白質ファミリのデータベース各蛋白質ファミリのマルチプル

アライメント HMMなどを集めたデータベース

httppfamsangeracuk

Pkinase_Tyrドメインをもつタンパク質の例

ABL_HUMAN

BTK_HUMAN

ILK_HUMAN

MERTK_HUMAN

PGFRB_HUMAN

HCK_HUMAN

Family Pkinase_Tyr (PF07714) Protein tyrosine kinase

Pfamデータベース(httppfamsangeracukSoftwarePfam)からの引用

ドメイン構造と疎水性の関係Tyrosine protein kinase HCK (1ad5A HCK_HUMAN)

SH3 domain

SH2 domain

Tyrosine-kinase domain

3つの分断された疎水性コアrarr ドメイン構造

大きなタンパク質はいくつかの構造上のまとまり(ドメイン)を持つことが多い

立体構造によるタンパク質の分類

bull 配列による分類の延長ドメイン単位の分類進化的に関係のある(相同な)タンパク質を群にする(ファミリー)という考え方は同じ

bull 立体構造の類似性からより遠縁の相同性を見つけより大きな群を作る(スーパーファミリー)

bull スーパーファミリーをまとめたさらに大きなグループ(フォールドクラス)

bull 主にアミノ酸(Cαレベル)のラフな構造の類似性に

着目

bull 分類対象は主に球状タンパク質

立体構造分類データベースSCOPhttpscopmrc-lmbcamacukscop

4階層で分類Class(クラス)

Fold(フォールド)

Superfamily(スーパーファミリー)

Family(ファミリー)

どの階層に分類するかは配列の類似性立体構造の類似性分子機能の類似性機能部位の類似性

を専門家が総合的に判断して決める

1akr

ltホモロジーgt

ltアナロジーgt

他の構造分類データベースとしてCATHが有名

同様に階層的な分類体系を持つがその詳細はSCOPとは異なる

クラス

1mbd

1mqkH

1n55A 1pqwA

1fxd 1a2p

all-α (a)

all-β (b)

αβ (c)

α+β (d)

α-へリックスが中心

β-シートが中心

逆平行が多い

α-へリックスとβ-シートが配列上交互に現れる平行β-シートが中心

α-へリックスとβ-シートが混在配列上の並びの規則はない逆平行と平行のβ-シートが混在

アミノ酸配列と立体構造の関係ピロリ菌と大腸菌のフラボドキシン (同一残基率 SeqID 44)

ピロリ菌(1fueA) 大腸菌(1ag9A)

配列が似ていれば立体構造も似ている

SeqID = 44

RMSD = 12 Å

1fueA 2GKIGIFFGTDSGNAEAIAEKISKAIG--NAEVVDVAKASKEQFNGFTKVILVAPTAGAGD59

1ag9A 2AITGIFFGSDTGNTENIAKMIQKQLGKDVADVHDIAKSSKEDLEAYDILLLGIPTWYYGE61

1fueA 60LQTDWEDFLGTLEASD-FANKTIGLVGLGDQDTYSETFAEGIFHIYEKAK--AGKVVGQT116

1ag9A 62AQCDWDDFFPTLE-EIDFNGKLVALFGCGDQEDYAEYFCDALGTIRDIIEPRGATIVGHW120

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C 14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

BLAST

PSI-BLAST 構造比較

構造比較

アミノ酸配列がほとんど似ていなくても立体構造は似ている場合がある

構造は配列より進化的に保存がよい 構造比較から新たなホモログが発見できる可能性

立体

構造

の変

アミノ酸配列の変化と立体構造の変化の相関(グロビン族)

立体構造の変化はアミノ酸配列の変化と相関配列が30以上一致していればRMSDは2Å以下

アミノ酸配列の類似度

2つの構造の類似性

ホモロジー (homology 相同)進化的起源を共有することによる類似多くの場合分子機能なども類似している

アナロジー (analogy 相似)進化的起源とは無関係な類似多くの場合分子機能など他の属性は似ていない物理化学的な構造の偏好が原因とされる

イルカの胸びれ サルの前足

チョウの羽 トリの翼

ネコの前足

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C

ldquoFlavodoxin-likerdquo fold (c23)

ldquoFlavoproteinsrdquo superfamily (c235)

ldquoCheY-likerdquosuperfamily(c231)

14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

AnalogyHomology

HomologyHomolo

gy

多く現れるフォールド(出現ドメイン数順)

太字はスーパーフォールド多くのスーパーファミリーを含むフォールド

d58

c1

g3

c23 b34

b1

a4フォールド名 (SCOP173によるクラスfhijkは除く) ドメイ

ンの数

スーパーファミリーの数

a4 DNARNA-binding 3-helical bundle 292 14c1 TIM betaalpha-barrel 269 33d58 Ferredoxin-like 248 55b1 Immunoglobulin-like beta sandwich 246 27c37 P-loop nucleoside triphosphate hydrolase 235 1c2 NAD(P)-binding Rossmann-fold domains 168 1g3 Knottins 154 19d15 Beta-Grasp(ubiquitin-like) 131 13c23 Flavodoxin-like 118 15b34 SH3-like barrel 117 18b40 OB-fold 100 12c66 SAM-dependent methyltransferases 95 1

c37 c2

d15

b40 c66

スーパーフォールド(Superfold)

フォールド名 (SCOP173によるクラスfhijkは除く) その下のスーパーファミリーの数

d58 Ferredoxin-like 55c1 TIM betaalpha-barrel 33b1 Immunoglobulin-like beta sandwich 27a24 Four-helical up-and-down bundle 27a118 Alpha-alpha superhelix 23g3 Knottins 19b34 SH3-like barrel 18g41 Rubredoxin-like 16c23 Flavodoxin-like 15a60 SAM(sterile alpha motif) domain-like 15b69 7-bladed beta-propeller 14a4 DNARNA-binding 3-helical bundle 14

スーパーフォールド多くのスーパーファミリーを含むフォールド

スーパーフォールドは「構造の類似と機能の類似が対応しにくいフォールド」ともいえる

d58

c1

g3a118

c23

a24

a60

b34

b1

g41

b69 a4

三本へリックスバンドルDNARNA‐binding 3‐helical bundle(a4)

Mating type protein A2 yeast(1k61Aa411)

(1gvdAa413)(1wh5Aa411)

三本のへリックスが束になった構造DNAやRNAに結合する蛋白質が多い

DNAと

結合した構造(1k61)

TIMバレルTIM betaalpha barrel (c1)

Triosephosphate isomerase1n55A(c111)

全般に解糖系の酵素が多い基質酵素反応は極めて多彩

八本のβストランドとαへリックスが交互に組み合わさり対称的な樽(barrel)構造を形成す

る中央の樽構造は平行のβシートからなる

Imidazole glycerol phosphate synthasesubunit hisF1thfD(c121)

KHGKDPG aldolase1euaA(c1101)

フェレドキシン様Ferredoxin‐like (d58)

4Fe-4S Ferredoxin(1fxdd581)

1 234 4本の逆平行のβストランドと2本のαへリックスからな

分子機能は極めて多彩

CheY binding domain of CheA(1eayCd5824)

U1A RNA binding domain(1nu4Ad5871)

免疫グロブリン様Immunoglobulin‐like beta sandwich(b1)

Immunoglobulin Heavy chain variabledomain 1mjuH1(b111)

Immunoglobulin Heavy chain constantdomain 1mjuH2(b112)

Macromomycin1noaA (b171)

免疫グロブリン分子はH鎖とL鎖から

なりそれぞれ免疫グロブリン様ドメインからできている

V

C

V

C

C

C

V

CV

CC

C

L鎖

H鎖H鎖 L鎖

細胞表面あるいは分泌蛋白質が多い免疫や分子認識に関する機能を担うことが多い

4本のβストランドからなるβシートが二枚サンドイッチ状に重なった構造をとる逆平行のβシートが主

P‐loop スーパーファミリーP‐loop nucleoside triphosphate hydrolase(c37)

Ras-related protein RAB-5A1r2qA(c3718)

Guanylate kinase1gkyA(c3711)

RecA proteinDomain1 1xmsA1(c37111)

平行のβシートが主トポロジーには様々な変異あり

シグナル伝達DNA結合

モーター機能など多彩な分子機能を担うがATP GTPなどのヌクレオシド

の加水分解を行う点は共通

N C

132 4 5 6

ヌクレオシド結合部GxxxxGKTの

配列モチーフ(P-loop)を持つ

ロスマン フォールドNAD(P)‐binding Rossmann‐fold domains (c2)

Alcohol dehydrogenase gamma chaindomain2 1u3wA(c211)

Aspartate beta-semialdehydedehydrogenase2gz1A1(c213)

L-alanine dehydrogenase1pjcA1(c214)

補酵素を利用したNAD(P)を脱水素酵素を持つ基質を認識するドメインは別に存在する

NC

123 4 5 6

平行のβシートが主

7枚羽 βプロペラ7‐bladed beta‐propeller (b69)

Garactose oxydasedomain3 1k3iA3(b6911)

Guanine nucleotide-bindingprotein subunit beta-11gotB(b6941)

細胞膜付近のシグナル伝達や糖結合に関わることが多い

Influenza Neuraminidase 1f8dA(b6811)

6枚羽 βプロペラ

N C

321 4

のユニットが7回円環状に繰り返しされたフォールド

立体構造比較プログラム1990年ごろから多くの構造比較プログラムが開発されている

WEBアドレス スコア アライメント

DALI httpwwwebiacukdali

距離の差を独自の関数で変換したスコア

局所アライメントをモンテカルロ法でつなぎ合わせる

CE httpclsdsceducehtml

局所的なRMSD 局所アライメントを積み上げていく

MATRAS httpbiunitnaistjpmatras

距離の変化が相同相似で起こる確率の比をスコアとする

SSEで仮アライメント

を生成残基アライメントを収束するまで反復する

タンパク質の相同性の判断基準

100

同一残基率30以上

BLASTのE-value lt 00001

PSI-BLASTのE-value lt 00001

0102030407025 15 535

同一残基率(Sequence Identity)()

立体構造比較が必要

(1)立体構造の類似性が高い(DALIのZスコアMATRASのRdisスコア)(2)同一残基率がそこそこ高い(PSI-BLASTでヒットするSeqIDgt=15ぐらい)

(3)分子機能に類似性がある(補酵素酵素反応基質代謝経路等の共通性等)(4)基質補酵素の結合部位が類似しておりそのアミノ酸が保存(モチーフ)(5)ドメイン構成の共通性(6)スーパーフォールドの場合は特別な注意が必要

配列解析

同一残基率が25以下の場合の相同性の判断基準

50608090

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 43: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

Pkinase_Tyrドメインをもつタンパク質の例

ABL_HUMAN

BTK_HUMAN

ILK_HUMAN

MERTK_HUMAN

PGFRB_HUMAN

HCK_HUMAN

Family Pkinase_Tyr (PF07714) Protein tyrosine kinase

Pfamデータベース(httppfamsangeracukSoftwarePfam)からの引用

ドメイン構造と疎水性の関係Tyrosine protein kinase HCK (1ad5A HCK_HUMAN)

SH3 domain

SH2 domain

Tyrosine-kinase domain

3つの分断された疎水性コアrarr ドメイン構造

大きなタンパク質はいくつかの構造上のまとまり(ドメイン)を持つことが多い

立体構造によるタンパク質の分類

bull 配列による分類の延長ドメイン単位の分類進化的に関係のある(相同な)タンパク質を群にする(ファミリー)という考え方は同じ

bull 立体構造の類似性からより遠縁の相同性を見つけより大きな群を作る(スーパーファミリー)

bull スーパーファミリーをまとめたさらに大きなグループ(フォールドクラス)

bull 主にアミノ酸(Cαレベル)のラフな構造の類似性に

着目

bull 分類対象は主に球状タンパク質

立体構造分類データベースSCOPhttpscopmrc-lmbcamacukscop

4階層で分類Class(クラス)

Fold(フォールド)

Superfamily(スーパーファミリー)

Family(ファミリー)

どの階層に分類するかは配列の類似性立体構造の類似性分子機能の類似性機能部位の類似性

を専門家が総合的に判断して決める

1akr

ltホモロジーgt

ltアナロジーgt

他の構造分類データベースとしてCATHが有名

同様に階層的な分類体系を持つがその詳細はSCOPとは異なる

クラス

1mbd

1mqkH

1n55A 1pqwA

1fxd 1a2p

all-α (a)

all-β (b)

αβ (c)

α+β (d)

α-へリックスが中心

β-シートが中心

逆平行が多い

α-へリックスとβ-シートが配列上交互に現れる平行β-シートが中心

α-へリックスとβ-シートが混在配列上の並びの規則はない逆平行と平行のβ-シートが混在

アミノ酸配列と立体構造の関係ピロリ菌と大腸菌のフラボドキシン (同一残基率 SeqID 44)

ピロリ菌(1fueA) 大腸菌(1ag9A)

配列が似ていれば立体構造も似ている

SeqID = 44

RMSD = 12 Å

1fueA 2GKIGIFFGTDSGNAEAIAEKISKAIG--NAEVVDVAKASKEQFNGFTKVILVAPTAGAGD59

1ag9A 2AITGIFFGSDTGNTENIAKMIQKQLGKDVADVHDIAKSSKEDLEAYDILLLGIPTWYYGE61

1fueA 60LQTDWEDFLGTLEASD-FANKTIGLVGLGDQDTYSETFAEGIFHIYEKAK--AGKVVGQT116

1ag9A 62AQCDWDDFFPTLE-EIDFNGKLVALFGCGDQEDYAEYFCDALGTIRDIIEPRGATIVGHW120

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C 14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

BLAST

PSI-BLAST 構造比較

構造比較

アミノ酸配列がほとんど似ていなくても立体構造は似ている場合がある

構造は配列より進化的に保存がよい 構造比較から新たなホモログが発見できる可能性

立体

構造

の変

アミノ酸配列の変化と立体構造の変化の相関(グロビン族)

立体構造の変化はアミノ酸配列の変化と相関配列が30以上一致していればRMSDは2Å以下

アミノ酸配列の類似度

2つの構造の類似性

ホモロジー (homology 相同)進化的起源を共有することによる類似多くの場合分子機能なども類似している

アナロジー (analogy 相似)進化的起源とは無関係な類似多くの場合分子機能など他の属性は似ていない物理化学的な構造の偏好が原因とされる

イルカの胸びれ サルの前足

チョウの羽 トリの翼

ネコの前足

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C

ldquoFlavodoxin-likerdquo fold (c23)

ldquoFlavoproteinsrdquo superfamily (c235)

ldquoCheY-likerdquosuperfamily(c231)

14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

AnalogyHomology

HomologyHomolo

gy

多く現れるフォールド(出現ドメイン数順)

太字はスーパーフォールド多くのスーパーファミリーを含むフォールド

d58

c1

g3

c23 b34

b1

a4フォールド名 (SCOP173によるクラスfhijkは除く) ドメイ

ンの数

スーパーファミリーの数

a4 DNARNA-binding 3-helical bundle 292 14c1 TIM betaalpha-barrel 269 33d58 Ferredoxin-like 248 55b1 Immunoglobulin-like beta sandwich 246 27c37 P-loop nucleoside triphosphate hydrolase 235 1c2 NAD(P)-binding Rossmann-fold domains 168 1g3 Knottins 154 19d15 Beta-Grasp(ubiquitin-like) 131 13c23 Flavodoxin-like 118 15b34 SH3-like barrel 117 18b40 OB-fold 100 12c66 SAM-dependent methyltransferases 95 1

c37 c2

d15

b40 c66

スーパーフォールド(Superfold)

フォールド名 (SCOP173によるクラスfhijkは除く) その下のスーパーファミリーの数

d58 Ferredoxin-like 55c1 TIM betaalpha-barrel 33b1 Immunoglobulin-like beta sandwich 27a24 Four-helical up-and-down bundle 27a118 Alpha-alpha superhelix 23g3 Knottins 19b34 SH3-like barrel 18g41 Rubredoxin-like 16c23 Flavodoxin-like 15a60 SAM(sterile alpha motif) domain-like 15b69 7-bladed beta-propeller 14a4 DNARNA-binding 3-helical bundle 14

スーパーフォールド多くのスーパーファミリーを含むフォールド

スーパーフォールドは「構造の類似と機能の類似が対応しにくいフォールド」ともいえる

d58

c1

g3a118

c23

a24

a60

b34

b1

g41

b69 a4

三本へリックスバンドルDNARNA‐binding 3‐helical bundle(a4)

Mating type protein A2 yeast(1k61Aa411)

(1gvdAa413)(1wh5Aa411)

三本のへリックスが束になった構造DNAやRNAに結合する蛋白質が多い

DNAと

結合した構造(1k61)

TIMバレルTIM betaalpha barrel (c1)

Triosephosphate isomerase1n55A(c111)

全般に解糖系の酵素が多い基質酵素反応は極めて多彩

八本のβストランドとαへリックスが交互に組み合わさり対称的な樽(barrel)構造を形成す

る中央の樽構造は平行のβシートからなる

Imidazole glycerol phosphate synthasesubunit hisF1thfD(c121)

KHGKDPG aldolase1euaA(c1101)

フェレドキシン様Ferredoxin‐like (d58)

4Fe-4S Ferredoxin(1fxdd581)

1 234 4本の逆平行のβストランドと2本のαへリックスからな

分子機能は極めて多彩

CheY binding domain of CheA(1eayCd5824)

U1A RNA binding domain(1nu4Ad5871)

免疫グロブリン様Immunoglobulin‐like beta sandwich(b1)

Immunoglobulin Heavy chain variabledomain 1mjuH1(b111)

Immunoglobulin Heavy chain constantdomain 1mjuH2(b112)

Macromomycin1noaA (b171)

免疫グロブリン分子はH鎖とL鎖から

なりそれぞれ免疫グロブリン様ドメインからできている

V

C

V

C

C

C

V

CV

CC

C

L鎖

H鎖H鎖 L鎖

細胞表面あるいは分泌蛋白質が多い免疫や分子認識に関する機能を担うことが多い

4本のβストランドからなるβシートが二枚サンドイッチ状に重なった構造をとる逆平行のβシートが主

P‐loop スーパーファミリーP‐loop nucleoside triphosphate hydrolase(c37)

Ras-related protein RAB-5A1r2qA(c3718)

Guanylate kinase1gkyA(c3711)

RecA proteinDomain1 1xmsA1(c37111)

平行のβシートが主トポロジーには様々な変異あり

シグナル伝達DNA結合

モーター機能など多彩な分子機能を担うがATP GTPなどのヌクレオシド

の加水分解を行う点は共通

N C

132 4 5 6

ヌクレオシド結合部GxxxxGKTの

配列モチーフ(P-loop)を持つ

ロスマン フォールドNAD(P)‐binding Rossmann‐fold domains (c2)

Alcohol dehydrogenase gamma chaindomain2 1u3wA(c211)

Aspartate beta-semialdehydedehydrogenase2gz1A1(c213)

L-alanine dehydrogenase1pjcA1(c214)

補酵素を利用したNAD(P)を脱水素酵素を持つ基質を認識するドメインは別に存在する

NC

123 4 5 6

平行のβシートが主

7枚羽 βプロペラ7‐bladed beta‐propeller (b69)

Garactose oxydasedomain3 1k3iA3(b6911)

Guanine nucleotide-bindingprotein subunit beta-11gotB(b6941)

細胞膜付近のシグナル伝達や糖結合に関わることが多い

Influenza Neuraminidase 1f8dA(b6811)

6枚羽 βプロペラ

N C

321 4

のユニットが7回円環状に繰り返しされたフォールド

立体構造比較プログラム1990年ごろから多くの構造比較プログラムが開発されている

WEBアドレス スコア アライメント

DALI httpwwwebiacukdali

距離の差を独自の関数で変換したスコア

局所アライメントをモンテカルロ法でつなぎ合わせる

CE httpclsdsceducehtml

局所的なRMSD 局所アライメントを積み上げていく

MATRAS httpbiunitnaistjpmatras

距離の変化が相同相似で起こる確率の比をスコアとする

SSEで仮アライメント

を生成残基アライメントを収束するまで反復する

タンパク質の相同性の判断基準

100

同一残基率30以上

BLASTのE-value lt 00001

PSI-BLASTのE-value lt 00001

0102030407025 15 535

同一残基率(Sequence Identity)()

立体構造比較が必要

(1)立体構造の類似性が高い(DALIのZスコアMATRASのRdisスコア)(2)同一残基率がそこそこ高い(PSI-BLASTでヒットするSeqIDgt=15ぐらい)

(3)分子機能に類似性がある(補酵素酵素反応基質代謝経路等の共通性等)(4)基質補酵素の結合部位が類似しておりそのアミノ酸が保存(モチーフ)(5)ドメイン構成の共通性(6)スーパーフォールドの場合は特別な注意が必要

配列解析

同一残基率が25以下の場合の相同性の判断基準

50608090

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 44: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

ドメイン構造と疎水性の関係Tyrosine protein kinase HCK (1ad5A HCK_HUMAN)

SH3 domain

SH2 domain

Tyrosine-kinase domain

3つの分断された疎水性コアrarr ドメイン構造

大きなタンパク質はいくつかの構造上のまとまり(ドメイン)を持つことが多い

立体構造によるタンパク質の分類

bull 配列による分類の延長ドメイン単位の分類進化的に関係のある(相同な)タンパク質を群にする(ファミリー)という考え方は同じ

bull 立体構造の類似性からより遠縁の相同性を見つけより大きな群を作る(スーパーファミリー)

bull スーパーファミリーをまとめたさらに大きなグループ(フォールドクラス)

bull 主にアミノ酸(Cαレベル)のラフな構造の類似性に

着目

bull 分類対象は主に球状タンパク質

立体構造分類データベースSCOPhttpscopmrc-lmbcamacukscop

4階層で分類Class(クラス)

Fold(フォールド)

Superfamily(スーパーファミリー)

Family(ファミリー)

どの階層に分類するかは配列の類似性立体構造の類似性分子機能の類似性機能部位の類似性

を専門家が総合的に判断して決める

1akr

ltホモロジーgt

ltアナロジーgt

他の構造分類データベースとしてCATHが有名

同様に階層的な分類体系を持つがその詳細はSCOPとは異なる

クラス

1mbd

1mqkH

1n55A 1pqwA

1fxd 1a2p

all-α (a)

all-β (b)

αβ (c)

α+β (d)

α-へリックスが中心

β-シートが中心

逆平行が多い

α-へリックスとβ-シートが配列上交互に現れる平行β-シートが中心

α-へリックスとβ-シートが混在配列上の並びの規則はない逆平行と平行のβ-シートが混在

アミノ酸配列と立体構造の関係ピロリ菌と大腸菌のフラボドキシン (同一残基率 SeqID 44)

ピロリ菌(1fueA) 大腸菌(1ag9A)

配列が似ていれば立体構造も似ている

SeqID = 44

RMSD = 12 Å

1fueA 2GKIGIFFGTDSGNAEAIAEKISKAIG--NAEVVDVAKASKEQFNGFTKVILVAPTAGAGD59

1ag9A 2AITGIFFGSDTGNTENIAKMIQKQLGKDVADVHDIAKSSKEDLEAYDILLLGIPTWYYGE61

1fueA 60LQTDWEDFLGTLEASD-FANKTIGLVGLGDQDTYSETFAEGIFHIYEKAK--AGKVVGQT116

1ag9A 62AQCDWDDFFPTLE-EIDFNGKLVALFGCGDQEDYAEYFCDALGTIRDIIEPRGATIVGHW120

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C 14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

BLAST

PSI-BLAST 構造比較

構造比較

アミノ酸配列がほとんど似ていなくても立体構造は似ている場合がある

構造は配列より進化的に保存がよい 構造比較から新たなホモログが発見できる可能性

立体

構造

の変

アミノ酸配列の変化と立体構造の変化の相関(グロビン族)

立体構造の変化はアミノ酸配列の変化と相関配列が30以上一致していればRMSDは2Å以下

アミノ酸配列の類似度

2つの構造の類似性

ホモロジー (homology 相同)進化的起源を共有することによる類似多くの場合分子機能なども類似している

アナロジー (analogy 相似)進化的起源とは無関係な類似多くの場合分子機能など他の属性は似ていない物理化学的な構造の偏好が原因とされる

イルカの胸びれ サルの前足

チョウの羽 トリの翼

ネコの前足

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C

ldquoFlavodoxin-likerdquo fold (c23)

ldquoFlavoproteinsrdquo superfamily (c235)

ldquoCheY-likerdquosuperfamily(c231)

14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

AnalogyHomology

HomologyHomolo

gy

多く現れるフォールド(出現ドメイン数順)

太字はスーパーフォールド多くのスーパーファミリーを含むフォールド

d58

c1

g3

c23 b34

b1

a4フォールド名 (SCOP173によるクラスfhijkは除く) ドメイ

ンの数

スーパーファミリーの数

a4 DNARNA-binding 3-helical bundle 292 14c1 TIM betaalpha-barrel 269 33d58 Ferredoxin-like 248 55b1 Immunoglobulin-like beta sandwich 246 27c37 P-loop nucleoside triphosphate hydrolase 235 1c2 NAD(P)-binding Rossmann-fold domains 168 1g3 Knottins 154 19d15 Beta-Grasp(ubiquitin-like) 131 13c23 Flavodoxin-like 118 15b34 SH3-like barrel 117 18b40 OB-fold 100 12c66 SAM-dependent methyltransferases 95 1

c37 c2

d15

b40 c66

スーパーフォールド(Superfold)

フォールド名 (SCOP173によるクラスfhijkは除く) その下のスーパーファミリーの数

d58 Ferredoxin-like 55c1 TIM betaalpha-barrel 33b1 Immunoglobulin-like beta sandwich 27a24 Four-helical up-and-down bundle 27a118 Alpha-alpha superhelix 23g3 Knottins 19b34 SH3-like barrel 18g41 Rubredoxin-like 16c23 Flavodoxin-like 15a60 SAM(sterile alpha motif) domain-like 15b69 7-bladed beta-propeller 14a4 DNARNA-binding 3-helical bundle 14

スーパーフォールド多くのスーパーファミリーを含むフォールド

スーパーフォールドは「構造の類似と機能の類似が対応しにくいフォールド」ともいえる

d58

c1

g3a118

c23

a24

a60

b34

b1

g41

b69 a4

三本へリックスバンドルDNARNA‐binding 3‐helical bundle(a4)

Mating type protein A2 yeast(1k61Aa411)

(1gvdAa413)(1wh5Aa411)

三本のへリックスが束になった構造DNAやRNAに結合する蛋白質が多い

DNAと

結合した構造(1k61)

TIMバレルTIM betaalpha barrel (c1)

Triosephosphate isomerase1n55A(c111)

全般に解糖系の酵素が多い基質酵素反応は極めて多彩

八本のβストランドとαへリックスが交互に組み合わさり対称的な樽(barrel)構造を形成す

る中央の樽構造は平行のβシートからなる

Imidazole glycerol phosphate synthasesubunit hisF1thfD(c121)

KHGKDPG aldolase1euaA(c1101)

フェレドキシン様Ferredoxin‐like (d58)

4Fe-4S Ferredoxin(1fxdd581)

1 234 4本の逆平行のβストランドと2本のαへリックスからな

分子機能は極めて多彩

CheY binding domain of CheA(1eayCd5824)

U1A RNA binding domain(1nu4Ad5871)

免疫グロブリン様Immunoglobulin‐like beta sandwich(b1)

Immunoglobulin Heavy chain variabledomain 1mjuH1(b111)

Immunoglobulin Heavy chain constantdomain 1mjuH2(b112)

Macromomycin1noaA (b171)

免疫グロブリン分子はH鎖とL鎖から

なりそれぞれ免疫グロブリン様ドメインからできている

V

C

V

C

C

C

V

CV

CC

C

L鎖

H鎖H鎖 L鎖

細胞表面あるいは分泌蛋白質が多い免疫や分子認識に関する機能を担うことが多い

4本のβストランドからなるβシートが二枚サンドイッチ状に重なった構造をとる逆平行のβシートが主

P‐loop スーパーファミリーP‐loop nucleoside triphosphate hydrolase(c37)

Ras-related protein RAB-5A1r2qA(c3718)

Guanylate kinase1gkyA(c3711)

RecA proteinDomain1 1xmsA1(c37111)

平行のβシートが主トポロジーには様々な変異あり

シグナル伝達DNA結合

モーター機能など多彩な分子機能を担うがATP GTPなどのヌクレオシド

の加水分解を行う点は共通

N C

132 4 5 6

ヌクレオシド結合部GxxxxGKTの

配列モチーフ(P-loop)を持つ

ロスマン フォールドNAD(P)‐binding Rossmann‐fold domains (c2)

Alcohol dehydrogenase gamma chaindomain2 1u3wA(c211)

Aspartate beta-semialdehydedehydrogenase2gz1A1(c213)

L-alanine dehydrogenase1pjcA1(c214)

補酵素を利用したNAD(P)を脱水素酵素を持つ基質を認識するドメインは別に存在する

NC

123 4 5 6

平行のβシートが主

7枚羽 βプロペラ7‐bladed beta‐propeller (b69)

Garactose oxydasedomain3 1k3iA3(b6911)

Guanine nucleotide-bindingprotein subunit beta-11gotB(b6941)

細胞膜付近のシグナル伝達や糖結合に関わることが多い

Influenza Neuraminidase 1f8dA(b6811)

6枚羽 βプロペラ

N C

321 4

のユニットが7回円環状に繰り返しされたフォールド

立体構造比較プログラム1990年ごろから多くの構造比較プログラムが開発されている

WEBアドレス スコア アライメント

DALI httpwwwebiacukdali

距離の差を独自の関数で変換したスコア

局所アライメントをモンテカルロ法でつなぎ合わせる

CE httpclsdsceducehtml

局所的なRMSD 局所アライメントを積み上げていく

MATRAS httpbiunitnaistjpmatras

距離の変化が相同相似で起こる確率の比をスコアとする

SSEで仮アライメント

を生成残基アライメントを収束するまで反復する

タンパク質の相同性の判断基準

100

同一残基率30以上

BLASTのE-value lt 00001

PSI-BLASTのE-value lt 00001

0102030407025 15 535

同一残基率(Sequence Identity)()

立体構造比較が必要

(1)立体構造の類似性が高い(DALIのZスコアMATRASのRdisスコア)(2)同一残基率がそこそこ高い(PSI-BLASTでヒットするSeqIDgt=15ぐらい)

(3)分子機能に類似性がある(補酵素酵素反応基質代謝経路等の共通性等)(4)基質補酵素の結合部位が類似しておりそのアミノ酸が保存(モチーフ)(5)ドメイン構成の共通性(6)スーパーフォールドの場合は特別な注意が必要

配列解析

同一残基率が25以下の場合の相同性の判断基準

50608090

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 45: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

立体構造によるタンパク質の分類

bull 配列による分類の延長ドメイン単位の分類進化的に関係のある(相同な)タンパク質を群にする(ファミリー)という考え方は同じ

bull 立体構造の類似性からより遠縁の相同性を見つけより大きな群を作る(スーパーファミリー)

bull スーパーファミリーをまとめたさらに大きなグループ(フォールドクラス)

bull 主にアミノ酸(Cαレベル)のラフな構造の類似性に

着目

bull 分類対象は主に球状タンパク質

立体構造分類データベースSCOPhttpscopmrc-lmbcamacukscop

4階層で分類Class(クラス)

Fold(フォールド)

Superfamily(スーパーファミリー)

Family(ファミリー)

どの階層に分類するかは配列の類似性立体構造の類似性分子機能の類似性機能部位の類似性

を専門家が総合的に判断して決める

1akr

ltホモロジーgt

ltアナロジーgt

他の構造分類データベースとしてCATHが有名

同様に階層的な分類体系を持つがその詳細はSCOPとは異なる

クラス

1mbd

1mqkH

1n55A 1pqwA

1fxd 1a2p

all-α (a)

all-β (b)

αβ (c)

α+β (d)

α-へリックスが中心

β-シートが中心

逆平行が多い

α-へリックスとβ-シートが配列上交互に現れる平行β-シートが中心

α-へリックスとβ-シートが混在配列上の並びの規則はない逆平行と平行のβ-シートが混在

アミノ酸配列と立体構造の関係ピロリ菌と大腸菌のフラボドキシン (同一残基率 SeqID 44)

ピロリ菌(1fueA) 大腸菌(1ag9A)

配列が似ていれば立体構造も似ている

SeqID = 44

RMSD = 12 Å

1fueA 2GKIGIFFGTDSGNAEAIAEKISKAIG--NAEVVDVAKASKEQFNGFTKVILVAPTAGAGD59

1ag9A 2AITGIFFGSDTGNTENIAKMIQKQLGKDVADVHDIAKSSKEDLEAYDILLLGIPTWYYGE61

1fueA 60LQTDWEDFLGTLEASD-FANKTIGLVGLGDQDTYSETFAEGIFHIYEKAK--AGKVVGQT116

1ag9A 62AQCDWDDFFPTLE-EIDFNGKLVALFGCGDQEDYAEYFCDALGTIRDIIEPRGATIVGHW120

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C 14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

BLAST

PSI-BLAST 構造比較

構造比較

アミノ酸配列がほとんど似ていなくても立体構造は似ている場合がある

構造は配列より進化的に保存がよい 構造比較から新たなホモログが発見できる可能性

立体

構造

の変

アミノ酸配列の変化と立体構造の変化の相関(グロビン族)

立体構造の変化はアミノ酸配列の変化と相関配列が30以上一致していればRMSDは2Å以下

アミノ酸配列の類似度

2つの構造の類似性

ホモロジー (homology 相同)進化的起源を共有することによる類似多くの場合分子機能なども類似している

アナロジー (analogy 相似)進化的起源とは無関係な類似多くの場合分子機能など他の属性は似ていない物理化学的な構造の偏好が原因とされる

イルカの胸びれ サルの前足

チョウの羽 トリの翼

ネコの前足

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C

ldquoFlavodoxin-likerdquo fold (c23)

ldquoFlavoproteinsrdquo superfamily (c235)

ldquoCheY-likerdquosuperfamily(c231)

14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

AnalogyHomology

HomologyHomolo

gy

多く現れるフォールド(出現ドメイン数順)

太字はスーパーフォールド多くのスーパーファミリーを含むフォールド

d58

c1

g3

c23 b34

b1

a4フォールド名 (SCOP173によるクラスfhijkは除く) ドメイ

ンの数

スーパーファミリーの数

a4 DNARNA-binding 3-helical bundle 292 14c1 TIM betaalpha-barrel 269 33d58 Ferredoxin-like 248 55b1 Immunoglobulin-like beta sandwich 246 27c37 P-loop nucleoside triphosphate hydrolase 235 1c2 NAD(P)-binding Rossmann-fold domains 168 1g3 Knottins 154 19d15 Beta-Grasp(ubiquitin-like) 131 13c23 Flavodoxin-like 118 15b34 SH3-like barrel 117 18b40 OB-fold 100 12c66 SAM-dependent methyltransferases 95 1

c37 c2

d15

b40 c66

スーパーフォールド(Superfold)

フォールド名 (SCOP173によるクラスfhijkは除く) その下のスーパーファミリーの数

d58 Ferredoxin-like 55c1 TIM betaalpha-barrel 33b1 Immunoglobulin-like beta sandwich 27a24 Four-helical up-and-down bundle 27a118 Alpha-alpha superhelix 23g3 Knottins 19b34 SH3-like barrel 18g41 Rubredoxin-like 16c23 Flavodoxin-like 15a60 SAM(sterile alpha motif) domain-like 15b69 7-bladed beta-propeller 14a4 DNARNA-binding 3-helical bundle 14

スーパーフォールド多くのスーパーファミリーを含むフォールド

スーパーフォールドは「構造の類似と機能の類似が対応しにくいフォールド」ともいえる

d58

c1

g3a118

c23

a24

a60

b34

b1

g41

b69 a4

三本へリックスバンドルDNARNA‐binding 3‐helical bundle(a4)

Mating type protein A2 yeast(1k61Aa411)

(1gvdAa413)(1wh5Aa411)

三本のへリックスが束になった構造DNAやRNAに結合する蛋白質が多い

DNAと

結合した構造(1k61)

TIMバレルTIM betaalpha barrel (c1)

Triosephosphate isomerase1n55A(c111)

全般に解糖系の酵素が多い基質酵素反応は極めて多彩

八本のβストランドとαへリックスが交互に組み合わさり対称的な樽(barrel)構造を形成す

る中央の樽構造は平行のβシートからなる

Imidazole glycerol phosphate synthasesubunit hisF1thfD(c121)

KHGKDPG aldolase1euaA(c1101)

フェレドキシン様Ferredoxin‐like (d58)

4Fe-4S Ferredoxin(1fxdd581)

1 234 4本の逆平行のβストランドと2本のαへリックスからな

分子機能は極めて多彩

CheY binding domain of CheA(1eayCd5824)

U1A RNA binding domain(1nu4Ad5871)

免疫グロブリン様Immunoglobulin‐like beta sandwich(b1)

Immunoglobulin Heavy chain variabledomain 1mjuH1(b111)

Immunoglobulin Heavy chain constantdomain 1mjuH2(b112)

Macromomycin1noaA (b171)

免疫グロブリン分子はH鎖とL鎖から

なりそれぞれ免疫グロブリン様ドメインからできている

V

C

V

C

C

C

V

CV

CC

C

L鎖

H鎖H鎖 L鎖

細胞表面あるいは分泌蛋白質が多い免疫や分子認識に関する機能を担うことが多い

4本のβストランドからなるβシートが二枚サンドイッチ状に重なった構造をとる逆平行のβシートが主

P‐loop スーパーファミリーP‐loop nucleoside triphosphate hydrolase(c37)

Ras-related protein RAB-5A1r2qA(c3718)

Guanylate kinase1gkyA(c3711)

RecA proteinDomain1 1xmsA1(c37111)

平行のβシートが主トポロジーには様々な変異あり

シグナル伝達DNA結合

モーター機能など多彩な分子機能を担うがATP GTPなどのヌクレオシド

の加水分解を行う点は共通

N C

132 4 5 6

ヌクレオシド結合部GxxxxGKTの

配列モチーフ(P-loop)を持つ

ロスマン フォールドNAD(P)‐binding Rossmann‐fold domains (c2)

Alcohol dehydrogenase gamma chaindomain2 1u3wA(c211)

Aspartate beta-semialdehydedehydrogenase2gz1A1(c213)

L-alanine dehydrogenase1pjcA1(c214)

補酵素を利用したNAD(P)を脱水素酵素を持つ基質を認識するドメインは別に存在する

NC

123 4 5 6

平行のβシートが主

7枚羽 βプロペラ7‐bladed beta‐propeller (b69)

Garactose oxydasedomain3 1k3iA3(b6911)

Guanine nucleotide-bindingprotein subunit beta-11gotB(b6941)

細胞膜付近のシグナル伝達や糖結合に関わることが多い

Influenza Neuraminidase 1f8dA(b6811)

6枚羽 βプロペラ

N C

321 4

のユニットが7回円環状に繰り返しされたフォールド

立体構造比較プログラム1990年ごろから多くの構造比較プログラムが開発されている

WEBアドレス スコア アライメント

DALI httpwwwebiacukdali

距離の差を独自の関数で変換したスコア

局所アライメントをモンテカルロ法でつなぎ合わせる

CE httpclsdsceducehtml

局所的なRMSD 局所アライメントを積み上げていく

MATRAS httpbiunitnaistjpmatras

距離の変化が相同相似で起こる確率の比をスコアとする

SSEで仮アライメント

を生成残基アライメントを収束するまで反復する

タンパク質の相同性の判断基準

100

同一残基率30以上

BLASTのE-value lt 00001

PSI-BLASTのE-value lt 00001

0102030407025 15 535

同一残基率(Sequence Identity)()

立体構造比較が必要

(1)立体構造の類似性が高い(DALIのZスコアMATRASのRdisスコア)(2)同一残基率がそこそこ高い(PSI-BLASTでヒットするSeqIDgt=15ぐらい)

(3)分子機能に類似性がある(補酵素酵素反応基質代謝経路等の共通性等)(4)基質補酵素の結合部位が類似しておりそのアミノ酸が保存(モチーフ)(5)ドメイン構成の共通性(6)スーパーフォールドの場合は特別な注意が必要

配列解析

同一残基率が25以下の場合の相同性の判断基準

50608090

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 46: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

立体構造分類データベースSCOPhttpscopmrc-lmbcamacukscop

4階層で分類Class(クラス)

Fold(フォールド)

Superfamily(スーパーファミリー)

Family(ファミリー)

どの階層に分類するかは配列の類似性立体構造の類似性分子機能の類似性機能部位の類似性

を専門家が総合的に判断して決める

1akr

ltホモロジーgt

ltアナロジーgt

他の構造分類データベースとしてCATHが有名

同様に階層的な分類体系を持つがその詳細はSCOPとは異なる

クラス

1mbd

1mqkH

1n55A 1pqwA

1fxd 1a2p

all-α (a)

all-β (b)

αβ (c)

α+β (d)

α-へリックスが中心

β-シートが中心

逆平行が多い

α-へリックスとβ-シートが配列上交互に現れる平行β-シートが中心

α-へリックスとβ-シートが混在配列上の並びの規則はない逆平行と平行のβ-シートが混在

アミノ酸配列と立体構造の関係ピロリ菌と大腸菌のフラボドキシン (同一残基率 SeqID 44)

ピロリ菌(1fueA) 大腸菌(1ag9A)

配列が似ていれば立体構造も似ている

SeqID = 44

RMSD = 12 Å

1fueA 2GKIGIFFGTDSGNAEAIAEKISKAIG--NAEVVDVAKASKEQFNGFTKVILVAPTAGAGD59

1ag9A 2AITGIFFGSDTGNTENIAKMIQKQLGKDVADVHDIAKSSKEDLEAYDILLLGIPTWYYGE61

1fueA 60LQTDWEDFLGTLEASD-FANKTIGLVGLGDQDTYSETFAEGIFHIYEKAK--AGKVVGQT116

1ag9A 62AQCDWDDFFPTLE-EIDFNGKLVALFGCGDQEDYAEYFCDALGTIRDIIEPRGATIVGHW120

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C 14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

BLAST

PSI-BLAST 構造比較

構造比較

アミノ酸配列がほとんど似ていなくても立体構造は似ている場合がある

構造は配列より進化的に保存がよい 構造比較から新たなホモログが発見できる可能性

立体

構造

の変

アミノ酸配列の変化と立体構造の変化の相関(グロビン族)

立体構造の変化はアミノ酸配列の変化と相関配列が30以上一致していればRMSDは2Å以下

アミノ酸配列の類似度

2つの構造の類似性

ホモロジー (homology 相同)進化的起源を共有することによる類似多くの場合分子機能なども類似している

アナロジー (analogy 相似)進化的起源とは無関係な類似多くの場合分子機能など他の属性は似ていない物理化学的な構造の偏好が原因とされる

イルカの胸びれ サルの前足

チョウの羽 トリの翼

ネコの前足

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C

ldquoFlavodoxin-likerdquo fold (c23)

ldquoFlavoproteinsrdquo superfamily (c235)

ldquoCheY-likerdquosuperfamily(c231)

14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

AnalogyHomology

HomologyHomolo

gy

多く現れるフォールド(出現ドメイン数順)

太字はスーパーフォールド多くのスーパーファミリーを含むフォールド

d58

c1

g3

c23 b34

b1

a4フォールド名 (SCOP173によるクラスfhijkは除く) ドメイ

ンの数

スーパーファミリーの数

a4 DNARNA-binding 3-helical bundle 292 14c1 TIM betaalpha-barrel 269 33d58 Ferredoxin-like 248 55b1 Immunoglobulin-like beta sandwich 246 27c37 P-loop nucleoside triphosphate hydrolase 235 1c2 NAD(P)-binding Rossmann-fold domains 168 1g3 Knottins 154 19d15 Beta-Grasp(ubiquitin-like) 131 13c23 Flavodoxin-like 118 15b34 SH3-like barrel 117 18b40 OB-fold 100 12c66 SAM-dependent methyltransferases 95 1

c37 c2

d15

b40 c66

スーパーフォールド(Superfold)

フォールド名 (SCOP173によるクラスfhijkは除く) その下のスーパーファミリーの数

d58 Ferredoxin-like 55c1 TIM betaalpha-barrel 33b1 Immunoglobulin-like beta sandwich 27a24 Four-helical up-and-down bundle 27a118 Alpha-alpha superhelix 23g3 Knottins 19b34 SH3-like barrel 18g41 Rubredoxin-like 16c23 Flavodoxin-like 15a60 SAM(sterile alpha motif) domain-like 15b69 7-bladed beta-propeller 14a4 DNARNA-binding 3-helical bundle 14

スーパーフォールド多くのスーパーファミリーを含むフォールド

スーパーフォールドは「構造の類似と機能の類似が対応しにくいフォールド」ともいえる

d58

c1

g3a118

c23

a24

a60

b34

b1

g41

b69 a4

三本へリックスバンドルDNARNA‐binding 3‐helical bundle(a4)

Mating type protein A2 yeast(1k61Aa411)

(1gvdAa413)(1wh5Aa411)

三本のへリックスが束になった構造DNAやRNAに結合する蛋白質が多い

DNAと

結合した構造(1k61)

TIMバレルTIM betaalpha barrel (c1)

Triosephosphate isomerase1n55A(c111)

全般に解糖系の酵素が多い基質酵素反応は極めて多彩

八本のβストランドとαへリックスが交互に組み合わさり対称的な樽(barrel)構造を形成す

る中央の樽構造は平行のβシートからなる

Imidazole glycerol phosphate synthasesubunit hisF1thfD(c121)

KHGKDPG aldolase1euaA(c1101)

フェレドキシン様Ferredoxin‐like (d58)

4Fe-4S Ferredoxin(1fxdd581)

1 234 4本の逆平行のβストランドと2本のαへリックスからな

分子機能は極めて多彩

CheY binding domain of CheA(1eayCd5824)

U1A RNA binding domain(1nu4Ad5871)

免疫グロブリン様Immunoglobulin‐like beta sandwich(b1)

Immunoglobulin Heavy chain variabledomain 1mjuH1(b111)

Immunoglobulin Heavy chain constantdomain 1mjuH2(b112)

Macromomycin1noaA (b171)

免疫グロブリン分子はH鎖とL鎖から

なりそれぞれ免疫グロブリン様ドメインからできている

V

C

V

C

C

C

V

CV

CC

C

L鎖

H鎖H鎖 L鎖

細胞表面あるいは分泌蛋白質が多い免疫や分子認識に関する機能を担うことが多い

4本のβストランドからなるβシートが二枚サンドイッチ状に重なった構造をとる逆平行のβシートが主

P‐loop スーパーファミリーP‐loop nucleoside triphosphate hydrolase(c37)

Ras-related protein RAB-5A1r2qA(c3718)

Guanylate kinase1gkyA(c3711)

RecA proteinDomain1 1xmsA1(c37111)

平行のβシートが主トポロジーには様々な変異あり

シグナル伝達DNA結合

モーター機能など多彩な分子機能を担うがATP GTPなどのヌクレオシド

の加水分解を行う点は共通

N C

132 4 5 6

ヌクレオシド結合部GxxxxGKTの

配列モチーフ(P-loop)を持つ

ロスマン フォールドNAD(P)‐binding Rossmann‐fold domains (c2)

Alcohol dehydrogenase gamma chaindomain2 1u3wA(c211)

Aspartate beta-semialdehydedehydrogenase2gz1A1(c213)

L-alanine dehydrogenase1pjcA1(c214)

補酵素を利用したNAD(P)を脱水素酵素を持つ基質を認識するドメインは別に存在する

NC

123 4 5 6

平行のβシートが主

7枚羽 βプロペラ7‐bladed beta‐propeller (b69)

Garactose oxydasedomain3 1k3iA3(b6911)

Guanine nucleotide-bindingprotein subunit beta-11gotB(b6941)

細胞膜付近のシグナル伝達や糖結合に関わることが多い

Influenza Neuraminidase 1f8dA(b6811)

6枚羽 βプロペラ

N C

321 4

のユニットが7回円環状に繰り返しされたフォールド

立体構造比較プログラム1990年ごろから多くの構造比較プログラムが開発されている

WEBアドレス スコア アライメント

DALI httpwwwebiacukdali

距離の差を独自の関数で変換したスコア

局所アライメントをモンテカルロ法でつなぎ合わせる

CE httpclsdsceducehtml

局所的なRMSD 局所アライメントを積み上げていく

MATRAS httpbiunitnaistjpmatras

距離の変化が相同相似で起こる確率の比をスコアとする

SSEで仮アライメント

を生成残基アライメントを収束するまで反復する

タンパク質の相同性の判断基準

100

同一残基率30以上

BLASTのE-value lt 00001

PSI-BLASTのE-value lt 00001

0102030407025 15 535

同一残基率(Sequence Identity)()

立体構造比較が必要

(1)立体構造の類似性が高い(DALIのZスコアMATRASのRdisスコア)(2)同一残基率がそこそこ高い(PSI-BLASTでヒットするSeqIDgt=15ぐらい)

(3)分子機能に類似性がある(補酵素酵素反応基質代謝経路等の共通性等)(4)基質補酵素の結合部位が類似しておりそのアミノ酸が保存(モチーフ)(5)ドメイン構成の共通性(6)スーパーフォールドの場合は特別な注意が必要

配列解析

同一残基率が25以下の場合の相同性の判断基準

50608090

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 47: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

クラス

1mbd

1mqkH

1n55A 1pqwA

1fxd 1a2p

all-α (a)

all-β (b)

αβ (c)

α+β (d)

α-へリックスが中心

β-シートが中心

逆平行が多い

α-へリックスとβ-シートが配列上交互に現れる平行β-シートが中心

α-へリックスとβ-シートが混在配列上の並びの規則はない逆平行と平行のβ-シートが混在

アミノ酸配列と立体構造の関係ピロリ菌と大腸菌のフラボドキシン (同一残基率 SeqID 44)

ピロリ菌(1fueA) 大腸菌(1ag9A)

配列が似ていれば立体構造も似ている

SeqID = 44

RMSD = 12 Å

1fueA 2GKIGIFFGTDSGNAEAIAEKISKAIG--NAEVVDVAKASKEQFNGFTKVILVAPTAGAGD59

1ag9A 2AITGIFFGSDTGNTENIAKMIQKQLGKDVADVHDIAKSSKEDLEAYDILLLGIPTWYYGE61

1fueA 60LQTDWEDFLGTLEASD-FANKTIGLVGLGDQDTYSETFAEGIFHIYEKAK--AGKVVGQT116

1ag9A 62AQCDWDDFFPTLE-EIDFNGKLVALFGCGDQEDYAEYFCDALGTIRDIIEPRGATIVGHW120

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C 14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

BLAST

PSI-BLAST 構造比較

構造比較

アミノ酸配列がほとんど似ていなくても立体構造は似ている場合がある

構造は配列より進化的に保存がよい 構造比較から新たなホモログが発見できる可能性

立体

構造

の変

アミノ酸配列の変化と立体構造の変化の相関(グロビン族)

立体構造の変化はアミノ酸配列の変化と相関配列が30以上一致していればRMSDは2Å以下

アミノ酸配列の類似度

2つの構造の類似性

ホモロジー (homology 相同)進化的起源を共有することによる類似多くの場合分子機能なども類似している

アナロジー (analogy 相似)進化的起源とは無関係な類似多くの場合分子機能など他の属性は似ていない物理化学的な構造の偏好が原因とされる

イルカの胸びれ サルの前足

チョウの羽 トリの翼

ネコの前足

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C

ldquoFlavodoxin-likerdquo fold (c23)

ldquoFlavoproteinsrdquo superfamily (c235)

ldquoCheY-likerdquosuperfamily(c231)

14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

AnalogyHomology

HomologyHomolo

gy

多く現れるフォールド(出現ドメイン数順)

太字はスーパーフォールド多くのスーパーファミリーを含むフォールド

d58

c1

g3

c23 b34

b1

a4フォールド名 (SCOP173によるクラスfhijkは除く) ドメイ

ンの数

スーパーファミリーの数

a4 DNARNA-binding 3-helical bundle 292 14c1 TIM betaalpha-barrel 269 33d58 Ferredoxin-like 248 55b1 Immunoglobulin-like beta sandwich 246 27c37 P-loop nucleoside triphosphate hydrolase 235 1c2 NAD(P)-binding Rossmann-fold domains 168 1g3 Knottins 154 19d15 Beta-Grasp(ubiquitin-like) 131 13c23 Flavodoxin-like 118 15b34 SH3-like barrel 117 18b40 OB-fold 100 12c66 SAM-dependent methyltransferases 95 1

c37 c2

d15

b40 c66

スーパーフォールド(Superfold)

フォールド名 (SCOP173によるクラスfhijkは除く) その下のスーパーファミリーの数

d58 Ferredoxin-like 55c1 TIM betaalpha-barrel 33b1 Immunoglobulin-like beta sandwich 27a24 Four-helical up-and-down bundle 27a118 Alpha-alpha superhelix 23g3 Knottins 19b34 SH3-like barrel 18g41 Rubredoxin-like 16c23 Flavodoxin-like 15a60 SAM(sterile alpha motif) domain-like 15b69 7-bladed beta-propeller 14a4 DNARNA-binding 3-helical bundle 14

スーパーフォールド多くのスーパーファミリーを含むフォールド

スーパーフォールドは「構造の類似と機能の類似が対応しにくいフォールド」ともいえる

d58

c1

g3a118

c23

a24

a60

b34

b1

g41

b69 a4

三本へリックスバンドルDNARNA‐binding 3‐helical bundle(a4)

Mating type protein A2 yeast(1k61Aa411)

(1gvdAa413)(1wh5Aa411)

三本のへリックスが束になった構造DNAやRNAに結合する蛋白質が多い

DNAと

結合した構造(1k61)

TIMバレルTIM betaalpha barrel (c1)

Triosephosphate isomerase1n55A(c111)

全般に解糖系の酵素が多い基質酵素反応は極めて多彩

八本のβストランドとαへリックスが交互に組み合わさり対称的な樽(barrel)構造を形成す

る中央の樽構造は平行のβシートからなる

Imidazole glycerol phosphate synthasesubunit hisF1thfD(c121)

KHGKDPG aldolase1euaA(c1101)

フェレドキシン様Ferredoxin‐like (d58)

4Fe-4S Ferredoxin(1fxdd581)

1 234 4本の逆平行のβストランドと2本のαへリックスからな

分子機能は極めて多彩

CheY binding domain of CheA(1eayCd5824)

U1A RNA binding domain(1nu4Ad5871)

免疫グロブリン様Immunoglobulin‐like beta sandwich(b1)

Immunoglobulin Heavy chain variabledomain 1mjuH1(b111)

Immunoglobulin Heavy chain constantdomain 1mjuH2(b112)

Macromomycin1noaA (b171)

免疫グロブリン分子はH鎖とL鎖から

なりそれぞれ免疫グロブリン様ドメインからできている

V

C

V

C

C

C

V

CV

CC

C

L鎖

H鎖H鎖 L鎖

細胞表面あるいは分泌蛋白質が多い免疫や分子認識に関する機能を担うことが多い

4本のβストランドからなるβシートが二枚サンドイッチ状に重なった構造をとる逆平行のβシートが主

P‐loop スーパーファミリーP‐loop nucleoside triphosphate hydrolase(c37)

Ras-related protein RAB-5A1r2qA(c3718)

Guanylate kinase1gkyA(c3711)

RecA proteinDomain1 1xmsA1(c37111)

平行のβシートが主トポロジーには様々な変異あり

シグナル伝達DNA結合

モーター機能など多彩な分子機能を担うがATP GTPなどのヌクレオシド

の加水分解を行う点は共通

N C

132 4 5 6

ヌクレオシド結合部GxxxxGKTの

配列モチーフ(P-loop)を持つ

ロスマン フォールドNAD(P)‐binding Rossmann‐fold domains (c2)

Alcohol dehydrogenase gamma chaindomain2 1u3wA(c211)

Aspartate beta-semialdehydedehydrogenase2gz1A1(c213)

L-alanine dehydrogenase1pjcA1(c214)

補酵素を利用したNAD(P)を脱水素酵素を持つ基質を認識するドメインは別に存在する

NC

123 4 5 6

平行のβシートが主

7枚羽 βプロペラ7‐bladed beta‐propeller (b69)

Garactose oxydasedomain3 1k3iA3(b6911)

Guanine nucleotide-bindingprotein subunit beta-11gotB(b6941)

細胞膜付近のシグナル伝達や糖結合に関わることが多い

Influenza Neuraminidase 1f8dA(b6811)

6枚羽 βプロペラ

N C

321 4

のユニットが7回円環状に繰り返しされたフォールド

立体構造比較プログラム1990年ごろから多くの構造比較プログラムが開発されている

WEBアドレス スコア アライメント

DALI httpwwwebiacukdali

距離の差を独自の関数で変換したスコア

局所アライメントをモンテカルロ法でつなぎ合わせる

CE httpclsdsceducehtml

局所的なRMSD 局所アライメントを積み上げていく

MATRAS httpbiunitnaistjpmatras

距離の変化が相同相似で起こる確率の比をスコアとする

SSEで仮アライメント

を生成残基アライメントを収束するまで反復する

タンパク質の相同性の判断基準

100

同一残基率30以上

BLASTのE-value lt 00001

PSI-BLASTのE-value lt 00001

0102030407025 15 535

同一残基率(Sequence Identity)()

立体構造比較が必要

(1)立体構造の類似性が高い(DALIのZスコアMATRASのRdisスコア)(2)同一残基率がそこそこ高い(PSI-BLASTでヒットするSeqIDgt=15ぐらい)

(3)分子機能に類似性がある(補酵素酵素反応基質代謝経路等の共通性等)(4)基質補酵素の結合部位が類似しておりそのアミノ酸が保存(モチーフ)(5)ドメイン構成の共通性(6)スーパーフォールドの場合は特別な注意が必要

配列解析

同一残基率が25以下の場合の相同性の判断基準

50608090

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 48: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

アミノ酸配列と立体構造の関係ピロリ菌と大腸菌のフラボドキシン (同一残基率 SeqID 44)

ピロリ菌(1fueA) 大腸菌(1ag9A)

配列が似ていれば立体構造も似ている

SeqID = 44

RMSD = 12 Å

1fueA 2GKIGIFFGTDSGNAEAIAEKISKAIG--NAEVVDVAKASKEQFNGFTKVILVAPTAGAGD59

1ag9A 2AITGIFFGSDTGNTENIAKMIQKQLGKDVADVHDIAKSSKEDLEAYDILLLGIPTWYYGE61

1fueA 60LQTDWEDFLGTLEASD-FANKTIGLVGLGDQDTYSETFAEGIFHIYEKAK--AGKVVGQT116

1ag9A 62AQCDWDDFFPTLE-EIDFNGKLVALFGCGDQEDYAEYFCDALGTIRDIIEPRGATIVGHW120

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C 14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

BLAST

PSI-BLAST 構造比較

構造比較

アミノ酸配列がほとんど似ていなくても立体構造は似ている場合がある

構造は配列より進化的に保存がよい 構造比較から新たなホモログが発見できる可能性

立体

構造

の変

アミノ酸配列の変化と立体構造の変化の相関(グロビン族)

立体構造の変化はアミノ酸配列の変化と相関配列が30以上一致していればRMSDは2Å以下

アミノ酸配列の類似度

2つの構造の類似性

ホモロジー (homology 相同)進化的起源を共有することによる類似多くの場合分子機能なども類似している

アナロジー (analogy 相似)進化的起源とは無関係な類似多くの場合分子機能など他の属性は似ていない物理化学的な構造の偏好が原因とされる

イルカの胸びれ サルの前足

チョウの羽 トリの翼

ネコの前足

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C

ldquoFlavodoxin-likerdquo fold (c23)

ldquoFlavoproteinsrdquo superfamily (c235)

ldquoCheY-likerdquosuperfamily(c231)

14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

AnalogyHomology

HomologyHomolo

gy

多く現れるフォールド(出現ドメイン数順)

太字はスーパーフォールド多くのスーパーファミリーを含むフォールド

d58

c1

g3

c23 b34

b1

a4フォールド名 (SCOP173によるクラスfhijkは除く) ドメイ

ンの数

スーパーファミリーの数

a4 DNARNA-binding 3-helical bundle 292 14c1 TIM betaalpha-barrel 269 33d58 Ferredoxin-like 248 55b1 Immunoglobulin-like beta sandwich 246 27c37 P-loop nucleoside triphosphate hydrolase 235 1c2 NAD(P)-binding Rossmann-fold domains 168 1g3 Knottins 154 19d15 Beta-Grasp(ubiquitin-like) 131 13c23 Flavodoxin-like 118 15b34 SH3-like barrel 117 18b40 OB-fold 100 12c66 SAM-dependent methyltransferases 95 1

c37 c2

d15

b40 c66

スーパーフォールド(Superfold)

フォールド名 (SCOP173によるクラスfhijkは除く) その下のスーパーファミリーの数

d58 Ferredoxin-like 55c1 TIM betaalpha-barrel 33b1 Immunoglobulin-like beta sandwich 27a24 Four-helical up-and-down bundle 27a118 Alpha-alpha superhelix 23g3 Knottins 19b34 SH3-like barrel 18g41 Rubredoxin-like 16c23 Flavodoxin-like 15a60 SAM(sterile alpha motif) domain-like 15b69 7-bladed beta-propeller 14a4 DNARNA-binding 3-helical bundle 14

スーパーフォールド多くのスーパーファミリーを含むフォールド

スーパーフォールドは「構造の類似と機能の類似が対応しにくいフォールド」ともいえる

d58

c1

g3a118

c23

a24

a60

b34

b1

g41

b69 a4

三本へリックスバンドルDNARNA‐binding 3‐helical bundle(a4)

Mating type protein A2 yeast(1k61Aa411)

(1gvdAa413)(1wh5Aa411)

三本のへリックスが束になった構造DNAやRNAに結合する蛋白質が多い

DNAと

結合した構造(1k61)

TIMバレルTIM betaalpha barrel (c1)

Triosephosphate isomerase1n55A(c111)

全般に解糖系の酵素が多い基質酵素反応は極めて多彩

八本のβストランドとαへリックスが交互に組み合わさり対称的な樽(barrel)構造を形成す

る中央の樽構造は平行のβシートからなる

Imidazole glycerol phosphate synthasesubunit hisF1thfD(c121)

KHGKDPG aldolase1euaA(c1101)

フェレドキシン様Ferredoxin‐like (d58)

4Fe-4S Ferredoxin(1fxdd581)

1 234 4本の逆平行のβストランドと2本のαへリックスからな

分子機能は極めて多彩

CheY binding domain of CheA(1eayCd5824)

U1A RNA binding domain(1nu4Ad5871)

免疫グロブリン様Immunoglobulin‐like beta sandwich(b1)

Immunoglobulin Heavy chain variabledomain 1mjuH1(b111)

Immunoglobulin Heavy chain constantdomain 1mjuH2(b112)

Macromomycin1noaA (b171)

免疫グロブリン分子はH鎖とL鎖から

なりそれぞれ免疫グロブリン様ドメインからできている

V

C

V

C

C

C

V

CV

CC

C

L鎖

H鎖H鎖 L鎖

細胞表面あるいは分泌蛋白質が多い免疫や分子認識に関する機能を担うことが多い

4本のβストランドからなるβシートが二枚サンドイッチ状に重なった構造をとる逆平行のβシートが主

P‐loop スーパーファミリーP‐loop nucleoside triphosphate hydrolase(c37)

Ras-related protein RAB-5A1r2qA(c3718)

Guanylate kinase1gkyA(c3711)

RecA proteinDomain1 1xmsA1(c37111)

平行のβシートが主トポロジーには様々な変異あり

シグナル伝達DNA結合

モーター機能など多彩な分子機能を担うがATP GTPなどのヌクレオシド

の加水分解を行う点は共通

N C

132 4 5 6

ヌクレオシド結合部GxxxxGKTの

配列モチーフ(P-loop)を持つ

ロスマン フォールドNAD(P)‐binding Rossmann‐fold domains (c2)

Alcohol dehydrogenase gamma chaindomain2 1u3wA(c211)

Aspartate beta-semialdehydedehydrogenase2gz1A1(c213)

L-alanine dehydrogenase1pjcA1(c214)

補酵素を利用したNAD(P)を脱水素酵素を持つ基質を認識するドメインは別に存在する

NC

123 4 5 6

平行のβシートが主

7枚羽 βプロペラ7‐bladed beta‐propeller (b69)

Garactose oxydasedomain3 1k3iA3(b6911)

Guanine nucleotide-bindingprotein subunit beta-11gotB(b6941)

細胞膜付近のシグナル伝達や糖結合に関わることが多い

Influenza Neuraminidase 1f8dA(b6811)

6枚羽 βプロペラ

N C

321 4

のユニットが7回円環状に繰り返しされたフォールド

立体構造比較プログラム1990年ごろから多くの構造比較プログラムが開発されている

WEBアドレス スコア アライメント

DALI httpwwwebiacukdali

距離の差を独自の関数で変換したスコア

局所アライメントをモンテカルロ法でつなぎ合わせる

CE httpclsdsceducehtml

局所的なRMSD 局所アライメントを積み上げていく

MATRAS httpbiunitnaistjpmatras

距離の変化が相同相似で起こる確率の比をスコアとする

SSEで仮アライメント

を生成残基アライメントを収束するまで反復する

タンパク質の相同性の判断基準

100

同一残基率30以上

BLASTのE-value lt 00001

PSI-BLASTのE-value lt 00001

0102030407025 15 535

同一残基率(Sequence Identity)()

立体構造比較が必要

(1)立体構造の類似性が高い(DALIのZスコアMATRASのRdisスコア)(2)同一残基率がそこそこ高い(PSI-BLASTでヒットするSeqIDgt=15ぐらい)

(3)分子機能に類似性がある(補酵素酵素反応基質代謝経路等の共通性等)(4)基質補酵素の結合部位が類似しておりそのアミノ酸が保存(モチーフ)(5)ドメイン構成の共通性(6)スーパーフォールドの場合は特別な注意が必要

配列解析

同一残基率が25以下の場合の相同性の判断基準

50608090

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 49: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C 14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

BLAST

PSI-BLAST 構造比較

構造比較

アミノ酸配列がほとんど似ていなくても立体構造は似ている場合がある

構造は配列より進化的に保存がよい 構造比較から新たなホモログが発見できる可能性

立体

構造

の変

アミノ酸配列の変化と立体構造の変化の相関(グロビン族)

立体構造の変化はアミノ酸配列の変化と相関配列が30以上一致していればRMSDは2Å以下

アミノ酸配列の類似度

2つの構造の類似性

ホモロジー (homology 相同)進化的起源を共有することによる類似多くの場合分子機能なども類似している

アナロジー (analogy 相似)進化的起源とは無関係な類似多くの場合分子機能など他の属性は似ていない物理化学的な構造の偏好が原因とされる

イルカの胸びれ サルの前足

チョウの羽 トリの翼

ネコの前足

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C

ldquoFlavodoxin-likerdquo fold (c23)

ldquoFlavoproteinsrdquo superfamily (c235)

ldquoCheY-likerdquosuperfamily(c231)

14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

AnalogyHomology

HomologyHomolo

gy

多く現れるフォールド(出現ドメイン数順)

太字はスーパーフォールド多くのスーパーファミリーを含むフォールド

d58

c1

g3

c23 b34

b1

a4フォールド名 (SCOP173によるクラスfhijkは除く) ドメイ

ンの数

スーパーファミリーの数

a4 DNARNA-binding 3-helical bundle 292 14c1 TIM betaalpha-barrel 269 33d58 Ferredoxin-like 248 55b1 Immunoglobulin-like beta sandwich 246 27c37 P-loop nucleoside triphosphate hydrolase 235 1c2 NAD(P)-binding Rossmann-fold domains 168 1g3 Knottins 154 19d15 Beta-Grasp(ubiquitin-like) 131 13c23 Flavodoxin-like 118 15b34 SH3-like barrel 117 18b40 OB-fold 100 12c66 SAM-dependent methyltransferases 95 1

c37 c2

d15

b40 c66

スーパーフォールド(Superfold)

フォールド名 (SCOP173によるクラスfhijkは除く) その下のスーパーファミリーの数

d58 Ferredoxin-like 55c1 TIM betaalpha-barrel 33b1 Immunoglobulin-like beta sandwich 27a24 Four-helical up-and-down bundle 27a118 Alpha-alpha superhelix 23g3 Knottins 19b34 SH3-like barrel 18g41 Rubredoxin-like 16c23 Flavodoxin-like 15a60 SAM(sterile alpha motif) domain-like 15b69 7-bladed beta-propeller 14a4 DNARNA-binding 3-helical bundle 14

スーパーフォールド多くのスーパーファミリーを含むフォールド

スーパーフォールドは「構造の類似と機能の類似が対応しにくいフォールド」ともいえる

d58

c1

g3a118

c23

a24

a60

b34

b1

g41

b69 a4

三本へリックスバンドルDNARNA‐binding 3‐helical bundle(a4)

Mating type protein A2 yeast(1k61Aa411)

(1gvdAa413)(1wh5Aa411)

三本のへリックスが束になった構造DNAやRNAに結合する蛋白質が多い

DNAと

結合した構造(1k61)

TIMバレルTIM betaalpha barrel (c1)

Triosephosphate isomerase1n55A(c111)

全般に解糖系の酵素が多い基質酵素反応は極めて多彩

八本のβストランドとαへリックスが交互に組み合わさり対称的な樽(barrel)構造を形成す

る中央の樽構造は平行のβシートからなる

Imidazole glycerol phosphate synthasesubunit hisF1thfD(c121)

KHGKDPG aldolase1euaA(c1101)

フェレドキシン様Ferredoxin‐like (d58)

4Fe-4S Ferredoxin(1fxdd581)

1 234 4本の逆平行のβストランドと2本のαへリックスからな

分子機能は極めて多彩

CheY binding domain of CheA(1eayCd5824)

U1A RNA binding domain(1nu4Ad5871)

免疫グロブリン様Immunoglobulin‐like beta sandwich(b1)

Immunoglobulin Heavy chain variabledomain 1mjuH1(b111)

Immunoglobulin Heavy chain constantdomain 1mjuH2(b112)

Macromomycin1noaA (b171)

免疫グロブリン分子はH鎖とL鎖から

なりそれぞれ免疫グロブリン様ドメインからできている

V

C

V

C

C

C

V

CV

CC

C

L鎖

H鎖H鎖 L鎖

細胞表面あるいは分泌蛋白質が多い免疫や分子認識に関する機能を担うことが多い

4本のβストランドからなるβシートが二枚サンドイッチ状に重なった構造をとる逆平行のβシートが主

P‐loop スーパーファミリーP‐loop nucleoside triphosphate hydrolase(c37)

Ras-related protein RAB-5A1r2qA(c3718)

Guanylate kinase1gkyA(c3711)

RecA proteinDomain1 1xmsA1(c37111)

平行のβシートが主トポロジーには様々な変異あり

シグナル伝達DNA結合

モーター機能など多彩な分子機能を担うがATP GTPなどのヌクレオシド

の加水分解を行う点は共通

N C

132 4 5 6

ヌクレオシド結合部GxxxxGKTの

配列モチーフ(P-loop)を持つ

ロスマン フォールドNAD(P)‐binding Rossmann‐fold domains (c2)

Alcohol dehydrogenase gamma chaindomain2 1u3wA(c211)

Aspartate beta-semialdehydedehydrogenase2gz1A1(c213)

L-alanine dehydrogenase1pjcA1(c214)

補酵素を利用したNAD(P)を脱水素酵素を持つ基質を認識するドメインは別に存在する

NC

123 4 5 6

平行のβシートが主

7枚羽 βプロペラ7‐bladed beta‐propeller (b69)

Garactose oxydasedomain3 1k3iA3(b6911)

Guanine nucleotide-bindingprotein subunit beta-11gotB(b6941)

細胞膜付近のシグナル伝達や糖結合に関わることが多い

Influenza Neuraminidase 1f8dA(b6811)

6枚羽 βプロペラ

N C

321 4

のユニットが7回円環状に繰り返しされたフォールド

立体構造比較プログラム1990年ごろから多くの構造比較プログラムが開発されている

WEBアドレス スコア アライメント

DALI httpwwwebiacukdali

距離の差を独自の関数で変換したスコア

局所アライメントをモンテカルロ法でつなぎ合わせる

CE httpclsdsceducehtml

局所的なRMSD 局所アライメントを積み上げていく

MATRAS httpbiunitnaistjpmatras

距離の変化が相同相似で起こる確率の比をスコアとする

SSEで仮アライメント

を生成残基アライメントを収束するまで反復する

タンパク質の相同性の判断基準

100

同一残基率30以上

BLASTのE-value lt 00001

PSI-BLASTのE-value lt 00001

0102030407025 15 535

同一残基率(Sequence Identity)()

立体構造比較が必要

(1)立体構造の類似性が高い(DALIのZスコアMATRASのRdisスコア)(2)同一残基率がそこそこ高い(PSI-BLASTでヒットするSeqIDgt=15ぐらい)

(3)分子機能に類似性がある(補酵素酵素反応基質代謝経路等の共通性等)(4)基質補酵素の結合部位が類似しておりそのアミノ酸が保存(モチーフ)(5)ドメイン構成の共通性(6)スーパーフォールドの場合は特別な注意が必要

配列解析

同一残基率が25以下の場合の相同性の判断基準

50608090

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 50: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

立体

構造

の変

アミノ酸配列の変化と立体構造の変化の相関(グロビン族)

立体構造の変化はアミノ酸配列の変化と相関配列が30以上一致していればRMSDは2Å以下

アミノ酸配列の類似度

2つの構造の類似性

ホモロジー (homology 相同)進化的起源を共有することによる類似多くの場合分子機能なども類似している

アナロジー (analogy 相似)進化的起源とは無関係な類似多くの場合分子機能など他の属性は似ていない物理化学的な構造の偏好が原因とされる

イルカの胸びれ サルの前足

チョウの羽 トリの翼

ネコの前足

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C

ldquoFlavodoxin-likerdquo fold (c23)

ldquoFlavoproteinsrdquo superfamily (c235)

ldquoCheY-likerdquosuperfamily(c231)

14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

AnalogyHomology

HomologyHomolo

gy

多く現れるフォールド(出現ドメイン数順)

太字はスーパーフォールド多くのスーパーファミリーを含むフォールド

d58

c1

g3

c23 b34

b1

a4フォールド名 (SCOP173によるクラスfhijkは除く) ドメイ

ンの数

スーパーファミリーの数

a4 DNARNA-binding 3-helical bundle 292 14c1 TIM betaalpha-barrel 269 33d58 Ferredoxin-like 248 55b1 Immunoglobulin-like beta sandwich 246 27c37 P-loop nucleoside triphosphate hydrolase 235 1c2 NAD(P)-binding Rossmann-fold domains 168 1g3 Knottins 154 19d15 Beta-Grasp(ubiquitin-like) 131 13c23 Flavodoxin-like 118 15b34 SH3-like barrel 117 18b40 OB-fold 100 12c66 SAM-dependent methyltransferases 95 1

c37 c2

d15

b40 c66

スーパーフォールド(Superfold)

フォールド名 (SCOP173によるクラスfhijkは除く) その下のスーパーファミリーの数

d58 Ferredoxin-like 55c1 TIM betaalpha-barrel 33b1 Immunoglobulin-like beta sandwich 27a24 Four-helical up-and-down bundle 27a118 Alpha-alpha superhelix 23g3 Knottins 19b34 SH3-like barrel 18g41 Rubredoxin-like 16c23 Flavodoxin-like 15a60 SAM(sterile alpha motif) domain-like 15b69 7-bladed beta-propeller 14a4 DNARNA-binding 3-helical bundle 14

スーパーフォールド多くのスーパーファミリーを含むフォールド

スーパーフォールドは「構造の類似と機能の類似が対応しにくいフォールド」ともいえる

d58

c1

g3a118

c23

a24

a60

b34

b1

g41

b69 a4

三本へリックスバンドルDNARNA‐binding 3‐helical bundle(a4)

Mating type protein A2 yeast(1k61Aa411)

(1gvdAa413)(1wh5Aa411)

三本のへリックスが束になった構造DNAやRNAに結合する蛋白質が多い

DNAと

結合した構造(1k61)

TIMバレルTIM betaalpha barrel (c1)

Triosephosphate isomerase1n55A(c111)

全般に解糖系の酵素が多い基質酵素反応は極めて多彩

八本のβストランドとαへリックスが交互に組み合わさり対称的な樽(barrel)構造を形成す

る中央の樽構造は平行のβシートからなる

Imidazole glycerol phosphate synthasesubunit hisF1thfD(c121)

KHGKDPG aldolase1euaA(c1101)

フェレドキシン様Ferredoxin‐like (d58)

4Fe-4S Ferredoxin(1fxdd581)

1 234 4本の逆平行のβストランドと2本のαへリックスからな

分子機能は極めて多彩

CheY binding domain of CheA(1eayCd5824)

U1A RNA binding domain(1nu4Ad5871)

免疫グロブリン様Immunoglobulin‐like beta sandwich(b1)

Immunoglobulin Heavy chain variabledomain 1mjuH1(b111)

Immunoglobulin Heavy chain constantdomain 1mjuH2(b112)

Macromomycin1noaA (b171)

免疫グロブリン分子はH鎖とL鎖から

なりそれぞれ免疫グロブリン様ドメインからできている

V

C

V

C

C

C

V

CV

CC

C

L鎖

H鎖H鎖 L鎖

細胞表面あるいは分泌蛋白質が多い免疫や分子認識に関する機能を担うことが多い

4本のβストランドからなるβシートが二枚サンドイッチ状に重なった構造をとる逆平行のβシートが主

P‐loop スーパーファミリーP‐loop nucleoside triphosphate hydrolase(c37)

Ras-related protein RAB-5A1r2qA(c3718)

Guanylate kinase1gkyA(c3711)

RecA proteinDomain1 1xmsA1(c37111)

平行のβシートが主トポロジーには様々な変異あり

シグナル伝達DNA結合

モーター機能など多彩な分子機能を担うがATP GTPなどのヌクレオシド

の加水分解を行う点は共通

N C

132 4 5 6

ヌクレオシド結合部GxxxxGKTの

配列モチーフ(P-loop)を持つ

ロスマン フォールドNAD(P)‐binding Rossmann‐fold domains (c2)

Alcohol dehydrogenase gamma chaindomain2 1u3wA(c211)

Aspartate beta-semialdehydedehydrogenase2gz1A1(c213)

L-alanine dehydrogenase1pjcA1(c214)

補酵素を利用したNAD(P)を脱水素酵素を持つ基質を認識するドメインは別に存在する

NC

123 4 5 6

平行のβシートが主

7枚羽 βプロペラ7‐bladed beta‐propeller (b69)

Garactose oxydasedomain3 1k3iA3(b6911)

Guanine nucleotide-bindingprotein subunit beta-11gotB(b6941)

細胞膜付近のシグナル伝達や糖結合に関わることが多い

Influenza Neuraminidase 1f8dA(b6811)

6枚羽 βプロペラ

N C

321 4

のユニットが7回円環状に繰り返しされたフォールド

立体構造比較プログラム1990年ごろから多くの構造比較プログラムが開発されている

WEBアドレス スコア アライメント

DALI httpwwwebiacukdali

距離の差を独自の関数で変換したスコア

局所アライメントをモンテカルロ法でつなぎ合わせる

CE httpclsdsceducehtml

局所的なRMSD 局所アライメントを積み上げていく

MATRAS httpbiunitnaistjpmatras

距離の変化が相同相似で起こる確率の比をスコアとする

SSEで仮アライメント

を生成残基アライメントを収束するまで反復する

タンパク質の相同性の判断基準

100

同一残基率30以上

BLASTのE-value lt 00001

PSI-BLASTのE-value lt 00001

0102030407025 15 535

同一残基率(Sequence Identity)()

立体構造比較が必要

(1)立体構造の類似性が高い(DALIのZスコアMATRASのRdisスコア)(2)同一残基率がそこそこ高い(PSI-BLASTでヒットするSeqIDgt=15ぐらい)

(3)分子機能に類似性がある(補酵素酵素反応基質代謝経路等の共通性等)(4)基質補酵素の結合部位が類似しておりそのアミノ酸が保存(モチーフ)(5)ドメイン構成の共通性(6)スーパーフォールドの場合は特別な注意が必要

配列解析

同一残基率が25以下の場合の相同性の判断基準

50608090

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 51: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

2つの構造の類似性

ホモロジー (homology 相同)進化的起源を共有することによる類似多くの場合分子機能なども類似している

アナロジー (analogy 相似)進化的起源とは無関係な類似多くの場合分子機能など他の属性は似ていない物理化学的な構造の偏好が原因とされる

イルカの胸びれ サルの前足

チョウの羽 トリの翼

ネコの前足

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C

ldquoFlavodoxin-likerdquo fold (c23)

ldquoFlavoproteinsrdquo superfamily (c235)

ldquoCheY-likerdquosuperfamily(c231)

14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

AnalogyHomology

HomologyHomolo

gy

多く現れるフォールド(出現ドメイン数順)

太字はスーパーフォールド多くのスーパーファミリーを含むフォールド

d58

c1

g3

c23 b34

b1

a4フォールド名 (SCOP173によるクラスfhijkは除く) ドメイ

ンの数

スーパーファミリーの数

a4 DNARNA-binding 3-helical bundle 292 14c1 TIM betaalpha-barrel 269 33d58 Ferredoxin-like 248 55b1 Immunoglobulin-like beta sandwich 246 27c37 P-loop nucleoside triphosphate hydrolase 235 1c2 NAD(P)-binding Rossmann-fold domains 168 1g3 Knottins 154 19d15 Beta-Grasp(ubiquitin-like) 131 13c23 Flavodoxin-like 118 15b34 SH3-like barrel 117 18b40 OB-fold 100 12c66 SAM-dependent methyltransferases 95 1

c37 c2

d15

b40 c66

スーパーフォールド(Superfold)

フォールド名 (SCOP173によるクラスfhijkは除く) その下のスーパーファミリーの数

d58 Ferredoxin-like 55c1 TIM betaalpha-barrel 33b1 Immunoglobulin-like beta sandwich 27a24 Four-helical up-and-down bundle 27a118 Alpha-alpha superhelix 23g3 Knottins 19b34 SH3-like barrel 18g41 Rubredoxin-like 16c23 Flavodoxin-like 15a60 SAM(sterile alpha motif) domain-like 15b69 7-bladed beta-propeller 14a4 DNARNA-binding 3-helical bundle 14

スーパーフォールド多くのスーパーファミリーを含むフォールド

スーパーフォールドは「構造の類似と機能の類似が対応しにくいフォールド」ともいえる

d58

c1

g3a118

c23

a24

a60

b34

b1

g41

b69 a4

三本へリックスバンドルDNARNA‐binding 3‐helical bundle(a4)

Mating type protein A2 yeast(1k61Aa411)

(1gvdAa413)(1wh5Aa411)

三本のへリックスが束になった構造DNAやRNAに結合する蛋白質が多い

DNAと

結合した構造(1k61)

TIMバレルTIM betaalpha barrel (c1)

Triosephosphate isomerase1n55A(c111)

全般に解糖系の酵素が多い基質酵素反応は極めて多彩

八本のβストランドとαへリックスが交互に組み合わさり対称的な樽(barrel)構造を形成す

る中央の樽構造は平行のβシートからなる

Imidazole glycerol phosphate synthasesubunit hisF1thfD(c121)

KHGKDPG aldolase1euaA(c1101)

フェレドキシン様Ferredoxin‐like (d58)

4Fe-4S Ferredoxin(1fxdd581)

1 234 4本の逆平行のβストランドと2本のαへリックスからな

分子機能は極めて多彩

CheY binding domain of CheA(1eayCd5824)

U1A RNA binding domain(1nu4Ad5871)

免疫グロブリン様Immunoglobulin‐like beta sandwich(b1)

Immunoglobulin Heavy chain variabledomain 1mjuH1(b111)

Immunoglobulin Heavy chain constantdomain 1mjuH2(b112)

Macromomycin1noaA (b171)

免疫グロブリン分子はH鎖とL鎖から

なりそれぞれ免疫グロブリン様ドメインからできている

V

C

V

C

C

C

V

CV

CC

C

L鎖

H鎖H鎖 L鎖

細胞表面あるいは分泌蛋白質が多い免疫や分子認識に関する機能を担うことが多い

4本のβストランドからなるβシートが二枚サンドイッチ状に重なった構造をとる逆平行のβシートが主

P‐loop スーパーファミリーP‐loop nucleoside triphosphate hydrolase(c37)

Ras-related protein RAB-5A1r2qA(c3718)

Guanylate kinase1gkyA(c3711)

RecA proteinDomain1 1xmsA1(c37111)

平行のβシートが主トポロジーには様々な変異あり

シグナル伝達DNA結合

モーター機能など多彩な分子機能を担うがATP GTPなどのヌクレオシド

の加水分解を行う点は共通

N C

132 4 5 6

ヌクレオシド結合部GxxxxGKTの

配列モチーフ(P-loop)を持つ

ロスマン フォールドNAD(P)‐binding Rossmann‐fold domains (c2)

Alcohol dehydrogenase gamma chaindomain2 1u3wA(c211)

Aspartate beta-semialdehydedehydrogenase2gz1A1(c213)

L-alanine dehydrogenase1pjcA1(c214)

補酵素を利用したNAD(P)を脱水素酵素を持つ基質を認識するドメインは別に存在する

NC

123 4 5 6

平行のβシートが主

7枚羽 βプロペラ7‐bladed beta‐propeller (b69)

Garactose oxydasedomain3 1k3iA3(b6911)

Guanine nucleotide-bindingprotein subunit beta-11gotB(b6941)

細胞膜付近のシグナル伝達や糖結合に関わることが多い

Influenza Neuraminidase 1f8dA(b6811)

6枚羽 βプロペラ

N C

321 4

のユニットが7回円環状に繰り返しされたフォールド

立体構造比較プログラム1990年ごろから多くの構造比較プログラムが開発されている

WEBアドレス スコア アライメント

DALI httpwwwebiacukdali

距離の差を独自の関数で変換したスコア

局所アライメントをモンテカルロ法でつなぎ合わせる

CE httpclsdsceducehtml

局所的なRMSD 局所アライメントを積み上げていく

MATRAS httpbiunitnaistjpmatras

距離の変化が相同相似で起こる確率の比をスコアとする

SSEで仮アライメント

を生成残基アライメントを収束するまで反復する

タンパク質の相同性の判断基準

100

同一残基率30以上

BLASTのE-value lt 00001

PSI-BLASTのE-value lt 00001

0102030407025 15 535

同一残基率(Sequence Identity)()

立体構造比較が必要

(1)立体構造の類似性が高い(DALIのZスコアMATRASのRdisスコア)(2)同一残基率がそこそこ高い(PSI-BLASTでヒットするSeqIDgt=15ぐらい)

(3)分子機能に類似性がある(補酵素酵素反応基質代謝経路等の共通性等)(4)基質補酵素の結合部位が類似しておりそのアミノ酸が保存(モチーフ)(5)ドメイン構成の共通性(6)スーパーフォールドの場合は特別な注意が必要

配列解析

同一残基率が25以下の場合の相同性の判断基準

50608090

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 52: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

大腸菌フラボドキシン(1ag9A)

ラットNADPH シトクロームP450還元酵素 C末ドメイン (1ja1A2)

大腸菌走化性タンパク質CheY(3chy)

ヒトキノン還元酵素(1d4aA)

44 12Å

22 2

8Å

8 44Å

ピロリ菌フラボドキシン(1fueA)

N

C

ldquoFlavodoxin-likerdquo fold (c23)

ldquoFlavoproteinsrdquo superfamily (c235)

ldquoCheY-likerdquosuperfamily(c231)

14 32Å

C

N

12 3 4 5

CNN

C

N

C

N

C

AnalogyHomology

HomologyHomolo

gy

多く現れるフォールド(出現ドメイン数順)

太字はスーパーフォールド多くのスーパーファミリーを含むフォールド

d58

c1

g3

c23 b34

b1

a4フォールド名 (SCOP173によるクラスfhijkは除く) ドメイ

ンの数

スーパーファミリーの数

a4 DNARNA-binding 3-helical bundle 292 14c1 TIM betaalpha-barrel 269 33d58 Ferredoxin-like 248 55b1 Immunoglobulin-like beta sandwich 246 27c37 P-loop nucleoside triphosphate hydrolase 235 1c2 NAD(P)-binding Rossmann-fold domains 168 1g3 Knottins 154 19d15 Beta-Grasp(ubiquitin-like) 131 13c23 Flavodoxin-like 118 15b34 SH3-like barrel 117 18b40 OB-fold 100 12c66 SAM-dependent methyltransferases 95 1

c37 c2

d15

b40 c66

スーパーフォールド(Superfold)

フォールド名 (SCOP173によるクラスfhijkは除く) その下のスーパーファミリーの数

d58 Ferredoxin-like 55c1 TIM betaalpha-barrel 33b1 Immunoglobulin-like beta sandwich 27a24 Four-helical up-and-down bundle 27a118 Alpha-alpha superhelix 23g3 Knottins 19b34 SH3-like barrel 18g41 Rubredoxin-like 16c23 Flavodoxin-like 15a60 SAM(sterile alpha motif) domain-like 15b69 7-bladed beta-propeller 14a4 DNARNA-binding 3-helical bundle 14

スーパーフォールド多くのスーパーファミリーを含むフォールド

スーパーフォールドは「構造の類似と機能の類似が対応しにくいフォールド」ともいえる

d58

c1

g3a118

c23

a24

a60

b34

b1

g41

b69 a4

三本へリックスバンドルDNARNA‐binding 3‐helical bundle(a4)

Mating type protein A2 yeast(1k61Aa411)

(1gvdAa413)(1wh5Aa411)

三本のへリックスが束になった構造DNAやRNAに結合する蛋白質が多い

DNAと

結合した構造(1k61)

TIMバレルTIM betaalpha barrel (c1)

Triosephosphate isomerase1n55A(c111)

全般に解糖系の酵素が多い基質酵素反応は極めて多彩

八本のβストランドとαへリックスが交互に組み合わさり対称的な樽(barrel)構造を形成す

る中央の樽構造は平行のβシートからなる

Imidazole glycerol phosphate synthasesubunit hisF1thfD(c121)

KHGKDPG aldolase1euaA(c1101)

フェレドキシン様Ferredoxin‐like (d58)

4Fe-4S Ferredoxin(1fxdd581)

1 234 4本の逆平行のβストランドと2本のαへリックスからな

分子機能は極めて多彩

CheY binding domain of CheA(1eayCd5824)

U1A RNA binding domain(1nu4Ad5871)

免疫グロブリン様Immunoglobulin‐like beta sandwich(b1)

Immunoglobulin Heavy chain variabledomain 1mjuH1(b111)

Immunoglobulin Heavy chain constantdomain 1mjuH2(b112)

Macromomycin1noaA (b171)

免疫グロブリン分子はH鎖とL鎖から

なりそれぞれ免疫グロブリン様ドメインからできている

V

C

V

C

C

C

V

CV

CC

C

L鎖

H鎖H鎖 L鎖

細胞表面あるいは分泌蛋白質が多い免疫や分子認識に関する機能を担うことが多い

4本のβストランドからなるβシートが二枚サンドイッチ状に重なった構造をとる逆平行のβシートが主

P‐loop スーパーファミリーP‐loop nucleoside triphosphate hydrolase(c37)

Ras-related protein RAB-5A1r2qA(c3718)

Guanylate kinase1gkyA(c3711)

RecA proteinDomain1 1xmsA1(c37111)

平行のβシートが主トポロジーには様々な変異あり

シグナル伝達DNA結合

モーター機能など多彩な分子機能を担うがATP GTPなどのヌクレオシド

の加水分解を行う点は共通

N C

132 4 5 6

ヌクレオシド結合部GxxxxGKTの

配列モチーフ(P-loop)を持つ

ロスマン フォールドNAD(P)‐binding Rossmann‐fold domains (c2)

Alcohol dehydrogenase gamma chaindomain2 1u3wA(c211)

Aspartate beta-semialdehydedehydrogenase2gz1A1(c213)

L-alanine dehydrogenase1pjcA1(c214)

補酵素を利用したNAD(P)を脱水素酵素を持つ基質を認識するドメインは別に存在する

NC

123 4 5 6

平行のβシートが主

7枚羽 βプロペラ7‐bladed beta‐propeller (b69)

Garactose oxydasedomain3 1k3iA3(b6911)

Guanine nucleotide-bindingprotein subunit beta-11gotB(b6941)

細胞膜付近のシグナル伝達や糖結合に関わることが多い

Influenza Neuraminidase 1f8dA(b6811)

6枚羽 βプロペラ

N C

321 4

のユニットが7回円環状に繰り返しされたフォールド

立体構造比較プログラム1990年ごろから多くの構造比較プログラムが開発されている

WEBアドレス スコア アライメント

DALI httpwwwebiacukdali

距離の差を独自の関数で変換したスコア

局所アライメントをモンテカルロ法でつなぎ合わせる

CE httpclsdsceducehtml

局所的なRMSD 局所アライメントを積み上げていく

MATRAS httpbiunitnaistjpmatras

距離の変化が相同相似で起こる確率の比をスコアとする

SSEで仮アライメント

を生成残基アライメントを収束するまで反復する

タンパク質の相同性の判断基準

100

同一残基率30以上

BLASTのE-value lt 00001

PSI-BLASTのE-value lt 00001

0102030407025 15 535

同一残基率(Sequence Identity)()

立体構造比較が必要

(1)立体構造の類似性が高い(DALIのZスコアMATRASのRdisスコア)(2)同一残基率がそこそこ高い(PSI-BLASTでヒットするSeqIDgt=15ぐらい)

(3)分子機能に類似性がある(補酵素酵素反応基質代謝経路等の共通性等)(4)基質補酵素の結合部位が類似しておりそのアミノ酸が保存(モチーフ)(5)ドメイン構成の共通性(6)スーパーフォールドの場合は特別な注意が必要

配列解析

同一残基率が25以下の場合の相同性の判断基準

50608090

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 53: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

多く現れるフォールド(出現ドメイン数順)

太字はスーパーフォールド多くのスーパーファミリーを含むフォールド

d58

c1

g3

c23 b34

b1

a4フォールド名 (SCOP173によるクラスfhijkは除く) ドメイ

ンの数

スーパーファミリーの数

a4 DNARNA-binding 3-helical bundle 292 14c1 TIM betaalpha-barrel 269 33d58 Ferredoxin-like 248 55b1 Immunoglobulin-like beta sandwich 246 27c37 P-loop nucleoside triphosphate hydrolase 235 1c2 NAD(P)-binding Rossmann-fold domains 168 1g3 Knottins 154 19d15 Beta-Grasp(ubiquitin-like) 131 13c23 Flavodoxin-like 118 15b34 SH3-like barrel 117 18b40 OB-fold 100 12c66 SAM-dependent methyltransferases 95 1

c37 c2

d15

b40 c66

スーパーフォールド(Superfold)

フォールド名 (SCOP173によるクラスfhijkは除く) その下のスーパーファミリーの数

d58 Ferredoxin-like 55c1 TIM betaalpha-barrel 33b1 Immunoglobulin-like beta sandwich 27a24 Four-helical up-and-down bundle 27a118 Alpha-alpha superhelix 23g3 Knottins 19b34 SH3-like barrel 18g41 Rubredoxin-like 16c23 Flavodoxin-like 15a60 SAM(sterile alpha motif) domain-like 15b69 7-bladed beta-propeller 14a4 DNARNA-binding 3-helical bundle 14

スーパーフォールド多くのスーパーファミリーを含むフォールド

スーパーフォールドは「構造の類似と機能の類似が対応しにくいフォールド」ともいえる

d58

c1

g3a118

c23

a24

a60

b34

b1

g41

b69 a4

三本へリックスバンドルDNARNA‐binding 3‐helical bundle(a4)

Mating type protein A2 yeast(1k61Aa411)

(1gvdAa413)(1wh5Aa411)

三本のへリックスが束になった構造DNAやRNAに結合する蛋白質が多い

DNAと

結合した構造(1k61)

TIMバレルTIM betaalpha barrel (c1)

Triosephosphate isomerase1n55A(c111)

全般に解糖系の酵素が多い基質酵素反応は極めて多彩

八本のβストランドとαへリックスが交互に組み合わさり対称的な樽(barrel)構造を形成す

る中央の樽構造は平行のβシートからなる

Imidazole glycerol phosphate synthasesubunit hisF1thfD(c121)

KHGKDPG aldolase1euaA(c1101)

フェレドキシン様Ferredoxin‐like (d58)

4Fe-4S Ferredoxin(1fxdd581)

1 234 4本の逆平行のβストランドと2本のαへリックスからな

分子機能は極めて多彩

CheY binding domain of CheA(1eayCd5824)

U1A RNA binding domain(1nu4Ad5871)

免疫グロブリン様Immunoglobulin‐like beta sandwich(b1)

Immunoglobulin Heavy chain variabledomain 1mjuH1(b111)

Immunoglobulin Heavy chain constantdomain 1mjuH2(b112)

Macromomycin1noaA (b171)

免疫グロブリン分子はH鎖とL鎖から

なりそれぞれ免疫グロブリン様ドメインからできている

V

C

V

C

C

C

V

CV

CC

C

L鎖

H鎖H鎖 L鎖

細胞表面あるいは分泌蛋白質が多い免疫や分子認識に関する機能を担うことが多い

4本のβストランドからなるβシートが二枚サンドイッチ状に重なった構造をとる逆平行のβシートが主

P‐loop スーパーファミリーP‐loop nucleoside triphosphate hydrolase(c37)

Ras-related protein RAB-5A1r2qA(c3718)

Guanylate kinase1gkyA(c3711)

RecA proteinDomain1 1xmsA1(c37111)

平行のβシートが主トポロジーには様々な変異あり

シグナル伝達DNA結合

モーター機能など多彩な分子機能を担うがATP GTPなどのヌクレオシド

の加水分解を行う点は共通

N C

132 4 5 6

ヌクレオシド結合部GxxxxGKTの

配列モチーフ(P-loop)を持つ

ロスマン フォールドNAD(P)‐binding Rossmann‐fold domains (c2)

Alcohol dehydrogenase gamma chaindomain2 1u3wA(c211)

Aspartate beta-semialdehydedehydrogenase2gz1A1(c213)

L-alanine dehydrogenase1pjcA1(c214)

補酵素を利用したNAD(P)を脱水素酵素を持つ基質を認識するドメインは別に存在する

NC

123 4 5 6

平行のβシートが主

7枚羽 βプロペラ7‐bladed beta‐propeller (b69)

Garactose oxydasedomain3 1k3iA3(b6911)

Guanine nucleotide-bindingprotein subunit beta-11gotB(b6941)

細胞膜付近のシグナル伝達や糖結合に関わることが多い

Influenza Neuraminidase 1f8dA(b6811)

6枚羽 βプロペラ

N C

321 4

のユニットが7回円環状に繰り返しされたフォールド

立体構造比較プログラム1990年ごろから多くの構造比較プログラムが開発されている

WEBアドレス スコア アライメント

DALI httpwwwebiacukdali

距離の差を独自の関数で変換したスコア

局所アライメントをモンテカルロ法でつなぎ合わせる

CE httpclsdsceducehtml

局所的なRMSD 局所アライメントを積み上げていく

MATRAS httpbiunitnaistjpmatras

距離の変化が相同相似で起こる確率の比をスコアとする

SSEで仮アライメント

を生成残基アライメントを収束するまで反復する

タンパク質の相同性の判断基準

100

同一残基率30以上

BLASTのE-value lt 00001

PSI-BLASTのE-value lt 00001

0102030407025 15 535

同一残基率(Sequence Identity)()

立体構造比較が必要

(1)立体構造の類似性が高い(DALIのZスコアMATRASのRdisスコア)(2)同一残基率がそこそこ高い(PSI-BLASTでヒットするSeqIDgt=15ぐらい)

(3)分子機能に類似性がある(補酵素酵素反応基質代謝経路等の共通性等)(4)基質補酵素の結合部位が類似しておりそのアミノ酸が保存(モチーフ)(5)ドメイン構成の共通性(6)スーパーフォールドの場合は特別な注意が必要

配列解析

同一残基率が25以下の場合の相同性の判断基準

50608090

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 54: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

スーパーフォールド(Superfold)

フォールド名 (SCOP173によるクラスfhijkは除く) その下のスーパーファミリーの数

d58 Ferredoxin-like 55c1 TIM betaalpha-barrel 33b1 Immunoglobulin-like beta sandwich 27a24 Four-helical up-and-down bundle 27a118 Alpha-alpha superhelix 23g3 Knottins 19b34 SH3-like barrel 18g41 Rubredoxin-like 16c23 Flavodoxin-like 15a60 SAM(sterile alpha motif) domain-like 15b69 7-bladed beta-propeller 14a4 DNARNA-binding 3-helical bundle 14

スーパーフォールド多くのスーパーファミリーを含むフォールド

スーパーフォールドは「構造の類似と機能の類似が対応しにくいフォールド」ともいえる

d58

c1

g3a118

c23

a24

a60

b34

b1

g41

b69 a4

三本へリックスバンドルDNARNA‐binding 3‐helical bundle(a4)

Mating type protein A2 yeast(1k61Aa411)

(1gvdAa413)(1wh5Aa411)

三本のへリックスが束になった構造DNAやRNAに結合する蛋白質が多い

DNAと

結合した構造(1k61)

TIMバレルTIM betaalpha barrel (c1)

Triosephosphate isomerase1n55A(c111)

全般に解糖系の酵素が多い基質酵素反応は極めて多彩

八本のβストランドとαへリックスが交互に組み合わさり対称的な樽(barrel)構造を形成す

る中央の樽構造は平行のβシートからなる

Imidazole glycerol phosphate synthasesubunit hisF1thfD(c121)

KHGKDPG aldolase1euaA(c1101)

フェレドキシン様Ferredoxin‐like (d58)

4Fe-4S Ferredoxin(1fxdd581)

1 234 4本の逆平行のβストランドと2本のαへリックスからな

分子機能は極めて多彩

CheY binding domain of CheA(1eayCd5824)

U1A RNA binding domain(1nu4Ad5871)

免疫グロブリン様Immunoglobulin‐like beta sandwich(b1)

Immunoglobulin Heavy chain variabledomain 1mjuH1(b111)

Immunoglobulin Heavy chain constantdomain 1mjuH2(b112)

Macromomycin1noaA (b171)

免疫グロブリン分子はH鎖とL鎖から

なりそれぞれ免疫グロブリン様ドメインからできている

V

C

V

C

C

C

V

CV

CC

C

L鎖

H鎖H鎖 L鎖

細胞表面あるいは分泌蛋白質が多い免疫や分子認識に関する機能を担うことが多い

4本のβストランドからなるβシートが二枚サンドイッチ状に重なった構造をとる逆平行のβシートが主

P‐loop スーパーファミリーP‐loop nucleoside triphosphate hydrolase(c37)

Ras-related protein RAB-5A1r2qA(c3718)

Guanylate kinase1gkyA(c3711)

RecA proteinDomain1 1xmsA1(c37111)

平行のβシートが主トポロジーには様々な変異あり

シグナル伝達DNA結合

モーター機能など多彩な分子機能を担うがATP GTPなどのヌクレオシド

の加水分解を行う点は共通

N C

132 4 5 6

ヌクレオシド結合部GxxxxGKTの

配列モチーフ(P-loop)を持つ

ロスマン フォールドNAD(P)‐binding Rossmann‐fold domains (c2)

Alcohol dehydrogenase gamma chaindomain2 1u3wA(c211)

Aspartate beta-semialdehydedehydrogenase2gz1A1(c213)

L-alanine dehydrogenase1pjcA1(c214)

補酵素を利用したNAD(P)を脱水素酵素を持つ基質を認識するドメインは別に存在する

NC

123 4 5 6

平行のβシートが主

7枚羽 βプロペラ7‐bladed beta‐propeller (b69)

Garactose oxydasedomain3 1k3iA3(b6911)

Guanine nucleotide-bindingprotein subunit beta-11gotB(b6941)

細胞膜付近のシグナル伝達や糖結合に関わることが多い

Influenza Neuraminidase 1f8dA(b6811)

6枚羽 βプロペラ

N C

321 4

のユニットが7回円環状に繰り返しされたフォールド

立体構造比較プログラム1990年ごろから多くの構造比較プログラムが開発されている

WEBアドレス スコア アライメント

DALI httpwwwebiacukdali

距離の差を独自の関数で変換したスコア

局所アライメントをモンテカルロ法でつなぎ合わせる

CE httpclsdsceducehtml

局所的なRMSD 局所アライメントを積み上げていく

MATRAS httpbiunitnaistjpmatras

距離の変化が相同相似で起こる確率の比をスコアとする

SSEで仮アライメント

を生成残基アライメントを収束するまで反復する

タンパク質の相同性の判断基準

100

同一残基率30以上

BLASTのE-value lt 00001

PSI-BLASTのE-value lt 00001

0102030407025 15 535

同一残基率(Sequence Identity)()

立体構造比較が必要

(1)立体構造の類似性が高い(DALIのZスコアMATRASのRdisスコア)(2)同一残基率がそこそこ高い(PSI-BLASTでヒットするSeqIDgt=15ぐらい)

(3)分子機能に類似性がある(補酵素酵素反応基質代謝経路等の共通性等)(4)基質補酵素の結合部位が類似しておりそのアミノ酸が保存(モチーフ)(5)ドメイン構成の共通性(6)スーパーフォールドの場合は特別な注意が必要

配列解析

同一残基率が25以下の場合の相同性の判断基準

50608090

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 55: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

三本へリックスバンドルDNARNA‐binding 3‐helical bundle(a4)

Mating type protein A2 yeast(1k61Aa411)

(1gvdAa413)(1wh5Aa411)

三本のへリックスが束になった構造DNAやRNAに結合する蛋白質が多い

DNAと

結合した構造(1k61)

TIMバレルTIM betaalpha barrel (c1)

Triosephosphate isomerase1n55A(c111)

全般に解糖系の酵素が多い基質酵素反応は極めて多彩

八本のβストランドとαへリックスが交互に組み合わさり対称的な樽(barrel)構造を形成す

る中央の樽構造は平行のβシートからなる

Imidazole glycerol phosphate synthasesubunit hisF1thfD(c121)

KHGKDPG aldolase1euaA(c1101)

フェレドキシン様Ferredoxin‐like (d58)

4Fe-4S Ferredoxin(1fxdd581)

1 234 4本の逆平行のβストランドと2本のαへリックスからな

分子機能は極めて多彩

CheY binding domain of CheA(1eayCd5824)

U1A RNA binding domain(1nu4Ad5871)

免疫グロブリン様Immunoglobulin‐like beta sandwich(b1)

Immunoglobulin Heavy chain variabledomain 1mjuH1(b111)

Immunoglobulin Heavy chain constantdomain 1mjuH2(b112)

Macromomycin1noaA (b171)

免疫グロブリン分子はH鎖とL鎖から

なりそれぞれ免疫グロブリン様ドメインからできている

V

C

V

C

C

C

V

CV

CC

C

L鎖

H鎖H鎖 L鎖

細胞表面あるいは分泌蛋白質が多い免疫や分子認識に関する機能を担うことが多い

4本のβストランドからなるβシートが二枚サンドイッチ状に重なった構造をとる逆平行のβシートが主

P‐loop スーパーファミリーP‐loop nucleoside triphosphate hydrolase(c37)

Ras-related protein RAB-5A1r2qA(c3718)

Guanylate kinase1gkyA(c3711)

RecA proteinDomain1 1xmsA1(c37111)

平行のβシートが主トポロジーには様々な変異あり

シグナル伝達DNA結合

モーター機能など多彩な分子機能を担うがATP GTPなどのヌクレオシド

の加水分解を行う点は共通

N C

132 4 5 6

ヌクレオシド結合部GxxxxGKTの

配列モチーフ(P-loop)を持つ

ロスマン フォールドNAD(P)‐binding Rossmann‐fold domains (c2)

Alcohol dehydrogenase gamma chaindomain2 1u3wA(c211)

Aspartate beta-semialdehydedehydrogenase2gz1A1(c213)

L-alanine dehydrogenase1pjcA1(c214)

補酵素を利用したNAD(P)を脱水素酵素を持つ基質を認識するドメインは別に存在する

NC

123 4 5 6

平行のβシートが主

7枚羽 βプロペラ7‐bladed beta‐propeller (b69)

Garactose oxydasedomain3 1k3iA3(b6911)

Guanine nucleotide-bindingprotein subunit beta-11gotB(b6941)

細胞膜付近のシグナル伝達や糖結合に関わることが多い

Influenza Neuraminidase 1f8dA(b6811)

6枚羽 βプロペラ

N C

321 4

のユニットが7回円環状に繰り返しされたフォールド

立体構造比較プログラム1990年ごろから多くの構造比較プログラムが開発されている

WEBアドレス スコア アライメント

DALI httpwwwebiacukdali

距離の差を独自の関数で変換したスコア

局所アライメントをモンテカルロ法でつなぎ合わせる

CE httpclsdsceducehtml

局所的なRMSD 局所アライメントを積み上げていく

MATRAS httpbiunitnaistjpmatras

距離の変化が相同相似で起こる確率の比をスコアとする

SSEで仮アライメント

を生成残基アライメントを収束するまで反復する

タンパク質の相同性の判断基準

100

同一残基率30以上

BLASTのE-value lt 00001

PSI-BLASTのE-value lt 00001

0102030407025 15 535

同一残基率(Sequence Identity)()

立体構造比較が必要

(1)立体構造の類似性が高い(DALIのZスコアMATRASのRdisスコア)(2)同一残基率がそこそこ高い(PSI-BLASTでヒットするSeqIDgt=15ぐらい)

(3)分子機能に類似性がある(補酵素酵素反応基質代謝経路等の共通性等)(4)基質補酵素の結合部位が類似しておりそのアミノ酸が保存(モチーフ)(5)ドメイン構成の共通性(6)スーパーフォールドの場合は特別な注意が必要

配列解析

同一残基率が25以下の場合の相同性の判断基準

50608090

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 56: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

TIMバレルTIM betaalpha barrel (c1)

Triosephosphate isomerase1n55A(c111)

全般に解糖系の酵素が多い基質酵素反応は極めて多彩

八本のβストランドとαへリックスが交互に組み合わさり対称的な樽(barrel)構造を形成す

る中央の樽構造は平行のβシートからなる

Imidazole glycerol phosphate synthasesubunit hisF1thfD(c121)

KHGKDPG aldolase1euaA(c1101)

フェレドキシン様Ferredoxin‐like (d58)

4Fe-4S Ferredoxin(1fxdd581)

1 234 4本の逆平行のβストランドと2本のαへリックスからな

分子機能は極めて多彩

CheY binding domain of CheA(1eayCd5824)

U1A RNA binding domain(1nu4Ad5871)

免疫グロブリン様Immunoglobulin‐like beta sandwich(b1)

Immunoglobulin Heavy chain variabledomain 1mjuH1(b111)

Immunoglobulin Heavy chain constantdomain 1mjuH2(b112)

Macromomycin1noaA (b171)

免疫グロブリン分子はH鎖とL鎖から

なりそれぞれ免疫グロブリン様ドメインからできている

V

C

V

C

C

C

V

CV

CC

C

L鎖

H鎖H鎖 L鎖

細胞表面あるいは分泌蛋白質が多い免疫や分子認識に関する機能を担うことが多い

4本のβストランドからなるβシートが二枚サンドイッチ状に重なった構造をとる逆平行のβシートが主

P‐loop スーパーファミリーP‐loop nucleoside triphosphate hydrolase(c37)

Ras-related protein RAB-5A1r2qA(c3718)

Guanylate kinase1gkyA(c3711)

RecA proteinDomain1 1xmsA1(c37111)

平行のβシートが主トポロジーには様々な変異あり

シグナル伝達DNA結合

モーター機能など多彩な分子機能を担うがATP GTPなどのヌクレオシド

の加水分解を行う点は共通

N C

132 4 5 6

ヌクレオシド結合部GxxxxGKTの

配列モチーフ(P-loop)を持つ

ロスマン フォールドNAD(P)‐binding Rossmann‐fold domains (c2)

Alcohol dehydrogenase gamma chaindomain2 1u3wA(c211)

Aspartate beta-semialdehydedehydrogenase2gz1A1(c213)

L-alanine dehydrogenase1pjcA1(c214)

補酵素を利用したNAD(P)を脱水素酵素を持つ基質を認識するドメインは別に存在する

NC

123 4 5 6

平行のβシートが主

7枚羽 βプロペラ7‐bladed beta‐propeller (b69)

Garactose oxydasedomain3 1k3iA3(b6911)

Guanine nucleotide-bindingprotein subunit beta-11gotB(b6941)

細胞膜付近のシグナル伝達や糖結合に関わることが多い

Influenza Neuraminidase 1f8dA(b6811)

6枚羽 βプロペラ

N C

321 4

のユニットが7回円環状に繰り返しされたフォールド

立体構造比較プログラム1990年ごろから多くの構造比較プログラムが開発されている

WEBアドレス スコア アライメント

DALI httpwwwebiacukdali

距離の差を独自の関数で変換したスコア

局所アライメントをモンテカルロ法でつなぎ合わせる

CE httpclsdsceducehtml

局所的なRMSD 局所アライメントを積み上げていく

MATRAS httpbiunitnaistjpmatras

距離の変化が相同相似で起こる確率の比をスコアとする

SSEで仮アライメント

を生成残基アライメントを収束するまで反復する

タンパク質の相同性の判断基準

100

同一残基率30以上

BLASTのE-value lt 00001

PSI-BLASTのE-value lt 00001

0102030407025 15 535

同一残基率(Sequence Identity)()

立体構造比較が必要

(1)立体構造の類似性が高い(DALIのZスコアMATRASのRdisスコア)(2)同一残基率がそこそこ高い(PSI-BLASTでヒットするSeqIDgt=15ぐらい)

(3)分子機能に類似性がある(補酵素酵素反応基質代謝経路等の共通性等)(4)基質補酵素の結合部位が類似しておりそのアミノ酸が保存(モチーフ)(5)ドメイン構成の共通性(6)スーパーフォールドの場合は特別な注意が必要

配列解析

同一残基率が25以下の場合の相同性の判断基準

50608090

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 57: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

フェレドキシン様Ferredoxin‐like (d58)

4Fe-4S Ferredoxin(1fxdd581)

1 234 4本の逆平行のβストランドと2本のαへリックスからな

分子機能は極めて多彩

CheY binding domain of CheA(1eayCd5824)

U1A RNA binding domain(1nu4Ad5871)

免疫グロブリン様Immunoglobulin‐like beta sandwich(b1)

Immunoglobulin Heavy chain variabledomain 1mjuH1(b111)

Immunoglobulin Heavy chain constantdomain 1mjuH2(b112)

Macromomycin1noaA (b171)

免疫グロブリン分子はH鎖とL鎖から

なりそれぞれ免疫グロブリン様ドメインからできている

V

C

V

C

C

C

V

CV

CC

C

L鎖

H鎖H鎖 L鎖

細胞表面あるいは分泌蛋白質が多い免疫や分子認識に関する機能を担うことが多い

4本のβストランドからなるβシートが二枚サンドイッチ状に重なった構造をとる逆平行のβシートが主

P‐loop スーパーファミリーP‐loop nucleoside triphosphate hydrolase(c37)

Ras-related protein RAB-5A1r2qA(c3718)

Guanylate kinase1gkyA(c3711)

RecA proteinDomain1 1xmsA1(c37111)

平行のβシートが主トポロジーには様々な変異あり

シグナル伝達DNA結合

モーター機能など多彩な分子機能を担うがATP GTPなどのヌクレオシド

の加水分解を行う点は共通

N C

132 4 5 6

ヌクレオシド結合部GxxxxGKTの

配列モチーフ(P-loop)を持つ

ロスマン フォールドNAD(P)‐binding Rossmann‐fold domains (c2)

Alcohol dehydrogenase gamma chaindomain2 1u3wA(c211)

Aspartate beta-semialdehydedehydrogenase2gz1A1(c213)

L-alanine dehydrogenase1pjcA1(c214)

補酵素を利用したNAD(P)を脱水素酵素を持つ基質を認識するドメインは別に存在する

NC

123 4 5 6

平行のβシートが主

7枚羽 βプロペラ7‐bladed beta‐propeller (b69)

Garactose oxydasedomain3 1k3iA3(b6911)

Guanine nucleotide-bindingprotein subunit beta-11gotB(b6941)

細胞膜付近のシグナル伝達や糖結合に関わることが多い

Influenza Neuraminidase 1f8dA(b6811)

6枚羽 βプロペラ

N C

321 4

のユニットが7回円環状に繰り返しされたフォールド

立体構造比較プログラム1990年ごろから多くの構造比較プログラムが開発されている

WEBアドレス スコア アライメント

DALI httpwwwebiacukdali

距離の差を独自の関数で変換したスコア

局所アライメントをモンテカルロ法でつなぎ合わせる

CE httpclsdsceducehtml

局所的なRMSD 局所アライメントを積み上げていく

MATRAS httpbiunitnaistjpmatras

距離の変化が相同相似で起こる確率の比をスコアとする

SSEで仮アライメント

を生成残基アライメントを収束するまで反復する

タンパク質の相同性の判断基準

100

同一残基率30以上

BLASTのE-value lt 00001

PSI-BLASTのE-value lt 00001

0102030407025 15 535

同一残基率(Sequence Identity)()

立体構造比較が必要

(1)立体構造の類似性が高い(DALIのZスコアMATRASのRdisスコア)(2)同一残基率がそこそこ高い(PSI-BLASTでヒットするSeqIDgt=15ぐらい)

(3)分子機能に類似性がある(補酵素酵素反応基質代謝経路等の共通性等)(4)基質補酵素の結合部位が類似しておりそのアミノ酸が保存(モチーフ)(5)ドメイン構成の共通性(6)スーパーフォールドの場合は特別な注意が必要

配列解析

同一残基率が25以下の場合の相同性の判断基準

50608090

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 58: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

免疫グロブリン様Immunoglobulin‐like beta sandwich(b1)

Immunoglobulin Heavy chain variabledomain 1mjuH1(b111)

Immunoglobulin Heavy chain constantdomain 1mjuH2(b112)

Macromomycin1noaA (b171)

免疫グロブリン分子はH鎖とL鎖から

なりそれぞれ免疫グロブリン様ドメインからできている

V

C

V

C

C

C

V

CV

CC

C

L鎖

H鎖H鎖 L鎖

細胞表面あるいは分泌蛋白質が多い免疫や分子認識に関する機能を担うことが多い

4本のβストランドからなるβシートが二枚サンドイッチ状に重なった構造をとる逆平行のβシートが主

P‐loop スーパーファミリーP‐loop nucleoside triphosphate hydrolase(c37)

Ras-related protein RAB-5A1r2qA(c3718)

Guanylate kinase1gkyA(c3711)

RecA proteinDomain1 1xmsA1(c37111)

平行のβシートが主トポロジーには様々な変異あり

シグナル伝達DNA結合

モーター機能など多彩な分子機能を担うがATP GTPなどのヌクレオシド

の加水分解を行う点は共通

N C

132 4 5 6

ヌクレオシド結合部GxxxxGKTの

配列モチーフ(P-loop)を持つ

ロスマン フォールドNAD(P)‐binding Rossmann‐fold domains (c2)

Alcohol dehydrogenase gamma chaindomain2 1u3wA(c211)

Aspartate beta-semialdehydedehydrogenase2gz1A1(c213)

L-alanine dehydrogenase1pjcA1(c214)

補酵素を利用したNAD(P)を脱水素酵素を持つ基質を認識するドメインは別に存在する

NC

123 4 5 6

平行のβシートが主

7枚羽 βプロペラ7‐bladed beta‐propeller (b69)

Garactose oxydasedomain3 1k3iA3(b6911)

Guanine nucleotide-bindingprotein subunit beta-11gotB(b6941)

細胞膜付近のシグナル伝達や糖結合に関わることが多い

Influenza Neuraminidase 1f8dA(b6811)

6枚羽 βプロペラ

N C

321 4

のユニットが7回円環状に繰り返しされたフォールド

立体構造比較プログラム1990年ごろから多くの構造比較プログラムが開発されている

WEBアドレス スコア アライメント

DALI httpwwwebiacukdali

距離の差を独自の関数で変換したスコア

局所アライメントをモンテカルロ法でつなぎ合わせる

CE httpclsdsceducehtml

局所的なRMSD 局所アライメントを積み上げていく

MATRAS httpbiunitnaistjpmatras

距離の変化が相同相似で起こる確率の比をスコアとする

SSEで仮アライメント

を生成残基アライメントを収束するまで反復する

タンパク質の相同性の判断基準

100

同一残基率30以上

BLASTのE-value lt 00001

PSI-BLASTのE-value lt 00001

0102030407025 15 535

同一残基率(Sequence Identity)()

立体構造比較が必要

(1)立体構造の類似性が高い(DALIのZスコアMATRASのRdisスコア)(2)同一残基率がそこそこ高い(PSI-BLASTでヒットするSeqIDgt=15ぐらい)

(3)分子機能に類似性がある(補酵素酵素反応基質代謝経路等の共通性等)(4)基質補酵素の結合部位が類似しておりそのアミノ酸が保存(モチーフ)(5)ドメイン構成の共通性(6)スーパーフォールドの場合は特別な注意が必要

配列解析

同一残基率が25以下の場合の相同性の判断基準

50608090

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 59: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

P‐loop スーパーファミリーP‐loop nucleoside triphosphate hydrolase(c37)

Ras-related protein RAB-5A1r2qA(c3718)

Guanylate kinase1gkyA(c3711)

RecA proteinDomain1 1xmsA1(c37111)

平行のβシートが主トポロジーには様々な変異あり

シグナル伝達DNA結合

モーター機能など多彩な分子機能を担うがATP GTPなどのヌクレオシド

の加水分解を行う点は共通

N C

132 4 5 6

ヌクレオシド結合部GxxxxGKTの

配列モチーフ(P-loop)を持つ

ロスマン フォールドNAD(P)‐binding Rossmann‐fold domains (c2)

Alcohol dehydrogenase gamma chaindomain2 1u3wA(c211)

Aspartate beta-semialdehydedehydrogenase2gz1A1(c213)

L-alanine dehydrogenase1pjcA1(c214)

補酵素を利用したNAD(P)を脱水素酵素を持つ基質を認識するドメインは別に存在する

NC

123 4 5 6

平行のβシートが主

7枚羽 βプロペラ7‐bladed beta‐propeller (b69)

Garactose oxydasedomain3 1k3iA3(b6911)

Guanine nucleotide-bindingprotein subunit beta-11gotB(b6941)

細胞膜付近のシグナル伝達や糖結合に関わることが多い

Influenza Neuraminidase 1f8dA(b6811)

6枚羽 βプロペラ

N C

321 4

のユニットが7回円環状に繰り返しされたフォールド

立体構造比較プログラム1990年ごろから多くの構造比較プログラムが開発されている

WEBアドレス スコア アライメント

DALI httpwwwebiacukdali

距離の差を独自の関数で変換したスコア

局所アライメントをモンテカルロ法でつなぎ合わせる

CE httpclsdsceducehtml

局所的なRMSD 局所アライメントを積み上げていく

MATRAS httpbiunitnaistjpmatras

距離の変化が相同相似で起こる確率の比をスコアとする

SSEで仮アライメント

を生成残基アライメントを収束するまで反復する

タンパク質の相同性の判断基準

100

同一残基率30以上

BLASTのE-value lt 00001

PSI-BLASTのE-value lt 00001

0102030407025 15 535

同一残基率(Sequence Identity)()

立体構造比較が必要

(1)立体構造の類似性が高い(DALIのZスコアMATRASのRdisスコア)(2)同一残基率がそこそこ高い(PSI-BLASTでヒットするSeqIDgt=15ぐらい)

(3)分子機能に類似性がある(補酵素酵素反応基質代謝経路等の共通性等)(4)基質補酵素の結合部位が類似しておりそのアミノ酸が保存(モチーフ)(5)ドメイン構成の共通性(6)スーパーフォールドの場合は特別な注意が必要

配列解析

同一残基率が25以下の場合の相同性の判断基準

50608090

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 60: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

ロスマン フォールドNAD(P)‐binding Rossmann‐fold domains (c2)

Alcohol dehydrogenase gamma chaindomain2 1u3wA(c211)

Aspartate beta-semialdehydedehydrogenase2gz1A1(c213)

L-alanine dehydrogenase1pjcA1(c214)

補酵素を利用したNAD(P)を脱水素酵素を持つ基質を認識するドメインは別に存在する

NC

123 4 5 6

平行のβシートが主

7枚羽 βプロペラ7‐bladed beta‐propeller (b69)

Garactose oxydasedomain3 1k3iA3(b6911)

Guanine nucleotide-bindingprotein subunit beta-11gotB(b6941)

細胞膜付近のシグナル伝達や糖結合に関わることが多い

Influenza Neuraminidase 1f8dA(b6811)

6枚羽 βプロペラ

N C

321 4

のユニットが7回円環状に繰り返しされたフォールド

立体構造比較プログラム1990年ごろから多くの構造比較プログラムが開発されている

WEBアドレス スコア アライメント

DALI httpwwwebiacukdali

距離の差を独自の関数で変換したスコア

局所アライメントをモンテカルロ法でつなぎ合わせる

CE httpclsdsceducehtml

局所的なRMSD 局所アライメントを積み上げていく

MATRAS httpbiunitnaistjpmatras

距離の変化が相同相似で起こる確率の比をスコアとする

SSEで仮アライメント

を生成残基アライメントを収束するまで反復する

タンパク質の相同性の判断基準

100

同一残基率30以上

BLASTのE-value lt 00001

PSI-BLASTのE-value lt 00001

0102030407025 15 535

同一残基率(Sequence Identity)()

立体構造比較が必要

(1)立体構造の類似性が高い(DALIのZスコアMATRASのRdisスコア)(2)同一残基率がそこそこ高い(PSI-BLASTでヒットするSeqIDgt=15ぐらい)

(3)分子機能に類似性がある(補酵素酵素反応基質代謝経路等の共通性等)(4)基質補酵素の結合部位が類似しておりそのアミノ酸が保存(モチーフ)(5)ドメイン構成の共通性(6)スーパーフォールドの場合は特別な注意が必要

配列解析

同一残基率が25以下の場合の相同性の判断基準

50608090

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 61: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

7枚羽 βプロペラ7‐bladed beta‐propeller (b69)

Garactose oxydasedomain3 1k3iA3(b6911)

Guanine nucleotide-bindingprotein subunit beta-11gotB(b6941)

細胞膜付近のシグナル伝達や糖結合に関わることが多い

Influenza Neuraminidase 1f8dA(b6811)

6枚羽 βプロペラ

N C

321 4

のユニットが7回円環状に繰り返しされたフォールド

立体構造比較プログラム1990年ごろから多くの構造比較プログラムが開発されている

WEBアドレス スコア アライメント

DALI httpwwwebiacukdali

距離の差を独自の関数で変換したスコア

局所アライメントをモンテカルロ法でつなぎ合わせる

CE httpclsdsceducehtml

局所的なRMSD 局所アライメントを積み上げていく

MATRAS httpbiunitnaistjpmatras

距離の変化が相同相似で起こる確率の比をスコアとする

SSEで仮アライメント

を生成残基アライメントを収束するまで反復する

タンパク質の相同性の判断基準

100

同一残基率30以上

BLASTのE-value lt 00001

PSI-BLASTのE-value lt 00001

0102030407025 15 535

同一残基率(Sequence Identity)()

立体構造比較が必要

(1)立体構造の類似性が高い(DALIのZスコアMATRASのRdisスコア)(2)同一残基率がそこそこ高い(PSI-BLASTでヒットするSeqIDgt=15ぐらい)

(3)分子機能に類似性がある(補酵素酵素反応基質代謝経路等の共通性等)(4)基質補酵素の結合部位が類似しておりそのアミノ酸が保存(モチーフ)(5)ドメイン構成の共通性(6)スーパーフォールドの場合は特別な注意が必要

配列解析

同一残基率が25以下の場合の相同性の判断基準

50608090

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 62: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

立体構造比較プログラム1990年ごろから多くの構造比較プログラムが開発されている

WEBアドレス スコア アライメント

DALI httpwwwebiacukdali

距離の差を独自の関数で変換したスコア

局所アライメントをモンテカルロ法でつなぎ合わせる

CE httpclsdsceducehtml

局所的なRMSD 局所アライメントを積み上げていく

MATRAS httpbiunitnaistjpmatras

距離の変化が相同相似で起こる確率の比をスコアとする

SSEで仮アライメント

を生成残基アライメントを収束するまで反復する

タンパク質の相同性の判断基準

100

同一残基率30以上

BLASTのE-value lt 00001

PSI-BLASTのE-value lt 00001

0102030407025 15 535

同一残基率(Sequence Identity)()

立体構造比較が必要

(1)立体構造の類似性が高い(DALIのZスコアMATRASのRdisスコア)(2)同一残基率がそこそこ高い(PSI-BLASTでヒットするSeqIDgt=15ぐらい)

(3)分子機能に類似性がある(補酵素酵素反応基質代謝経路等の共通性等)(4)基質補酵素の結合部位が類似しておりそのアミノ酸が保存(モチーフ)(5)ドメイン構成の共通性(6)スーパーフォールドの場合は特別な注意が必要

配列解析

同一残基率が25以下の場合の相同性の判断基準

50608090

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 63: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

タンパク質の相同性の判断基準

100

同一残基率30以上

BLASTのE-value lt 00001

PSI-BLASTのE-value lt 00001

0102030407025 15 535

同一残基率(Sequence Identity)()

立体構造比較が必要

(1)立体構造の類似性が高い(DALIのZスコアMATRASのRdisスコア)(2)同一残基率がそこそこ高い(PSI-BLASTでヒットするSeqIDgt=15ぐらい)

(3)分子機能に類似性がある(補酵素酵素反応基質代謝経路等の共通性等)(4)基質補酵素の結合部位が類似しておりそのアミノ酸が保存(モチーフ)(5)ドメイン構成の共通性(6)スーパーフォールドの場合は特別な注意が必要

配列解析

同一残基率が25以下の場合の相同性の判断基準

50608090

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 64: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 65: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

H20 問63

1 スーパーフォールドとは進化的類縁関係が考えられないようなタンパク質間であっても共通して現れる類似フォールドの集合である

2 SCOP CATHなどの構造分類データベースは非階層的に構

築されている3 構造分類における立体構造のクラスの代表的なものとして

all-αall-βαβα+βがある

4 タンパク質の立体構造は通常ドメインを単位として分類される

次の立体構造分類に関する記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 66: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

タンパク質の立体構造予測

M T D KL T S LR Q Y TT V V AD T G D

Amino acids sequence

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 67: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

3次構造予測(1)Ab initio 予測

分子動力学法(Molecular Dynamics MD) ニュートンの運動方程式に従って原子を動かす

原子モデルとポテンシャルエネルギー関数を設定より低いエネルギー値になるように構造を変形していく

構造を探索するための手法

エネルギー関数原子を作用単位とした古典力学的なものが多い量子力学は使わないアミノ酸単位の粗視化したモデルもよく用いられる

分子力学法(Molecular Mechanics MM)エネルギーが低くなる方向に原子を動かす

モンテカルロ法(Monte Carlo MC)ランダムに原子を動かす

rArr 近年フラグメントアセンブリによるモンテカルロ法がよく使われてきている

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 68: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

フラグメントアセンブリ法立体構造データベースから切り出してきた短い(9残基ぐらい)フラグメントのライブラリを用意するAb initio予測で構造を変形させるときにフラグメントのライブラリから

一つ選びその構造と入れ替えることで予測を行う

立体構造データベースから切り出したフラグメントライブラリ

構造の一部をライブラリから選んだフラグメントと入れ替える

予測したいタンパク質の立体構造

天然にある構造の部分を組み合わせて立体構造を構築するのでそれらしく局所構造が再現されやすい

エネルギーが減少したら変化させた構造を採択

David BakerグループのプログラムROSETTAが有名

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 69: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 70: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

H20 問65

1 分子動力学法は英語ではMolecular DynamicsでありMDという略称も使われる

2 分子力学法は英語ではMolecular MechanicsでありMMという略称も使われる

3 分子動力学法では分子を構成する各原子の運動はニュートンの運動方程式で記述される

4 分子力学法では分子を構成する各原子の運動はシュレーディンガーの波動方程式で記述される

生体高分子の立体構造解析に用いられる計算手法のうち分子動力学法と分子力学法に関する以下の記述において不適切なものを選択肢の中から選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 71: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

テンプレート構造

ステップ1フォールド認識 ステップ2モデリング

予測対象配列

立体構造データベース

LNVANGKSVIGPALLEEVWGSRD

M

N

I

A

DG

SV

V

GA L

QE

A W

FT

QD

PT

R

L

N

V

A

NG

SV

I

GL L

EE

V W

FS

QD

PA

R K

LNVANGKSVIGPALLEEVWFS-RD

MNIADG-SVVGPTALQEAWFTQRD

テンプレート構造とそのアライメント

3次構造予測(2)比較モデリング(ホモロジーモデリング)

原理 立体構造はアミノ酸配列より保存しやすい

立体構造データベースの中からクエリ配列に

も適合する構造(テンプレート構造)を探す

テンプレート構造に従って全原子を構築(1)側鎖原子の構築(2)挿入ループ部を構築

BLASTFASTA PSI-BLASThellipスレディング法

MODELLER SCRWRLhellip

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 72: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

スレッディング法(3D‐1D法)

α外

α内

α外

β内

β内

V FD L G

予測対象配列

立体

構造

構造(3D)と配列(1D)の適合関数を用いてテンプレート構造と予測対象配列

の 適なアライメントを生成しその適合性を評価する方法

1体型のスコアでは標準的な動的計画法を使用2体型の場合は構造アライメントと似た発見的な解法が用いられる

V

F

D

LG

α外

α内

α外

β内

β内

V

F

D

LG

二次構造(αβcoil)埋

もれ度(内外)などの環境とアミノ酸の適合性のスコアBowie Luthy Eisenberg (1992)の3Dプロフィールが

有名

アミノ酸間の距離によるスコア Sipplらが提

案したアミノ酸間の統計ポテンシャルが有名

1体型スコア 2体型スコア 配列と構造のアライメント

テンプレート構造(3D)に当てはまる配列(1D)を探すことはAb initioの構造と志向が反対であるのでスレディング法を

「逆フォールディング問題」と呼ぶこともある

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 73: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

モデリングテンプレート構造を元にした全原子の構築

Sequence ALIMSTKGFVSStructure LLLM---GFIT

(1)ループの構築

(2)側鎖原子の構築

Sequence AYVINDStructure AFVVTD AFVVTD AYVIND

テンプレート モデル

テンプレート モデル

Saliらが開発したMODELLER が有名(httpwwwsalilaborgmodellermodellerhtml

側鎖原子の構築だけに特化したプログラム側鎖構造ライブラリとしてDunbrackらが開発したSCRWRLがある(httpdunbrackfccceduscwrl4SCWRL4php)

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 74: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

DBaker and ASali Science Vol 294 93-96

リガンドの設計

高分子のドッキング

低分子のドッキング

部位特異的置換のサポート

保存している表面残基の発見

反応メカニズムの理解

[分子置換法による精密化]

[NMRの精密化]

SeqID = 50

SeqID = 30

Ab initio

[電顕等の粗い電子密度へのフィット]

SeqID = 100 モデリングした構造の精度と用途

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 75: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 76: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

H19 問52タンパク質の立体構造予測に用いられる手法名として適切でないものを選択肢の中から一つ選べ

1ホモロジーモデリング法2スレッディング法3フラグメントアセンブリ法4系統フットプリント法

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 77: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 78: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

H19 問72以下に示したホモロジーモデリングによるタンパク質の立体構造モデルの構築についての記述の中に不適切なものがある一つ選べ

1 信頼性の高いモデルを得るには立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の正確なアライメントが要求される

2 一般に立体構造既知のアミノ酸配列と立体構造未知のアミノ酸配列の一致度が低かったり一方に大きな挿入あるいは欠失が含まれていると高精度のモデル構造は構築できない

3 基本的にはホモログの既知立体構造を鋳型としてモデル構造が構築される

4 一般に保存度の高い活性中心よりも保存度の低いループ領域の方がモデル中で正確に構築されている(反対保存度の低いループのほうが欠失が多いため一般にモデルの構築は難しい)

平成19年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 79: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

1 Sipplらはタンパク質配列を正しい立体構造と偽の立体構造とに

当てはめたときこの両者を残基間の安定性の差として区別できることを見いだしDifferential Display法と名付けた

2 Saliらが開発したMODELLERプログラムはホモロジー法に基づ

く立体構造予測を行う3 Dunbrackらが開発したSCWRLは側鎖ロータマーのライブラリで

ある4 Eisenbergらは与えられた立体構造からそれに もふさわしい

アミノ酸配列を求める逆フォールディング問題に取り組んだ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用

Page 80: バイオインフォマティクス基礎講座 分子系統解析とタンパク質 … · RasMol Win Mac Linux(ソース 公開) 独自の高速描画アルゴリズムを用い、非力なハード

H20 問64タンパク質の立体構造予測に関連した下記の記述のうち不適切なものを選択肢の中から一つ選べ

平成20年度バイオインフォマティクス技術者認定試験

(日本バイオインフォマティクス学会主催)問題から引用