MODELLER を利用してタンパク質の立体構造を予測するには、最低限、次に示す 3 つのファイルを必要とする。
- テンプレートの原子座標ファイル:テンプレートとなるタンパク質を構成する各アミノ酸の原子座標が記載されているファイル。PDB ファイルなどで代用する。
- アライメントファイル:テンプレートとなるタンパク質のアミノ酸配列と予測対象のアミノ酸配列のアライメントが記載されているファイル。
- MODELLER 実行スクリプト:MODELLER を実行する際に必要なオプション設定などを記載する。
このページでは、例として次のタンパク質の立体構造を予測する方法を示す。この構造不明のアミノ酸配列をターゲット配列とする。
MNGTEGPNFYVPFSNKTGVVRSPFEAPQYYLAEPWQFSMLAAYMFLLIMLGFPINFLTLYVTVQHKKLRTPLNYILLNLA VADLFMVFGGFTTTLYTSLHGYFVFGPTGCNLEGFFATLGGEIALWSLVVLAIERYVVVCKPMSNFRFGENHAIMGVAFT WVMALACAAPPLVGWSRYIPEGMQCSCGIDYYTPHEETNNESFVIYMFVVHFIIPLIVIFFCYGQLVFTVKEAAAQQQES ATTQKAEKEVTRMVIIMVIAFLICWLPYAGVAFYIFTHQGSDFGPIFMTIPAFFAKTSAVYNPVIYIMMNKQFRNCMVTT LCCGKNPLGDDEASTTVSKTETSQVAPA
MODELLER を用いてタンパク質の立体構造をモデリングするとき、以下の手順で行う。
- テンプレート配列を探す
- ターゲット配列とテンプレート配列のアライメントを計算する
- MODELLER を実行する
1. テンプレートを探す
立体構造予測の際に利用するテンプレートは、配列の特徴や目的に応じて、PSI-BLAST などのホモロジー検索プログラムを利用して探す。相同性の高い配列が多く検索されるが、ここでは 4A4M を利用する。
4A4M の PDB ファイルを必要とするので、ダウンロードして 4A4M.pdb の名前で保存する。
2. アライメントファイルを計算する
次に、ターゲット配列とテンプレート配列のアラインメントを計算する。アラインメントを計算する際に Clustal Omega や MAFFT などのプログラムを利用する。計算したアラインメントを以下のように PIR 形式で保存する。1 行目には配列 ID を記入し、2 行目には MODELLER に与えるオプションを記入し、3 行目からは配列を記入する。
以下のファイルを align.pir の名前で保存する。
>P1;TARGET sequence:TARGET:::::::: MNGTEGPNFYVPFSNKTGVVRSPFEAPQYYLAEPWQFSMLAAYMFLLIMLGFPINFLTLY VTVQHKKLRTPLNYILLNLAVADLFMVFG-GFTTTLYTSLHGYFVFGPTGCNLEGFFATL GGEIALWSLVVLAIERYVVVCKPMSN-FRFGENHAIMGVAFTWVMALACAAPPLVGWSRY IPEGMQCSCGIDYYTPHEETNNESFVIYMFVVHFIIPLIVIFFCYGQLVFTVK------- -----EAAAQQQESATTQKAEKEVTRMVIIMVIAFLICWLPYAGVAFYIFTHQGSDFGPI FMTIPAFFAKTSAVYNPVIYIMMNKQFRNCMVTTL-----CCGKN---PLGDDEASTTVS KTETSQVAPA--------* >P1;4A4M structureX:4A4M:1:A:326:A:::: MCGTEGPNFYVPFSNKTGVVRSPFEAPQYYLAEPWQFSMLAAYMFLLIMLGFPINFLTLY VTVQHKKLRTPLNYILLNLAVADLFMVFG-GFTTTLYTSLHGYFVFGPTGCNLEGFFATL GGEIALWSLVVLAIERYVVVCKPMSN-FRFGENHAIMGVAFTWVMALACAAPPLVGWSRY IPEGMQCSCGIDYYTPHEETNNESFVIYMFVVHFIIPLIVIFFCYGQLVFTVK------- -----EAAAQQQESATTQKAEKEVTRMVIIYVIAFLICWLPYAGVAFYIFTHQGSCFGPI FMTIPAFFAKTSAVYNPVIYIMMNKQFRNCMVTTL-----CCGKN--------------- ------------------*
3. MODELLER を実行する
次に、MODELLER を実行するためのスクリプトファイルを作成する。以下の内容を script.py の名前で保存する。
from modeller import *
from modeller.automodel import *
log.verbose()
env = environ()
a = automodel(env,
alnfile = 'align.pir',
knowns = '4A4M',
sequence = 'TARGET')
a.starting_model= 1
a.ending_model = 1
a.make()
最後に、テンプレートの PDB ファイル(4A4M.pdb)、アラインメントファイル(align.pir)およびスクリプトファイル(script.py)をすべて同じディレクトリ保存し、ターミナル(端末)を立ち上げて、以下のコマンドを実行する。
# 上述の 3 つのファイルが保存されているディレクトリに移動
cd path_to_your_file_directory
# MODELLER を実行
mod9.13 script.py
MODELLER が正しく実行されると、同じディレクトリに複数のファイルが生成される。
生成されたファイル | 内容 |
TARGET.B999001.pdb | 予測結果。複数の予測結果が出力される場合は、B999002、B999003 のように続く。 |
TARGET.D000001 | |
TARGET.ini | |
TARGET.rsr | |
TARGET.sch | |
TARGET.V99990001 | |
script.log |