MODELLER によるホモロジーモデリング

簡単な実行例

MODELLER を利用してタンパク質の立体構造を予測するには、最低限、次に示す 3 つのファイルを必要とする。

  • テンプレートの原子座標ファイル:テンプレートとなるタンパク質を構成する各アミノ酸の原子座標が記載されているファイル。PDB ファイルなどで代用する。
  • アライメントファイル:テンプレートとなるタンパク質のアミノ酸配列と予測対象のアミノ酸配列のアライメントが記載されているファイル。
  • MODELLER 実行スクリプト:MODELLER を実行する際に必要なオプション設定などを記載する。

このページでは、例として次のタンパク質の立体構造を予測する方法を示す。この構造不明のアミノ酸配列をターゲット配列とする。

MNGTEGPNFYVPFSNKTGVVRSPFEAPQYYLAEPWQFSMLAAYMFLLIMLGFPINFLTLYVTVQHKKLRTPLNYILLNLA
VADLFMVFGGFTTTLYTSLHGYFVFGPTGCNLEGFFATLGGEIALWSLVVLAIERYVVVCKPMSNFRFGENHAIMGVAFT
WVMALACAAPPLVGWSRYIPEGMQCSCGIDYYTPHEETNNESFVIYMFVVHFIIPLIVIFFCYGQLVFTVKEAAAQQQES
ATTQKAEKEVTRMVIIMVIAFLICWLPYAGVAFYIFTHQGSDFGPIFMTIPAFFAKTSAVYNPVIYIMMNKQFRNCMVTT
LCCGKNPLGDDEASTTVSKTETSQVAPA

MODELLER を用いてタンパク質の立体構造をモデリングするとき、以下の手順で行う。

  1. テンプレート配列を探す
  2. ターゲット配列とテンプレート配列のアライメントを計算する
  3. MODELLER を実行する

1. テンプレートを探す

立体構造予測の際に利用するテンプレートは、配列の特徴や目的に応じて、PSI-BLAST などのホモロジー検索プログラムを利用して探す。相同性の高い配列が多く検索されるが、ここでは 4A4M を利用する。

4A4M の PDB ファイルを必要とするので、ダウンロードして 4A4M.pdb の名前で保存する。

2. アライメントファイルを計算する

次に、ターゲット配列とテンプレート配列のアラインメントを計算する。アラインメントを計算する際に Clustal Omega や MAFFT などのプログラムを利用する。計算したアラインメントを以下のように PIR 形式で保存する。1 行目には配列 ID を記入し、2 行目には MODELLER に与えるオプションを記入し、3 行目からは配列を記入する。

以下のファイルを align.pir の名前で保存する。

>P1;TARGET
sequence:TARGET::::::::
MNGTEGPNFYVPFSNKTGVVRSPFEAPQYYLAEPWQFSMLAAYMFLLIMLGFPINFLTLY
VTVQHKKLRTPLNYILLNLAVADLFMVFG-GFTTTLYTSLHGYFVFGPTGCNLEGFFATL
GGEIALWSLVVLAIERYVVVCKPMSN-FRFGENHAIMGVAFTWVMALACAAPPLVGWSRY
IPEGMQCSCGIDYYTPHEETNNESFVIYMFVVHFIIPLIVIFFCYGQLVFTVK-------
-----EAAAQQQESATTQKAEKEVTRMVIIMVIAFLICWLPYAGVAFYIFTHQGSDFGPI
FMTIPAFFAKTSAVYNPVIYIMMNKQFRNCMVTTL-----CCGKN---PLGDDEASTTVS
KTETSQVAPA--------*
>P1;4A4M
structureX:4A4M:1:A:326:A::::
MCGTEGPNFYVPFSNKTGVVRSPFEAPQYYLAEPWQFSMLAAYMFLLIMLGFPINFLTLY
VTVQHKKLRTPLNYILLNLAVADLFMVFG-GFTTTLYTSLHGYFVFGPTGCNLEGFFATL
GGEIALWSLVVLAIERYVVVCKPMSN-FRFGENHAIMGVAFTWVMALACAAPPLVGWSRY
IPEGMQCSCGIDYYTPHEETNNESFVIYMFVVHFIIPLIVIFFCYGQLVFTVK-------
-----EAAAQQQESATTQKAEKEVTRMVIIYVIAFLICWLPYAGVAFYIFTHQGSCFGPI
FMTIPAFFAKTSAVYNPVIYIMMNKQFRNCMVTTL-----CCGKN---------------
------------------*

3. MODELLER を実行する

次に、MODELLER を実行するためのスクリプトファイルを作成する。以下の内容を script.py の名前で保存する。

from modeller import *
from modeller.automodel import *

log.verbose()
env = environ()

a = automodel(env,
              alnfile  = 'align.pir',
              knowns   = '4A4M',
              sequence = 'TARGET')
a.starting_model= 1
a.ending_model  = 1
a.make()

最後に、テンプレートの PDB ファイル(4A4M.pdb)、アラインメントファイル(align.pir)およびスクリプトファイル(script.py)をすべて同じディレクトリ保存し、ターミナル(端末)を立ち上げて、以下のコマンドを実行する。

# 上述の 3 つのファイルが保存されているディレクトリに移動
cd path_to_your_file_directory
# MODELLER を実行
mod9.13 script.py

MODELLER が正しく実行されると、同じディレクトリに複数のファイルが生成される。

生成されたファイル内容
TARGET.B999001.pdb予測結果。複数の予測結果が出力される場合は、B999002、B999003 のように続く。
TARGET.D000001
TARGET.ini
TARGET.rsr
TARGET.sch
TARGET.V99990001
script.log

警告文が出る場合

'import site' failed; use -v for traceback
Python のバージョンに起因する警告文です。既に報告されている現象ですので、プログラムは正しく実行されています。(参照
Counld not find platform independent libraries <prefix>
Python のバージョンに起因する警告文です。既に報告されている現象ですので、プログラムは正しく実行されています。(参照