複数テンプレート

MODELLER に複数のテンプレートを与えて、ホモロジーモデリングを行うことができる。

予測対象の配列

以下の配列を複数のテンプレートを利用して構造予測を行う。

MNGTEGPNFYVPFSNKTGVVRSPFEAPQYYLAEPWQFSMLAAYMFLLIMLGFPINFLTLYVTVQHKKLRTPLNYILLNLA
VADLFMVFGGFTTTLYTSLHGYFVFGPTGCNLEGFFATLGGEIALWSLVVLAIERYVVVCKPMSNFRFGENHAIMGVAFT
WVMALACAAPPLVGWSRYIPEGMQCSCGIDYYTPHEETNNESFVIYMFVVHFIIPLIVIFFCYGQLVFTVKEAAAQQQES
ATTQKAEKEVTRMVIIMVIAFLICWLPYAGVAFYIFTHQGSDFGPIFMTIPAFFAKTSAVYNPVIYIMMNKQFRNCMVTT
LCCGKNPLGDDEASTTVSKTETSQVAPA

テンプレート

PSI-BLAST 検索などを利用して相同性の高いテンプレートを検索する。ここでは例として、4A4M2ZIY をテンプレートとして利用する。これらのファイルを PDB からダウンロードする。

アラインメントファイル

マルチテンプレートを利用してホモロジーモデリングを行う場合、マルチプルアライメントを用意する必要がある。基本的に、ペアワイズアライメントと同様に、PIR ファイル形式で記載する。以下にアラインメント済みの配列を align.pir の名前で保存する。

>P1;TARGET
sequence:TARGET::::::::
MNGTEGPNFYVPFSNKTGVVRSPFEAPQYYLAEPWQFSMLAAYMFLLIMLGFPINFLTLY
VTVQHKKLRTPLNYILLNLAVADLFMVFG-GFTTTLYTSLHGYFVFGPTGCNLEGFFATL
GGEIALWSLVVLAIERYVVVCKPMSN-FRFGENHAIMGVAFTWVMALACAAPPLVGWSRY
IPEGMQCSCGIDYYTPHEETNNESFVIYMFVVHFIIPLIVIFFCYGQLVFTVK-------
-----EAAAQQQESATTQKAEKEVTRMVIIMVIAFLICWLPYAGVAFYIFTHQGSDFGPI
FMTIPAFFAKTSAVYNPVIYIMMNKQFRNCMVTTL-----CCGKN---PLGDDEASTTVS
KTETSQVAPA--------*
>P1;4A4M
structureX:4A4M:1:A:326:A::::
MCGTEGPNFYVPFSNKTGVVRSPFEAPQYYLAEPWQFSMLAAYMFLLIMLGFPINFLTLY
VTVQHKKLRTPLNYILLNLAVADLFMVFG-GFTTTLYTSLHGYFVFGPTGCNLEGFFATL
GGEIALWSLVVLAIERYVVVCKPMSN-FRFGENHAIMGVAFTWVMALACAAPPLVGWSRY
IPEGMQCSCGIDYYTPHEETNNESFVIYMFVVHFIIPLIVIFFCYGQLVFTVK-------
-----EAAAQQQESATTQKAEKEVTRMVIIYVIAFLICWLPYAGVAFYIFTHQGSCFGPI
FMTIPAFFAKTSAVYNPVIYIMMNKQFRNCMVTTL-----CCGKN---------------
------------------*
>P1;2ZIY
structureX:2ZIY:4:A:373:A::::
----DLRDNETWWYNPSIIVHPHWR--EFDQVPDAVYYSLGIFIGICGIIGCGGNGIVIY
LFTKTKSLQTPANMFIINLAFSDFTFSLVNGFPLMTISCFLKKWIFGFAACKVYGFIGGI
FGFMSIMTMAMISIDRYNVIGRPMAASKKMSHRRAFIMIIFVWLWSVLWAIGPIFGWGAY
TLEGVLCNCSFDYIS--RDSTTRSNILCMFILGFFGPILIIFFCYFNIVMSVSNHEKEMA
AMAKRLNAKELRKAQAGANAEMRLAKISIVIVSQFLLSWSPYAVVALLAQFGPLEWVTPY
AAQLPVMFAKASAIHNPMIYSVSHPKFREAISQTFPWVLTCCQFDDKETEDDKDAETEIP
AGESSDAAPSADAAQMKE*

2ZIY のオプションの行では「4:A:373:A」とあるが、これは 2ZIY の PDB ファイルの ATOM レコードが 4 番目のアミノ酸から始まっているからである。

スクリプトファイル

最後に MODELLER を実行するためのスクリプトファイルを作成する。以下のように、automodel メソッドの knowns 引数に 2 つのテンプレート ID をリストとして代入する。このファイルを script.py として保存する。

from modeller import *
from modeller.automodel import *

log.verbose()
env = environ()

a = automodel(env,
              alnfile  = 'align.pir',
              knowns   = ['4A4M', '2ZIY'],
              sequence = 'TARGET')
a.starting_model= 1
a.ending_model  = 1
a.make()

MODELLER の実行

2 つのPDB ファイル、アラインメントファイル、スクリプトファイルを 1 つのディレクトリに保存してから、ターミナル(端末)を起動する。次に、この 4 つのファイルが保存されているディレクトリに移動し、MODELLER を実行する。

# ファイルが保存されているディレクトリに移動
cd path_to_your_directory
# MODELLER を実行する
mod9.13 script.py

MODELLER の実行結果として、TARGET.B99990001.pdb などのファイルができる。TARGET.B99990001.pdb が予測構造である。