MODELLER のエラーとその原因について

エラー

MODELLER を利用してホモロジーモデリングを行うときによく見かけるエラーとその対処方法を以下に示す。

ModellerError: read_te_290E

アラインメントファイル中に書かれている配列の開始番号と終了番号が PDB ファイル中の番号と異なっている。

ModellerError: read_te_290E> Number of residues
in the alignment and  pdb files are different:
      326      337 For alignment entry:        1  4A4M

アラインメントファイルに書かれている配列番号を PDB ファイルのものと合わせると、エラーが無くなる。例えばアラインメントの部分が A 鎖で PDB ファイルの ATOM 行で 3 ~ 328 ならば、アラインメントファイルは「3:A:328:A」とする。

PDB ファイルの ATOM 行の例。

ATOM      4  N   MET A   3      11.337  71.244  39.172  1.00113.27           N  
ATOM      5  CA  MET A   3      12.418  70.369  38.678  1.00100.94           C  
ATOM      6  C   MET A   3      13.290  69.752  39.797  1.00 92.20           C  
    << 中略 >>
ATOM   2594  OD1 ASN A 328      17.020   9.408  56.908  1.00124.03           O  
ATOM   2595  ND2 ASN A 328      18.782  10.790  57.020  1.00116.39           N  
TER    2596      ASN A 328                                                      

アラインメントファイルの正しい書き方。

>P1;XXXX
structureX:XXXX:3:A:328:A::::
MCGTEGPNFYVPFSNKTGVVRSPFEAPQYYLAEPWQFSMLAAYMFLLIMLGFPINFLTLY
VTVQHKKLRTPLNYILLNLAVADLFMVFG-GFTTTLYTSLHGYFVFGPTGCNLEGFFATL
GGEIALWSLVVLAIERYVVVCKPMSN-FRFGENHAIMGVAFTWVMALACAAPPLVGWSRY
IPEGMQCSCGIDYYTPHEETNNESFVIYMFVVHFIIPLIVIFFCYGQLVFTVK-------
-----EAAAQQQESATTQKAEKEVTRMVIIYVIAFLICWLPYAGVAFYIFTHQGSCFGPI
FMTIPAFFAKTSAVYNPVIYIMMNKQFRNCMVTTL-----CCGKN---------------
------------------*

SequenceMismatchError: read_te_291E

アラインメント中の配列長と PDB ファイル中の配列長が等しくない場合に発生するエラー。PDB ファイル中の ATOM 行のアミノ酸とアラインメント中のアミノ酸を見比べながら、配列長を合わせる。

SequenceMismatchError: read_te_291E>
Sequence difference between alignment and  pdb :

ModellerError: read_al_373E

実行スクリプトで指定しているタンパク質がアラインメントファイルの中に存在しない場合に発生するエラー。PDB ID のスペルミスを直すと、エラーがなくなる。大小文字も区別されるので、「3dah」と「3DAH」は別物と見なされる。

ModellerError: read_al_373E> Protein specified in ALIGN_CODES(i) 
was not found in the alignment file; ALIGN_CODES(       1) =  3dah

ModellerError: check_a_282E

アライメントファイルが間違っている可能性がある。テンプレートとなる配列には配列情報を必要とする。そのため、アライメントファイルの 2 行目に記載する最初お項目は「structureX」などである。予測ターゲットの「sequence」につられて「sequenceX」と書いてしまうと、このエラーがでる。

_modeller.ModellerError: check_a_282E> Unable to read structural information for alignment sequence:
        1  1JFP This command requires structures.

ModellerError: real_al_375E

アライメントファイルの配列に空白が入っていたりすると、このようなエラーが発生する。各行の最後に空白が挿入されていないかを再チェックするして、修正する。

_modeller.ModellerError: read_al_375E> Unknown residue type,position,sequence:        363        1