MUSTER

MUSTER (Wu et al., 2007) はホモロジーモデリングを行う際に利用するテンプレートとなる配列を検索するプログラムである。検索結果は、アラインメントがなされ、そのまま MODELLER の入力ファイルとして用いることができる。

コマンドラインでの利用

MUSTER は I-TASSER Suit に含まれている。I-TASSR Suit をインストールすれば runMUSTER.pl を実行すればよい。例として、以下の予測配列を用いる。

>3PQR:A|PDBID|CHAIN|SEQUENCE
MNGTEGPNFYVPFSNKTGVVRSPFEAPQYYLAEPWQFSMLAAYMFLLIMLGFPINFLTLYVTVQHKKLRTPLNY
ILLNLAVADLFMVFGGFTTTLYTSLHGYFVFGPTGCNLEGFFATLGGEIALWSLVVLAIERYVVVCKPMSNFRF
GENHAIMGVAFTWVMALACAAPPLVGWSRYIPEGMQCSCGIDYYTPHEETNNESFVIYMFVVHFIIPLIVIFFC
YGQLVFTVKEAAAQQQESATTQKAEKEVTRMVIIMVIAFLICWLPYAGVAFYIFTHQGSDFGPIFMTIPAFFAK
TSAVYNPVIYIMMNKQFRNCMVTTLCCGKNPLGDDEASTTVSKTETSQVAPA

このファイルを seq.fasta の名前で保存し、targets ディレクトリの中に入れる。次に、runMUSTER.pl を実行する。-pkgdir には I-TASSER Suit のインストールディレクトリを、-libdir には I-TASSER のライブラリーへのパスを与える。また、実行するのに時間がかかるため、ここでは nohup を利用した。

nohup runMUSTER.pl -pkgdir /tools/I-TASSER4.1 \
                   -libdir /tools/I-TASSER4.1/lib \
                   -seqname 3PQR \
                   -datadir ./targets &

実行結果は targets ディレクトリに保存される。align_MUSTER_1.txt、align_MUSTER_2.txt などにペアワイズアラインメントが保存されている。例えば、align_MUSTER_1.txt の内容を見ると、以下のようになっている。直接 MODELLER が利用できるように作られている。

>P1;target
sequence:target: : : : : : : :
MNGTEGPNFYVPFSNKTGVVRSPFEAPQYYLAEPWQFSMLAAYMFLLIMLGFPINFLTLYVTVQHKKLRTPLNY
ILLNLAVADLFMVFGGFTTTLYTSLHGYFVFGPTGCNLEGFFATLGGEIALWSLVVLAIERYVVVCKPMSNFRF
GENHAIMGVAFTWVMALACAAPPLVGWSRYIPEGMQCSCGIDYYTPHEETNNESFVIYMFVVHFIIPLIVIFFC
YGQLVFTVKEAAAQQQESATTQKAEKEVTRMVIIMVIAFLICWLPYAGVAFYIFTHQGSDFGPIFMTIPAFFAK
TSAVYNPVIYIMMNKQFRNCMVTTLCCGKNPLGDDEASTTVSKTETSQVAPA*
>P1;2g87A
structure:2g87A: : : : : : : :
MNGTEGPNFYVPFSNKTGVVRSPFEAPQYYLAEPWQFSMLAAYMFLLIMLGFPINFLTLYVTVQHKKLRTPLNY
ILLNLAVADLFMVFGGFTTTLYTSLHGYFVFGPTGCNLEGFFATLGGEIALWSLVVLAIERYVVVCKPMSNFRF
GENHAIMGVAFTWVMALACAAPPLVGWSRYIPEGMQCSCGIDYYTPHEETNNESFVIYMFVVHFIIPLIVIFFC
YGQLVFTVKEAAAQQQESATTQKAEKEVTRMVIIMVIAFLICWLPYAGVAFYIFTHQGSDFGPIFMTIPAFFAK
TSAVYNPVIYIMMNKQFRNCMVTTLCCGKNPLGDDEASTTVSKTETSQVAPA*

ウェブページからの利用

MUSTER は Zhang lab のウェブページに公開されている。該当ページに移動し、検索フォームにアミノ酸配列を入力すれば、簡単に検索を行うことができる。

メールアドレスの入力も求められる。プログラムの実行が終了すると、検索結果が入力したメールアドレスに送信される。

MUSTERのウェブページ

結果メール中に記載されたリンクをクリックすると検索結果を見ることができる。「Target-template alignments」がクエリー配列とテンプレート配列のアライメントである。「Full-length models by MODELLER」が MODELLER による予測結果である。

MUSTERの結果画面

References

  • Wu S, Zhang Y. MUSTER: Improving protein sequence profile-profile alignments by using multiple sources of structure information. Proteins. 2008, 72(2):547-56. DOI: 10.1002/prot.21945 PMID: 18247410