MUSTER (Wu et al., 2007) はホモロジーモデリングを行う際に利用するテンプレートとなる配列を検索するプログラムである。検索結果は、アラインメントがなされ、そのまま MODELLER の入力ファイルとして用いることができる。
コマンドラインでの利用
MUSTER は I-TASSER Suit に含まれている。I-TASSR Suit をインストールすれば runMUSTER.pl
を実行すればよい。例として、以下の予測配列を用いる。
>3PQR:A|PDBID|CHAIN|SEQUENCE MNGTEGPNFYVPFSNKTGVVRSPFEAPQYYLAEPWQFSMLAAYMFLLIMLGFPINFLTLYVTVQHKKLRTPLNY ILLNLAVADLFMVFGGFTTTLYTSLHGYFVFGPTGCNLEGFFATLGGEIALWSLVVLAIERYVVVCKPMSNFRF GENHAIMGVAFTWVMALACAAPPLVGWSRYIPEGMQCSCGIDYYTPHEETNNESFVIYMFVVHFIIPLIVIFFC YGQLVFTVKEAAAQQQESATTQKAEKEVTRMVIIMVIAFLICWLPYAGVAFYIFTHQGSDFGPIFMTIPAFFAK TSAVYNPVIYIMMNKQFRNCMVTTLCCGKNPLGDDEASTTVSKTETSQVAPA
このファイルを seq.fasta の名前で保存し、targets ディレクトリの中に入れる。次に、runMUSTER.pl
を実行する。-pkgdir
には I-TASSER Suit のインストールディレクトリを、-libdir
には I-TASSER のライブラリーへのパスを与える。また、実行するのに時間がかかるため、ここでは nohup
を利用した。
nohup runMUSTER.pl -pkgdir /tools/I-TASSER4.1 \
-libdir /tools/I-TASSER4.1/lib \
-seqname 3PQR \
-datadir ./targets &
実行結果は targets ディレクトリに保存される。align_MUSTER_1.txt、align_MUSTER_2.txt などにペアワイズアラインメントが保存されている。例えば、align_MUSTER_1.txt の内容を見ると、以下のようになっている。直接 MODELLER が利用できるように作られている。
>P1;target sequence:target: : : : : : : : MNGTEGPNFYVPFSNKTGVVRSPFEAPQYYLAEPWQFSMLAAYMFLLIMLGFPINFLTLYVTVQHKKLRTPLNY ILLNLAVADLFMVFGGFTTTLYTSLHGYFVFGPTGCNLEGFFATLGGEIALWSLVVLAIERYVVVCKPMSNFRF GENHAIMGVAFTWVMALACAAPPLVGWSRYIPEGMQCSCGIDYYTPHEETNNESFVIYMFVVHFIIPLIVIFFC YGQLVFTVKEAAAQQQESATTQKAEKEVTRMVIIMVIAFLICWLPYAGVAFYIFTHQGSDFGPIFMTIPAFFAK TSAVYNPVIYIMMNKQFRNCMVTTLCCGKNPLGDDEASTTVSKTETSQVAPA* >P1;2g87A structure:2g87A: : : : : : : : MNGTEGPNFYVPFSNKTGVVRSPFEAPQYYLAEPWQFSMLAAYMFLLIMLGFPINFLTLYVTVQHKKLRTPLNY ILLNLAVADLFMVFGGFTTTLYTSLHGYFVFGPTGCNLEGFFATLGGEIALWSLVVLAIERYVVVCKPMSNFRF GENHAIMGVAFTWVMALACAAPPLVGWSRYIPEGMQCSCGIDYYTPHEETNNESFVIYMFVVHFIIPLIVIFFC YGQLVFTVKEAAAQQQESATTQKAEKEVTRMVIIMVIAFLICWLPYAGVAFYIFTHQGSDFGPIFMTIPAFFAK TSAVYNPVIYIMMNKQFRNCMVTTLCCGKNPLGDDEASTTVSKTETSQVAPA*
ウェブページからの利用
MUSTER は Zhang lab のウェブページに公開されている。該当ページに移動し、検索フォームにアミノ酸配列を入力すれば、簡単に検索を行うことができる。
メールアドレスの入力も求められる。プログラムの実行が終了すると、検索結果が入力したメールアドレスに送信される。
結果メール中に記載されたリンクをクリックすると検索結果を見ることができる。「Target-template alignments」がクエリー配列とテンプレート配列のアライメントである。「Full-length models by MODELLER」が MODELLER による予測結果である。
References
- MUSTER: Improving protein sequence profile-profile alignments by using multiple sources of structure information. Proteins. 2008, 72(2):547-56. DOI: 10.1002/prot.21945 PMID: 18247410