Clustal Omega は Clustal W の後続として開発されたマルチプルアラインメントを計算するプログラムである。
インストール
Clustal Omega のサイトからコンパイル済みのプログラムをダウンロードしてくるか、ソースコードをダウンロードしてローカルでコンパイルする。
コンパイル済みのプログラム
Clustal Omega のダウンロードでは、「Standalone 64-bit Linux binary (1.1.0)」などのようなリンクをクリックすることでダウンロードできる。ダウンロードしたファイルはそのままプログラム本体となる。これに実行権限を追加する。必要であれば、長いファイル名を短くしてもよい。
chmod +x clustalo-1.1.0-linux-64
chmod +x clustalo-1.1.0-linux-64 clustalo
ソースコード
tar.gz 形式で配布されているソースコードをダウンロードした場合は、これを展開して make
コマンドでコンパイルする。
tar xzvf clustal-omega-1.1.0.tar.gz
cd clustal-omega-1.1.0
./configure
make
make install
コンパイル後 src ディレクトリの中に、実行可能ファイルの clustalo が生成される。これがプログラム本体となる。
また、./configure
の実行でエラーが出る場合、エラーメッセージを読み足りないライブラリーをインストールしてもう一度実行すれば良い。例えば libargtable2 が足りない場合は以下のようにインストールする。
apt-get install libargtable2-0
apt-get install libargtable2-dev
Clustal Omega の使い方
ダウンロードしたプログラム本体あるいは各自でコンパイルしたプログラム本体を、アラインメントしたいディレクトリに移動しておく。clasto
を以下のように実行する。-t
の後ろにアミノ酸または核酸かを指定し、-i
にアラインメントファイル、-o
にアラインメント結果を保存するファイル名を与える。
./clustalo --auto -i proteins.fa -o alinged_result.fa
./clustalo -t Protein -i proteins.fa -o alinged_result.fa
アライメントの結果は FASTA 形式で保存される。
Clustal Omega のオプション
-i | 複数の配列が記載されたFASTAファイル |
--hmm-in | HMMを利用する場合は、ここでそのプロファイルを指定します |
--dealign | アラインメントされた配列が存在する場合は、再アラインメントしないときに指定します。 |
--p1 | プロファイル |
--p2 | プロファイル |
-t | 分子タイプを指定します。「Protein」、「DNA」または「RNA」を指定できます。省略すると、自動判別します。 |
-infmt | 入力ファイルのフォーマットを指定します。省略する場合は自動判別します。 |
--distmat-in | |
--distmat-out | |
--guidetree-in | |
--guidetree-out | |
--full | |
--full-iter | |
-o | 実行結果の保存先を指定します。 |
--outfmt | 出力ファイルのフォーマットを指定します。省略する場合はFASTAになります。 |
--iterations | HMMなどを利用する際に、その繰り返し回数を指定します。 |
--max-guidetree-iterations | |
--max-hmm-iterations | HMMの最大繰り返し回数を指定します。 |
--maxnumseq | 入力FASTAに含まれる配列数が、ここで指定した数よりも多い時、エラーになりアラインメントをしません。 |
--maxseqlen | 入力FASTAい含まれる各配列の長さのうち、一つでもここで指定した数値よりも長い場合、エラーになり実行されません。 |
--auto | ファイルの種類や分子タイプやなどをプログラムが自動調整します |
--threds | アラインメント時のCPUの個数を指定します |