タンパク質ドメイン・機能部位データベース

PROSITE

PROSITE (Hulo et al., 2006) はタンパク質機能部位データベースである。タンパク質は、1 つないし複数の酵素活性を示す機能部位を持つ。このような機能部位は、多くの場合、そのアミノ酸配列が短くて保存度が高い。PROSITE では、このような機能部位を ProRule とよばれている規則で記述している。機能が未知なタンパク質のアミノ酸配列を PROSITE データベースと照合すると、そのタンパク質に含まれる機能部位を同定することができ、タンパク質の機能推測に役立つ。

機能部位(ドメインやモチーフなど)の名前がわかっている場合、その名前で検索することが可能である。例えば、植物の分化などに関わるドメイン LOB を調べる場合は、次のようにする。

PROSITEでドメインを調べる

検索で見つかった場合には、そのドメインのプロファイル(LOB domain profile)が表示される。

PROSITEでドメインを調べた結果

配列中にある機能部位の推測

PROSITE のウェブサイトで、タンパク質のアミノ酸配列を入力することで、アミノ酸配列上にあるプロファイルなどを探し出すことができる。

例えば、次のアミノ酸は配列を PROSITE のウェブサイトでプロファイル予測するには、アミノ酸配列を入力欄に貼り付けて Scan すればよい。

MDFYYMPGGGGCRTVIMVAKALGLELNKKLLNTMEGEQLKPEFVKLNPQHTIPTLVDNGFSIWESRAIAVYLVEKYGKDD
YLLPNDPKKRAVINQRLYFDMGTLYESFAKYYYPLFRTGKPGSDEDLKRIETAFGFLDTFLEGQEYVAGDQLTVADIAIL
STVSTFEVSEFDFSKYSNVSRWYDNAKKVTPGWDENWEGLMAMKALFDARKLAAK
PROSITEでアミノ酸配列上のプロファイルをスキャンする方法

スキャン結果には、アミノ酸配列のどの部分が PROSITE 上で定義済みのプロファイルになっているのかが出力される。例えば、この結果では、このアミノ酸配列位には GST_NTERGST_CTER の 2 つのプロファイルを持つことがわかる。

PROSITEでアミノ酸配列をスキャンした結果にはプロファイルの名前が表示される。

References

  • Hulo N., Bairoch A., Bulliard V., Cerutti L., De Castro E.,Langendijk-Genevaux P.S., Pagni M., Sigrist C.J.A. The PROSITE database. Nucleic Acids Res. 2006, 34:D227-30. DOI: 10.1093/nar/gkj063 PMC: PMC1347426