PROSITE (Hulo et al., 2006) はタンパク質機能部位データベースである。タンパク質は、1 つないし複数の酵素活性を示す機能部位を持つ。このような機能部位は、多くの場合、そのアミノ酸配列が短くて保存度が高い。PROSITE では、このような機能部位を ProRule とよばれている規則で記述している。機能が未知なタンパク質のアミノ酸配列を PROSITE データベースと照合すると、そのタンパク質に含まれる機能部位を同定することができ、タンパク質の機能推測に役立つ。
機能部位の検索
機能部位(ドメインやモチーフなど)の名前がわかっている場合、その名前で検索することが可能である。例えば、植物の分化などに関わるドメイン LOB を調べる場合は、次のようにする。
検索で見つかった場合には、そのドメインのプロファイル(LOB domain profile)が表示される。
配列中にある機能部位の推測
PROSITE のウェブサイトで、タンパク質のアミノ酸配列を入力することで、アミノ酸配列上にあるプロファイルなどを探し出すことができる。
例えば、次のアミノ酸は配列を PROSITE のウェブサイトでプロファイル予測するには、アミノ酸配列を入力欄に貼り付けて Scan すればよい。
MDFYYMPGGGGCRTVIMVAKALGLELNKKLLNTMEGEQLKPEFVKLNPQHTIPTLVDNGFSIWESRAIAVYLVEKYGKDD YLLPNDPKKRAVINQRLYFDMGTLYESFAKYYYPLFRTGKPGSDEDLKRIETAFGFLDTFLEGQEYVAGDQLTVADIAIL STVSTFEVSEFDFSKYSNVSRWYDNAKKVTPGWDENWEGLMAMKALFDARKLAAK
スキャン結果には、アミノ酸配列のどの部分が PROSITE 上で定義済みのプロファイルになっているのかが出力される。例えば、この結果では、このアミノ酸配列位には GST_NTER と GST_CTER の 2 つのプロファイルを持つことがわかる。
References
- The PROSITE database. Nucleic Acids Res. 2006, 34:D227-30. DOI: 10.1093/nar/gkj063 PMC: PMC1347426