塩基配列解析とアミノ酸配列解析

配列解析

タンパク質は、生物が生命活動する上で欠かせない物質である。例えば、ATP 合成酵素と呼ばれるタンパク質は、細胞が正常な代謝を行うために必要な ATP と呼ばれるエネルギー源を合成している。また、ヒトが風邪ウィルスに感染されたとき、ヒトの体内には免疫グロブリンと呼ばれるタンパク質が作られる。この免疫グロブリンは、ウィルスの破壊を促進し、ヒトをウィルスから守る。このように、生体内において多様なタンパク質が多様な機能を果たすことで、生物は 1 個体として生命活動を続けられる。

生体内に存在している多様なタンパク質はすべて、複数のアミノ酸が 1 列に繋がることによって作られる。このように、アミノ酸が 1 列に繋がったものを、アミノ酸配列と呼ぶ。タンパク質を構成するアミノ酸は 20 種類ある。この 20 種類のアミノ酸は A(アラニン)、C (システイン)、D(アスパラギン酸)などのように、アルファベット 1 文字で記載することができる(アミノ酸の 1 文字表記)。したがって、アミノ酸配列は、例えば次のように、アルファベット 1 文字表記によって記述することができる。

TPEMPVLENRAAQGNITAPGGARRLTGDQTAALRNSLSDKPAKNIILLIGDGMGDSEITA
ARNYAEGAGGFFKGIDALPLTGQYTHYALNKKTGKPDYVTDSAASATAWSTGVKTYNGAL
GVDIHEKDHPTILEMA

アミノ酸配列は、DNA から作られる。DNA は塩基とよばれる化合物で作られる。塩基は A(アデニン)、C(シトシン)、G(グアニン)および T(チミン)の 4 種類からなる。このらの塩基が 1 列に並んだものが DNA である。したがって、タンパク質がアミノ酸配列で表せるように、DNA (核酸)は塩基配列で表せる。

TTCCTGGNCTGTAGGTAGCGACTACAGTTAGGGGGCACCTAGCATTCAGGCCCTCATCCT
CCTCCTTCCCAGCAGGGTGTCACGCTTCTCCGAAGACTGGATGACTGCCATGGAGGAGTC

配列解析は、主にこうした塩基配列とアミノ酸配列を対象にしている。例えば、似た配列を探す(相同性検索)アルゴリズムの開発、遺伝子領域予測や系統解析などが盛んに研究されている。