塩基配列解析とアミノ酸配列解析

配列解析

タンパク質は、生物が生命活動する上で欠かせない物質である。生体内に存在している多様なタンパク質はすべて、複数のアミノ酸が 1 列に繋がることによって作られる。このように、アミノ酸が 1 列に繋がったものを、アミノ酸配列と呼ぶ。タンパク質を構成するアミノ酸は 20 種類ある。この 20 種類のアミノ酸は A(アラニン)、C (システイン)、D(アスパラギン酸)などのように、アルファベット 1 文字で記載することができる。したがって、アミノ酸配列は、例えば次のように、アルファベット 1 文字表記によって記述することができる。

TPEMPVLENRAAQGNITAPGGARRLTGDQTAALRNSLSDKPAKNIILLIGDGMGDSEITA
ARNYAEGAGGFFKGIDALPLTGQYTHYALNKKTGKPDYVTDSAASATAWSTGVKTYNGAL
GVDIHEKDHPTILEMA

アミノ酸配列は、DNA から作られる。DNA は塩基とよばれる化合物で作られる。塩基は A(アデニン)、C(シトシン)、G(グアニン)および T(チミン)の 4 種類からなる。このらの塩基が 1 列に並んだものが DNA である。したがって、タンパク質がアミノ酸配列で表せるように、DNA (核酸)は塩基配列で表せる。

TTCCTGGNCTGTAGGTAGCGACTACAGTTAGGGGGCACCTAGCATTCAGGCCCTCATCCT
CCTCCTTCCCAGCAGGGTGTCACGCTTCTCCGAAGACTGGATGACTGCCATGGAGGAGTC

配列解析は、主にこうした塩基配列とアミノ酸配列を対象にしている。例えば、似た配列を探す(相同性検索)アルゴリズムの開発、遺伝子領域予測や系統解析などが盛んに研究されている。