1.1. 生体高分子#

生体高分子biopolymer)とは、生物が作り出す天然の高分子polymer)であり、sugar)、核酸nucleic acid)、アミノ酸amino acid)などが鎖状につながったものです。代表的な生体高分子として、多糖類polysaccharide)、核酸nucleic acid)、タンパク質protein)などが挙げられます。

1.1.1. 核酸#

核酸は、生物が持つ遺伝情報を担う高分子化合物であり、すべての生物に共通して存在します。核酸は、ヌクレオチドnucleotide)と呼ばれる単位が多数連結した高分子です。1 つのヌクレオチドは、五炭糖pentose sugar)、窒素塩基nitrogenous base)、リン酸phosphoric acid)の 3 つの部分から構成されています。五炭糖には、デオキシリボースdeoxyribose)とリボースribose)の 2 種類があり、この違いが両者の化学的安定性の差につながっています。デオキシリボースを含む核酸はデオキシリボ核酸deoxyribonucleic acid; DNA)と呼ばれ、リボースを含む核酸はリボ核酸ribonucleic acid; RNA)と呼ばれます。また、窒素塩基には、アデニンadenine; A)、グアニンguanine; G)、シトシンcytosine; C)、チミンthymine; T)、ウラシルuracil; U)の 5 種類が存在します。DNA では A、C、G、T が用いられ、RNA では A、C、G、U が用いられます。

DNA は通常、2 本のポリヌクレオチド鎖が互いに逆向きに並び、二重らせん構造double helix)を形成しています。2 本の鎖は、相補的な塩基対形成によって結び付けられています。具体的には、A と T、G と C がそれぞれ水素結合を介して対をなします。DNA は主に細胞核内に存在し、染色体として整理された形で保存されます。真核生物では、DNA はヒストンhistone)と呼ばれるタンパク質と結合し、クロマチン構造を形成しています。

RNA は一般に一本鎖で存在しますが、分子内で塩基対を形成することにより、複雑な立体構造をとることもあります。RNA は DNA から転写され、遺伝情報の発現に関与します。代表的な RNA の種類には、タンパク質合成の鋳型となる メッセンジャー RNAmRNA)、アミノ酸を運搬するトランスファー RNAtRNA)、リボソームの構成要素であるリボソーム RNArRNA)などがあります。また、近年では、バイオインフォマティクス技術を含む関連分野の発展により、miRNA や lncRNA など、多様な遺伝子発現制御に関与する非コード RNAnon-coding RNA; ncRNA)も発見され、その重要性が明らかになっています。

1.1.2. アミノ酸#

アミノ酸は、アミノ基とカルボキシル基の両方をもつ有機化合物であり、生体で利用されるアミノ酸は 20 種類存在します。それぞれのアミノ酸は異なる側鎖を持っています。カルボキシル基が結合している炭素(α 炭素)にアミノ基も結合しており、一般式は RCH(NH2)COOH で表されます。R は側鎖と呼ばれ、その性質によってアミノ酸は親水性、疎水性、塩基性、酸性などの性質を示します。

生体で利用される 20 種類のアミノ酸のうち、多くは体内で合成されますが、体内で合成できない、あるいは微量しか合成できないアミノ酸も存在します。このようなアミノ酸を必須アミノ酸essential amino acid)といいます。必須アミノ酸は生物種によって異なります。例えば、ヒトの必須アミノ酸は、トリプトファン、リシン、メチオニン、フェニルアラニン、トレオニン、バリン、ロイシン、イソロイシン、ヒスチジンの 9 種類です。これらのアミノ酸は、食事などによって摂取する必要があります。

タンパク質を構成する 20 種類のアミノ酸は、アルファベットの 1 文字または 3 文字で略して表記されることが多いです。バイオインフォマティクスでは、これらの文字情報に対して解析を行うことが一般的です。

アミノ酸名

3 文字コード

1 文字コード

特徴

アラニン

ALA

A

アラニントランスアミナーゼにより、グルタミン酸のアミノ基がピルビン酸に転移して生合成されます。

アスパラギン

ASN

N

アスパラギンシンテターゼにより、アスパラギン酸から合成されます。

システイン

CYS

C

メチオニンとセリンから生合成されます。

グルタミン

GLN

Q

グルタミン酸から生合成されます。窒素代謝に関わる重要なアミノ酸です。

グリシン

GLY

G

不斉炭素を持たず、生体を構成するアミノ酸の中で唯一立体異性体が存在しません。

イソロイシン

ILE

I

ヒトの必須アミノ酸です。

ロイシン

LEU

L

ヒトの必須アミノ酸です。タンパク質の合成と分解に関与します。

メチオニン

MET

M

ヒトの必須アミノ酸です。植物や微生物ではアスパラギン酸とシステインから生合成されます。

フェニルアラニン

PHE

F

ヒトの必須アミノ酸です。植物や微生物ではシキミ酸経路によりプレフェン酸から生合成されます。

プロリン

PRO

P

肝臓と小腸で生合成されます。α 炭素にはアミノ基がなく、イミノ基が結合しています。

セリン

SER

S

解糖系の中間体である 3-ホスホグリセリン酸から生合成されます。

トレオニン

THR

T

ヒトの必須アミノ酸です。植物や微生物ではアスパラギン酸から生合成されます。

トリプトファン

TRP

W

ヒトの必須アミノ酸です。糖原性とケト原性を併せ持ちます。

チロシン

TYR

Y

動物ではフェニルアラニンから生合成されます。

バリン

VAL

V

ヒトの必須アミノ酸です。

アスパラギン酸

ASP

D

クエン酸回路の中間体であるオキサロ酢酸から生合成されます。

グルタミン酸

GLU

E

クエン酸回路の中間体である 2-オキソグルタル酸から生合成されます。

アルギニン

ARG

R

尿素回路に関与するアミノ酸です。

ヒスチジン

HIS

H

ヒトの必須アミノ酸です。

リシン

LYS

K

ヒトの必須アミノ酸です。

1.1.3. タンパク質#

タンパク質は、核酸に記録された遺伝情報に従って、アミノ酸がペプチド結合peptide bond)によって次々と連結されることで合成される生体高分子です。その機能は、アミノ酸配列だけでなく、形成される立体構造や化学的性質によって決定されます。

タンパク質の構造は、一般に 4 段階の階層構造として整理されます。一次構造primary structure)はアミノ酸の配列そのもので、遺伝子配列によって一義的に決まります。二次構造secondary structure)はポリペプチド鎖の局所的な折りたたみ構造で、α ヘリックスalpha helix)や β シートbeta sheet)が代表例です。これらは主に水素結合hydrogen bond)によって安定化されます。三次構造tertiary structure)はポリペプチド鎖全体の立体構造で、疎水性相互作用やイオン結合、水素結合など、さまざまな相互作用によって形成されます。そして、四次構造quaternary structure)は、複数のポリペプチド鎖が集合してできる構造で、ヘモグロビンのような多量体タンパク質に見られます。

多くのタンパク質は、モチーフmotif)やドメインdomain)と呼ばれる特徴的な配列や構造単位を持っています。モチーフは数個から数十個のアミノ酸からなる短い特徴的な配列や構造で、特定の機能に関与することが多い部分です。例えば、「リン酸化されやすい場所」など、特定の働きを示す目印のような役割を果たします。一方、ドメインは数十から数百個のアミノ酸からなる独立した構造単位で、折りたたまれて安定した立体構造を持ちます。ドメインは特定の機能を担うことが多く、「DNAに結合する」「酵素活性を持つ」など、より具体的な働きを行います。

タンパク質の機能は多岐にわたり、酵素、構造タンパク質、輸送タンパク質、シグナル伝達に関与するタンパク質などがあります。酵素は生化学反応を触媒して反応速度を著しく高め、ほとんどすべての代謝反応を制御しています。構造タンパク質は細胞や組織の形態を維持し、コラーゲンやアクチンがその例です。輸送タンパク質は分子やイオンを細胞内外へ運び、ヘモグロビンや膜輸送体が含まれます。さらに、受容体やキナーゼなどのシグナル伝達タンパク質は、細胞内外の情報伝達を担っています。