ゲノム

1.3. ゲノム#

ゲノムとは、ある生物が持つ全遺伝情報の集合を指します。一般には、1 個体が有するすべての DNA 配列を意味し、細胞核内の DNA に加えて、ミトコンドリアや葉緑体などの細胞小器官に存在する DNA も含めて考える場合が多くあります。ゲノムは、生物の形態や機能、代謝能力、環境への適応などを規定する情報の基盤となっています。

1.3.1. 染色体#

真核生物の多くは、ゲノム、すなわち DNA を複数の染色体（chromosome）に分割して保持しています。例えば、ヒトは 23 対、計 46 本の染色体を持ちます。通常、DNA は細胞核内に存在し、ヒストンタンパク質に巻き付いてヌクレオソーム（nucleosome）を形成し、さらに高次構造へと折りたたまれてクロマチン（chromatin）の状態で存在しています。この状態では、個々の染色体を区別して観察することはできません。しかし、細胞分裂期になると、クロマチンが強く凝縮し、棒状の明瞭な構造として観察されるようになります。この凝縮した構造が染色体です。

動物などでは通常、父親と母親から 1 組ずつ染色体を受け継ぐため、細胞核内には相同な染色体が 2 組存在します。これらを相同染色体（homologous chromosomes）と呼びます。相同染色体が対をなして存在する生物は二倍体（diploid）と呼ばれます。例えばヒトの場合、父親と母親それぞれから 23 本ずつの染色体を受け継ぎ、合計 46 本（23 対）となります。そのため、ヒトのゲノムは 2n = 46 のように表記されます。一方、植物や一部の動物では、染色体数が通常より多い多倍体（polyploid）の個体も存在します。例えばコムギは、異なる 3 つの祖先種それぞれから染色体を受け継いでおり、各祖先種由来の 14 本（7 対）の染色体を持つため、合計 42 本の染色体を有します。このため、コムギは 2n = 6x = 42 と表記される 6 倍体です。

原核生物である細菌や古細菌では、ゲノムは環状 DNA として存在する場合が多く、染色体は通常 1 本です。原核生物は核を持たないため、DNA は細胞質中のヌクレオイド（nucleoid）と呼ばれる領域に局在しています。

1.3.2. ゲノムサイズ#

生物が持つゲノムは、そのすべてが遺伝情報をコードしているわけではありません。タンパク質をコードする遺伝子や、rRNA や tRNA などの非翻訳 RNA をコードする遺伝子といった遺伝情報のほかに、遺伝子の発現を制御するプロモーターやエンハンサー、さらには機能が不明な領域なども多く含まれています。特に真核生物では、タンパク質をコードしない領域がゲノムの大部分を占めており、ゲノムサイズと遺伝子数が必ずしも比例しないことが知られています。例えば、イネのゲノムは約 4 億 3000 万塩基対で約 4 万個の遺伝子を持つのに対し、ヒトは約 2 万 5000 個の遺伝子しか持ちません。このように、ゲノムの大きさは生物種によって大きく異なり、ゲノムサイズが生物の複雑さを直接反映しない現象は C 値パラドックス（C-value paradox）と呼ばれています。

生物種	染色体数	推定ゲノムサイズ	推定遺伝子数
大腸菌（Escherichia coli）	1	4.6 ~ 5.6 MB	4,000 ~ 5,000
酵母（Saccharomyces cerevisiae）	2n = 32	12 MB	6,000
シロイヌナズナ（Arabidopsis thaliana）	2n = 10	135 MB	27,000
イネ（Oryza sativa）	2n = 24	430 MB	40,000
コムギ（Triticum aestivum）	2n = 6x = 42	15.4 GB	107,000
トウモロコシ（Zea mays）	2n = 20	2.3 GB	32,000
ヒト（Homo sapiens）	2n = 46	3.0 GB	22,000
キイロショウジョウバエ（Drosophila melanogaster）	2n = 8	125 MB	13,000
マウス（Mus musculus）	2n = 40	3.3 GB	23,000
ラット（Rattus norvegicus）	2n = 42	2.8 GB	22,000
ゼブラフィッシュ（Danio rerio）	2n = 50	1.7 GB	26,000
メダカ（Oryzias latipes）	2n = 48	800 MB	24,000

1.3.3. 遺伝子#

生物がもつ遺伝情報は DNA に保存されていますが、DNA に書かれた情報がそのまま直接利用されるわけではありません。遺伝子の情報が実際に使われる一連の過程は、遺伝子発現（gene expression）と呼ばれます。DNA 上に記録された遺伝子の情報は、まず RNA に写し取られ、その後にタンパク質として実体化されます。DNA から RNA が作られる過程を転写（transcription）、RNA からタンパク質が作られる過程を翻訳（translation）といいます。酵素や細胞構造を形成するタンパク質、さらに遺伝子の働きを調節するタンパク質など、細胞の機能の多くは、このようにして合成されたタンパク質によって支えられています。

原核生物の遺伝子は比較的単純な構造をしており、DNA 上の連続した領域がそのまま RNA に転写され、タンパク質の情報として利用されることが多いです。

一方、真核生物では遺伝子構造がより複雑で、エクソン（exon）と イントロン（intron）と呼ばれる領域が交互に並んでいます。エクソンとイントロンはいずれも転写されますが、その後、スプライシング（splicing）と呼ばれる過程でイントロンが除去され、エクソン同士が連結され、タンパク質の合成に使われます。

1.3.4. 転写#

転写は、DNA の塩基配列を鋳型として RNA を合成する過程です。この反応は RNA ポリメラーゼ（RNA polymerase）という酵素によって行われます。DNA は二本鎖構造をしていますが、転写の際にはそのうち一方の鎖だけが読み取られ、相補的な塩基配列をもつ RNA が合成されます。こうして合成された RNA のうち、タンパク質の設計図となるものをメッセンジャー RNA（messenger RNA; mRNA）と呼びます。

真核生物では、転写によって最初に作られる RNA はすぐに翻訳に使われるわけではありません。この段階の RNA は前駆体 mRNA（pre-mRNA）と呼ばれ、いくつかの加工を受けて成熟した mRNA になります。この過程を転写後修飾（post-transcriptional modification）といいます。転写後修飾は、RNA の安定性や翻訳効率を高め、正しいタンパク質が作られるために重要な役割を果たしています。

転写後修飾の代表的な例として、スプライシングがあります。真核生物の遺伝子は、エクソンとイントロンという領域から構成されています。エクソンは最終的にタンパク質の情報として利用される部分であり、イントロンはその間に挟まれた翻訳されない領域です。転写によって作られた pre-mRNA には、エクソンとイントロンの両方が含まれていますが、スプライシングによってイントロンが除去され、エクソン同士が連結されます。

スプライシングの過程では、すべてのエクソンが常に利用されるとは限らず、一部のエクソンのみが選択される場合があります。これを選択的スプライシング（alternative splicing）と呼びます。選択的スプライシングによって、同じ遺伝子から異なる組み合わせのエクソンが選ばれ、その結果、1 つの遺伝子から複数種類の mRNA が作られ、異なるタンパク質が合成されます。この仕組みは、限られた遺伝子数で多様なタンパク質を生み出すための重要な戦略です。この発見により、かつて考えられていた「1 つの遺伝子が 1 つのタンパク質を作る」という単純な概念は見直されました。現代の生物学において遺伝子は、単なる設計図ではなく、複雑な調節ネットワークの一部として理解されています。

スプライシングにより作られた mRNA の 5′ 側には 5′ 非翻訳領域（5′ untranslated region; 5′ UTR）があり、翻訳の開始効率やその調節に関与しています。一方、3′ 側には 3′ 非翻訳領域（3′ untranslated region; 3′ UTR）が存在し、mRNA の安定性や分解速度、翻訳量の制御に関わっています。これらの領域は翻訳されませんが、遺伝子発現の調節において重要な役割を果たしています。UTR に対して、mRNA の中で開始コドンから終止コドンまでの、実際にタンパク質のアミノ酸配列を指定している領域を CDS（coding sequence）と呼びます。このように、5′ UTR、CDS、3′ UTR を合わせたものが、1 本の成熟した mRNA です。

転写後修飾のもう 1 つの重要な要素がポリ A 付加（polyadenylation）です。pre-mRNA の 3′ 末端には、多数のアデニン（A）が連なったポリ A 鎖が付加されます。これをポリ A テール（poly A tail）と呼びます。ポリ A テールは mRNA を分解から守り、細胞質への輸送や翻訳効率の向上に寄与します。

1.3.5. 翻訳#

転写および転写後修飾を経て生成された成熟した mRNA は、細胞質に運ばれ、タンパク質合成の場であるリボソーム（ribosome）に結合します。リボソームは mRNA の塩基配列を読み取り、対応するアミノ酸を順番に結合していくことで、ポリペプチド鎖を合成します。この過程が翻訳です。

こうして成熟した mRNA は、核から細胞質へと運ばれ、翻訳の過程に入ります。翻訳はリボソームと呼ばれる分子装置によって行われます。リボソームは mRNA の塩基配列を 3 つずつ読み取り、それぞれに対応するアミノ酸を順に結合させていきます。この 3 つの塩基の組をコドン（codon）と呼び、コドンとアミノ酸の対応関係は遺伝暗号として知られています。

翻訳の過程では、トランスファー RNA（transfer RNA; tRNA）が重要な役割を果たします。tRNA は特定のアミノ酸を運び、mRNA 上のコドンと相補的な配列をもつことで、正しい順序でアミノ酸が並ぶようにします。こうして合成されたアミノ酸鎖は折りたたまれ、必要に応じて修飾を受けることで、機能をもつタンパク質となります。

このように、転写と翻訳は単なる情報の写し替えではなく、多段階の調節と加工を伴う精密な過程です。遺伝子の情報がどのように解釈され、どのような形で細胞の機能として現れるのかを理解するうえで、転写と翻訳は生物学の中核となる概念です。

ゲノム

Contents