遺伝子の転写単位には、次の3つがある。
 (a) モノシストロン転写単位: 単一のタンパク質をコードする遺伝子
   コード配列の前後に5'リーダー(leader)と3'トレーラー(trailer)がつく。
 (b) ポリシストロン転写単位: オペロンを構成する複数のタンパク質をコードする遺伝子
 (c) rRNAとtRNAをコードする遺伝子: スペーサー配列で区切られている。
=>原核生物のタンパク質遺伝子の多くはポリシストロン転写単位である。

[原核生物の遺伝子の構造的特徴]



真核生物の場合、全てモノシストロン転写単位から成る。用いられる転写系の違いで次の3つに分けられる。
(1) クラスI遺伝子: RNAポリメラーゼI(核小体に局在)によって転写
   5.8S, 18S, 28S rRNA前駆体の遺伝子
(2) クラスII遺伝子: RNAポリメラーゼIIによって転写
   全てのmRNAと核内低分子RNA(snRNA)遺伝子
(3) クラスIII遺伝子: RNAポリメラーゼIIIによって転写
   5S rRNA, tRNA, いくつかの細胞質低分子RNA(scRNA)遺伝子

ヒトのゲノムDNAには何が書かれているのか?》

遺伝子 (30%) 非遺伝子 (70%)
3 非コード領域 (27%) 偽遺伝子とスペーサー (52%) (18%)
コード領域 (3%) 繰り返し配列

1) 遺伝子領域: ゲノム全体の30%(900Mb)

タンパク質とrRNA,tRNAをコードする約22,000個の遺伝子があるとされている。

構造遺伝子領域(90Mb=全体の3%)
リボソームRNA遺伝子約250コピーが複数の染色体上に存在する。5S rRNAは約2,000コピーもある。
 RNAポリメラーゼI の1分子がrRNA前駆体を転写するのに約5分かかる。複数のポリメラーゼで一度にたくさんのrRNAをつくるには多コピーが必要。
tRNA遺伝子約1,300コピー存在(1つのtRNA当り約10〜100コピー)
タンパク質をコードする遺伝子通常、1つのタンパク質当り1コピー。
 (例外的に,ヒストンのように同じ遺伝子が多数、直列に配置している場合もある)
・ また、a-およびb-グロビン遺伝子群、アクチン群、チューブリン群、コラーゲン群など、遺伝子重複によって生じた近縁遺伝子群(多重遺伝子)が25〜50%を占める。

[グロビン遺伝子スーパーファミリーの分子進化(分子系統樹)]
グロビン遺伝子群は共通の祖先遺伝子から進化した。
非コード領域(810Mb=全体の27%)
・ 遺伝子を分断するイントロン、転写調節領域、5'-リーダーや3'-トレーラー配列などがある。
いくつかの遺伝子における介在配列(イントロン)
遺伝子産物 生物 エキソン イントロン
総塩基対
エリトロポエチン
a-インターフェロン
アデノシンデアミナーゼ
低密度リポタンパク質
チログロビン
VIII因子
アポリポタンパク質
b-グロビン
HGPRT
ビテロゲニン
フィブロイン(絹)
ファセオリン
ウリカーゼサブユニット
ゼイン
tRNATyr
シトクロムb
ヒト
ヒト
ヒト
ヒト
ヒト
ヒト
ヒト
マウス
マウス
カエル
カイコ
インゲンマメ
ソラマメ
トウモロコシ
酵母
酵母ミトコンドリア
582
600
1,500
5,100
8,500
9,000
14,000
432
1,307
6,300
18,000
1,263
300
700
76
2,200
4
0
11
17
>40
25
28
2
8
33
1
5
7
0
1
6
1,562
0
30,000
40,000
100,000
177,000
29,000
762
32,000
20,000
970
515
4,500
0
14
5,100

植物,動物,それらに感染するウイルスにはイントロンが多いが,無脊椎動物ではまれ。原核生物にはないが,T4バクテリオファージのチミジル酸シンテターゼにはイントロンがある。古細菌にもイントロンが見つかっている。


2) 非遺伝子領域: ゲノム全体の70%(2100Mb)

機能不明ものが多い従来,ガラクタ(junk)DNAといわれてきた。最近,マウスゲノムの発現の解析から、全体の長さの60%以上が何らかの形で細胞内で利用されていることが報告された(2005年)。人でも同様の仕組みがあると考えられるので、下記の非繰り返し配列にはまだ機能未知のものが含まれる可能性が高い。

非繰り返し配列(1680Mb=ゲノム全体の52%)
・ 遺伝子重複で生じた非機能性の偽遺伝子(pseudogene)
スペーサーDNA遺伝子間を区切っている無意味な配列
・ 応答エレメント(エンハンサーやサイレンサー配列)、複製開始点など
繰り返し配列(420Mb=全体の18%)
[縦列型反復配列] 短い配列が同じ領域に数千回繰り返している
サテライトDNA(セントロメア近傍に局在)
ミニサテライトDNA(大きさが>500bp)染色体末端に存在。
 テロメアはTTAGGGという配列が2000回以上(12kbp)繰り返したミニサテライトである。
ミクロサテライトDNA(大きさが500bp以下)染色体全体に散在。
[分散型反復配列] 染色体に散在する反復配列(ゲノム全体の10%)
短分散型核因子(SINE): (例)Alu配列ゲノム全体の5%
長分散型核因子(LINE): (例)L16.1kbp。2つのORFをもつ。ゲノム全体の4%。
ウィルス遺伝子の挿入痕跡レトロウィルスのプロウィルスDNA(LTR)
トランスポゾン(transposons、動く遺伝子)染色体をあちこち動き回る遺伝子
《Alu配列》
制限酵素Alu Iで切断される部位を持つ全長300bpの配列で、
ゲノム全体にほぼ均一に存在。



 ミトコンドリアの構築や機能に必要なタンパク質の大部分は核DNAの遺伝子でつくられるが、一部はミトコンドリアゲノムにコードされている。ゲノムの大きさや遺伝子の構成は種によって大きく異なる。動物では20kbp以下、植物では数100〜数1000kbp、酵母は約80kbp。1つのミトコンドリアに5〜10コピー存在する。

【ヒトミトコンドリアDNAの特徴】
 全体的には原核生物的な特徴が見られるが,mRNAがポリA化されるなど真核生物的性質も兼ね備えている。

ゲノムの構造
・ミトコンドリアDNAはクリステに結合した状態で存在し,核様体をなす(原核生物的)。
・ミトコンドリアゲノムは環状二本鎖構造をしており,数コピー存在する。
・ゲノムには13個のタンパク質、2個のrRNA(原核生物的)および全種類のtRNAがコードされている。
・遺伝子にはイントロンがない(原核生物的)。
・ミトコンドリアDNAは核DNAよりも10倍早く変異する種内集団遺伝学の研究対象としてよく用いられる
[ヒトミトコンドリアDNA]
DNA2本鎖(H鎖,L鎖と呼ぶ)のそれぞれに複製起点(OriHOriL)が存在。
内側の矢印OriHからの転写産物。一番内側の矢印はrRNA専用の転写。
OriLからは全長のものは1つだけつくられる。
遺伝子の向きは時計回りのものと,反時計回りのものとがある。
赤いboxはtRNA遺伝子。
ND, NADHデヒドロゲナーゼ複合体; CO, シトクロムcオキシダーゼ;Cytb, シトクロムb
ミトコンドリアの分裂とDNA複製
・細胞分裂に伴ってミトコンドリアも分裂する。この時,細胞の分裂に先立ってミトコンドリアの分裂も起こる。
・ミトコンドリアのDNAの複製は核DNAとは独立に行われるが,核の遺伝子で厳密な制御を受けている。複製酵素はDNAポリメラーゼgである。
転写
・転写は特別なミトコンドリアRNAポリメラーゼが行う。
・mRNAはポリA化されるが(真核生物的),5'末端のキャップ構造はない(原核生物的)。
・2つのDNA鎖(H鎖,L鎖)のそれぞれに複製起点(OriHOriL)が存在し,それぞれ全長が転写されてプロセシングでmRNA, rRNA, tRNAになる。
・rRNA専用の転写もある 一度に多くのrRNAを作るため
・いくつかの遺伝子には終止コドンがない これらの転写産物の3'末端はUかUAで、ポリA化されるとUAAという終止コドンが自動的に生じる。
翻訳
・ミトコンドリアのコドンは核のコドンと一部異なる。また,種による違いもある。
AUG以外に、AUA, AUU, AUCも開始コドン
UGAは終止コドンではなくTrpのコドン
AGAとAGGはArgのコドンではなく終止コドン
・翻訳の際、開始tRNAはFormyl-Metを運ぶ(原核生物的)
・ミトコンドリアのリボソームは細胞質のリボソームよりも小型(原核生物的)



 遺伝子(gene)は、個々の表現形質に対応する原因となる単位を表わし,分子的には独立した存在ではなく,単に巨大なDNAの一部である。これに対して、ゲノム(genome)という概念は、ある生物種の個体全体を完全な状態に保つために必要な遺伝的情報の1セットを指す言葉である。従って,生物種ごとに固有のゲノムが存在する。ウイルスや細菌についてもファージゲノム細菌ゲノムとよぶ。細胞小器官でDNAをもつミトコンドリアや葉緑体についても、ミトコンドリアゲノム葉緑体ゲノムと呼ぶことができる。遺伝情報そのものはDNAの塩基配列であるから,ゲノムの実体はDNAそのものといえる。
 今後、たくさんの生物のゲノムの全構造が決められ、 その中の遺伝子と遺伝子産物に関する情報が次々と明らかにされるであろう。ゲノム全体を対象に全遺伝情報を調べあげ、そこから個別的な研究を始めるという研究を「ゲノム生物学」という。

【全ゲノム配列が発表・公開された生物】
  バクテリアを中心に、ゲノムの全配列が次々と報告されています。これまでに全ゲノム配列が 決定されているものは以下のとおりである(from KEGG)。DNAの大きさは生物種ごとにずいぶん異なる。現在のところ,真核生物で全ゲノムが分かっているのはC. elegans(線虫)だけであるが,2003年までにはヒトゲノムの全配列が明らかとなるであろう。

生物種 ゲノムサイズ
(kbp)
遺伝子総数
Mycoplasma genitalium (マイコプラズマ感染症)
Mycoplasma pneumoniae (肺炎の病原体)
Borrelia burgdorferi B31(ライム病の病原スピロヘータ)
Chlamydia trachomatis (トラコーマ病原体)
Rickettsia prowazekii (発疹チフス病原体)
Treponema pallidum (梅毒トレポネマ)
Chlamydia pneumoniae (クラミジア)
Aquifex aeolicus(超好熱性細菌)
Helicobacter pylori J99(ピロリ菌)
Methanococcus jannaschii (メタン細菌)
Helicobacter pylori 26695(胃炎や胃潰瘍の病原菌ピロリ菌)
Pyrococcus horikoshii OT3(超好熱性古細菌)
Methanobacterium thermoautotrophicum deltaH(メタン細菌)
Haemophilus influenzae Rd(インフルエンザ菌)
Archaeoglobus fulgidus (好熱性硫黄細菌)
Synecocystis sp.PCC6803 (ラン藻類)
Bacillus subtilis (枯草菌)
Mycobacterium tuberculosis H37Rv (結核菌)
Escherichia coli (大腸菌)
Saccharomyces cerevisiae (出芽酵母)
Caenorhabditis elegans (線虫)
Thermotoga maritima MSB8 (好熱性真正細菌)
Aeropyrum pernix K1 (好気性好熱菌)
580
816
910
1040
1110
1140
1130
1550
1640
1660
1670
1740
1750
1830
2180
3570
4210
4410
4640
12000
97000
1860
1670
467
677
1256
894
834
1031
-
1522
1495
1770
1566
1979
1869
1717
2407
3166
4100
3918
4289
6286
約19000
1877
2694