結果と考察
プライマーセットは、非常にGCに富んだDRD4遺伝子(1)の4エキソン、および隣接するプロモーター領域とスプライスジャンクションを増幅するように選ばれた(Fig.1)。 20人のADHD患者から得たDRD4遺伝子のプロモーターとコード領域全体の最初の再シーケンス(データは示していない)により、以前に報告された多くの多型が発見された。 これらの多型には、プロモーター領域(VNTRの上流4.3kb;文献18および19)およびエクソン1(VNTRの上流2.7kb;文献20;図1参照)の2つの挿入/欠失多型が含まれていた。 さらに、エクソン3のVNTRでは、多数の新しいコーディングSNPが発見された(2)。また、イントロン3では、VNTRの中心から20 nt離れた≈350 bp下流に、これまで報告されていない2つのSNPが発見された(図1)。 この最初のサンプルで確認された高レベルのVNTR多型を考慮して、世界的な集団サンプルから得られた600のエクソン3 VNTRアレルの、より広範囲なPCR再シーケンスが行われた(参考文献3および17;表1;図2)。 このサンプルは、ほとんどの主要な地理的起源を代表する個体を含んでいた(方法参照)。 大部分の個体はヘテロ接合体であり、2つの対立遺伝子PCR産物は配列決定の前にゲル電気泳動で分離でき、明確なハプロタイプを得ることができた。 合計で450,000bp以上のゲノムDNAと2,968個の48bp反復配列がスクリーニングされた。
ヒトDRD4遺伝子領域の模式図。 エクソン位置はブロックで示している(黄色は非コード化、オレンジはコード化)。 120bpのプロモーター領域重複(青い三角形)、エクソン1の12bp重複(青い三角形)、エクソン3のVNTR(青い三角形)、イントロン3の2つのSNPのおおよその位置が示されている。 VNTRの2R-11R変異体は、エクソン3(青)の下に、PCR解析によって決定された世界的な人口頻度とともに示されている(3, 17)。
- View inline
- View popup
DRD4 exon 3 alleles 600人のハプロタイプ
VNTR motifの塩基およびアミノ酸配列。 35個のDRD4エクソン3 48bpリピートモチーフのヌクレオチドおよび対応するアミノ酸(赤色)配列を示す。 これらのモチーフのうち19個については、以前の命名法(2)を示している(α-ξ)。 これらのモチーフのほとんどは、一段階で発生したと推定され、組換え(R)または突然変異(M)イベントとして示されている。 例えば、7モチーフは2モチーフと3モチーフの組換え(R2/3)、8モチーフは2モチーフの一点変異(M2)であると仮定されている。 観察されたハプロタイプ変異の大部分を占めるモチーフ1〜6(表1)は、前駆型と考えられる。 モチーフ1〜6がハプロタイプの大部分を占め(表1)、モチーフ1〜6がハプロタイプの祖先と考えられるが、モチーフ15など起源が特定されていないモチーフは複数の祖先の可能性がある。 これらのハプロタイプは35の異なる48bpの変異モチーフから構成されており(図2)、そのうち19は以前に報告されていた(図2ではα-ξと表記;文献2)。 これらのDRD4 48bpバリアントモチーフには、ギリシャ語のアルファベットでは文字数が足りないため、従来使われていた文字ではなく、図のように番号が付けられていることを提案する(2)。 DRD4 exon 3 variantsは、最も一般的な4R alleleを4R(1-2-3-4)などと呼ぶことを提案する。
4R対立遺伝子は世界人口の65%を占めるが(表1)、配列変異はほとんど発見されていないので、我々は意図的に約4倍を超えるサンプルを非4R対立遺伝子から採取した (3, 17)。 このサンプルのハプロタイプのほとんど(85.7%)は1%未満の頻度で見つかった(表1)。 VNTR番号で定義された変異体間の塩基多様性を見ると、共通の2R、4R、7R対立遺伝子は最も多様性が低く、それぞれ78.2、95.2、88.9%が最も多い2R(1〜4)、4R(1〜2〜3〜4)、7R(1〜2〜6〜5〜2)ハプロタイプで表現されている(表1)。 一方、3R、5R、6R、8Rの対立遺伝子はまれではあるが、比例して多くの変異体を持つ(表1)。 このような対立遺伝子の多様性の異常なパターンは、単純な長さの効果、すなわち長い対立遺伝子がより多様性を持つということではないことは明らかである。 多くの集団特異的な稀なハプロタイプが観察された。 例えば、スルイ族(南米)のサンプルにのみ見られる2R(30-4)ハプロタイプや、漢民族(アジア)のサンプルにのみ見られる5R(1-3-2-3-4)ハプロタイプなどがある(表1、図2)。
VNTRハプロタイプに見られる塩基変化のパターンはランダムではない(図2)。 ほとんどのDNA配列変異はアミノ酸配列を変えており、時にはかなり劇的に変化することもある(すなわち、GlnからProへ;図2)。 これらの変異体の多くは関連した変異イベントであるが(下記)、Ka/Ks(部位ごとのアミノ酸置換の数を同義性変化の数の推定値で割った比率)の計算で、これらの関係を説明することができる。 通常、Ka/Ksが1より大きい値は、観察されたDNAセグメントにおける正の選択の厳しい指標とされる(22, 23)。 タンデムリピート配列では、多くの仮定された関係が推測され、それゆえ、異なるKa/Ks比を計算することができる。 しかし、DRD4変異体のすべての仮定された関係では、Ka/Ks > 1である。 例えば、最も多い1-6変異体モチーフ(図2)がすべて共通の起源を持ち、多様性は突然変異と組み換えの両方によって生じたと仮定すると(下記)、Ka/Ksの値は3が得られる。 霊長類の系統ではこのVNTRの変異が急速にde novoで生成されるため、種間分岐(これらの計算を改善する強力な方法)を含めるためにこの分析を拡張することはできない(28)。
これらのハプロタイプ間の進化関係を定義する標準的アプローチは、DNA配列が繰り返しであるため適用できない(23)。 しかし、観察されたDNA配列とそのヌクレオチド変異に基づいて、これらのハプロタイプの大部分について単純な起源を提案することは容易である(図3;表1)。 最も一般的な対立遺伝子間の一段階組み換え/突然変異事象は、2R-6R対立遺伝子の観察された変異のほぼすべてを説明することができる。 図3は、提案されている最も一般的な組換え事象の簡略図である。 祖先DRD4の推定塩基配列は決定できないが、特定の霊長類におけるすべての対立遺伝子は、比較的最近の共通祖先に由来すると思われる(28)。 霊長類のDRD4 4R対立遺伝子について報告されている限られた配列データ(28)、(ii)この対立遺伝子周辺の多型のLDレベルが低いこと(後述)、(iii)非4R対立遺伝子の配列モチーフ配置から、最も一般的な4R対立遺伝子がヒトの祖先対立遺伝子として提案されている。 2つの4R(1-2-3-4)対立遺伝子間の不等間隔組換えは、観察された共通の2R-6R対立遺伝子を作り出すだろう(図3)。 交叉の位置は、結果として得られる配列を決定する。 例えば、最も一般的な3R(1-7-4)対立遺伝子と3R(1-2-4)対立遺伝子は、2番目のリピート内か後の交差の位置だけが異なる(図3;表1)。 したがって、タンデムリピート間の不等間隔組換えの頻度が高いことが知られており(29)、DRD4遺伝子の観察された多様性のほとんどを説明することが可能である。
DRD4の多様性の起源を提案する。 エクソン3の48bpリピート配列の多様性の簡略化したモデルを示し、主要な組み換え事象のみを示した(図2)。 主要な2R、4R、7R対立遺伝子は黄色で示し、マイナーな3R、5R、6R対立遺伝子はグレーで示し、不等間隔組換えによる起源と仮定した(赤矢印)と共に示している。 大きな赤い矢印は7R対立遺伝子の推定される多段階の起源を示す。 隣接するプロモーター領域(L1/S1)、エクソン1(L2/S2)、イントロン3(G-G/A-C)多型を示した。 L1、L2、A-C多型とDRD4 7R対立遺伝子との強い連鎖を示す。
この集団サンプルでは不等間隔交差に加え、一点変異が明らかである(表1、図2)。 例えば、1つの例外を除いて世界中のすべての2R対立遺伝子は配列2R(1-4)を持つ(表1)。 スルイ(南米)のDNAから再シークエンスした12個の2R対立遺伝子はすべて、2R(30-4)対立遺伝子という1つの点変異を含んでいることがわかった(表1、図2)。 この突然変異は、最初の繰り返しのCからTへの変化であり、アミノ酸配列に変化はなく、最近(1万年から2万年未満)生じたものと思われる(24)。
対照的に、観察された7R以上のアレルの形成は、4R(1-2-3-4)ハプロタイプからの単純な1段階の組み換え/突然変異事象では説明できない(図3)。 最も一般的な4R対立遺伝子から7R対立遺伝子が生じるには、少なくとも1回の組換えと6回の突然変異が必要である。 より複雑な遺伝子変換事象を考慮しても、4R対立遺伝子を7R対立遺伝子に変換するためには、複数の低確率のステップが必要である(図3)。 例えば、一般的な7R(1-2-6-5-2-5-4)ハプロタイプに見られる中央の5変化モチーフは、2つの4R対立遺伝子間の組換えによって作り出される可能性がある。 一方の4R対立遺伝子の末端4変異モチーフと、もう一方の4R対立遺伝子の初期1変異モチーフとの組換えにより、7R(1-2-3-5-2-3-4)ハプロタイプが得られる(図2)。 この推定上の7Rハプロタイプの2つの3変化モチーフのそれぞれについて、さらに3つの変異が現在の7R(1-2-6-5-2-5-4)ハプロタイプを作り出すために必要である。 これらの6つのヌクレオチド変化のうち4つは非同義であり、アミノ酸配列を変化させている(SerからGly、GlnからPro、AlaからPro、SerからGly;Fig.2)。 7R(1-2-3-5-2-3-4)対立遺伝子にこれらのヌクレオチド変化を「挿入」するメカニズムとして突然変異ではなく遺伝子変換が提案できるが、7R-7R対立遺伝子変換を伴う、2つのあり得ない出来事が必要である(図2、3)。 私たちのサンプルには、遺伝的多様性と年齢が最も高い集団を含むと考えられているアフリカ起源の個体から配列決定された47の7R対立遺伝子が含まれていた(24)。 従って、中間の7Rハプロタイプが高い頻度で存在する可能性は低い。 しかし、我々は、DRD4 7R対立遺伝子の特定の起源を提案するつもりはない。 むしろ、DNA配列の解析から、DRD4の7R対立遺伝子は、一般的な2R-6R対立遺伝子とは全く異なるものであることを強調したいのである。 DRD4 7R対立遺伝子の起源が、単一の非常に起こりにくい事象なのか、あるいは一連の起こりにくい事象なのかは判断できない(図3)。
DRD4 7R対立遺伝子の起源のメカニズムに関係なく、それは明らかに他の対立遺伝子との組み換え事象に参加することが可能である。 観察された稀な7Rハプロタイプのほとんどは組換え事象であると思われ、そのほとんどは一般的な4R(1-2-3-4)対立遺伝子との組換え事象である(表1)。 例えば、7R(1-2-6-5-2-3-4)ハプロタイプは4R(1-2-3-4)対立遺伝子と7R(1-2-6-5-2-4)対立遺伝子間の組み換えであるように見える(表1及び図2)。 この起源は、組換え領域外のSNPを分析することにより確認された(下記参照)。 さらに、稀な5Rおよび6R対立遺伝子の一部と8R以上の対立遺伝子は、7R対立遺伝子に特有の6変化モチーフを含むため、7R対立遺伝子を含む組み換えによって起源を説明できる(図2、表1)。 しかし、これらの8R以上の対立遺伝子の多くは、DNA配列分析によるともっと複雑な起源を持つようである(表1、図2)。
このモデル(図3)は、最も豊富な(そして古い、後述)4R対立遺伝子が塩基多様性を最も低くするという、上述の観測されたハプロタイプ多様性の明らかな異常(表1)を説明するものである。 もし組換えが多様性の主な要因であるならば、4R-4R組換え事象の大部分は塩基配列が変化しないことが予想される。 このような事象は、外部マーカーの組換えによってのみ推測することができる。 登録外の組み換えが起こったときのみ、新しいヌクレオチド配列(および長さ)の変異体が生成される(図3)。
DRD4 7R対立遺伝子の配列構成が珍しいことから、それがまれな突然変異事象として生じたことが示唆され、4Rと7R対立遺伝子の間にLDの違いが存在するかどうかを調べることになった。 2つの隣接するイントロンSNP(G/A-G/C;図1)は、48bpVNTRを増幅するのに用いたのと同じPCR産物に存在していたため、直接ハプロタイプを決定することができた。 A-CのSNP対と7R対立遺伝子との間に強いLDが認められた(図3)。 7R対立遺伝子の97%はA-C SNPペアと関連していた(調べた68人中66人)。 G-GのSNPに関連する2つの7Rアレルは、DNA配列解析(上)から独自に決定された7R-4R組み換えハプロタイプであった。 一方、G-GとA-CのSNPペアはいずれもDRD4の4Rアレルと関連している(調査した487のアレル)。 しかし、G-Gのペアが最も頻繁で、アフリカのサンプルでは86.1%であるが、我々のアジアのサンプルでは98.6%までである。
すべてのアフリカ7RアリルはA-Cハプロタイプと関連していたが、アフリカ4Rアリルのわずか13.9%はA-Cハプロタイプと関連していた。 いくつかのチンパンジーとボノボのサンプルのDNA配列分析(データは示していない)から、G-G SNPペアが祖先の配列である可能性が高いことがわかった(図3)。 したがって、本来のDRD4 7R対立遺伝子は、この希少なA-C SNPバックグラウンドで生じたと思われる。 73の2R、3R、5R、6R対立遺伝子はG-GおよびA-C SNPsとほぼ同じ関連を示したが、これは4Rおよび7R対立遺伝子からの組換え起源と考えられていることと矛盾しない(Fig.3)。 興味深いことに、調査した26のアジア人2R対立遺伝子サンプルはすべてA-C SNPsとの関連を示し、7R対立遺伝子を含む組み換えに由来することが示唆された(図3)
同様の結果はより離れたプロモーターやエクソン1挿入/欠失多型でも得られた(図1)。 この場合、我々の先行する集団研究(3、17)で得られたデータと、本研究で使用した個体のサブセットのPCR解析から間接的に関連を推論したものである。 親のDNAも入手可能で、これらのマーカーについて遺伝子型判定が可能な40のサンプルについては、相を直接推定することが可能であった。 長い(重複した)L1プロモーター多型(図1)と7R対立遺伝子(図3)の間に強い関連が見られ、7R対立遺伝子の90.8%がL1と関連していた(607対立遺伝子を分析)。 一方、L1多型は4R対立遺伝子の61.9%のみと結合している(2,102対立遺伝子を解析)。 集団特異的な変異が観察されたが(例えば、アフリカ人集団よりも中国人集団の方がL1-4Rの結合が多い)、全体的なL1-4Rの結合はほとんど検出されなかった(図3)。 エクソン1に近いL2多型(図1)は、7R対立遺伝子の93.4%、4R対立遺伝子の86.4%と関連しており、L1-7RおよびL1-4Rの関連で認められたのと同様の相対差であった。 しかし、L2/S2多型はコーディング領域にあり、選択的制約がアレル頻度にも影響している可能性がある(30)。
これらのアレルに対する合体時間の標準的な推定方法は、この領域の繰り返し性と高い組み換え頻度を考えると、適用できない。 しかし、DRD4 4Rと7R対立遺伝子の比較的高い世界的な人口頻度に基づく対立遺伝子年齢の計算は、これらの対立遺伝子が古い(>30万年前;参考文献25と26;方法論を参照)ことを示唆するものであった。 一方、観察された対立遺伝子内変動に基づく対立遺伝子年齢の計算(文献26、27;方法論参照)は、7R対立遺伝子が5〜10倍「若い」(3万〜5万年前)ことを示唆している。 これらの2つの方法で計算された対立遺伝子年齢の間のこのような大きな不一致は、通常、選択によって対立遺伝子の頻度がランダムな遺伝的ドリフトによって予想されるよりも高いレベルにまで増加したことの証拠とされる(26)。 これらの推定値の絶対値は、その計算で使われる仮定、例えば想定される組換え頻度などに大きく影響される(26)。 我々は、11pの末端20メガバイトで観測された平均値に基づいて、組換え頻度を保守的に見積もった(31)。 この遺伝子座で観察された高い組換え率を考えると(表1、図3)、7R対立遺伝子の実際の年齢はさらに若いと思われ、さらなるLD解析によってこの推定値は精緻化されるであろう。 しかし、重要な結論は、仮定したパラメータにかかわらず、対立遺伝子内変動から計算した4Rと7R対立遺伝子の相対的な年齢差は依然として大きく、一方、それらの集団頻度は、それらが両方とも古いことを示唆しているということである。
(1)観察されたヌクレオチド変化(Ka/Ks)の偏り、(2)DRD4 7R対立遺伝子の珍しい配列構成、(3)この対立遺伝子を取り巻く強いLDを説明する最も単純な仮説は、7R対立遺伝子が稀な突然変異事象(または事象)として生じ、それでも正の選択によって高い周波数まで増大したというものである。 有利な対立遺伝子は通常、0.1の頻度に達するまでに長い時間を要し、その後、高い頻度(>0.9)にまで急速に増加する。 私たちは最近、非常に有利な7R対立遺伝子の拡大を観察している可能性があるが、この2対立遺伝子のDRD4システム(図3)はバランスのとれた選択の例である可能性が高いことを示唆するものである。 このような選択は、一般に考えられているよりも、ヒトのゲノムに広く存在している可能性がある(24)。 バランスのとれた選択モデルでは、4Rと7Rの両アレルがヒト集団で高い頻度で維持されていることが提案されている。 このようなバランスのとれた選択には、ヘテロ接合体の優位性から頻度依存的な選択まで、様々なメカニズムが提案される(24)。 進化ゲーム理論(32)によれば、ある特定の種類の性格に対する進化上の見返りは、既存の性格タイプの分布に依存することになる。 例えば、攻撃性の高い個体は、ほとんど全員がおとなしい場合には高いフィットネスをもたらすが、非常に一般的な場合には、攻撃的な個体は頻繁な衝突によるペナルティを受けるため、低いフィットネスをもたらすかもしれない。 このような頻度依存の選択は、この特定の神経伝達物質受容体に関連するものを含む、多くのタイプの心理的変異に適用されると予想される(4-9)。
提案された正の選択に対する代替的説明として、最近のランダムボトルネック、集団拡大、集団混血(24)は、観察結果を説明する可能性はあまりない。 ボトルネックは人類の移動と進化の過程で確かに発生し(33-35)、現在の世界的なDRD4対立遺伝子頻度に影響を及ぼしていることは間違いないだろう。 他の遺伝子に関する多くの集団研究(24, 33, 35)では、「アフリカ外」の対立遺伝子多様性の縮小(とLDの増加)が起こった可能性が高いことが示されている。 本研究では、アフリカのDRD4 4R対立遺伝子は、他の母集団と比較して多様性が高く(LDが低く)、out-of-Africa仮説(24)と一致する。 7R対立遺伝子頻度がアフリカ大陸外への拡大期に偶然に増加したという説もあるが、この説ではアフリカの7R対立遺伝子の多様性の異常な欠如を説明できない。 最も一般的なL1L2-7R(1-2-6-5-2-5-4)-A-Cハプロタイプ(図3)は、世界中で見られる頻度(>85%)と同程度に見られる。 このような結果は、どのようなボトルネックによってもたらされたのか、すなわち、1つの対立遺伝子(DRD4 7R)については世界的に強いLDを示し、残りの対立遺伝子についてはLDがほとんどないということは、想像に難くない。 この仮説では、DRD4の4R対立遺伝子は古くから土着の集団に存在し、7R対立遺伝子はアフリカから(そしてアフリカに)拡大する過程で広がったと仮定している。
我々はDRD4 7R対立遺伝子のデータを説明するのに、最近の突然変異の起源と正選択が最も適していると提案するが、別の可能性も排除できない。 4R対立遺伝子から7R対立遺伝子を生み出すのに必要な組換え/突然変異の可能性が極めて低いことを考えると、検討に値する可能性は、近縁のヒト科の系統からこの対立遺伝子が輸入されたことである。 どのような系統であるかは推測するしかないが、7R対立遺伝子が発生したおおよその時期にはネアンデルタール人の集団が存在していたと思われる。 このモデルによれば、4Rと7R対立遺伝子の合体時期は古く、輸入はLDで測定するとつい最近起こったことになる。
DRD4遺伝子座については、DRD4 7R対立遺伝子自体の独特で珍しいDNA配列を考えると、隣接する遺伝子の選択が提案された選択の説明になるとは考えにくい。 DRD4 7R対立遺伝子が約4万年前に誕生したとすれば、その当時、人類の歴史の中で何が起こっていたのだろうか。 その時期に起こった人類の大膨張、急進的な新技術の出現(旧石器時代)、および/または農業の発展(24)が、DRD4 7R対立遺伝子頻度の増加に関係しているのではないかと推測したくなる。 おそらく、新奇性追求、忍耐力などの性格特性を持つ個体が、拡大(と一部置き換え)を推進したのであろう。 現在の7R対立遺伝子分布は、移動によって説明できるのではないかという推測が提唱されている(34)。 このような表現型選択に加えて、性選択も働いている可能性がある。 ダーウィン(36)が最初に定義したように、「生殖に関してのみ、特定の個体が同性・同種の他者に対して持つあらゆる優位性」は、子孫の増加につながる。 もし、DRD4 7R対立遺伝子を持つ個体が、自分に有利な性格/認知特性(複数の性的パートナー、より高い確率での仲間選びなど)を持っているなら、この対立遺伝子の頻度は、文化的環境に応じて急速に拡大することになる。 おそらく、文化の違いによって、DRD4 7R対立遺伝子頻度の違いが説明できるのだろう(3)。 もちろん、DRD4選択の正確な性質とその生化学的・行動学的基盤の解明には、さらなる実験が必要である。 ADHD患者でこの珍しいDRD4 7R対立遺伝子を持っている人は、他のADHD患者と比較して、注意に関する重要な神経心理学的テストにおいて正常に機能していることを示す最近の実験(6)は、今後調査すべき多くの分野の1つである。
ヒト集団において強い正の選択を受けてきたと思われる対立遺伝子が、なぜ現在ADHDの診断を受けた人に偏って多く存在しているのかと思うかもしれない。 共通変異/共通障害仮説(16)では,共通遺伝的変異が共通疾患に関連するのは,その疾患が新しい環境の産物であるか(その疾患に関連する遺伝子型が過去に排除されなかったため),その疾患の適応度への影響が小さい(発症が遅いため)ためであると提唱している。 早期発症の障害(自閉症、ADHDなど)については、素因となる対立遺伝子が実際には正の選択を受けており、他の環境・遺伝的要因と組み合わさったときにのみ有害な影響をもたらすという可能性を検討することを提案します。 この文脈では、以前の選択的制約がもはやこの遺伝子に作用していない可能性がある。 しかし、DRD4 7R対立遺伝子を持つ個体では、まさにその形質が選択される可能性があり、典型的な教室環境では不適切とみなされ、それゆえADHDと診断される行動を起こしやすくなると推測することも可能である
。