Siden afslutningen af det menneskelige genomprojekt har fremskridt inden for humant populationsgenetik og sammenlignende genomforskning gjort det muligt at få øget indsigt i den genetiske mangfoldighed. Vi er imidlertid kun lige begyndt at forstå, hvordan processer som tilfældig prøveudtagning af kønsceller, strukturelle variationer (insertioner/deletioner (indels), copy number variations (CNV), retroelementer), enkeltnukleotid-polymorfismer (SNP) og naturlig udvælgelse har formet niveauet og mønstret af variation inden for arter og også mellem arter.
Menneskets genetiske variationRediger
Den tilfældige udtagning af kønsceller under seksuel reproduktion fører til genetisk drift – en tilfældig fluktuation i populationsfrekvensen af en egenskab – i de efterfølgende generationer og ville resultere i tab af al variation i fravær af ekstern påvirkning. Det postuleres, at hastigheden af genetisk drift er omvendt proportional med populationsstørrelsen, og at den kan fremskyndes i specifikke situationer såsom flaskehalse, hvor populationsstørrelsen er reduceret i en vis periode, og ved grundlæggereffekten (individer i en population, der kan spores tilbage til et lille antal grundlæggerindivider).
Anzai et al. viste, at indels udgør 90,4 % af alle observerede variationer i sekvensen af det store histokompatibilitetslokus (MHC) mellem mennesker og chimpanser. Når man tager flere indels i betragtning, falder den høje grad af genomisk lighed mellem de to arter (98,6 % nukleotidsekvensidentitet) til kun 86,7 %. F.eks. resulterer en stor deletion på 95 kilobaser (kb) mellem loci for de menneskelige MICA- og MICB-gener i et enkelt hybridchimpanse-MIC-gen, som forbinder denne region med en artsspecifik håndtering af flere retrovirale infektioner og den deraf følgende modtagelighed for forskellige autoimmune sygdomme. Forfatterne konkluderer, at i stedet for mere subtile SNP’er var indels den drivende mekanisme i primaters artsdannelse.
Bortset fra mutationer bidrager SNP’er og andre strukturelle varianter såsom copy-number-varianter (CNV’er) til den genetiske diversitet i menneskelige populationer. Ved hjælp af mikroarrays er der i HapMap-prøvesamlingen blevet identificeret næsten 1 500 regioner med variabel kopinummer, der dækker ca. 12 % af genomet og indeholder hundredvis af gener, sygdomsloci, funktionelle elementer og segmentale duplikationer. Selv om CNV’ernes specifikke funktion fortsat er uklar, understreger det forhold, at CNV’er dækker mere nukleotidindhold pr. genom end SNP’er, CNV’ernes betydning for den genetiske diversitet og evolution.
Undersøgelse af menneskelige genomiske variationer rummer et stort potentiale for identifikation af gener, der kan ligge til grund for forskelle i sygdomsresistens (f.eks. MHC-region) eller lægemiddelmetabolisme.
Naturlig selektionRediger
Naturlig selektion i udviklingen af en egenskab kan opdeles i tre klasser. Retningsbestemt eller positiv selektion henviser til en situation, hvor en bestemt allel har en større fitness end andre alleler, hvorved dens populationsfrekvens øges (f.eks. antibiotikaresistens hos bakterier). I modsætning hertil sænker stabiliserende eller negativ selektion (også kendt som rensende selektion) frekvensen eller fjerner endog alleler fra en population på grund af de ulemper, der er forbundet med den i forhold til andre alleler. Endelig findes der en række former for balancerende selektion; disse øger den genetiske variation inden for en art ved at være overdominerende (heterozygote individer er federe end homozygote individer, f.eks. G6PD, et gen, der er involveret i både hæmolytisk anæmi og malariaresistens) eller kan variere rumligt inden for en art, der lever i forskellige nicher, og dermed begunstige forskellige alleler. Nogle genomiske forskelle påvirker måske ikke fitness. Neutral variation, som tidligere blev anset for at være “junk”-DNA, påvirkes ikke af naturlig selektion, hvilket resulterer i højere genetisk variation på sådanne steder sammenlignet med steder, hvor variation påvirker fitness.
Det er ikke helt klart, hvordan naturlig selektion har formet populationsforskelle; dog er der for nylig blevet identificeret genetiske kandidatregioner under selektion. Mønstre af DNA-polymorfismer kan bruges til pålideligt at påvise signaturer af udvælgelse og kan bidrage til at identificere gener, der kan ligge til grund for variation i sygdomsresistens eller lægemiddelmetabolisme. Barreiro et al. fandt beviser for, at negativ selektion har reduceret populationsdifferentieringen på aminosyre-ændringsniveau (især i sygdomsrelaterede gener), mens positiv selektion har sikret regional tilpasning af menneskelige populationer ved at øge populationsdifferentieringen i genregioner (hovedsagelig nonsynonyme og 5′-untranslated region-varianter).
Det antages, at de fleste komplekse og mendelske sygdomme (bortset fra sygdomme med sent indsættende sygdomme, idet det antages, at ældre individer ikke længere bidrager til deres afkoms fitness) vil have en effekt på overlevelse og/eller reproduktion, og at de genetiske faktorer, der ligger til grund for disse sygdomme, derfor bør påvirkes af naturlig selektion. Selv om sygdomme, der i dag er sent udviklede, kan have været sygdomme i barndommen i fortiden, da gener, der forsinker sygdomsudviklingen, kan have været genstand for selektion. Gauchers sygdom (mutationer i GBA-genet), Crohns sygdom (mutation i NOD2) og familiær hypertrofisk kardiomyopati (mutationer i MYH7, TNNT2, TPM1 og MYBPC3) er alle eksempler på negativ selektion. Disse sygdomsmutationer er primært recessive og segregeres som forventet med en lav frekvens, hvilket understøtter den formodede negative udvælgelse. Der er tegn på, at det genetiske grundlag for type 1-diabetes kan have været udsat for positiv selektion. Der er kun rapporteret få tilfælde, hvor sygdomsfremkaldende mutationer forekommer med de høje frekvenser, der understøttes af en afbalanceret udvælgelse. Det mest fremtrædende eksempel er mutationer i G6PD-lokusset, hvor der i homozygote tilfælde opstår G6PD-enzymunderskud og dermed hæmolytisk anæmi, men hvor der i heterozygote tilfælde er en delvis beskyttende effekt mod malaria. Andre mulige forklaringer på segregering af sygdomsalleler med moderat eller høj frekvens omfatter genetisk drift og nylige ændringer i retning af positiv selektion som følge af miljømæssige ændringer som f.eks. kost eller genetisk hitch-hiking.
Genomdækkende komparative analyser af forskellige menneskelige populationer samt mellem arter (f.eks. menneske versus chimpanse) hjælper os til at forstå forholdet mellem sygdomme og selektion og giver beviser for, at mutationer i begrænsede gener er uforholdsmæssigt forbundet med arvelige sygdomsfænotyper. Gener, der er involveret i komplekse sygdomme, har tendens til at være under mindre negativ selektion end Mendelske sygdomsgener eller ikke-sygdomsgener.