Dal completamento del Progetto Genoma Umano i progressi nella genetica delle popolazioni umane e nella genomica comparativa hanno permesso di ottenere una crescente comprensione della natura della diversità genetica. Tuttavia, stiamo appena iniziando a capire come processi come il campionamento casuale dei gameti, le variazioni strutturali (inserzioni/delezioni (indel), variazioni del numero di copie (CNV), retroelementi), polimorfismi a singolo nucleotide (SNPs), e la selezione naturale hanno modellato il livello e il modello di variazione all’interno delle specie e anche tra le specie.
Variazione genetica umanaModifica
Il campionamento casuale dei gameti durante la riproduzione sessuale porta alla deriva genetica – una fluttuazione casuale nella frequenza della popolazione di un tratto – nelle generazioni successive e porterebbe alla perdita di tutte le variazioni in assenza di influenza esterna. Si postula che il tasso di deriva genetica sia inversamente proporzionale alla dimensione della popolazione, e che possa essere accelerato in situazioni specifiche come i colli di bottiglia, dove la dimensione della popolazione è ridotta per un certo periodo di tempo, e dall’effetto fondatore (individui in una popolazione che risalgono a un piccolo numero di individui fondatori).
Anzai et al. hanno dimostrato che gli indel rappresentano il 90,4% di tutte le variazioni osservate nella sequenza del locus maggiore di istocompatibilità (MHC) tra esseri umani e scimpanzé. Dopo aver preso in considerazione gli indel multipli, l’alto grado di somiglianza genomica tra le due specie (98,6% di identità di sequenza nucleotidica) scende solo all’86,7%. Per esempio, una grande delezione di 95 kilobasi (kb) tra i loci dei geni MICA e MICB umani, risulta in un singolo gene MIC ibrido dello scimpanzé, collegando questa regione ad una gestione specie-specifica di diverse infezioni retrovirali e la conseguente suscettibilità a varie malattie autoimmuni. Gli autori concludono che invece di SNPs più sottili, gli indel erano il meccanismo di guida nella speciazione dei primati.
Oltre alle mutazioni, SNPs e altre varianti strutturali come le varianti di numero di copie (CNVs) stanno contribuendo alla diversità genetica nelle popolazioni umane. Utilizzando i microarray, quasi 1.500 regioni variabili del numero di copie, che coprono circa il 12% del genoma e contengono centinaia di geni, loci di malattia, elementi funzionali e duplicazioni segmentali, sono stati identificati nella collezione di campioni HapMap. Anche se la funzione specifica delle CNV rimane sfuggente, il fatto che le CNV coprano più contenuto nucleotidico per genoma rispetto agli SNP sottolinea l’importanza delle CNV nella diversità genetica e nell’evoluzione.
Indagare le variazioni genomiche umane ha un grande potenziale per identificare i geni che potrebbero essere alla base delle differenze nella resistenza alle malattie (ad esempio la regione MHC) o nel metabolismo dei farmaci.
Selezione naturaleModifica
La selezione naturale nell’evoluzione di un tratto può essere divisa in tre classi. La selezione direzionale o positiva si riferisce ad una situazione in cui un certo allele ha una fitness maggiore di altri alleli, aumentando di conseguenza la sua frequenza nella popolazione (ad esempio la resistenza agli antibiotici dei batteri). Al contrario, la selezione stabilizzante o negativa (conosciuta anche come selezione purificante) abbassa la frequenza o addirittura rimuove gli alleli da una popolazione a causa degli svantaggi associati ad esso rispetto ad altri alleli. Infine, esiste un certo numero di forme di selezione equilibrante; queste aumentano la variazione genetica all’interno di una specie essendo sovradominanti (gli individui eterozigoti sono più adatti di quelli omozigoti, per esempio il G6PD, un gene che è coinvolto sia nell’anemia emolitica che nella resistenza alla malaria) o possono variare spazialmente all’interno di una specie che abita nicchie diverse, favorendo così alleli diversi. Alcune differenze genomiche possono non influenzare la fitness. La variazione neutra, precedentemente ritenuta DNA “spazzatura”, non è influenzata dalla selezione naturale con conseguente maggiore variazione genetica in tali siti rispetto ai siti in cui la variazione influenza la fitness.
Non è del tutto chiaro come la selezione naturale abbia modellato le differenze di popolazione; tuttavia, recentemente sono state identificate regioni genetiche candidate sotto selezione. I modelli di polimorfismi del DNA possono essere utilizzati per rilevare in modo affidabile le firme della selezione e possono aiutare a identificare i geni che potrebbero essere alla base della variazione nella resistenza alle malattie o nel metabolismo dei farmaci. Barreiro et al. hanno trovato prove che la selezione negativa ha ridotto la differenziazione della popolazione a livello degli aminoacidi (in particolare nei geni legati alle malattie), mentre la selezione positiva ha assicurato l’adattamento regionale delle popolazioni umane aumentando la differenziazione della popolazione nelle regioni geniche (principalmente varianti non sinonime e della regione 5′- non tradotta).
Si pensa che la maggior parte delle malattie complesse e mendeliane (tranne le malattie a insorgenza tardiva, supponendo che gli individui più anziani non contribuiscano più alla fitness della loro prole) abbiano un effetto sulla sopravvivenza e/o sulla riproduzione, quindi i fattori genetici alla base di queste malattie dovrebbero essere influenzati dalla selezione naturale. Tuttavia, le malattie che oggi hanno un’insorgenza tardiva potrebbero essere state malattie infantili in passato, poiché i geni che ritardano la progressione della malattia potrebbero aver subito una selezione. La malattia di Gaucher (mutazioni nel gene GBA), la malattia di Crohn (mutazione di NOD2) e la cardiomiopatia ipertrofica familiare (mutazioni in MYH7, TNNT2, TPM1 e MYBPC3) sono tutti esempi di selezione negativa. Queste mutazioni della malattia sono principalmente recessive e segregano come previsto ad una bassa frequenza, sostenendo la selezione negativa ipotizzata. Ci sono prove che la base genetica del diabete di tipo 1 può aver subito una selezione positiva. Sono stati riportati pochi casi in cui le mutazioni che causano la malattia appaiono alle alte frequenze supportate dalla selezione bilanciata. L’esempio più prominente è costituito dalle mutazioni del locus G6PD dove, se omozigote, risulta una carenza dell’enzima G6PD e di conseguenza un’anemia emolitica, ma nello stato eterozigote sono parzialmente protettive contro la malaria. Altre possibili spiegazioni per la segregazione di alleli di malattia a frequenze moderate o alte includono la deriva genetica e alterazioni recenti verso la selezione positiva dovuta a cambiamenti ambientali come la dieta o l’autostop genetico.
Le analisi comparative a livello genomico di diverse popolazioni umane, così come tra le specie (ad esempio l’uomo rispetto allo scimpanzé) ci stanno aiutando a capire la relazione tra malattie e selezione e forniscono prove di mutazioni in geni vincolati che sono sproporzionatamente associati a fenotipi di malattia ereditabili. I geni implicati nei disordini complessi tendono ad essere sottoposti a una selezione meno negativa rispetto ai geni mendeliani delle malattie o ai geni non-malattia.