Depuis l’achèvement du projet du génome humain, les progrès en génétique des populations humaines et en génomique comparative ont permis de mieux comprendre la nature de la diversité génétique. Cependant, nous commençons tout juste à comprendre comment des processus tels que l’échantillonnage aléatoire des gamètes, les variations structurelles (insertions/délétions (indels), variations du nombre de copies (CNV), rétroéléments), les polymorphismes mononucléotidiques (SNP) et la sélection naturelle ont façonné le niveau et le modèle de variation au sein des espèces et également entre les espèces.
Variation génétique humaineEdit
L’échantillonnage aléatoire des gamètes lors de la reproduction sexuée entraîne une dérive génétique – une fluctuation aléatoire de la fréquence de population d’un trait – dans les générations suivantes et entraînerait la perte de toute variation en l’absence d’influence extérieure. Il est postulé que le taux de dérive génétique est inversement proportionnel à la taille de la population, et qu’il peut être accéléré dans des situations spécifiques telles que les goulots d’étranglement, où la taille de la population est réduite pendant une certaine période, et par l’effet fondateur (individus d’une population remontant à un petit nombre d’individus fondateurs).
Anzai et al. ont démontré que les indels représentent 90,4% de toutes les variations observées dans la séquence du locus majeur d’histocompatibilité (CMH) entre les humains et les chimpanzés. Après avoir pris en compte les indels multiples, le haut degré de similarité génomique entre les deux espèces (98,6 % d’identité de séquence nucléotidique) tombe à seulement 86,7 %. Par exemple, une importante délétion de 95 kilobases (kb) entre les loci des gènes MICA et MICB de l’homme donne lieu à un seul gène MIC hybride de chimpanzé, ce qui relie cette région à un traitement spécifique à l’espèce de plusieurs infections rétrovirales et à la susceptibilité qui en résulte à diverses maladies auto-immunes. Les auteurs concluent qu’au lieu de SNP plus subtils, les indels ont été le mécanisme moteur de la spéciation des primates.
En dehors des mutations, les SNP et d’autres variantes structurelles telles que les variantes du nombre de copies (CNV) contribuent à la diversité génétique des populations humaines. Grâce aux puces à ADN, près de 1 500 régions variables du nombre de copies, couvrant environ 12 % du génome et contenant des centaines de gènes, de loci de maladies, d’éléments fonctionnels et de duplications segmentaires, ont été identifiées dans la collection d’échantillons HapMap. Bien que la fonction spécifique des CNV reste insaisissable, le fait que les CNV couvrent plus de contenu nucléotidique par génome que les SNP souligne l’importance des CNV dans la diversité et l’évolution génétiques.
L’étude des variations génomiques humaines offre un grand potentiel pour identifier les gènes qui pourraient sous-tendre les différences dans la résistance aux maladies (par exemple, la région du CMH) ou le métabolisme des médicaments.
Sélection naturelleModifier
La sélection naturelle dans l’évolution d’un trait peut être divisée en trois classes. La sélection directionnelle ou positive se réfère à une situation où un certain allèle a une plus grande fitness que les autres allèles, augmentant par conséquent sa fréquence dans la population (par exemple, la résistance aux antibiotiques des bactéries). À l’inverse, la sélection stabilisatrice ou négative (également appelée sélection purificatrice) diminue la fréquence ou même supprime des allèles d’une population en raison des désavantages qui lui sont associés par rapport aux autres allèles. Enfin, il existe un certain nombre de formes de sélection équilibrante ; celles-ci augmentent la variation génétique au sein d’une espèce en étant surdominantes (les individus hétérozygotes sont plus aptes que les individus homozygotes, par exemple le G6PD, un gène impliqué à la fois dans l’anémie hémolytique et la résistance au paludisme) ou peuvent varier dans l’espace au sein d’une espèce qui habite différentes niches, favorisant ainsi différents allèles. Certaines différences génomiques peuvent ne pas affecter la valeur adaptative. La variation neutre, que l’on considérait auparavant comme de l’ADN « poubelle », n’est pas affectée par la sélection naturelle, ce qui se traduit par une variation génétique plus élevée sur ces sites par rapport aux sites où la variation influence la valeur adaptative.
On ne sait pas exactement comment la sélection naturelle a façonné les différences entre les populations ; cependant, des régions génétiques candidates soumises à la sélection ont été identifiées récemment. Les modèles de polymorphismes de l’ADN peuvent être utilisés pour détecter de manière fiable les signatures de la sélection et peuvent aider à identifier les gènes qui pourraient sous-tendre la variation de la résistance aux maladies ou du métabolisme des médicaments. Barreiro et al. ont trouvé des preuves que la sélection négative a réduit la différenciation des populations au niveau de l’altération des acides aminés (en particulier dans les gènes liés aux maladies), tandis que, la sélection positive a assuré l’adaptation régionale des populations humaines en augmentant la différenciation des populations dans les régions génétiques (principalement les variants non synonymes et de la région 5′-non traduite).
On pense que la plupart des maladies complexes et mendéliennes (à l’exception des maladies à déclenchement tardif, en supposant que les individus âgés ne contribuent plus à la condition physique de leur progéniture) auront un effet sur la survie et/ou la reproduction, ainsi, les facteurs génétiques qui sous-tendent ces maladies devraient être influencés par la sélection naturelle. Par conséquent, les facteurs génétiques qui sous-tendent ces maladies devraient être influencés par la sélection naturelle. Toutefois, les maladies qui se déclarent tardivement aujourd’hui pourraient avoir été des maladies infantiles dans le passé, car les gènes retardant la progression de la maladie auraient pu faire l’objet d’une sélection. La maladie de Gaucher (mutations du gène GBA), la maladie de Crohn (mutation de NOD2) et la cardiomyopathie hypertrophique familiale (mutations de MYH7, TNNT2, TPM1 et MYBPC3) sont autant d’exemples de sélection négative. Les mutations de ces maladies sont principalement récessives et ségrègent comme prévu à une faible fréquence, ce qui confirme l’hypothèse d’une sélection négative. Il existe des preuves que la base génétique du diabète de type 1 a pu subir une sélection positive. Peu de cas ont été rapportés, où des mutations causant la maladie sont apparues à des fréquences élevées soutenues par une sélection équilibrée. L’exemple le plus frappant est celui des mutations du locus G6PD qui, à l’état homozygote, entraînent une déficience en enzyme G6PD et donc une anémie hémolytique, mais qui, à l’état hétérozygote, protègent partiellement contre le paludisme. D’autres explications possibles pour la ségrégation d’allèles de maladie à des fréquences modérées ou élevées comprennent la dérive génétique et les modifications récentes vers une sélection positive due à des changements environnementaux tels que le régime alimentaire ou l’auto-stop génétique.
Les analyses comparatives à l’échelle du génome de différentes populations humaines, ainsi qu’entre espèces (par exemple, l’homme par rapport au chimpanzé) nous aident à comprendre la relation entre les maladies et la sélection et fournissent des preuves que les mutations dans les gènes contraints sont associées de manière disproportionnée aux phénotypes de maladies héréditaires. Les gènes impliqués dans des troubles complexes ont tendance à être moins soumis à une sélection négative que les gènes de maladies mendéliennes ou les gènes non-malades.