Les gènes liés au QI sont enrichis dans plusieurs régions des chromosomes 7 et X
Pour aborder la complexité génétique du score du QI, nous avons développé IQdb (http://IQdb.cbi.pku.edu.cn), une base de données accessible au public pour explorer les gènes humains associés au QI7. Dans IQdb, 158 gènes vérifiés expérimentalement dans la littérature servent d’ensemble de données de base, parmi lesquels environ 16 % des gènes associés au QI sont situés sur le chromosome X. Il est rapporté que seulement 3,4 % des gènes associés au QI sont situés sur le chromosome X, ce qui n’est pas le cas. Il est signalé que seulement 3,4 % de tous les gènes humains appartiennent au chromosome X12. Ce contraste évident pourrait indiquer que les gènes liés au QI sont surreprésentés sur le chromosome X. Pour clarifier de manière plus détaillée les régions génomiques qui contiennent un plus grand nombre de gènes liés au QI, nous avons adopté un test hypergéométrique basé sur le contenu en gènes de chaque cytobande du génome humain. L’analyse d’enrichissement a permis d’identifier 10 régions génomiques contenant un nombre significativement plus élevé de gènes liés au QI. Parmi ces 10 régions, 4 appartiennent au chromosome X, notamment Xp, Xq, Xq28 et Xp11. Une étude précédente sur l’expression des gènes a montré que les gènes du chromosome X sont plus susceptibles de s’exprimer dans les régions du cerveau et les tissus reproducteurs13. Nos résultats peuvent être cohérents avec l’idée que les gènes du chromosome X peuvent être associés au score quantitatif du QI12. Puisque le chromosome X est important pour la différenciation sexuelle, l’enrichissement des gènes liés au QI sur le chromosome X peut inciter à explorer les différences dans les scores de QI entre les sexes14,15.
Des études antérieures ont identifié 46 régions génomiques impliquées dans le QI en utilisant une approche de liaison7. Bien qu’aucune de ces régions ne soit située sur le chromosome X, six d’entre elles proviennent du chromosome 7 chez l’homme (13,04 %). Parmi les dix régions génomiques enrichies en gènes liés au QI, six ne se trouvent pas sur le chromosome X, notamment 7q, 7q11, 7q31, 8p12, 15q14 et 17p13. À l’exception de 8p1216, aucune de ces régions génomiques ne chevauche les régions génomiques des études de liaison antérieures. Trois des six régions proviennent du chromosome 7, représentant 8,86 % des 158 gènes liés au QI (tableau 1). Une étude précédente a montré que les régions 7q31-36 pouvaient être liées au QI verbal sur la base de 361 jumeaux australiens et néerlandais17. Nos résultats peuvent découvrir des rôles complémentaires des gènes sur le chromosome 7 dans l’intelligence générale.
En résumé, notre analyse réduit les régions génomiques probables à plusieurs candidats probables, fournissant une meilleure compréhension d’une génomique liée au QI et une façon très rationnelle d’interpréter des différences telles que le sexe. Notamment, notre approche basée sur l’enrichissement des gènes a permis d’identifier de multiples régions génomiques sur le chromosome X, ce qui avait été manqué dans les études de liaison précédentes. Cette différence peut être due à la taille de l’échantillon de la population dans les études de liaison. L’autre raison potentielle est que la plupart des gènes du chromosome X dans IQdb sont collectés sur la base d’études fonctionnelles monogéniques. L’association génétique est en train de devenir un outil de dépistage à grande échelle. Ces petites proportions de régions génomiques ont permis un examen global du génome/protéome sur une plus grande population.
Les gènes cibles enrichis dans 158 gènes liés au QI pour les facteurs de transcription et les miARN liés aux troubles mentaux
Un problème fondamental dans les systèmes biologiques est la découverte de régulateurs potentiels pour les gènes candidats, ce qui peut nous aider à comprendre le volume entier d’informations génétiques. Par rapport aux gènes enrichis liés au QI, la régulation ne nous apprend pas la relation linéaire avec le chromosome physique, mais les mécanismes dynamiques du changement environnemental sous-jacent.
Les effets modificateurs de plusieurs types de gènes régulateurs sont largement étudiés et peuvent être prédits sur la base des caractéristiques de séquence de leurs gènes cibles potentiels. Le facteur de transcription (TF) peut influencer l’expression des gènes par l’activation ou la suppression de la transcription des gènes cibles avec une efficacité de liaison différente dans les régions promotrices18. L’autre grand groupe de régulateurs, les microARN (miRNA), peuvent réguler l’expression des ARNm au niveau post-transcriptionnel, comme la dégradation ou la répression traductionnelle en liant le gène cible avec de petites séquences complémentaires19. Pour identifier les TFs et miRNAs en amont comme régulateurs potentiels de l’ensemble des 158 gènes, nous avons effectué une analyse d’enrichissement sur les cibles des TFs et miRNAs. Au total, nous avons identifié sept TF susceptibles de réguler l’ensemble des gènes liés au QI. Ce sont FOXF2, FOXO4, MAZ, MEF2A, NFIL3, TCF3 et TFAP4. NFIL3 serait lié à la maladie des neurones20. Plus remarquablement, il est démontré que MEF2 régule négativement la plasticité structurelle induite par l’apprentissage et la formation de la mémoire21. Il y a 16 gènes cibles pour MEF2 dans le jeu de gènes 158, y compris ATXN1, BDNF, BRAF, DBH, DMD, DMPK, DRD3, GNAS, GRIN2B, IL1RAPL1, IL6R, NR3C2, PHOX2B, SNAP25, TMEM67 et TSC1. Sur la base de l’annotation des voies, nous avons constaté que six d’entre eux (BDNF, BRAF, DRD3, GNAS, GRIN2B et SNAP25) avaient des fonctions dans le système neuronal. En outre, les gènes DRD3, GNAS et GRIN2B étaient liés à la synapse dopaminergique. Ces cibles MEF2 dans l’ensemble de gènes liés au QI peuvent former le circuit transcriptionnel central influençant la formation de la mémoire liée au QI, ce qui demande une validation expérimentale supplémentaire.
Sur la base d’une approche similaire, nous avons trouvé que 16 miARN humains avaient tendance à réguler les gènes liés au QI. Il s’agissait de hsa-let-7i, hsa-mir-15b, hsa-mir-16, hsa-mir-181d, hsa-mir-195, hsa-mir-30a-3p, hsa-mir-30e-3p, hsa-mir-330, hsa-mir-374, hsa-mir-424, hsa-mir-429, hsa-mir-497, hsa-mir-515-5p, hsa-mir-519e, hsa-mir-522 et hsa-mir-96. Quatre d’entre eux, hsa-let-7i, hsa-miR-15b, hsa-miR-195 et hsa-miR-330, étaient liés à des troubles mentaux d’après l’annotation des maladies. Le hsa-miR-15b et le hsa-miR-195 appartiennent tous deux à la famille miR-15, qui a été régulée à la hausse dans le gyrus temporal supérieur et le cortex préfrontal dorsolatéral chez les schizophrènes22. Ces deux miARN peuvent provoquer un large silence génétique dans la cellule. Parmi les 158 gènes liés au QI, les cibles de ces deux miARN sont ADRB2, ATXN2, BDNF, GHR, IL1RAPL1, KCNJ2, MAP2K1, PAFAH1B1, RAF1, RELN, RPS6KA3, SIGMAR1, SLC6A4 et STX1A. En comparant cet ensemble avec celui des cibles de MEF2, seul le BDNF apparaît dans les deux ensembles de cibles des TF et des miARN liés aux troubles mentaux, ce qui pourrait mettre en évidence son rôle central dans les voies de signalisation liées à l’intelligence humaine et son rôle potentiel en tant que pivot des circuits de régulation dans les gènes liés au QI23.
Reconstruction de la voie centrale pour les gènes liés au QI en utilisant les voies biologiques connues
Nous sommes maintenant en mesure de spécifier plusieurs régions génomiques et régulateurs comme déterminants possibles du phénotype QI. Nous avons adopté une approche de reconstruction de voies pour décrire des processus biologiques plus complexes disposés sous la forme d’une cascade de réactions biochimiques connectées ou de transductions de signalisation. En général, la technologie expérimentale de la biologie moléculaire nous permet d’identifier les interactions physiques et fonctionnelles entre les molécules dans la cellule. De nombreux réseaux et voies de signalisation sont résumés sur la base de preuves expérimentales fiables. D’une manière générale, les voies biologiques sont dispersées dans de nombreuses bases de données et sont souvent représentées sous forme de diagrammes. Récemment, Pathway Commons a intégré des bases de données populaires sur les voies et fournit maintenant un format pratique en texte clair pour l’exploration et la reconstruction des voies24. Afin d’utiliser les données disponibles, nous avons adopté l’algorithme de Klein-Ravi Steiner pour extraire les interactions centrales des données intégrées sur les voies humaines (voir Méthodes). La voie centrale reconstruite contient 97 gènes et 129 connexions de voie entièrement connectées au total (Figure 1A). Parmi les 97 nœuds, 62 se trouvent dans les 158 gènes liés au QI.
L’analyse d’enrichissement des voies biologiques est l’un des moyens les plus pratiques pour exploiter les mécanismes moléculaires sous-jacents dans les processus cellulaires complexes25. Une analyse d’enrichissement fonctionnel plus poussée a montré que 97 gènes de notre carte reconstruite étaient enrichis dans 30 voies biologiques (tableau 2). En termes de fonction liée aux neurones, il y a trois voies identifiées : « signalisation des neurotrophines », « potentialisation à long terme » et « signalisation de la GnRH ». Il est intéressant de noter que la majorité des 27 voies restantes sont liées à divers événements de signalisation, notamment la signalisation dans le cancer, le récepteur ErbB, TRAIL, le protéoglycane syndecan, IFN-gamma, PI3K, MAPK, TSH, le récepteur Kit, TCR, IL-3 et le récepteur du facteur de croissance des hépatocytes. Outre la neurohormone GnRH, qui est produite dans une cellule neurale et libérée à son terminal neural, la carte indique que cinq autres hormones peuvent avoir un effet. Il s’agit des androgènes, des endothélines, du glypican, de la leptine et de la prolactine. En résumé, notre carte reconstruite a révélé de multiples chemins liés à plusieurs voies de signalisation connues, suggérant des mécanismes cellulaires potentiels qui n’ont pas été présentés sur le thème de la transduction de la signalisation, pour autant que nous le sachions. Les voies liées aux hormones, y compris une voie de signalisation de réception des androgènes liée au développement des caractéristiques sexuelles secondaires masculines, pourraient suggérer des composants intéressants et nouveaux liés à la différence de sexe, élargissant nos connaissances actuelles.
L’arrangement et la structure des nœuds dans un système complexe, tel qu’un réseau biologique, suivent souvent des règles spécifiques qui peuvent être étroitement liées à la fonction dans ce système11. Pour décomposer les cartes reconstruites, une analyse topologique a été effectuée (Figure 1B-D). Généralement, le nombre de connexions à chaque nœud est représenté comme le degré dans un réseau11. Comme le montre la figure 1B, les degrés de toutes les molécules dans la carte reconstruite suivent une distribution de loi de puissance : P(k) ~ k-b, où P(k) est la probabilité qu’une molécule se connecte avec k molécules et b a une valeur estimée de 1,602. Par conséquent, la majorité des molécules de notre carte sont faiblement connectées. En revanche, une petite fraction de molécules est plus susceptible d’être connectée. Au total, il y a 11 molécules avec au moins cinq connexions. Ce sont PRKACA (14), CREB1 (9), TP53 (8), SOS1 (8), JAK2 (7), PTPN11 (7), PIK3CA (6), CREBBP (6), CDC42 (6), RAF1 (5) et GNAI3 (5). Parmi celles-ci, quatre se trouvent dans l’ensemble de 158 gènes liés au QI, à savoir SOS1, PTPN11, CREBBP et RAF1. Les sept molécules restantes sont annexées par des voies connectées aux 158 gènes.
Les nœuds centraux d’un réseau servent souvent de connexions communes pour médiatiser la transduction de l’information le long d’un chemin court. Ainsi, ils jouent souvent un rôle prépondérant dans le réseau biologique. Dans notre carte, le gène PRKACA est le plus connecté, montrant 14 connexions. PRKACA (protéine kinase, cAMP-dépendante, catalytique, alpha) joue un rôle fondamental dans diverses fonctions cellulaires liées à 76 voies KEGG et 59 voies REACTOME, notamment le cycle cellulaire, l’apoptose, la transduction du signal, la jonction gap et l’interaction avec le VIH et le système immunitaire. En outre, PRKACA participe à de nombreux processus neurologiques tels que la potentialisation à long terme, la signalisation de la GnRH, l’activité de la nicotine sur les neurones dopaminergiques, la dépendance (amphétamine, cocaïne et morphine), les activités des synapses (synapses cholinergiques, dopaminergiques, glutamatergiques et sérotoninergiques). Des études antérieures ont démontré que les protéines kinases dépendantes de l’AMPc sont impliquées dans l’apprentissage associatif de la drosophile (mouche à fruits)26. De plus, les protéines kinases dépendantes de l’AMPc dans la région de l’hippocampe seraient liées à une phase de consolidation de la mémoire tardive de l’apprentissage motivé par l’aversion chez les rats27. En outre, les protéines kinases dépendantes de l’AMPc peuvent également coopérer avec CaMKII dans le récepteur H3 pour réguler la synthèse et la libération d’histamine28. En plus de PRKACA, CREB1 (cAMP response element-binding protein 1), le deuxième gène le plus connecté dans notre carte reconstruite, peut également se lier aux éléments de réponse de l’AMPc dans l’ADN. Ce gène a été signalé comme facilitant la formation de la mémoire à long terme. En outre, CREB1 interagit avec le BDNF et NTRK2 pour former une voie centrale dans la dépression29. Malgré ce volume de preuves du rôle des protéines kinases dépendantes de l’AMPc et de la protéine de liaison à l’élément de réponse de l’AMPc dans les processus liés à la cognition, aucune association n’a été établie entre les protéines kinases dépendantes de l’AMPc ou la protéine de liaison à l’élément de réponse de l’AMPc et le QI. Ces chevauchements avec de nombreuses cascades de signalisation connues avec des gènes liés au QI, ce qui pourrait fournir un indice pour la diaphonie de signalisation complexe centrée par PRKACA/CREB1, qui est dans IQdb.
En plus des molécules liées à l’AMPc, il y a au moins deux gènes liés au cancer identifiés par notre approche de reconstruction des voies. L’un est le suppresseur de tumeur le plus connu, TP53. En fait, il existe des preuves que ce gène joue un rôle dans les troubles mentaux liés au QI, comme la schizophrénie30. De plus, l’autre oncogène, PIK3CA, est également inclus dans notre carte finale et est connu pour influencer plusieurs processus psychiatriques31,32,33. Les trois gènes suivants les plus connectés (JAK2, CDC42 et GNAI3) ont également été signalés comme étant liés à des troubles cognitifs ou à des fonctions neuronales connexes. JAK2 est lié à la déficience cognitive dans le modèle de souris34. CDC42 est associé à la neurofibromatose et au retard mental35. Malgré le fait qu’il n’y ait pas de preuve directe de son rôle dans le processus cognitif, GNAI3 participe à la régulation négative de la transmission des synapses, de la dépression à long terme et du guidage des axones selon l’annotation des voies KEGG. En résumé, sur les sept molécules pivots de notre carte reconstruite liées au QI, au moins six (85,71 %) d’entre elles sont signalées dans la littérature comme étant potentiellement associées au QI ou à d’autres processus cognitifs. Cette pertinence élevée démontre non seulement la précision de l’approche de reconstruction basée sur la voie pour identifier les molécules critiques, mais fournit également une voie de signalisation entièrement connectée qui mérite une étude plus approfondie.
Bien que notre carte reconstruite soit une voie de signalisation non orientée, elle fournit de nombreuses molécules testables dans un réseau typique de petit monde impliqué dans les processus cognitifs, où leurs degrés suivent une distribution de loi de puissance. Notre analyse topologique plus poussée sur le chemin court (figure 1C) et la centralité de proximité (figure 1D) montre que la carte reconstruite est relativement compacte. La longueur du chemin représente le nombre d’étapes entre un nœud et d’autres nœuds11. Comme le montre la figure 1C, la majorité des nœuds de la carte sont facilement accessibles depuis un autre nœud en trois à six étapes. La centralité de proximité est utilisée pour révéler l’étape la plus courte d’un nœud à un autre11. Comme le montre la figure 1D, les nœuds avec plus de voisins ont tendance à avoir une centralité de proximité plus élevée.
Un réseau connecté de médicaments-cibles dans la voie centrale des gènes liés au QI
Sur la base de la carte des voies reconstruites, nous avons ensuite identifié les cibles médicamenteuses enrichies dans cette carte. En utilisant les cibles médicamenteuses enrichies comme entrées, nous avons combiné les médicaments et leurs cibles pour former un réseau médicament-cible. Comme le montre la figure 2A, il existe dix médicaments enrichis, à savoir la dopamine, l’oxyde nitrique, la L-tyrosine, la méthamphétamine, la noradrénaline, le glutathion, l’amphétamine, la tétrahydrobioptérine, l’apomorphine et la somatropine recombinante. À l’exception de la somatropine recombinante, tous ont été signalés comme étant actifs dans les systèmes nerveux ou les fonctions mentales selon l’annotation pharmacodynamique dans DrugBank36. Il est intéressant de noter que six d’entre eux interagissent avec deux systèmes critiques de neurotransmetteurs (dopamine et norépinéphrine) qui régulent l’humeur et le comportement. Il s’agit de l’amphétamine, l’apomorphine, la dopamine, la L-tyrosine et la norépinéphrine. La dopamine est un neurotransmetteur responsable de diverses activités comportementales et cognitives, comme celles que l’on trouve dans les systèmes d’apprentissage basés sur la récompense. La dopamine est également liée à de nombreux troubles neurologiques tels que la maladie de Parkinson, la psychose et la schizophrénie37. La norépinéphrine joue un rôle essentiel dans la prise de décision et peut affecter l’attention ; elle est également utilisée comme antidépresseur et antischizophrénique38,39. La L-tyrosine est l’un des précurseurs de la synthèse de la dopamine et de la norépinéphrine et peut être utilisée pour traiter la dépression, améliorer la mémoire et accroître la vigilance mentale selon l’annotation de la DrugBank36. L’amphétamine peut stimuler les récepteurs adrénergiques centraux pour libérer la norépinéphrine et une dose élevée d’amphétamine aiderait à libérer la dopamine. La méthamphétamine, une entité apparentée, est neurotoxique pour les transporteurs de dopamine et est souvent utilisée pour marquer la dopamine terminale des animaux de laboratoire. Comme elle intervient dans les systèmes dopaminergiques, la méthamphétamine serait associée à un ralentissement de la fonction motrice et à une détérioration de la mémoire40. L’apomorphine est un agoniste de la dopamine et est utilisée pour traiter la maladie de Parkinson selon l’annotation DrugBank, selon l’annotation DrugBank36.
Les six médicaments qui affectent les deux neurotransmetteurs critiques que sont la dopamine et la norépinéphrine couvraient 66,7% des gènes cibles (32 gènes) dans la carte cible-médicament (Figure 2A). Comme nous avons construit cette carte à partir de médicaments enrichis, cette carte est principalement centrée sur les médicaments. Par conséquent, les connectivités des médicaments sont plus élevées que celles des gènes cibles des médicaments, comme le montre la figure 2B. En utilisant l’analyse topologique, la plupart des nœuds peuvent être atteints d’un autre en deux à quatre étapes (Figure 2C). Comme la majorité des cibles et des médicaments sont liés aux systèmes de la dopamine et de la noradrénaline, ce réseau est également très compact d’après les centralités de proximité (figure 2D). En résumé, notre analyse d’enrichissement et de réseau montre que les systèmes de dopamine et de noradrénaline sont essentiels aux gènes liés au QI, ce qui peut permettre de mieux comprendre le processus cognitif du point de vue du QI.