Mit dem IQ zusammenhängende Gene sind in mehreren Regionen der Chromosomen 7 und X angereichert
Um die genetische Komplexität des IQ-Scores zu erfassen, haben wir IQdb (http://IQdb.cbi.pku.edu.cn) entwickelt, eine öffentlich zugängliche Datenbank zur Erforschung von IQ-assoziierten menschlichen Genen7. In IQdb dienen 158 experimentell überprüfte Gene aus der Literatur als Kerndatensatz, von denen sich etwa 16 % der IQ-bezogenen Gene auf dem X-Chromosom befinden. Es wird berichtet, dass nur 3,4 % aller menschlichen Gene auf dem X-Chromosom liegen12. Der offensichtliche Kontrast könnte darauf hindeuten, dass die IQ-bezogenen Gene auf dem X-Chromosom überrepräsentiert sind. Um genauer zu klären, welche Genomregionen eine größere Anzahl von IQ-bezogenen Genen enthalten, haben wir einen hypergeometrischen Test auf der Grundlage des Gengehalts jedes Zytobands im menschlichen Genom durchgeführt. Die weitere Anreicherungsanalyse identifizierte 10 genomische Regionen mit einer signifikant größeren Anzahl von IQ-bezogenen Genen. Von den 10 Regionen gehören 4 zum X-Chromosom, darunter Xp, Xq, Xq28 und Xp11. Eine frühere Genexpressionsstudie hat gezeigt, dass die Gene auf dem X-Chromosom eher in Gehirnregionen und reproduktiven Geweben exprimiert werden13. Unsere Ergebnisse könnten mit der Vorstellung übereinstimmen, dass Gene auf dem X-Chromosom mit dem quantitativen IQ-Wert in Verbindung stehen12. Da das X-Chromosom für die geschlechtliche Differenzierung wichtig ist, könnte die Anreicherung von IQ-bezogenen Genen auf dem X-Chromosom ein Anreiz sein, die Unterschiede in den IQ-Werten zwischen den Geschlechtern zu erforschen14,15.
Vorangegangene Studien haben 46 genomische Regionen identifiziert, die mit dem IQ in Verbindung stehen, indem sie einen Kopplungsansatz verwendeten7. Obwohl sich keine dieser Regionen auf dem X-Chromosom befindet, stammen sechs von ihnen vom Chromosom 7 des Menschen (13,04 %). Von den zehn genomischen Regionen mit angereicherten IQ-bezogenen Genen befinden sich sechs nicht auf dem X-Chromosom, darunter 7q, 7q11, 7q31, 8p12, 15q14 und 17p13. Mit Ausnahme von 8p1216 überschneidet sich keine dieser genomischen Regionen mit den genomischen Regionen in den früheren Kopplungsstudien. Drei der sechs Regionen liegen auf Chromosom 7 und machen 8,86 % der 158 IQ-bezogenen Gene aus (Tabelle 1). Eine frühere Studie zeigte, dass 7q31-36 auf der Grundlage von 361 australischen und niederländischen Zwillingen mit dem verbalen IQ verbunden sein könnte17. Unsere Ergebnisse könnten komplementäre Rollen der Gene auf Chromosom 7 bei der allgemeinen Intelligenz aufdecken.
Zusammenfassend lässt sich sagen, dass unsere Analyse die wahrscheinlichen genomischen Regionen auf mehrere wahrscheinliche Kandidaten eingrenzt, was ein besseres Verständnis einer IQ-bezogenen Genomik und eine sehr rationale Art der Interpretation von Unterschieden wie dem Geschlecht ermöglicht. Bemerkenswert ist, dass unser auf Genanreicherung basierender Ansatz mehrere genomische Regionen auf Chromosom X identifiziert hat, die in früheren Linkage-Studien übersehen wurden. Dieser Unterschied kann durch die Stichprobengröße der Population in Linkage-Studien bedingt sein. Ein weiterer möglicher Grund ist, dass die meisten Gene auf Chromosom X in der IQdb auf der Grundlage von funktionellen Einzelgenstudien erfasst wurden. Die genetische Assoziation entwickelt sich zu einem groß angelegten Screening-Instrument. Diese kleinen Anteile von Genomregionen haben eine globale Untersuchung des Genoms/Proteoms in einer größeren Population ermöglicht.
Die angereicherten Zielgene in 158 IQ-bezogenen Genen für Transkriptionsfaktoren und miRNAs im Zusammenhang mit psychischen Störungen
Ein grundlegendes Problem in biologischen Systemen ist die Entdeckung potenzieller Regulatoren für Kandidatengene, die uns helfen können, das gesamte Volumen der genetischen Information zu verstehen. Im Vergleich zu den angereicherten IQ-bezogenen Genen lehrt uns die Regulation nicht die lineare Beziehung zum physischen Chromosom, sondern die dynamischen Mechanismen der zugrunde liegenden Umweltveränderungen.
Die modifizierenden Wirkungen verschiedener Arten von regulatorischen Genen sind weitgehend untersucht und können auf der Grundlage von Sequenzmerkmalen ihrer potenziellen Zielgene vorhergesagt werden. Transkriptionsfaktoren (TF) können die Genexpression durch Transkriptionsaktivierung oder -unterdrückung von Zielgenen mit unterschiedlicher Bindungseffizienz in Promotorregionen beeinflussen18. Die andere große Gruppe von Regulatoren, die MicroRNA (miRNA), kann die mRNA-Expression auf posttranskriptioneller Ebene regulieren, z. B. durch Abbau oder Translationsunterdrückung, indem sie das Zielgen mit kleinen komplementären Sequenzen bindet19. Um potenzielle Upstream-TFs und miRNAs als mögliche Regulatoren der 158 Gene zu identifizieren, führten wir eine Anreicherungsanalyse für TF- und miRNA-Ziele durch. Insgesamt identifizierten wir sieben TFs, die wahrscheinlich die IQ-bezogenen Gene regulieren. Es handelt sich um FOXF2, FOXO4, MAZ, MEF2A, NFIL3, TCF3 und TFAP4. NFIL3 steht Berichten zufolge im Zusammenhang mit Nervenkrankheiten20. Besonders bemerkenswert ist, dass MEF2 nachweislich die lerninduzierte strukturelle Plastizität und die Gedächtnisbildung negativ reguliert21. Es gibt 16 Zielgene für MEF2 in 158 Genen, darunter ATXN1, BDNF, BRAF, DBH, DMD, DMPK, DRD3, GNAS, GRIN2B, IL1RAPL1, IL6R, NR3C2, PHOX2B, SNAP25, TMEM67 und TSC1. Anhand der Annotation von Signalwegen stellten wir fest, dass sechs dieser Gene (BDNF, BRAF, DRD3, GNAS, GRIN2B und SNAP25) Funktionen im neuronalen System haben. Darüber hinaus waren die Gene DRD3, GNAS und GRIN2B mit der dopaminergen Synapse verbunden. Diese MEF2-Ziele im IQ-bezogenen Gensatz könnten den zentralen transkriptionellen Schaltkreis bilden, der die Gedächtnisbildung im Zusammenhang mit dem IQ beeinflusst, was eine weitere experimentelle Validierung erfordert.
Basierend auf einem ähnlichen Ansatz fanden wir heraus, dass 16 menschliche miRNAs dazu neigen, IQ-bezogene Gene zu regulieren. Es handelt sich um hsa-let-7i, hsa-mir-15b, hsa-mir-16, hsa-mir-181d, hsa-mir-195, hsa-mir-30a-3p, hsa-mir-30e-3p, hsa-mir-330, hsa-mir-374, hsa-mir-424, hsa-mir-429, hsa-mir-497, hsa-mir-515-5p, hsa-mir-519e, hsa-mir-522 und hsa-mir-96. Vier von ihnen, hsa-let-7i, hsa-miR-15b, hsa-miR-195 und hsa-miR-330, wurden aufgrund der Krankheitsannotation mit psychischen Störungen in Verbindung gebracht. Sowohl hsa-miR-15b als auch hsa-miR-195 gehören zur miR-15-Familie, die bei Schizophrenen im Gyrus temporalis superior und im dorsolateralen präfrontalen Kortex hochreguliert wurde22. Diese beiden miRNAs können eine weitgehende Stilllegung von Genen in der Zelle bewirken. Unter den 158 IQ-bezogenen Genen sind die Ziele dieser beiden miRNAs ADRB2, ATXN2, BDNF, GHR, IL1RAPL1, KCNJ2, MAP2K1, PAFAH1B1, RAF1, RELN, RPS6KA3, SIGMAR1, SLC6A4 und STX1A. Vergleicht man diesen Satz mit dem der MEF2-Ziele, so kommt nur BDNF in beiden Zielsätzen der mit psychischen Störungen zusammenhängenden TFs und miRNAs vor, was seine zentrale Rolle in den mit der menschlichen Intelligenz zusammenhängenden Signalwegen und seine potenzielle Rolle als Knotenpunkt der Regelkreise in den IQ-bezogenen Genen unterstreichen könnte23.
Rekonstruktion des Kernpfades für IQ-bezogene Gene unter Verwendung bekannter biologischer Pfade
Wir sind jetzt in der Lage, mehrere genomische Regionen und Regulatoren als mögliche Determinanten des IQ-Phänotyps zu spezifizieren. Um komplexere biologische Prozesse zu beschreiben, die in Form einer Kaskade von miteinander verbundenen biochemischen Reaktionen oder Signaltransduktionen ablaufen, haben wir einen Ansatz zur Rekonstruktion von Signalwegen gewählt. Im Allgemeinen ermöglicht uns die molekularbiologische Versuchstechnik, physikalische und funktionelle Wechselwirkungen zwischen Molekülen in der Zelle zu identifizieren. Zahlreiche Signalnetzwerke und -wege werden auf der Grundlage zuverlässiger experimenteller Beweise zusammengefasst. Im Allgemeinen sind die biologischen Signalwege in vielen Datenbanken verstreut und werden oft als Diagramme dargestellt. Kürzlich hat Pathway Commons populäre Pathway-Datenbanken integriert und bietet nun ein bequemes, auf Klartext basierendes Format für die weitere Suche und Rekonstruktion von Pathways24. Um die verfügbaren Daten zu nutzen, verwendeten wir den Klein-Ravi Steiner-Algorithmus, um Kerninteraktionen aus den integrierten menschlichen Pfaddaten zu extrahieren (siehe Methoden). Der rekonstruierte Kernpfad enthält insgesamt 97 Gene und 129 vollständig verbundene Pfadverbindungen (Abbildung 1A). Von den 97 Knoten befinden sich 62 in den 158 IQ-verwandten Genen.
Die Analyse der Anreicherung von biologischen Pfaden ist eine der praktischsten Methoden, um die zugrundeliegenden molekularen Mechanismen in komplexen zellulären Prozessen zu ermitteln25. Eine weitere Analyse der funktionellen Anreicherung zeigte, dass 97 Gene in unserer rekonstruierten Karte in 30 biologischen Pfaden angereichert waren (Tabelle 2). In Bezug auf die Funktion von Neuronen wurden drei Wege identifiziert: „Neurotrophin-Signalisierung“, „Langzeitpotenzierung“ und „GnRH-Signalisierung“. Interessanterweise stehen die meisten der verbleibenden 27 Signalwege im Zusammenhang mit verschiedenen Signalereignissen, einschließlich der Signalübertragung bei Krebs, ErbB-Rezeptor, TRAIL, Proteoglykan-Syndekan, IFN-gamma, PI3K, MAPK, TSH, Kit-Rezeptor, TCR, IL-3 und Hepatozyten-Wachstumsfaktor-Rezeptor. Neben dem Neurohormon GnRH, das in einer Nervenzelle produziert und an ihrem neuronalen Terminal freigesetzt wird, deutet die Karte darauf hin, dass fünf weitere Hormone eine Wirkung haben könnten. Dabei handelt es sich um Androgen, Endotheline, Glypican, Leptin und Prolaktin. Zusammenfassend lässt sich sagen, dass unsere rekonstruierte Karte mehrere Pfade offenbart, die mit mehreren bekannten Signalwegen in Verbindung stehen und auf potenzielle zelluläre Mechanismen hindeuten, die unseres Wissens noch nicht zum Thema Signaltransduktion vorgestellt wurden. Hormonbezogene Signalwege, einschließlich eines Signalwegs für die Androgenrezeption, der mit der Entwicklung männlicher sekundärer Geschlechtsmerkmale zusammenhängt, könnten interessante und neue Komponenten im Zusammenhang mit dem Geschlechtsunterschied nahelegen und unser derzeitiges Wissen erweitern.
Die Anordnung und Struktur der Knoten in einem komplexen System, wie z. B. einem biologischen Netzwerk, folgt oft bestimmten Regeln, die eng mit der Funktion in diesem System verbunden sein können11. Um die rekonstruierten Karten zu zerlegen, wurde eine topologische Analyse durchgeführt (Abbildung 1B-D). Im Allgemeinen wird die Anzahl der Verbindungen an jedem Knoten als Grad in einem Netzwerk dargestellt11. Wie in Abbildung 1B dargestellt, folgen die Grade aller Moleküle in der rekonstruierten Karte einer Potenzgesetzverteilung: P(k) ~ k-b, wobei P(k) die Wahrscheinlichkeit ist, dass ein Molekül mit k Molekülen verbunden ist, und b einen geschätzten Wert von 1,602 hat. Daher ist die Mehrheit der Moleküle in unserer Karte nur spärlich verbunden. Im Gegensatz dazu ist ein kleiner Teil der Moleküle mit größerer Wahrscheinlichkeit miteinander verbunden. Insgesamt gibt es 11 Moleküle mit mindestens fünf Verbindungen. Es handelt sich um PRKACA (14), CREB1 (9), TP53 (8), SOS1 (8), JAK2 (7), PTPN11 (7), PIK3CA (6), CREBBP (6), CDC42 (6), RAF1 (5) und GNAI3 (5). Davon gehören vier zu 158 IQ-bezogenen Genen, nämlich SOS1, PTPN11, CREBBP und RAF1. Die verbleibenden sieben Moleküle werden durch Wege angehängt, die mit den 158 Genen verbunden sind.
Die Knotenpunkte in einem Netzwerk dienen oft als gemeinsame Verbindungen, um die Informationsübertragung entlang eines kurzen Weges zu vermitteln. Daher spielen sie oft eine herausragende Rolle in biologischen Netzwerken. In unserer Karte ist das Gen PRKACA mit 14 Verbindungen am stärksten verbunden. PRKACA (Proteinkinase, cAMP-abhängig, katalytisch, alpha) spielt eine grundlegende Rolle bei verschiedenen zellulären Funktionen, die mit 76 KEGG- und 59 REACTOME-Wegen zusammenhängen, darunter Zellzyklus, Apoptose, Signaltransduktion, Gap Junction und Interaktion mit HIV und dem Immunsystem. Darüber hinaus ist PRKACA an vielen neurologischen Prozessen beteiligt, z. B. an der Langzeitpotenzierung, der GnRH-Signalgebung, der Nikotinaktivität auf dopaminerge Neuronen, der Sucht (Amphetamin, Kokain und Morphin) und den Synapsenaktivitäten (cholinerge, dopaminerge, glutamaterge und serotonerge Synapsen). Frühere Studien haben gezeigt, dass cAMP-abhängige Proteinkinasen beim assoziativen Lernen der Drosophila (Fruchtfliege) eine Rolle spielen26. Darüber hinaus wird berichtet, dass cAMP/cAMP-abhängige Proteinkinasen in der Hippocampusregion mit einer späten Gedächtniskonsolidierungsphase des aversiv motivierten Lernens bei Ratten in Verbindung stehen27. Darüber hinaus können die cAMP-abhängigen Proteinkinasen auch mit CaMKII im H3-Rezeptor zusammenarbeiten, um die Synthese und Freisetzung von Histamin zu regulieren28. Neben PRKACA kann auch CREB1 (cAMP response element-binding protein 1), das am zweithäufigsten verknüpfte Gen in unserer rekonstruierten Karte, an cAMP-Reaktionselemente in der DNA binden. Von diesem Gen wurde berichtet, dass es die Bildung des Langzeitgedächtnisses fördert. Darüber hinaus interagiert CREB1 mit BDNF und NTRK2 und bildet so einen zentralen Signalweg bei Depressionen29. Trotz dieser Fülle von Belegen für die Rolle der cAMP-abhängigen Proteinkinasen und des cAMP-Response-Element-bindenden Proteins bei kognitiven Prozessen wurde kein Zusammenhang zwischen cAMP-abhängigen Proteinkinasen oder dem cAMP-Response-Element-bindenden Protein und dem IQ festgestellt. Diese Überschneidungen mit vielen bekannten Signalkaskaden mit IQ-verwandten Genen könnten einen Hinweis auf einen komplexen Signalübergang geben, in dessen Mittelpunkt PRKACA/CREB1 steht, das in IQdb enthalten ist.
Zusätzlich zu den cAMP-verwandten Molekülen gibt es mindestens zwei krebsverwandte Gene, die durch unseren Ansatz der Pfadrekonstruktion identifiziert wurden. Eines davon ist der bekannteste Tumorsuppressor TP53. Es gibt sogar Hinweise darauf, dass es bei IQ-bezogenen psychischen Störungen wie Schizophrenie eine Rolle spielt30. Darüber hinaus ist das andere Onkogen, PIK3CA, ebenfalls in unserer endgültigen Karte enthalten, und es ist bekannt, dass es mehrere psychiatrische Prozesse beeinflusst31,32,33. Die nächsten drei Gene mit den meisten Verbindungen (JAK2, CDC42 und GNAI3) stehen Berichten zufolge ebenfalls mit kognitiven Störungen oder verwandten neuronalen Funktionen in Verbindung. JAK2 wird mit kognitiver Beeinträchtigung im Mausmodell in Verbindung gebracht34. CDC42 wird mit Neurofibromatose und geistiger Retardierung in Verbindung gebracht35. Obwohl es keine direkten Beweise für seine Rolle bei kognitiven Prozessen gibt, ist GNAI3 nach der KEGG-Pfadannotation an der negativen Regulierung der Synapsenübertragung, der Langzeitdepression und der Axonführung beteiligt. Zusammenfassend lässt sich sagen, dass von den sieben Hub-Molekülen in unserer rekonstruierten Karte, die mit dem IQ in Verbindung stehen, mindestens sechs (85,71 %) in der Literatur als potenziell mit dem IQ oder anderen kognitiven Prozessen in Verbindung stehend beschrieben sind. Diese hohe Relevanz zeigt nicht nur die Genauigkeit des pfadbasierten Rekonstruktionsansatzes bei der Identifizierung kritischer Moleküle, sondern liefert auch einen vollständig vernetzten Signalweg, der eine weitere Untersuchung wert ist.
Obwohl unsere rekonstruierte Karte ein nicht orientierter Signalweg ist, liefert sie viele prüfbare Moleküle in einem typischen Small-World-Netzwerk, das an kognitiven Prozessen beteiligt ist, bei denen ihre Grade einer Power-Law-Verteilung folgen. Unsere weitere topologische Analyse der kurzen Wege (Abbildung 1C) und der Zentralität der Nähe (Abbildung 1D) zeigt, dass die rekonstruierte Karte relativ kompakt ist. Die Pfadlänge gibt an, wie viele Schritte zwischen einem Knotenpunkt und anderen Knotenpunkten liegen11. Wie in Abbildung 1C dargestellt, sind die meisten Knoten in der Karte von einem anderen Knoten aus in drei bis sechs Schritten zu erreichen. Die Zentralität der Nähe wird verwendet, um den kürzesten Schritt von einem Knoten zu einem anderen zu ermitteln11. Wie in Abbildung 1D zu sehen ist, haben die Knoten mit mehr Nachbarn tendenziell eine höhere Nähe-Zentralität.
Ein zusammenhängendes Medikamenten-Ziel-Netzwerk im Kernpfad von IQ-bezogenen Genen
Auf der Grundlage der rekonstruierten Pfadkarte identifizierten wir ferner angereicherte Medikamentenziele in dieser Karte. Unter Verwendung der angereicherten Drogentargets als Inputs kombinierten wir die Drogen und ihre Targets, um ein Drogen-Target-Netzwerk zu bilden. Wie in Abbildung 2A dargestellt, gibt es zehn angereicherte Drogen, nämlich Dopamin, Stickstoffmonoxid, L-Tyrosin, Methamphetamin, Noradrenalin, Glutathion, Amphetamin, Tetrahydrobiopterin, Apomorphin und rekombinantes Somatropin. Mit Ausnahme von rekombinantem Somatropin sind laut Pharmakodynamik-Anmerkungen in DrugBank36 alle Wirkstoffe für das Nervensystem oder mentale Funktionen bekannt. Interessanterweise interagieren sechs von ihnen mit zwei wichtigen Neurotransmittersystemen (Dopamin und Noradrenalin), die Stimmung und Verhalten regulieren. Dazu gehören Amphetamin, Apomorphin, Dopamin, L-Tyrosin und Norepinephrin. Dopamin ist ein Neurotransmitter, der für verschiedene Verhaltensweisen und kognitive Aktivitäten verantwortlich ist, wie z. B. bei belohnungsgesteuerten Lernsystemen. Dopamin wird auch mit vielen neurologischen Störungen wie der Parkinsonschen Krankheit, Psychosen und Schizophrenie in Verbindung gebracht37. Noradrenalin spielt eine entscheidende Rolle bei der Entscheidungsfindung und kann die Aufmerksamkeit beeinflussen; es wird auch als Antidepressivum und Antischizophrenikum eingesetzt38,39. L-Tyrosin ist einer der Vorläufer bei der Synthese von Dopamin und Noradrenalin und kann laut DrugBank-Anmerkung36 zur Behandlung von Depressionen, zur Verbesserung des Gedächtnisses und zur Steigerung der geistigen Wachheit eingesetzt werden. Amphetamin kann die zentralen adrenergen Rezeptoren zur Freisetzung von Noradrenalin stimulieren, und eine hohe Amphetamindosis fördert Berichten zufolge die Freisetzung von Dopamin. Methamphetamin, eine verwandte Substanz, ist neurotoxisch für Dopamintransporter und wird häufig zur Markierung von Dopamin-Endstücken bei Labortieren verwendet. Da Methamphetamin am Dopaminsystem beteiligt ist, wird es Berichten zufolge mit einer verlangsamten motorischen Funktion und einer Verschlechterung des Gedächtnisses in Verbindung gebracht40. Apomorphin ist ein Dopamin-Agonist und wird laut DrugBank-Anmerkung zur Behandlung der Parkinson-Krankheit eingesetzt36.
Die sechs Drogen, die die beiden kritischen Neurotransmitter Dopamin und Noradrenalin beeinflussen, deckten 66,7 % der Zielgene (32 Gene) in der Drogen-Ziel-Karte ab (Abbildung 2A). Da wir diese Karte anhand von angereicherten Medikamenten erstellt haben, ist die Karte der Zielgene hauptsächlich durch Medikamente zentriert. Daher sind die Konnektivitäten von Drogen höher als die von Zielgenen, wie in Abbildung 2B gezeigt. Die topologische Analyse zeigt, dass die meisten Knoten von einem anderen in zwei bis vier Schritten erreicht werden können (Abbildung 2C). Da die meisten Targets und Drogen mit dem Dopamin- und Noradrenalin-System in Verbindung stehen, ist dieses Netzwerk auch sehr kompakt, wenn man die Zentralität der Nähe betrachtet (Abbildung 2D). Zusammenfassend zeigt unsere Anreicherungs- und netzwerkbasierte Analyse, dass das Dopamin- und Noradrenalin-System für IQ-bezogene Gene von entscheidender Bedeutung ist, was weitere Einblicke in den kognitiven Prozess unter dem IQ-Aspekt ermöglichen könnte.