IQ-gerelateerde genen zijn verrijkt in meerdere regio’s van chromosomen 7 en X
Om de genetische complexiteit van IQ score aan te pakken, ontwikkelden we IQdb (http://IQdb.cbi.pku.edu.cn), een publiek toegankelijke database voor het verkennen van IQ-geassocieerde menselijke genen7. In IQdb, dienen 158 experimenteel geverifieerde genen uit de literatuur als de kern dataset, waaronder ongeveer 16% van de IQ-gerelateerde genen zich op het X-chromosoom bevinden. Er wordt gemeld dat slechts 3,4% van alle menselijke genen tot het X-chromosoom behoren12. Het duidelijke contrast kan erop wijzen dat de IQ-gerelateerde genen oververtegenwoordigd zijn op het X-chromosoom. Om in meer detail te verduidelijken welke genomische regio’s grotere aantallen IQ-gerelateerde genen bevatten, hebben we een hypergeometrische test uitgevoerd op basis van de geninhoud van elke cytoband op het menselijk genoom. De verdere verrijkingsanalyse identificeerde 10 genomische regio’s met een significant groter aantal IQ-gerelateerde genen. Onder de 10 regio’s, behoren 4 tot het X chromosoom, waaronder Xp, Xq, Xq28 en Xp11. Een eerdere genexpressie studie toonde aan dat de genen op het X-chromosoom meer kans hebben om tot expressie te komen in hersengebieden en reproductieve weefsels13. Onze resultaten kunnen consistent zijn met het idee dat genen op X-chromosoom geassocieerd kunnen zijn met de kwantitatieve IQ score12. Aangezien het X-chromosoom belangrijk is voor seksuele differentiatie, kan de verrijking van IQ-gerelateerde genen op het X-chromosoom een stimulans zijn om verschillen in de IQ-scores tussen de seksen te onderzoeken14,15.
Vorige studies hebben 46 genomische regio’s geïdentificeerd die betrokken zijn bij het IQ met behulp van een koppelingsbenadering7. Hoewel geen van deze regio’s zich op het X-chromosoom bevindt, zijn zes van hen afkomstig van chromosoom 7 bij de mens (13,04%). Van de tien genomische regio’s met verrijkte IQ-gerelateerde genen, liggen er zes niet op het X-chromosoom, waaronder 7q, 7q11, 7q31, 8p12, 15q14, en17p13. Met uitzondering van 8p1216, overlapt geen van deze genomische regio’s met de genomische regio’s in de eerdere linkage studies. Drie van de zes regio’s zijn van chromosoom 7, goed voor 8,86% van de 158 IQ-gerelateerde genen (tabel 1). Een eerdere studie toonde aan dat 7q31-36 kan worden gekoppeld aan verbaal IQ op basis van 361 Australische en Nederlandse tweelingen17. Onze resultaten kunnen complementaire rollen van de genen op chromosoom 7 in algemene intelligentie aan het licht brengen.
In samenvatting, onze analyse vernauwt de waarschijnlijke genomische regio’s tot verschillende waarschijnlijke kandidaten, wat een beter begrip van een IQ-gerelateerde genomica oplevert en een zeer rationele manier om verschillen zoals geslacht te interpreteren. In het bijzonder heeft onze op genenverrijking gebaseerde benadering meerdere genomische regio’s in chromosoom X geïdentificeerd, die in eerdere linkage studies gemist werden. Dit verschil kan worden veroorzaakt door de steekproefgrootte van de bevolking in linkage studies. De andere mogelijke reden is dat de meeste genen op chromosoom X in IQdb zijn verzameld op basis van single-gen-gebaseerde functionele studies. Genetische associatie is in opkomst als een grootschalig screeninginstrument. Deze kleine proporties van genomische regio’s hebben een globaal onderzoek van het genoom/proteoom op een grotere populatie mogelijk gemaakt.
De verrijkte doelgenen in 158 IQ-gerelateerde genen voor transcriptiefactoren en miRNA’s in verband met mentale stoornissen
Een fundamenteel probleem in biologische systemen is het ontdekken van potentiële regulatoren voor kandidaat-genen, die ons kunnen helpen het volledige volume van genetische informatie te begrijpen. Vergeleken met verrijkte IQ-gerelateerde genen, leert regulatie ons niet over de lineaire relatie met het fysieke chromosoom, maar de dynamische mechanismen van onderliggende omgevingsveranderingen.
De modificerende effecten van verschillende soorten regulerende genen worden op grote schaal bestudeerd en kunnen worden voorspeld op basis van sequentiekenmerken van hun potentiële doelgenen. Transcriptiefactoren (TF) kunnen de genexpressie beïnvloeden door transcriptieactivering of -onderdrukking van doelgenen met verschillende bindingsefficiëntie in promotorgebieden18. De andere belangrijke groep regulatoren, MicroRNA (miRNA), kan mRNA-expressie op post-transcriptioneel niveau reguleren, zoals degradatie of translationele repressie, door het doelgen te binden met kleine complementaire sequenties19. Om potentiële stroomopwaartse TF’s en miRNA’s als mogelijke regulatoren van de 158 genen te identificeren, voerden wij een verrijkingsanalyse uit op zowel TF- als miRNA-doelen. In totaal identificeerden wij zeven TFs die waarschijnlijk de set van IQ-gerelateerde genen reguleren. Dit zijn FOXF2, FOXO4, MAZ, MEF2A, NFIL3, TCF3 en TFAP4. NFIL3 is naar verluidt gerelateerd aan neuronziekte20. Het meest opmerkelijke is dat MEF2 is aangetoond dat negatief reguleren leren-geïnduceerde structurele plasticiteit en geheugenvorming21. Er zijn 16 doelgenen voor MEF2 in 158 genenreeksen, waaronder ATXN1, BDNF, BRAF, DBH, DMD, DMPK, DRD3, GNAS, GRIN2B, IL1RAPL1, IL6R, NR3C2, PHOX2B, SNAP25, TMEM67 en TSC1. Gebaseerd op de pathway annotatie, vonden we dat zes van hen (BDNF, BRAF, DRD3, GNAS, GRIN2B en SNAP25) functies hadden in het neuronale systeem. Bovendien waren de genen DRD3, GNAS en GRIN2B gerelateerd aan de dopaminerge synaps. Deze MEF2-doelen in de IQ-gerelateerde genenset kunnen de kern vormen van het transcriptionele circuit dat geheugenvorming beïnvloedt in verband met IQ, wat om een verdere experimentele validatie vraagt.
Op basis van een vergelijkbare benadering vonden we dat 16 menselijke miRNA’s de neiging hadden om IQ-gerelateerde genen te reguleren. Dit waren hsa-let-7i, hsa-mir-15b, hsa-mir-16, hsa-mir-181d, hsa-mir-195, hsa-mir-30a-3p, hsa-mir-30e-3p, hsa-mir-330, hsa-mir-374, hsa-mir-424, hsa-mir-429, hsa-mir-497, hsa-mir-515-5p, hsa-mir-519e, hsa-mir-522 en hsa-mir-96. Vier daarvan, hsa-let-7i, hsa-miR-15b, hsa-miR-195 en hsa-miR-330, werden op basis van ziekte-annotatie in verband gebracht met psychische stoornissen. Zowel hsa-miR-15b als hsa-miR-195 behoren tot de miR-15 familie, die in de superieure temporale gyrus en de dorsolaterale prefrontale cortex bij schizofrenen is geüprguleerd22. Deze twee miRNA’s kunnen een brede genstilte in de cel bewerkstelligen. Onder de 158 IQ-gerelateerde genen zijn de doelwitten van deze twee miRNA’s ADRB2, ATXN2, BDNF, GHR, IL1RAPL1, KCNJ2, MAP2K1, PAFAH1B1, RAF1, RELN, RPS6KA3, SIGMAR1, SLC6A4 en STX1A. Bij vergelijking van deze set met die van de MEF2 targets komt alleen BDNF voor in beide sets van targets van aan mentale stoornissen gerelateerde TF’s en miRNA’s, wat zou kunnen wijzen op de centrale rol van BDNF in signaalroutes die verband houden met de menselijke intelligentie en de potentiële rol van BDNF als spil van regulerende circuits in de IQ-gerelateerde genen23.
Reconstructie van het kernpad voor IQ-gerelateerde genen met behulp van bekende biologische paden
We zijn nu in staat om verschillende genomische regio’s en regulatoren te specificeren als mogelijke determinanten van het IQ-fenotype. We hebben een pad-reconstructie benadering toegepast om meer complexe biologische processen te beschrijven die gerangschikt zijn in de vorm van een cascade van met elkaar verbonden biochemische reacties of signaaltransducties. In het algemeen stelt de moleculair biologische experimentele technologie ons in staat om fysische en functionele interacties tussen moleculen in de cel te identificeren. Talrijke signaalnetwerken en -routes zijn samengevat op basis van betrouwbaar experimenteel bewijsmateriaal. Over het algemeen zijn de biologische paden verspreid in vele databases en worden ze vaak voorgesteld als diagrammen. Onlangs integreerde Pathway Commons populaire pathway databases en biedt nu een handig, op platte tekst gebaseerd formaat voor verdere pathway mining en reconstructie24. Om de beschikbare gegevens te gebruiken, hebben we het Klein-Ravi Steiner algoritme gebruikt om kerninteracties te extraheren uit de geïntegreerde menselijke pathway gegevens (zie Methoden). De gereconstrueerde kern pad bevat 97 genen en 129 volledig aangesloten pad verbindingen in totaal (Figuur 1A). Onder de 97 knooppunten, 62 zijn in de 158 IQ-gerelateerde genen.
Biologische pad verrijking analyse is een van de meest praktische manieren om onderliggende moleculaire mechanismen in complexe cellulaire processen mijnen25. Verdere functionele verrijking analyse toonde aan dat 97 genen in onze gereconstrueerde kaart waren verrijkt in 30 biologische paden (tabel 2). In termen van neuron-gerelateerde functie, zijn er drie geïdentificeerde paden: “Neurotrophin signaling”, “Long-term potentiation” en “GnRH signaling”. Interessant is dat de meerderheid van de overige 27 pathways verband houden met verschillende signaleringsgebeurtenissen, waaronder signalering bij kanker, ErbB-receptor, TRAIL, proteoglycan syndecan, IFN-gamma, PI3K, MAPK, TSH, Kit-receptor, TCR, IL-3 en hepatocyte Groeifactor Receptor. Naast het neurohormoon GnRH, dat in een neurale cel wordt geproduceerd en aan de neurale terminal wordt afgegeven, wees de kaart uit dat vijf andere hormonen een effect kunnen hebben. Dit zijn androgeen, endothelines, glypican, leptine en prolactine. Samenvattend onthulde onze gereconstrueerde kaart meerdere paden die gerelateerd zijn aan verschillende bekende signaaltransductieroutes, wat wijst op potentiële cellulaire mechanismen die, voor zover wij weten, nog niet zijn gepresenteerd over het onderwerp signaaltransductie. Hormoongerelateerde paden, waaronder een signaalroute voor androgeenontvangst die verband houdt met de ontwikkeling van secundaire geslachtskenmerken bij mannen, zouden interessante en nieuwe componenten kunnen suggereren die verband houden met geslachtsverschillen, waardoor onze huidige kennis wordt uitgebreid.
De rangschikking en structuur van de knooppunten in een complex systeem, zoals een biologisch netwerk, volgen vaak specifieke regels die nauw verband kunnen houden met de functie in dit systeem.11 De volgorde en de structuur van de knooppunten in een complex systeem, zoals een biologisch netwerk, volgen vaak specifieke regels die nauw verband kunnen houden met de functie in dit systeem. Om de gereconstrueerde kaarten te ontleden, werd topologische analyse uitgevoerd (figuur 1B-D). In het algemeen wordt het aantal verbindingen op elk knooppunt weergegeven als de mate in een netwerk 11. Zoals getoond in figuur 1B, de graden van alle moleculen in de gereconstrueerde kaart volgen een power wet verdeling: P(k) ~ k-b, waarbij P (k) is de kans dat een molecuul verbindt met k moleculen en b heeft een geschatte waarde van 1.602. Daarom is de meerderheid van de moleculen in onze kaart zijn schaars verbonden. Daarentegen heeft een klein deel van de moleculen een grotere kans om verbonden te zijn. In totaal zijn er 11 moleculen met ten minste vijf verbindingen. Het gaat om PRKACA (14), CREB1 (9), TP53 (8), SOS1 (8), JAK2 (7), PTPN11 (7), PIK3CA (6), CREBBP (6), CDC42 (6), RAF1 (5) en GNAI3 (5). Daarvan zijn er vier in 158 IQ-gerelateerde genenverzameling, namelijk SOS1, PTPN11, CREBBP en RAF1. De overige zeven moleculen worden toegevoegd via paden die verbonden zijn met de 158 genen.
De hub-knooppunten in een netwerk dienen vaak als gemeenschappelijke verbindingen om informatieoverdracht langs een kort pad te bemiddelen. Zij spelen dus vaak een prominente rol in biologische netwerken. In onze kaart is gen PRKACA het meest verbonden, met 14 verbindingen. PRKACA (protein kinase, cAMP-dependent, catalytic, alpha) speelt een fundamentele rol in verschillende cellulaire functies die gerelateerd zijn aan 76 KEGG en 59 REACTOME pathways waaronder celcyclus, apoptose, signaaltransductie, gap junction en interactie met HIV en het immuunsysteem. Bovendien is PRKACA betrokken bij vele neurologische processen zoals lange-termijn potentiatie, GnRH signalering, Nicotine activiteit op Dopaminerge neuronen, verslaving (Amfetamine, Cocaïne en Morfine), synaps activiteiten (Cholinerge, Dopaminerge, Glutamaterge en Serotonerge synaps). Eerdere studies hebben aangetoond dat cAMP-afhankelijke proteïne kinasen betrokken zijn bij het associatief leren van de Drosophila (fruitvlieg)26. Daarnaast wordt gerapporteerd dat cAMP/cAMP-afhankelijke proteïne kinasen in de hippocampus gerelateerd zijn aan een late geheugenconsolidatiefase van aversief gemotiveerd leren bij ratten27. Bovendien kunnen cAMP-afhankelijke proteïnekinasen ook samenwerken met CaMKII in de H3-receptor om de synthese en het vrijkomen van histamine te reguleren28. Naast PRKACA kan ook CREB1 (cAMP response element-binding protein 1), het op één na meest verbonden gen in onze gereconstrueerde kaart, zich binden aan cAMP response elementen in het DNA. Van dit gen is bekend dat het de vorming van langetermijngeheugen vergemakkelijkt. Bovendien werkt CREB1 samen met BDNF en NTRK2 en vormt zo een kernroute bij depressie29. Ondanks deze hoeveelheid bewijs voor de rol van cAMP-afhankelijke proteïne kinasen en cAMP response element-bindend eiwit in cognitief-gerelateerde processen, is er geen verband gevonden tussen cAMP-afhankelijke proteïne kinasen of cAMP response element-bindend eiwit met IQ. Deze overlappingen met veel bekende signalering cascades met IQ-gerelateerde genen, die een aanwijzing kunnen geven voor complexe signalering cross-talk gecentreerd door PRKACA/CREB1, die in IQdb.
Naast de cAMP-gerelateerde moleculen, zijn er ten minste twee kanker-gerelateerde genen geïdentificeerd door onze pathway reconstructie aanpak. Een daarvan is de meest bekende tumor suppressor TP53. Er zijn zelfs aanwijzingen dat TP53 een rol speelt bij IQ-gerelateerde mentale stoornissen zoals schizofrenie30. Bovendien is het andere oncogen, PIK3CA, ook opgenomen in onze uiteindelijke kaart en is bekend dat het verschillende psychiatrische processen beïnvloedt31,32,33. De volgende drie meest verbonden genen (JAK2, CDC42 en GNAI3) zijn ook gerapporteerd als gerelateerd aan cognitieve stoornissen of gerelateerde neuronale functies. JAK2 is gerelateerd aan cognitieve stoornissen in het muismodel34. CDC42 wordt in verband gebracht met neurofibromatose en mentale retardatie35. Ondanks het feit dat er geen direct bewijs is voor zijn rol in het cognitieve proces, neemt GNAI3 deel aan de negatieve regulatie van synaps transmissie, lange termijn depressie en axon geleiding volgens de KEGG pathway annotatie. Samenvattend, van de zeven hub moleculen in onze gereconstrueerde kaart die gerelateerd zijn aan IQ, zijn er minstens zes (85.71%) waarvan in de literatuur wordt gerapporteerd dat ze mogelijk geassocieerd zijn met IQ of andere cognitieve processen. Deze hoge relevantie toont niet alleen de nauwkeurigheid van de pathway-based reconstructie aanpak om kritische moleculen te identificeren, maar biedt ook een volledig aangesloten signalering pathway waardig verder onderzoek.
Hoewel onze gereconstrueerde kaart is een niet-georiënteerde signalering pathway, het biedt veel testbare moleculen in een typische kleine-wereld netwerk betrokken bij cognitieve processen, waar hun graden volgen een power-law verdeling. Onze verdere topologische analyse op korte pad (figuur 1C) en nabijheid centraliteit (figuur 1D) blijkt dat de gereconstrueerde kaart is relatief compact. De padlengte geeft aan hoeveel stappen er zijn tussen een knooppunt en andere knooppunten11. Zoals in figuur 1C te zien is, zijn de meeste knooppunten op de kaart gemakkelijk in drie tot zes stappen vanaf een ander knooppunt te bereiken. De “closeness centrality” wordt gebruikt om de kortste stap van een knooppunt naar een ander knooppunt te bepalen11. Zoals te zien in figuur 1D, hebben de knooppunten met meer buren de neiging om een hogere closeness centrality.
Een verbonden drug-target netwerk in de kernroute van IQ-gerelateerde genen
Op basis van de gereconstrueerde pathway map, identificeerden we verder verrijkte drug targets in deze kaart. Met behulp van de verrijkte drug targets als inputs, combineerden we de drugs en hun doelen om een drug-target netwerk te vormen. Zoals weergegeven in figuur 2A, zijn er tien verrijkt drugs, namelijk dopamine, stikstofmonoxide, L-tyrosine, methamfetamine, noradrenaline, glutathion, amfetamine, tetrahydrobiopterine, apomorfine en somatropine recombinant. Met uitzondering van somatropine recombinant, zijn alle gerapporteerd dat ze actief zijn in het zenuwstelsel of mentale functies volgens de farmacodynamische annotatie in DrugBank36. Interessant is dat zes van hen interageren met twee kritische neurotransmittersystemen (dopamine en noradrenaline) die stemming en gedrag reguleren. Hiertoe behoren amfetamine, apomorfine, dopamine, L-tyrosine en noradrenaline. Dopamine is een neurotransmitter die verantwoordelijk is voor diverse gedrags- en cognitie-activiteiten, zoals die welke voorkomen in beloningsgestuurde leersystemen. Dopamine wordt ook in verband gebracht met veel neurologische aandoeningen, zoals de ziekte van Parkinson, psychose en schizofrenie37. Noradrenaline speelt een cruciale rol bij het nemen van beslissingen en kan de aandacht beïnvloeden; het wordt ook gebruikt als antidepressivum en antischizofreniemiddel38,39. L-tyrosine is een van de precursoren in de synthese van dopamine en noradrenaline en kan volgens de DrugBank annotatie worden gebruikt om depressie te behandelen, het geheugen te verbeteren en de mentale alertheid te verhogen36. Amfetamine kan centrale adrenerge receptoren stimuleren om noradrenaline vrij te geven en een hoge dosis amfetamine helpt naar verluidt om dopamine vrij te maken. Methamfetamine, een verwante entiteit, is neurotoxisch voor dopaminetransporters en wordt vaak gebruikt om dopamineterminale proefdieren te markeren. Aangezien het betrokken is bij dopaminesystemen, wordt methamfetamine naar verluidt in verband gebracht met een tragere motoriek en een verslechtering van het geheugen40. Apomorfine is een dopamine-agonist en wordt volgens de annotatie van de DrugBank gebruikt voor de behandeling van de ziekte van Parkinson36.