IQ-relaterade gener är berikade i flera olika regioner på kromosomerna 7 och X
För att ta itu med IQ-poängens genetiska komplexitet utvecklade vi IQdb (http://IQdb.cbi.pku.edu.cn), en allmänt tillgänglig databas för att utforska IQ-relaterade mänskliga gener7. I IQdb tjänar 158 experimentellt verifierade gener från litteraturen som kärndataset, bland vilka cirka 16 % av de IQ-relaterade generna är belägna på X-kromosomen. Det rapporteras att endast 3,4 % av alla mänskliga gener tillhör X-kromosomen12. Den uppenbara kontrasten kan tyda på att IQ-relaterade gener är överrepresenterade på X-kromosomen. För att närmare klargöra vilka genomiska regioner som innehåller ett större antal IQ-relaterade gener antog vi ett hypergeometriskt test baserat på geninnehållet i varje cytoband på det mänskliga genomet. Den ytterligare anrikningsanalysen identifierade 10 genomiska regioner med ett betydligt större antal IQ-relaterade gener. Bland de 10 regionerna tillhör fyra X-kromosomen, inklusive Xp, Xq, Xq28 och Xp11. En tidigare genuttrycksstudie visade att gener på X-kromosomen har större sannolikhet att uttrycka sig i hjärnregioner och reproduktiva vävnader13. Våra resultat kan stämma överens med tanken att gener på X-kromosomen kan vara förknippade med den kvantitativa IQ-poängen12. Eftersom X-kromosomen är viktig för den sexuella differentieringen kan anrikningen av IQ-relaterade gener på X-kromosomen utgöra ett incitament för att utforska skillnader i IQ-poäng mellan könen14,15.
I tidigare studier har man identifierat 46 genomiska regioner som är involverade i IQ med hjälp av en länkningsmetod7. Även om ingen av dessa regioner är belägen på X-kromosomen är sex av dem från kromosom 7 hos människor (13,04 %). Bland de tio genomiska regionerna med berikade IQ-relaterade gener finns sex inte på X-kromosomen, däribland 7q, 7q11, 7q31, 8p12, 15q14 och17p13. Med undantag för 8p1216 överlappar ingen av dessa genomiska regioner med de genomiska regionerna i de tidigare kopplingsstudierna. Tre av sex regioner kommer från kromosom 7 och står för 8,86 % av de 158 IQ-relaterade generna (tabell 1). En tidigare studie visade att 7q31-36 kan vara kopplat till verbal IQ baserat på 361 australiensiska och nederländska tvillingar17. Våra resultat kan avslöja kompletterande roller för generna på kromosom 7 i allmän intelligens.
Sammanfattningsvis begränsar vår analys de sannolika genomiska regionerna till flera troliga kandidater, vilket ger en bättre förståelse för en IQ-relaterad genomik och ett mycket rationellt sätt att tolka skillnader som kön. Framför allt har vårt genberikningsbaserade tillvägagångssätt identifierat flera genomiska regioner i kromosom X, som missats i tidigare kopplingsstudier. Denna skillnad kan orsakas av urvalsstorleken på populationen i kopplingsstudier. Den andra möjliga orsaken är att de flesta gener på kromosom X i IQdb samlas in baserat på funktionella studier av enskilda gener. Genetisk association håller på att växa fram som ett storskaligt screeningverktyg. Dessa små andelar av genomiska regioner har möjliggjort en global undersökning av genomet/proteomet på en större population.
De berikade målgenerna i 158 IQ-relaterade gener för transkriptionsfaktorer och miRNAs relaterade till psykiska störningar
Ett grundläggande problem i biologiska system är att upptäcka potentiella regulatorer för kandidatgener, vilket kan hjälpa oss att förstå hela volymen av genetisk information. Jämfört med berikade IQ-relaterade gener lär oss regleringen inte om det linjära förhållandet till den fysiska kromosomen, utan om de dynamiska mekanismerna för underliggande miljöförändringar.
De modifierande effekterna av flera typer av reglerande gener har studerats i stor utsträckning och kan förutsägas baserat på sekvensegenskaper hos deras potentiella målgener. Transkriptionsfaktorer (TF) kan påverka genuttryck genom transkriptionsaktivering eller -undertryckning av målgener med olika bindningseffektivitet i promotorregioner18. Den andra stora gruppen av regulatorer, mikroRNA (miRNA), kan reglera mRNA-uttrycket på posttranskriptionell nivå, t.ex. nedbrytning eller translationsrepressaliering, genom att binda målgenen med små komplementära sekvenser19. För att identifiera potentiella uppströms-TF:er och miRNA:er som möjliga regulatorer av den 158 genuppsättningen utförde vi en anrikningsanalys av både TF- och miRNA-mål. Totalt identifierade vi sju TFs som sannolikt reglerar uppsättningen IQ-relaterade gener. De är FOXF2, FOXO4, MAZ, MEF2A, NFIL3, TCF3 och TFAP4. NFIL3 har enligt uppgift ett samband med neuronsjukdomar20. Mest anmärkningsvärt är att MEF2 har visat sig negativt reglera inlärningsinducerad strukturell plasticitet och minnesbildning21. Det finns 16 målgener för MEF2 i 158 genuppsättningar, däribland ATXN1, BDNF, BRAF, DBH, DMD, DMPK, DRD3, GNAS, GRIN2B, IL1RAPL1, IL6R, NR3C2, PHOX2B, SNAP25, TMEM67 och TSC1. Baserat på vägannotering fann vi att sex av dem (BDNF, BRAF, DRD3, GNAS, GRIN2B och SNAP25) hade funktioner i det neuronala systemet. Dessutom var generna DRD3, GNAS och GRIN2B relaterade till dopaminerga synapser. Dessa MEF2-mål i den IQ-relaterade genuppsättningen kan utgöra det centrala transkriptionella kretsloppet som påverkar minnesbildning relaterad till IQ, vilket kräver ytterligare experimentell validering.
Baserat på ett liknande tillvägagångssätt fann vi att 16 humana miRNA tenderade att reglera IQ-relaterade gener. De var hsa-let-7i, hsa-mir-15b, hsa-mir-16, hsa-mir-181d, hsa-mir-195, hsa-mir-30a-3p, hsa-mir-30e-3p, hsa-mir-330, hsa-mir-374, hsa-mir-424, hsa-mir-429, hsa-mir-497, hsa-mir-515-5p, hsa-mir-519e, hsa-mir-522 och hsa-mir-96. Fyra av dem, hsa-let-7i, hsa-miR-15b, hsa-miR-195 och hsa-miR-330, var relaterade till psykiska störningar baserat på sjukdomskommentarer. Både hsa-miR-15b och hsa-miR-195 tillhör miR-15-familjen, som har uppreglerats i gyrus temporalis superior och i den dorsolaterala prefrontala cortexen hos schizofrena personer22. Dessa två miRNA:er kan förmedla omfattande tystnad av gener i cellen. Bland de 158 IQ-relaterade generna är ADRB2, ATXN2, BDNF, GHR, IL1RAPL1, KCNJ2, MAP2K1, PAFAH1B1, RAF1, RELN, RPS6KA3, SIGMAR1, SLC6A4 och STX1A måltavlor för dessa två miRNA. Om man jämför denna uppsättning med den för MEF2-målen är det bara BDNF som förekommer i båda uppsättningarna av mål för TF:er och miRNA:er som är relaterade till psykiska störningar, vilket kan belysa dess centrala roll i signalvägar som är relaterade till mänsklig intelligens och dess potentiella roll som navet i regleringskretsar i de IQ-relaterade generna23.
Rekonstruktion av kärnbanan för IQ-relaterade gener med hjälp av kända biologiska banor
Vi kan nu specificera flera genomiska regioner och regulatorer som möjliga bestämningsfaktorer för IQ-fenotypen. Vi använde oss av en metod för rekonstruktion av banor för att beskriva mer komplexa biologiska processer som är ordnade i form av en kaskad av sammanhängande biokemiska reaktioner eller signalöverföringar. Generellt sett gör molekylärbiologisk experimentell teknik det möjligt för oss att identifiera fysiska och funktionella interaktioner mellan molekyler i cellen. Mängder av signalnätverk och signalvägar sammanfattas utifrån tillförlitliga experimentella bevis. Generellt sett finns de biologiska signalvägarna utspridda i många databaser och representeras ofta som diagram. Pathway Commons har nyligen integrerat populära databaser för banor och erbjuder nu ett bekvämt format i klartext för ytterligare utvinning och rekonstruktion av banor24. För att utnyttja de tillgängliga uppgifterna använde vi Klein-Ravi Steiner-algoritmen för att extrahera centrala interaktioner från de integrerade uppgifterna om mänskliga vägar (se metoder). Den rekonstruerade kärnbanan innehåller totalt 97 gener och 129 helt anslutna banförbindelser (figur 1A). Bland de 97 noderna finns 62 i de 158 IQ-relaterade generna.
Analys av berikning av biologiska vägar är ett av de mest praktiska sätten att utvinna underliggande molekylära mekanismer i komplexa cellulära processer25. Ytterligare funktionell anrikningsanalys visade att 97 gener i vår rekonstruerade karta var anrikade i 30 biologiska vägar (tabell 2). När det gäller neuronrelaterad funktion finns det tre identifierade vägar: ”Neurotropinsignalering”, ”Långtidspotentiering” och ”GnRH-signalering”. Intressant nog är majoriteten av de återstående 27 banorna relaterade till olika signaleringshändelser, inklusive signalering i cancer, ErbB-receptor, TRAIL, proteoglykan syndekan, IFN-gamma, PI3K, MAPK, TSH, Kit-receptor, TCR, IL-3 och hepatocyte Growth Factor Receptor. Förutom neurohormonet GnRH, som produceras i en neuralcell och frisätts vid dess neuralterminal, visade kartläggningen att ytterligare fem hormoner kan ha en effekt. Dessa är androgen, endoteliner, glypican, leptin och prolaktin. Sammanfattningsvis visade vår rekonstruerade karta flera vägar som är relaterade till flera kända signalvägar, vilket tyder på potentiella cellulära mekanismer som inte har presenterats i ämnet signaltransduktion, såvitt vi vet. Hormonrelaterade vägar, inklusive en signalväg för androgenmottagning som är relaterad till utvecklingen av manliga sekundära könsegenskaper, kan föreslå intressanta och nya komponenter som är relaterade till könsskillnader, vilket utökar vår nuvarande kunskap.
Arrangemanget och strukturen av noderna i ett komplext system, såsom ett biologiskt nätverk, följer ofta specifika regler som kan vara nära relaterade till funktionen i detta system11. För att sönderdela de rekonstruerade kartorna genomfördes en topologisk analys (figur 1B-D). I allmänhet representeras antalet förbindelser vid varje nod som graden i ett nätverk11. Som framgår av figur 1B följer graderna för alla molekyler i den rekonstruerade kartan en power law-fördelning: P(k) ~ k-b, där P(k) är sannolikheten att en molekyl kopplar ihop sig med k molekyler och b har ett uppskattat värde på 1,602. Därför är majoriteten av molekylerna i vår karta sparsamt sammankopplade. En liten del av molekylerna har däremot större sannolikhet att vara sammankopplade. Totalt finns det 11 molekyler med minst fem förbindelser. De är PRKACA (14), CREB1 (9), TP53 (8), SOS1 (8), JAK2 (7), PTPN11 (7), PIK3CA (6), CREBBP (6), CDC42 (6), RAF1 (5) och GNAI3 (5). Av dessa finns fyra i 158 IQ-relaterade genuppsättningar, nämligen SOS1, PTPN11, CREBBP och RAF1. De återstående sju molekylerna är bifogade genom vägar som är kopplade till de 158 generna.
Hubbnoderna i ett nätverk fungerar ofta som gemensamma anslutningar för att förmedla informationstransduktion längs en kort väg. Därför spelar de ofta en framträdande roll i biologiska nätverk. I vår karta är genen PRKACA den mest sammankopplade med 14 kopplingar. PRKACA (protein kinase, cAMP-dependent, catalytic, alpha) spelar en grundläggande roll i olika cellfunktioner relaterade till 76 KEGG- och 59 REACTOME-banor, inklusive cellcykel, apoptos, signaltransduktion, gap junction och interaktion med HIV och immunsystemet. Dessutom är PRKACA involverad i många neurologiska processer, t.ex. långtidspotentiering, GnRH-signalering, nikotinaktivitet på dopaminerga neuroner, beroende (amfetamin, kokain och morfin), synapsverksamhet (kolinerga, dopaminerga, glutamaterga och serotonerga synapser). Tidigare studier visar att cAMP-beroende proteinkinaser är involverade i den associativa inlärningen hos Drosophila (fruktfluga)26. Dessutom rapporteras cAMP/cAMP-beroende proteinkinaser i hippocampusregionen vara relaterade till en sen minneskonsolideringsfas av aversivt motiverad inlärning hos råttor27. Dessutom kan cAMP-beroende proteinkinaser också samarbeta med CaMKII i H3-receptorn för att reglera syntesen och frisättningen av histamin28. Förutom PRKACA kan CREB1 (cAMP response element-binding protein 1), den näst mest sammankopplade genen i vår rekonstruerade karta, också binda sig till cAMP-responselement i DNA. Denna gen har rapporterats underlätta bildandet av långtidsminnen. Dessutom samverkar CREB1 med BDNF och NTRK2 för att bilda en central väg vid depression29. Trots denna mängd bevis för den roll som cAMP-beroende proteinkinaser och cAMP-responselementbindande proteiner spelar i kognitionsrelaterade processer har det inte funnits något samband mellan cAMP-beroende proteinkinaser eller cAMP-responselementbindande proteiner och IQ. Dessa överlappar med många kända signalkaskader med IQ-relaterade gener, vilket kan ge en ledtråd till komplexa signaleringskorsningar centrerade av PRKACA/CREB1, som finns i IQdb.
Inom de cAMP-relaterade molekylerna finns det minst två cancerrelaterade gener som identifierats av vår metod för rekonstruktion av vägar. Den ena är den mest välkända tumörsuppressorn TP53. Det finns faktiskt bevis för att den spelar en roll vid IQ-relaterade psykiska störningar som schizofreni30. Den andra onkogenen, PIK3CA, ingår också i vår slutliga karta och är känd för att påverka flera psykiatriska processer31,32,33. De nästa tre mest sammankopplade generna (JAK2, CDC42 och GNAI3) har också rapporterats vara relaterade till kognitiva störningar eller relaterade neuronala funktioner. JAK2 är relaterad till kognitiv nedsättning i musmodellen34. CDC42 är förknippad med neurofibromatos och mental retardation35. Trots att det inte finns några direkta bevis för dess roll i kognitiva processer deltar GNAI3 i den negativa regleringen av synapsöverföring, långtidsdepression och axonstyrning enligt KEGG-annoteringen av banan. Sammanfattningsvis kan man säga att av de sju navmolekylerna i vår rekonstruerade karta som är relaterade till IQ har minst sex (85,71 %) av dem rapporterats i litteraturen som potentiellt associerade med IQ eller andra kognitiva processer. Denna höga relevans visar inte bara att den vägbaserade rekonstruktionsmetoden för att identifiera kritiska molekyler är korrekt, utan ger också en fullt ansluten signalväg som är värd att undersöka ytterligare.
Trots att vår rekonstruerade karta är en oorienterad signalväg ger den många testabla molekyler i ett typiskt småvärldsnätverk som är involverat i kognitiva processer, där deras grader följer en power-law-distribution. Vår ytterligare topologiska analys av korta vägar (figur 1C) och närhetscentralitet (figur 1D) visar att den rekonstruerade kartan är relativt kompakt. Stens längd representerar hur många steg som finns mellan en nod och andra noder11. Som framgår av figur 1C kan majoriteten av noderna i kartan lätt nås från en annan nod med tre till sex steg. Närhetscentralen används för att avslöja det kortaste steget från en nod till en annan11. Som visas i figur 1D tenderar noder med fler grannar att ha högre närhetscentralitet.
Ett sammanhängande nätverk för läkemedelsmål i kärnbanan för IQ-relaterade gener
Baserat på den rekonstruerade bankkartan identifierade vi ytterligare berikade läkemedelsmål i denna karta. Med de berikade läkemedelsmålen som indata kombinerade vi läkemedlen och deras mål för att bilda ett nätverk mellan läkemedel och mål. Som framgår av figur 2A finns det tio berikade läkemedel, nämligen dopamin, kväveoxid, L-tyrosin, metamfetamin, noradrenalin, glutation, amfetamin, tetrahydrobiopterin, apomorfin och somatropin rekombinant. Med undantag för somatropin rekombinant har alla rapporterats vara aktiva i nervsystemet eller mentala funktioner enligt den farmakodynamiska annotationen i DrugBank36. Intressant nog interagerar sex av dem med två kritiska neurotransmittorsystem (dopamin och noradrenalin) som reglerar humör och beteende. Dessa inkluderar amfetamin, apomorfin, dopamin, L-tyrosin och noradrenalin. Dopamin är en neurotransmittor som ansvarar för olika beteende- och kognitionsaktiviteter, t.ex. sådana som finns i belöningsdrivna inlärningssystem. Dopamin är också kopplat till många neurologiska sjukdomar som Parkinsons sjukdom, psykos och schizofreni37. Noradrenalin spelar en viktig roll i beslutsfattandet och kan påverka uppmärksamheten; det används också som antidepressivt och antischizofrent medel38,39. L-tyrosin är en av prekursorerna i syntesen av dopamin och noradrenalin och kan användas för att behandla depression, förbättra minnet och öka den mentala vakenheten enligt DrugBank-annotationen36. Amfetamin kan stimulera centrala adrenerga receptorer att frisätta noradrenalin och en hög dos amfetamin rapporteras bidra till att frisätta dopamin. Metamfetamin, en besläktad entitet, är neurotoxiskt för dopamintransportörer och används ofta för att markera dopaminterminala försöksdjur. Eftersom det är involverat i dopaminsystemen har metamfetamin rapporterats vara förknippat med långsammare motorisk funktion och försämrat minne40. Apomorfin är en dopaminagonist och används för att behandla Parkinsons sjukdom baserat på DrugBank annotation, enligt DrugBank annotation36.
De sex läkemedel som påverkar de två kritiska neurotransmittorerna dopamin och noradrenalin täckte 66,7 % av målgenerna (32 gener) i kartan för läkemedels-måltavläsningen (figur 2A). Eftersom vi konstruerade den här kartan genom anrikade läkemedel är den här läkemedel-målkartan mestadels centrerad av läkemedel. Därför är konnektiviteterna för läkemedel högre än läkemedelsmålgener, vilket visas i figur 2B. Med hjälp av topologisk analys kan de flesta noderna nås från varandra i två till fyra steg (figur 2C). Eftersom majoriteten av målgener och läkemedel är relaterade till dopamin- och noradrenalin-systemet är detta nätverk också mycket kompakt baserat på närhetens centraliteter (figur 2D). Sammanfattningsvis visar vår anriknings- och nätverksbaserade analys att dopamin- och noradrenalsystemen är kritiska för IQ-relaterade gener, vilket kan ge mer insikt i den kognitiva processen ur en IQ-aspekt.