Geny související s IQ jsou obohaceny ve více oblastech chromozomů 7 a X
Pro řešení genetické složitosti IQ skóre jsme vyvinuli IQdb (http://IQdb.cbi.pku.edu.cn), veřejně dostupnou databázi pro zkoumání lidských genů souvisejících s IQ7. V databázi IQdb slouží 158 experimentálně ověřených genů z literatury jako základní soubor dat, mezi nimiž se přibližně 16 % genů souvisejících s IQ nachází na chromozomu X. V databázi IQdb jsou uvedeny všechny geny související s IQ. Uvádí se, že pouze 3,4 % všech lidských genů patří na chromozom X12. Tento zřejmý kontrast může naznačovat, že geny související s IQ jsou nadměrně zastoupeny na chromozomu X. Abychom podrobněji objasnili, které genomové oblasti obsahují větší počet genů souvisejících s IQ, přijali jsme hypergeometrický test založený na obsahu genů v jednotlivých cytobandech lidského genomu. Další analýza obohacení identifikovala 10 genomových oblastí s významně větším množstvím genů souvisejících s IQ. Z 10 oblastí patří 4 k chromozomu X, včetně Xp, Xq, Xq28 a Xp11. Předchozí studie genové exprese ukázala, že geny na chromozomu X se s větší pravděpodobností exprimují v oblastech mozku a reprodukčních tkáních13. Naše výsledky mohou být v souladu s myšlenkou, že geny na chromozomu X mohou souviset s kvantitativním skóre IQ12. Vzhledem k tomu, že chromozom X je důležitý pro pohlavní diferenciaci, může být obohacení genů souvisejících s IQ na chromozomu X podnětem ke zkoumání rozdílů ve skóre IQ mezi pohlavími14,15.
Předchozí studie identifikovaly 46 genomických oblastí podílejících se na IQ pomocí vazebného přístupu7. Ačkoli se žádná z těchto oblastí nenachází na chromozomu X, šest z nich pochází z lidského chromozomu 7 (13,04 %). Z deseti genomických oblastí s obohacenými geny souvisejícími s IQ se šest nenachází na chromozomu X, včetně 7q, 7q11, 7q31, 8p12, 15q14 a17p13. S výjimkou oblasti 8p1216 se žádná z těchto genomických oblastí nepřekrývá s genomickými oblastmi z předchozích vazebných studií. Tři ze šesti oblastí pocházejí z chromozomu 7, což představuje 8,86 % ze 158 genů souvisejících s IQ (tabulka 1). Jedna z předchozích studií ukázala, že 7q31-36 může být spojen s verbálním IQ na základě 361 australských a nizozemských dvojčat17. Naše výsledky mohou odhalit komplementární role genů na chromozomu 7 v obecné inteligenci.
V souhrnu naše analýza zužuje pravděpodobné genomické oblasti na několik pravděpodobných kandidátů, což poskytuje lepší pochopení genomiky související s IQ a vysoce racionální způsob interpretace rozdílů, jako je pohlaví. Pozoruhodné je, že náš přístup založený na obohacování genů identifikoval několik genomických oblastí na chromozomu X, které byly v předchozích studiích vazeb přehlédnuty. Tento rozdíl může být způsoben velikostí vzorku populace ve vazebných studiích. Dalším možným důvodem je, že většina genů na chromozomu X v IQdb je shromážděna na základě funkčních studií založených na jednom genu. Genetická asociace se stává rozsáhlým screeningovým nástrojem. Tyto malé podíly genomických oblastí umožnily globální zkoumání genomu/proteomu na větší populaci.
Obohacené cílové geny u 158 genů souvisejících s IQ pro transkripční faktory a miRNA související s duševními poruchami
Základním problémem v biologických systémech je objevování potenciálních regulátorů pro kandidátní geny, což nám může pomoci pochopit celý objem genetické informace. Ve srovnání s obohacenými geny souvisejícími s IQ nás regulace neučí o lineárním vztahu k fyzickému chromozomu, ale o dynamických mechanismech základních změn prostředí.
Modifikační účinky několika typů regulačních genů jsou široce studovány a lze je předvídat na základě sekvenčních vlastností jejich potenciálních cílových genů. Transkripční faktor (TF) může ovlivňovat genovou expresi prostřednictvím aktivace nebo suprese transkripce cílových genů s různou účinností vazby v promotorových oblastech18. Další významná skupina regulátorů, mikroRNA (miRNA), může regulovat expresi mRNA na posttranskripční úrovni, například degradací nebo translační represí, a to vazbou cílového genu pomocí malých komplementárních sekvencí19. Abychom identifikovali potenciální upstream TF a miRNA jako možné regulátory souboru 158 genů, provedli jsme analýzu obohacení na cíle TF i miRNA. Celkem jsme identifikovali sedm TF, které pravděpodobně regulují soubor genů souvisejících s IQ. Jsou to FOXF2, FOXO4, MAZ, MEF2A, NFIL3, TCF3 a TFAP4. NFIL3 údajně souvisí s onemocněním neuronů20. Nejpozoruhodnější je, že MEF2 prokazatelně negativně reguluje strukturální plasticitu vyvolanou učením a tvorbu paměti21. V souboru 158 genů je 16 cílových genů pro MEF2, včetně ATXN1, BDNF, BRAF, DBH, DMD, DMPK, DRD3, GNAS, GRIN2B, IL1RAPL1, IL6R, NR3C2, PHOX2B, SNAP25, TMEM67 a TSC1. Na základě anotace drah jsme zjistili, že šest z nich (BDNF, BRAF, DRD3, GNAS, GRIN2B a SNAP25) má funkce v neuronálním systému. Kromě toho geny DRD3, GNAS a GRIN2B souvisely s dopaminergní synapsí. Tyto cíle MEF2 v souboru genů souvisejících s IQ mohou tvořit jádro transkripčního obvodu ovlivňujícího tvorbu paměti související s IQ, což si žádá další experimentální ověření.
Na základě podobného přístupu jsme zjistili, že 16 lidských miRNA má tendenci regulovat geny související s IQ. Jednalo se o hsa-let-7i, hsa-mir-15b, hsa-mir-16, hsa-mir-181d, hsa-mir-195, hsa-mir-30a-3p, hsa-mir-30e-3p, hsa-mir-330, hsa-mir-374, hsa-mir-424, hsa-mir-429, hsa-mir-497, hsa-mir-515-5p, hsa-mir-519e, hsa-mir-522 a hsa-mir-96. V tomto případě se jednalo o hsa-let-7i. Čtyři z nich, hsa-let-7i, hsa-miR-15b, hsa-miR-195 a hsa-miR-330, byly na základě anotace onemocnění spojeny s duševními poruchami. Jak hsa-miR-15b, tak hsa-miR-195 patří do rodiny miR-15, která byla u schizofreniků zvýšeně regulována v horním temporálním gyru a v dorsolaterální prefrontální kůře22. Tyto dvě miRNA mohou zprostředkovat široké umlčení genů v buňce. Mezi 158 geny souvisejícími s IQ jsou cíli těchto dvou miRNA ADRB2, ATXN2, BDNF, GHR, IL1RAPL1, KCNJ2, MAP2K1, PAFAH1B1, RAF1, RELN, RPS6KA3, SIGMAR1, SLC6A4 a STX1A. Porovnáme-li tento soubor se souborem cílů MEF2, v obou souborech cílů TF a miRNA souvisejících s duševními poruchami se vyskytuje pouze BDNF, což by mohlo zdůraznit jeho ústřední roli v signálních drahách souvisejících s lidskou inteligencí a jeho potenciální roli jako centra regulačních obvodů v genech souvisejících s IQ23.
Rekonstrukce jádra dráhy pro geny související s IQ pomocí známých biologických drah
V současné době jsme schopni specifikovat několik genomických oblastí a regulátorů jako možných determinantů fenotypu IQ. K popisu složitějších biologických procesů uspořádaných do podoby kaskády propojených biochemických reakcí nebo signálních přenosů jsme přijali přístup rekonstrukce drah. Obecně nám molekulárně biologická experimentální technologie umožňuje identifikovat fyzikální a funkční interakce mezi molekulami v buňce. Množství signálních sítí a drah je shrnuto na základě spolehlivých experimentálních důkazů. Obecně řečeno, biologické dráhy jsou roztroušeny v mnoha databázích a často jsou znázorněny ve formě diagramů. Nedávno portál Pathway Commons integroval populární databáze drah a nyní poskytuje pohodlný formát založený na prostém textu, který je vhodný pro další vyhledávání a rekonstrukci drah24. Abychom využili dostupná data, přijali jsme algoritmus Klein-Ravi Steiner k extrakci základních interakcí z integrovaných dat o lidských drahách (viz Metody). Rekonstruovaná jádrová dráha obsahuje celkem 97 genů a 129 plně propojených spojení dráhy (obr. 1A). Mezi 97 uzly se 62 uzlů nachází ve 158 genech souvisejících s IQ.
Analýza obohacení biologických drah je jedním z nejpraktičtějších způsobů, jak vytěžit základní molekulární mechanismy v komplexních buněčných procesech25. Další analýza funkčního obohacení ukázala, že 97 genů v námi rekonstruované mapě bylo obohaceno ve 30 biologických drahách (tab. 2). Pokud jde o funkce související s neurony, byly identifikovány tři dráhy: „Neurotrofinová signalizace“, „Dlouhodobá potenciace“ a „GnRH signalizace“. Zajímavé je, že většina ze zbývajících 27 drah souvisí s různými signálními událostmi, včetně signalizace u rakoviny, receptoru ErbB, TRAIL, proteoglykanu syndekanu, IFN-gamma, PI3K, MAPK, TSH, receptoru Kit, TCR, IL-3 a receptoru pro růstový faktor hepatocytů. Kromě neurohormonu GnRH, který je produkován v nervové buňce a uvolňován v jejím nervovém terminálu, mapa naznačila, že vliv může mít pět dalších hormonů. Jsou to androgen, endoteliny, glypikan, leptin a prolaktin. Celkově naše rekonstruovaná mapa odhalila více cest souvisejících s několika známými signálními drahami, což naznačuje potenciální buněčné mechanismy, které na téma přenosu signálu, pokud je nám známo, dosud nebyly prezentovány. Dráhy související s hormony, včetně signální dráhy příjmu androgenů související s vývojem mužských sekundárních pohlavních znaků, mohou naznačovat zajímavé a nové komponenty související s rozdíly mezi pohlavími a rozšiřovat tak naše dosavadní znalosti.
Uspořádání a struktura uzlů v komplexním systému, jako je biologická síť, se často řídí specifickými pravidly, která mohou úzce souviset s funkcí v tomto systému11. Pro rozklad rekonstruovaných map byla provedena topologická analýza (obr. 1B-D). Obecně je počet spojení v každém uzlu reprezentován jako stupeň v síti11. Jak ukazuje obrázek 1B, stupně všech molekul v rekonstruované mapě se řídí mocninným zákonem rozdělení: P(k) ~ k-b, kde P(k) je pravděpodobnost, že se molekula spojí s k molekulami a b má odhadovanou hodnotu 1,602. Většina molekul v naší mapě je tedy řídce propojena. Naopak malá část molekul je propojena s větší pravděpodobností. Celkem je zde 11 molekul s alespoň pěti spojeními. Jsou to PRKACA (14), CREB1 (9), TP53 (8), SOS1 (8), JAK2 (7), PTPN11 (7), PIK3CA (6), CREBBP (6), CDC42 (6), RAF1 (5) a GNAI3 (5). Z nich čtyři jsou v souboru 158 genů souvisejících s IQ, a to SOS1, PTPN11, CREBBP a RAF1. Zbývajících sedm molekul je připojeno prostřednictvím drah spojených se 158 geny.
Hubové uzly v síti často slouží jako společná spojení ke zprostředkování přenosu informací po krátké dráze. V biologické síti tak často hrají významnou roli. V naší mapě je nejvíce propojen gen PRKACA, který vykazuje 14 spojení. PRKACA (protein kinase, cAMP-dependent, catalytic, alpha) hraje zásadní roli v různých buněčných funkcích souvisejících se 76 dráhami KEGG a 59 dráhami REACTOME, včetně buněčného cyklu, apoptózy, přenosu signálu, gap junction a interakce s HIV a imunitním systémem. Kromě toho se PRKACA podílí na mnoha neurologických procesech, jako je dlouhodobá potenciace, signalizace GnRH, aktivita nikotinu na dopaminergních neuronech, závislost (amfetamin, kokain a morfin), činnost synapsí (cholinergní, dopaminergní, glutamátergní a serotonergní synapse). Předchozí studie prokázaly, že cAMP-dependentní proteinkinázy se podílejí na asociativním učení drozofily (ovocné mušky)26. Kromě toho se uvádí, že cAMP/cAMP-dependentní proteinkinázy v hipokampální oblasti souvisejí s pozdní fází konsolidace paměti při averzivně motivovaném učení u potkanů27. Kromě toho mohou cAMP-dependentní proteinkinázy také spolupracovat s CaMKII v receptoru H3 při regulaci syntézy a uvolňování histaminu28. Kromě PRKACA se na elementy cAMP odpovědi v DNA může vázat také CREB1 (cAMP response element-binding protein 1), druhý nejvíce propojený gen v naší rekonstruované mapě. Bylo zjištěno, že tento gen usnadňuje tvorbu dlouhodobé paměti. Kromě toho CREB1 interaguje s BDNF a NTRK2 a vytváří tak základní dráhu u deprese29. Navzdory tomuto množství důkazů o úloze cAMP-dependentních proteinových kináz a cAMP response element-binding proteinu v procesech souvisejících s kognitivními funkcemi nebyla zjištěna žádná souvislost mezi cAMP-dependentními proteinovými kinázami nebo cAMP response element-binding proteinem s IQ. Ty se překrývají s mnoha známými signálními kaskádami s geny souvisejícími s IQ, což by mohlo poskytnout vodítko pro komplexní signální křížovou vazbu, jejímž centrem je PRKACA/CREB1, který je v IQdb.
Kromě molekul souvisejících s cAMP existují nejméně dva geny související s rakovinou identifikované naším přístupem rekonstrukce drah. Jedním z nich je nejznámější nádorový supresor TP53. Ve skutečnosti existují důkazy, že hraje roli u duševních poruch souvisejících s IQ, jako je schizofrenie30. Kromě toho je do naší konečné mapy zahrnut i druhý onkogen, PIK3CA, o němž je známo, že ovlivňuje několik psychiatrických procesů31,32,33. U dalších tří nejvíce propojených genů (JAK2, CDC42 a GNAI3) byla rovněž zjištěna souvislost s kognitivními poruchami nebo souvisejícími neuronálními funkcemi. JAK2 souvisí s kognitivními poruchami na myším modelu34. CDC42 souvisí s neurofibromatózou a mentální retardací35. Přestože neexistují přímé důkazy o jeho roli v kognitivním procesu, GNAI3 se podle anotace dráhy KEGG podílí na negativní regulaci přenosu synapsí, dlouhodobé deprese a vedení axonů. Souhrnně lze říci, že ze sedmi nábojových molekul v námi rekonstruované mapě souvisejících s IQ je nejméně šest (85,71 %) z nich uváděno v literatuře jako potenciálně související s IQ nebo jinými kognitivními procesy. Tato vysoká relevance nejen prokazuje přesnost přístupu rekonstrukce založeného na dráze k identifikaci kritických molekul, ale také poskytuje plně propojenou signální dráhu hodnou dalšího zkoumání.
Ačkoli je naše rekonstruovaná mapa neorientovanou signální dráhou, poskytuje mnoho testovatelných molekul v typické síti malého světa zapojené do kognitivních procesů, kde jejich stupně sledují rozdělení podle mocninného zákona. Naše další topologická analýza krátkých cest (obrázek 1C) a centrality blízkosti (obrázek 1D) ukazuje, že rekonstruovaná mapa je relativně kompaktní. Délka cesty vyjadřuje, kolik kroků je mezi jedním uzlem a ostatními uzly11. Jak ukazuje obrázek 1C, většina uzlů v mapě je snadno dosažitelná z jiného uzlu ve třech až šesti krocích. K odhalení nejkratšího kroku od jednoho uzlu k druhému se používá centralita blízkosti11. Jak ukazuje obrázek 1D, uzly s větším počtem sousedů mají tendenci mít vyšší centralitu blízkosti.
Propojená síť cílů léčiv v jádru dráhy genů souvisejících s IQ
Na základě rekonstruované mapy drah jsme v této mapě dále identifikovali obohacené cíle léčiv. Pomocí obohacených cílů léčiv jako vstupů jsme spojili léčiva a jejich cíle a vytvořili síť lék-cíl. Jak ukazuje obrázek 2A, existuje deset obohacených léčiv, a to dopamin, oxid dusnatý, L-tyrosin, metamfetamin, noradrenalin, glutathion, amfetamin, tetrahydrobiopterin, apomorfin a rekombinantní somatropin. S výjimkou rekombinantního somatropinu byly podle farmakodynamické anotace v databázi DrugBank36 u všech zaznamenány účinky na nervový systém nebo duševní funkce. Zajímavé je, že šest z nich interaguje se dvěma kritickými neurotransmiterovými systémy (dopamin a noradrenalin), které regulují náladu a chování. Patří mezi ně amfetamin, apomorfin, dopamin, L-tyrosin a noradrenalin. Dopamin je neurotransmiter zodpovědný za různé behaviorální a kognitivní aktivity, například ty, které se vyskytují v systémech učení řízených odměnou. Dopamin je také spojován s mnoha neurologickými poruchami, jako je Parkinsonova choroba, psychózy a schizofrenie37. Norepinefrin hraje klíčovou roli v rozhodování a může ovlivňovat pozornost; používá se také jako antidepresivum a antischizofrenikum38,39. L-tyrosin je jedním z prekurzorů při syntéze dopaminu a noradrenalinu a podle anotace DrugBank36 se může používat k léčbě deprese, zlepšení paměti a zvýšení duševní bdělosti. Amfetamin může stimulovat centrální adrenergní receptory k uvolňování noradrenalinu a uvádí se, že vysoké dávky amfetaminu pomáhají uvolňovat dopamin. Metamfetamin, příbuzná látka, je neurotoxický pro dopaminové transportéry a často se používá ke značení dopaminového terminálu laboratorních zvířat. Protože je zapojen do dopaminových systémů, uvádí se, že metamfetamin je spojen se zpomalením motorických funkcí a zhoršením paměti40. Apomorfin je agonista dopaminu a na základě anotace DrugBank se používá k léčbě Parkinsonovy choroby, podle anotace DrugBank36.
Šest léků, které ovlivňují dva kritické neurotransmitery dopamin a noradrenalin, pokrývalo 66,7 % cílových genů (32 genů) v mapě léků a cílů (obrázek 2A). Vzhledem k tomu, že jsme tuto mapu zkonstruovali pomocí obohacených léčiv, je tato mapa léků-cílů většinou soustředěna podle léčiv. Proto jsou konektivity léčiv vyšší než cílové geny léčiv, jak ukazuje obrázek 2B. Pomocí topologické analýzy lze zjistit, že k většině uzlů se lze dostat z jiného uzlu ve dvou až čtyřech krocích (obrázek 2C). Vzhledem k tomu, že většina cílových genů a léčiv souvisí s dopaminovým a noradrenalinovým systémem, je tato síť na základě centrality blízkosti také velmi kompaktní (obrázek 2D). Souhrnně řečeno, naše obohacení a analýza založená na síti ukazují, že dopaminový a noradrenalinový systém jsou rozhodující pro geny související s IQ, což může poskytnout více informací o kognitivním procesu z hlediska IQ.