Genele legate de IQ sunt îmbogățite în mai multe regiuni ale cromozomilor 7 și X
Pentru a aborda complexitatea genetică a scorului IQ, am dezvoltat IQdb (http://IQdb.cbi.pku.edu.cn), o bază de date disponibilă public pentru explorarea genelor umane asociate IQ7. În IQdb, 158 de gene verificate experimental din literatura de specialitate servesc drept set de date de bază, printre care aproximativ 16% dintre genele legate de IQ sunt localizate pe cromozomul X. S-a raportat că doar 3,4% din toate genele umane aparțin cromozomului X12. Contrastul evident poate indica faptul că genele legate de IQ sunt suprareprezentate pe cromozomul X. Pentru a clarifica mai în detaliu care regiuni genomice conțin un număr mai mare de gene legate de IQ, am adoptat un test hipergeometric bazat pe conținutul de gene al fiecărei citobandă din genomul uman. Analiza suplimentară de îmbogățire a identificat 10 regiuni genomice cu o cantitate semnificativ mai mare de gene legate de IQ. Dintre cele 10 regiuni, 4 aparțin cromozomului X, inclusiv Xp, Xq, Xq28 și Xp11. Un studiu anterior privind expresia genelor a arătat că genele de pe cromozomul X sunt mai susceptibile de a se exprima în regiunile cerebrale și în țesuturile reproductive13. Rezultatele noastre pot fi în concordanță cu ideea că genele de pe cromozomul X pot fi asociate cu scorul IQ cantitativ12. Deoarece cromozomul X este important pentru diferențierea sexuală, îmbogățirea genelor legate de IQ pe cromozomul X poate oferi un stimulent pentru a explora diferențele în ceea ce privește scorurile IQ între sexe14,15.
Studii anterioare au identificat 46 de regiuni genomice implicate în IQ utilizând o abordare de legătură7. Deși niciuna dintre aceste regiuni nu este localizată pe cromozomul X, șase dintre ele sunt din cromozomul 7 la om (13,04%). Dintre cele zece regiuni genomice cu gene legate de IQ îmbogățite, șase nu se află pe cromozomul X, inclusiv 7q, 7q11, 7q31, 8p12, 15q14 și17p13. Cu excepția lui 8p1216, niciuna dintre aceste regiuni genomice nu se suprapune cu regiunile genomice din studiile anterioare de legătură. Trei dintre cele șase regiuni sunt din cromozomul 7, reprezentând 8,86% din cele 158 de gene legate de IQ (tabelul 1). Un studiu anterior a arătat că 7q31-36 poate fi legat de IQ-ul verbal pe baza a 361 de gemeni australieni și olandezi17. Rezultatele noastre pot descoperi roluri complementare ale genelor de pe cromozomul 7 în inteligența generală.
În rezumat, analiza noastră restrânge regiunile genomice probabile la mai mulți candidați probabili, oferind o mai bună înțelegere a unei genomici legate de IQ și o modalitate foarte rațională de interpretare a diferențelor, cum ar fi cele legate de sex. În special, abordarea noastră bazată pe îmbogățirea genelor a identificat mai multe regiuni genomice în cromozomul X, care a fost ratată în studiile anterioare de legătură. Această diferență poate fi cauzată de dimensiunea eșantionului de populație în studiile de linkage. Celălalt motiv potențial este faptul că majoritatea genelor de pe cromozomul X din IQdb sunt colectate pe baza studiilor funcționale bazate pe o singură genă. Asocierea genetică apare ca un instrument de screening pe scară largă. Aceste proporții mici de regiuni genomice au permis examinarea globală a genomului/proteomului pe o populație mai mare.
Gene țintă îmbogățite în 158 de gene legate de IQ pentru factorii de transcripție și miARN-urile legate de tulburările mintale
O problemă fundamentală în sistemele biologice este descoperirea potențialilor regulatori pentru genele candidate, ceea ce ne poate ajuta să înțelegem întregul volum de informații genetice. În comparație cu genele îmbogățite legate de IQ, reglementarea nu ne învață despre relația liniară cu cromozomul fizic, ci despre mecanismele dinamice ale schimbărilor de mediu subiacente.
Efectele modificatoare ale mai multor tipuri de gene de reglementare sunt studiate pe scară largă și pot fi prezise pe baza caracteristicilor de secvență ale genelor lor țintă potențiale. Factorii de transcripție (TF) pot influența expresia genelor prin activarea sau suprimarea transcripției genelor țintă cu eficiență diferită de legare în regiunile promotoare18. Celălalt grup major de regulatori, microARN (miARN), poate regla expresia ARNm la nivel post-transcripțional, cum ar fi degradarea sau reprimarea translațională prin legarea genei țintă cu mici secvențe complementare19. Pentru a identifica potențiale TF-uri și miARN-uri în amonte ca posibili regulatori ai setului de 158 de gene, am efectuat o analiză de îmbogățire atât a țintelor TF, cât și a miARN-urilor. În total, am identificat șapte TF susceptibile de a regla setul de gene legate de IQ. Acestea sunt FOXF2, FOXO4, MAZ, MEF2A, NFIL3, TCF3 și TFAP4. Se pare că NFIL3 este legată de bolile neuronale20. Cel mai remarcabil este faptul că s-a demonstrat că MEF2 reglează negativ plasticitatea structurală indusă de învățare și formarea memoriei21. Există 16 gene țintă pentru MEF2 în 158 seturi de gene, inclusiv ATXN1, BDNF, BRAF, DBH, DMD, DMPK, DRD3, GNAS, GRIN2B, IL1RAPL1, IL6R, NR3C2, PHOX2B, SNAP25, TMEM67 și TSC1. Pe baza adnotării căilor, am constatat că șase dintre ele (BDNF, BRAF, DRD3, GNAS, GRIN2B și SNAP25) aveau funcții în sistemul neuronal. În plus, genele DRD3, GNAS și GRIN2B erau legate de sinapsa dopaminergică. Aceste ținte MEF2 din setul de gene legate de IQ pot forma circuitul transcripțional de bază care influențează formarea memoriei legate de IQ, ceea ce necesită o validare experimentală suplimentară.
Pe baza unei abordări similare, am constatat că 16 miARN-uri umane au avut tendința de a regla genele legate de IQ. Acestea au fost hsa-let-7i, hsa-mir-15b, hsa-mir-16, hsa-mir-181d, hsa-mir-195, hsa-mir-30a-3p, hsa-mir-30e-3p, hsa-mir-330, hsa-mir-374, hsa-mir-424, hsa-mir-429, hsa-mir-497, hsa-mir-515-5p, hsa-mir-519e, hsa-mir-522 și hsa-mir-96. Patru dintre acestea, hsa-let-7i, hsa-miR-15b, hsa-miR-195 și hsa-miR-330, au fost legate de tulburări mentale pe baza adnotării bolilor. Atât hsa-miR-15b, cât și hsa-miR-195 aparțin familiei miR-15, care a fost suprareglementată în girusul temporal superior și în cortexul prefrontal dorsolateral la schizofrenici22. Aceste două miARN-uri pot media o tăcere genică largă în celulă. Printre cele 158 de gene legate de IQ, țintele acestor doi miARN-uri sunt ADRB2, ATXN2, BDNF, GHR, IL1RAPL1, KCNJ2, MAP2K1, PAFAH1B1, RAF1, RELN, RPS6KA3, SIGMAR1, SLC6A4 și STX1A. Comparând acest set cu cel al țintelor MEF2, doar BDNF apare în ambele seturi de ținte ale TF-urilor și miARN-urilor legate de tulburările mintale, ceea ce ar putea evidenția rolul său central în căile de semnalizare legate de inteligența umană și rolul său potențial ca centru al circuitelor de reglementare în genele legate de IQ23.
Reconstrucția căii de bază pentru genele legate de IQ folosind căi biologice cunoscute
Suntem acum capabili să specificăm mai multe regiuni genomice și regulatori ca fiind posibili determinanți ai fenotipului IQ. Am adoptat o abordare de reconstrucție a căilor pentru a descrie procese biologice mai complexe dispuse sub forma unei cascade de reacții biochimice conectate sau transducții de semnalizare. În general, tehnologia experimentală de biologie moleculară ne permite să identificăm interacțiunile fizice și funcționale dintre moleculele din celulă. O mulțime de rețele și căi de semnalizare sunt rezumate pe baza unor dovezi experimentale fiabile. În general, căile biologice sunt dispersate în multe baze de date și sunt adesea reprezentate sub formă de diagrame. Recent, Pathway Commons a integrat bazele de date populare privind căile de acces și oferă acum un format convenabil, bazat pe text simplu, pentru extragerea și reconstrucția ulterioară a căilor de acces24. Pentru a utiliza datele disponibile, am adoptat algoritmul Klein-Ravi Steiner pentru a extrage interacțiunile de bază din datele integrate privind căile umane (a se vedea Metode). Calea de bază reconstruită conține în total 97 de gene și 129 de conexiuni de cale complet conectate (Figura 1A). Dintre cele 97 de noduri, 62 se află în cele 158 de gene legate de IQ.
Analiza de îmbogățire a căilor biologice este una dintre cele mai practice modalități de extragere a mecanismelor moleculare care stau la baza proceselor celulare complexe25. O analiză suplimentară de îmbogățire funcțională a arătat că 97 de gene din harta noastră reconstruită au fost îmbogățite în 30 de căi biologice (tabelul 2). În ceea ce privește funcția legată de neuron, există trei căi identificate: „Semnalizarea neurotrofinei”, „Potențializarea pe termen lung” și „Semnalizarea GnRH”. În mod interesant, majoritatea celor 27 de căi rămase sunt legate de diverse evenimente de semnalizare, inclusiv semnalizarea în cancer, receptorul ErbB, TRAIL, proteoglicanul syndecan, IFN-gamma, PI3K, MAPK, TSH, receptorul Kit, TCR, TCR, IL-3 și receptorul factorului de creștere a hepatocitului. În afară de neurohormonul GnRH, care este produs într-o celulă neuronală și eliberat la terminalul său neuronal, harta a indicat că cinci hormoni suplimentari pot avea un efect. Aceștia sunt androgenii, endotelinele, glicicanul, leptina și prolactina. Pe scurt, harta noastră reconstruită a dezvăluit mai multe căi legate de mai multe căi de semnalizare cunoscute, sugerând potențiale mecanisme celulare care nu au fost prezentate pe tema transducției semnalizării, din câte știm noi. Căile legate de hormoni, inclusiv o cale de semnalizare a recepției de androgeni legată de dezvoltarea caracteristicilor sexuale secundare masculine, ar putea sugera componente interesante și noi legate de diferența de sex, extinzând cunoștințele noastre actuale.
Dispoziția și structura nodurilor într-un sistem complex, cum ar fi o rețea biologică, urmează adesea reguli specifice care pot fi strâns legate de funcția din acest sistem11. Pentru a descompune hărțile reconstruite, s-a efectuat o analiză topologică (Figura 1B-D). În general, numărul de conexiuni la fiecare nod este reprezentat ca grad într-o rețea11. După cum se arată în figura 1B, gradele tuturor moleculelor din harta reconstruită urmează o distribuție de tip lege de putere: P(k) ~ k-b, unde P(k) este probabilitatea ca o moleculă să se conecteze cu k molecule, iar b are o valoare estimată de 1,602. Prin urmare, majoritatea moleculelor din harta noastră sunt slab conectate. În schimb, o fracțiune mică de molecule au o probabilitate mai mare de a fi conectate. În total, există 11 molecule cu cel puțin cinci conexiuni. Acestea sunt PRKACA (14), CREB1 (9), TP53 (8), SOS1 (8), JAK2 (7), PTPN11 (7), PIK3CA (6), CREBBP (6), CDC42 (6), RAF1 (5) și GNAI3 (5). Dintre acestea, patru se regăsesc în 158 set de gene legate de IQ, și anume SOS1, PTPN11, CREBBP și RAF1. Cele șapte molecule rămase sunt anexate prin intermediul căilor conectate la cele 158 de gene.
Nodurile centrale dintr-o rețea servesc adesea drept conexiuni comune pentru a media transducția informației de-a lungul unei căi scurte. Astfel, ei joacă adesea un rol proeminent în rețeaua biologică. În harta noastră, gena PRKACA este cea mai conectată, prezentând 14 conexiuni. PRKACA (protein kinaza, cAMP-dependentă, catalitică, alfa) joacă un rol fundamental în diverse funcții celulare legate de 76 de căi KEGG și 59 de căi REACTOME, inclusiv ciclul celular, apoptoza, transducția semnalizării, joncțiunea gap și interacțiunea cu HIV și sistemul imunitar. În plus, PRKACA implică multe procese neurologice, cum ar fi potențarea pe termen lung, semnalizarea GnRH, activitatea nicotinei asupra neuronilor dopaminergici, dependența (amfetamină, cocaină și morfină), activitățile sinapsei (sinapsa colinergică, dopaminergică, glutamatergică și serotoninergică). Studii anterioare demonstrează că proteinele kinaze dependente de AMPc sunt implicate în învățarea asociativă la Drosophila (musca de fructe)26. În plus, s-a raportat că proteinele kinaze dependente de cAMP/cAMP din regiunea hipocampală sunt legate de o fază târzie de consolidare a memoriei în învățarea motivată de aversiune la șobolani27. Mai mult, proteinele kinaze dependente de cAMP pot coopera, de asemenea, cu CaMKII în receptorul H3 pentru a regla sinteza și eliberarea de histamină28. În plus față de PRKACA, CREB1 (cAMP response element-binding protein 1), a doua cea mai conectată genă din harta noastră reconstruită, se poate lega, de asemenea, de elementele de răspuns cAMP din ADN. S-a raportat că această genă facilitează formarea memoriei pe termen lung. Mai mult, CREB1 interacționează cu BDNF și NTRK2 pentru a forma o cale centrală în depresie29. În ciuda acestui volum de dovezi privind rolul protein kinazelor dependente de cAMP și al proteinei de legare a elementelor de răspuns cAMP în procesele legate de cogniție, nu a existat nicio asociere între protein kinazele dependente de cAMP sau proteina de legare a elementelor de răspuns cAMP și IQ. Acestea se suprapun cu multe cascade de semnalizare cunoscute cu genele legate de IQ, ceea ce ar putea oferi un indiciu pentru o interacțiune încrucișată de semnalizare complexă centrată de PRKACA/CREB1, care se află în IQdb.
În plus față de moleculele legate de cAMP, există cel puțin două gene legate de cancer identificate prin abordarea noastră de reconstrucție a căilor. Una dintre ele este cel mai cunoscut supresor tumoral TP53. De fapt, există dovezi că este joacă un rol în tulburările mentale legate de IQ, cum ar fi schizofrenia30. În plus, cealaltă oncogenă, PIK3CA, este, de asemenea, inclusă în harta noastră finală și se știe că influențează mai multe procese psihiatrice31,32,33. Următoarele trei gene cele mai conectate (JAK2, CDC42 și GNAI3) au fost, de asemenea, raportate ca fiind legate de tulburări cognitive sau de funcții neuronale conexe. JAK2 este legată de afectarea cognitivă în modelul de șoarece34. CDC42 este asociată cu neurofibromatoza și întârzierea mintală35. În ciuda faptului că nu există dovezi directe ale rolului său în procesul cognitiv, GNAI3 participă la reglarea negativă a transmiterii sinapsei, a depresiei pe termen lung și a ghidării axonilor, conform adnotării căilor KEGG. Pe scurt, din cele șapte molecule hub din harta noastră reconstruită legate de IQ, cel puțin șase (85,71%) dintre ele sunt raportate în literatura de specialitate ca fiind potențial asociate cu IQ sau cu alte procese cognitive. Această relevanță ridicată nu numai că demonstrează acuratețea abordării de reconstrucție bazată pe căi pentru a identifica moleculele critice, dar oferă, de asemenea, o cale de semnalizare complet conectată, demnă de investigații suplimentare.
Chiar dacă harta noastră reconstruită este o cale de semnalizare neorientată, ea oferă multe molecule testabile într-o rețea tipică de lume mică implicată în procesele cognitive, în care gradele lor urmează o distribuție de tip lege de putere. Analiza noastră topologică ulterioară privind calea scurtă (Figura 1C) și centralitatea de apropiere (Figura 1D) arată că harta reconstruită este relativ compactă. Lungimea căii reprezintă câți pași se află între un nod și alte noduri11. După cum se arată în figura 1C, majoritatea nodurilor din hartă sunt ușor accesibile de la un alt nod în trei până la șase pași. Centralitatea proximității este utilizată pentru a dezvălui cel mai scurt pas de la un nod la altul11. După cum se arată în figura 1D, nodurile cu mai mulți vecini tind să aibă o centralitate de apropiere mai mare.
O rețea conectată de ținte medicamentoase în calea centrală a genelor legate de IQ
Pe baza hărții reconstruite a căilor, am identificat în continuare ținte medicamentoase îmbogățite în această hartă. Utilizând țintele de medicamente îmbogățite ca intrări, am combinat medicamentele și țintele lor pentru a forma o rețea de medicamente-țintă. După cum se arată în figura 2A, există zece medicamente îmbogățite, și anume dopamina, oxidul nitric, L-tirozina, metamfetamina, norepinefrina, glutationul, amfetamina, tetrahidrobiopterina, apomorfina și somatropina recombinantă. Cu excepția somatropinei recombinante, toate au fost raportate ca fiind active în sistemele nervoase sau în funcțiile mentale, conform adnotării farmacodinamice din DrugBank36. Este interesant faptul că șase dintre ele interacționează cu două sisteme de neurotransmițători critici (dopamină și noradrenalină) care reglează starea de spirit și comportamentul. Printre acestea se numără amfetamina, apomorfina, dopamina, L-tirozina și norepinefrina. Dopamina este un neurotransmițător responsabil pentru diverse activități comportamentale și cognitive, cum ar fi cele ale căror se regăsesc în sistemele de învățare bazate pe recompensă. De asemenea, dopamina este legată de multe tulburări neurologice, cum ar fi boala Parkinson, psihoza și schizofrenia37. Norepinefrina joacă un rol esențial în luarea deciziilor și poate afecta atenția; este, de asemenea, utilizată ca antidepresiv și antischizofrenic38,39. L-tirozina este unul dintre precursorii în sinteza dopaminei și a noradrenalinei și poate fi utilizată pentru a trata depresia, pentru a îmbunătăți memoria și pentru a spori vigilența mentală, conform adnotării DrugBank36. Amfetamina poate stimula receptorii adrenergici centrali pentru a elibera norepinefrină, iar o doză mare de amfetamină se pare că ajută la eliberarea dopaminei. Metamfetamina, o entitate înrudită, este neurotoxică pentru transportatorii de dopamină și este adesea utilizată pentru a marca animalele de laborator terminale de dopamină. Deoarece este implicată în sistemele de dopamină, s-a raportat că metamfetamina este asociată cu o funcție motorie mai lentă și cu deteriorarea memoriei40. Apomorfina este un agonist al dopaminei și este utilizată pentru a trata boala Parkinson pe baza adnotării DrugBank, conform adnotării DrugBank36.
Cele șase medicamente care afectează cei doi neurotransmițători critici, dopamina și noradrenalina, au acoperit 66,7% din genele țintă (32 de gene) în harta medicamente-țintă (Figura 2A). Deoarece am construit această hartă prin intermediul medicamentelor îmbogățite, această hartă medicament-țintă este în mare parte centrată de medicamente. Prin urmare, conectivitățile medicamentelor sunt mai mari decât genele țintă ale medicamentelor, după cum se arată în figura 2B. Utilizând analiza topologică, majoritatea nodurilor pot fi atinse de la altul în doi până la patru pași (Figura 2C). Deoarece majoritatea țintelor și a medicamentelor sunt legate de sistemul dopaminei și al norepinefrinei, această rețea este, de asemenea, foarte compactă pe baza centralităților de apropiere (Figura 2D). În concluzie, analiza noastră de îmbogățire și analiza bazată pe rețea arată că sistemele dopamină și noradrenalină sunt esențiale pentru genele legate de IQ, ceea ce poate oferi mai multe informații despre procesul cognitiv din punct de vedere al IQ.
.