I geni legati al QI sono arricchiti in più regioni dei cromosomi 7 e X
Per affrontare la complessità genetica del punteggio QI, abbiamo sviluppato IQdb (http://IQdb.cbi.pku.edu.cn), un database disponibile al pubblico per esplorare i geni umani associati al QI7. In IQdb, 158 geni verificati sperimentalmente dalla letteratura servono come il set di dati di base, tra cui circa il 16% dei geni correlati al QI si trovano sul cromosoma X. È riportato che solo 3,4% di tutti i geni umani appartengono al cromosoma X12. Il contrasto evidente può indicare che i geni legati al QI sono sovrarappresentati sul cromosoma X. Per chiarire in modo più dettagliato quali regioni genomiche contengono un maggior numero di geni legati al QI, abbiamo adottato un test ipergeometrico basato sul contenuto genico di ogni citobanda sul genoma umano. L’ulteriore analisi di arricchimento ha identificato 10 regioni genomiche con una quantità significativamente maggiore di geni legati al QI. Tra le 10 regioni, 4 appartengono al cromosoma X, tra cui Xp, Xq, Xq28 e Xp11. Un precedente studio di espressione genica ha mostrato che i geni sul cromosoma X sono più propensi ad esprimere nelle regioni del cervello e tessuti riproduttivi13. I nostri risultati possono essere coerenti con l’idea che i geni sul cromosoma X possono essere associati con il punteggio del QI quantitativo12. Poiché il cromosoma X è importante per la differenziazione sessuale, l’arricchimento dei geni legati al QI sul cromosoma X può fornire un incentivo per esplorare le differenze nei punteggi QI tra i sessi14,15.
Studi precedenti hanno identificato 46 regioni genomiche coinvolte nel QI utilizzando un approccio di linkage7. Anche se nessuna di queste regioni si trova sul cromosoma X, sei di loro sono dal cromosoma 7 negli esseri umani (13.04%). Tra le dieci regioni genomiche con arricchito IQ geni correlati, sei non sono sul cromosoma X, tra cui 7q, 7q11, 7q31, 8p12, 15q14, e17p13. Tranne 8p1216, nessuna di queste regioni genomiche si sovrappone alle regioni genomiche negli studi di linkage precedenti. Tre delle sei regioni provengono dal cromosoma 7 e rappresentano l’8,86% dei 158 geni legati al QI (Tabella 1). Uno studio precedente ha dimostrato che 7q31-36 può essere collegato al QI verbale basato su 361 gemelli australiani e olandesi 17. I nostri risultati possono scoprire ruoli complementari dei geni sul cromosoma 7 in intelligenza generale.
In sintesi, la nostra analisi restringe le probabili regioni genomiche a diversi probabili candidati, fornendo una migliore comprensione di una genomica legata al QI e un modo altamente razionale per interpretare le differenze come il genere. In particolare, il nostro approccio basato sull’arricchimento genico ha identificato più regioni genomiche nel cromosoma X, che è stato mancato nei precedenti studi di collegamento. Questa differenza può essere causata dalla dimensione del campione della popolazione negli studi di linkage. L’altra ragione potenziale è che la maggior parte dei geni sul cromosoma X in IQdb sono raccolti sulla base di studi funzionali basati su un singolo gene. L’associazione genetica sta emergendo come uno strumento di screening su larga scala. Queste piccole proporzioni di regioni genomiche hanno permesso l’esame globale del genoma/proteoma su una popolazione più grande.
I geni bersaglio arricchiti in 158 geni legati al QI per fattori di trascrizione e miRNA legati ai disturbi mentali
Un problema fondamentale nei sistemi biologici è scoprire potenziali regolatori per i geni candidati, che possono aiutarci a capire l’intero volume di informazioni genetiche. Rispetto ai geni arricchiti legati al QI, la regolazione non ci insegna la relazione lineare con il cromosoma fisico, ma i meccanismi dinamici del cambiamento ambientale sottostante.
Gli effetti modificanti di diversi tipi di geni regolatori sono ampiamente studiati e possono essere predetti sulla base delle caratteristiche di sequenza dei loro potenziali geni bersaglio. Il fattore di trascrizione (TF) può influenzare l’espressione genica attraverso l’attivazione o la soppressione della trascrizione dei geni bersaglio con diversa efficienza di legame nelle regioni promotrici18. L’altro grande gruppo di regolatori, MicroRNA (miRNA), può regolare l’espressione di mRNA a livello post-trascrizionale, come la degradazione o repressione traslazionale legando il gene bersaglio con piccole sequenze complementari19. Per identificare potenziali TFs a monte e miRNAs come possibili regolatori del set di 158 geni, abbiamo eseguito l’analisi di arricchimento su entrambi gli obiettivi TF e miRNA. In totale, abbiamo identificato sette TF che probabilmente regolano il set di geni legati al QI. Essi sono FOXF2, FOXO4, MAZ, MEF2A, NFIL3, TCF3 e TFAP4. NFIL3 è riferito legato alla malattia dei neuroni20. È stato dimostrato che MEF2 regola negativamente la plasticità strutturale indotta dall’apprendimento e la formazione della memoria21. Ci sono 16 geni bersaglio per MEF2 in 158 gene set, tra cui ATXN1, BDNF, BRAF, DBH, DMD, DMPK, DRD3, GNAS, GRIN2B, IL1RAPL1, IL6R, NR3C2, PHOX2B, SNAP25, TMEM67 e TSC1. Sulla base dell’annotazione del percorso, abbiamo trovato che sei di loro (BDNF, BRAF, DRD3, GNAS, GRIN2B e SNAP25) avevano funzioni nel sistema neuronale. Inoltre, i geni DRD3, GNAS e GRIN2B erano legati alla sinapsi dopaminergica. Questi obiettivi MEF2 nel set di geni legati al QI possono formare il circuito trascrizionale centrale che influenza la formazione della memoria legata al QI, che richiede un’ulteriore convalida sperimentale.
Basato su un approccio simile, abbiamo trovato che 16 miRNA umani tendevano a regolare i geni legati al QI. Erano hsa-let-7i, hsa-mir-15b, hsa-mir-16, hsa-mir-181d, hsa-mir-195, hsa-mir-30a-3p, hsa-mir-30e-3p, hsa-mir-330, hsa-mir-374, hsa-mir-424, hsa-mir-429, hsa-mir-497, hsa-mir-515-5p, hsa-mir-519e, hsa-mir-522 e hsa-mir-96. Quattro di loro, hsa-let-7i, hsa-miR-15b, hsa-miR-195 e hsa-miR-330, sono stati collegati a disturbi mentali in base all’annotazione della malattia. Sia hsa-miR-15b che hsa-miR-195 appartengono alla famiglia miR-15, che è stata up-regolata nel giro temporale superiore e nella corteccia prefrontale dorsolaterale negli schizofrenici22. Questi due miRNA possono mediare un ampio silenzio genico nella cellula. Tra i 158 geni legati al QI, i bersagli di questi due miRNA sono ADRB2, ATXN2, BDNF, GHR, IL1RAPL1, KCNJ2, MAP2K1, PAFAH1B1, RAF1, RELN, RPS6KA3, SIGMAR1, SLC6A4 e STX1A. Confrontando questo set con quello degli obiettivi MEF2, solo BDNF si verifica in entrambi gli insiemi di obiettivi di TFs mentale-disordine-correlati e miRNAs, che potrebbe evidenziare il suo ruolo centrale nelle vie di segnalazione relative all’intelligenza umana e il suo ruolo potenziale come il fulcro dei circuiti di regolazione nei geni legati al QI23.
Ricostruzione del percorso centrale per i geni legati al QI utilizzando percorsi biologici noti
Siamo ora in grado di specificare diverse regioni genomiche e regolatori come possibili determinanti del fenotipo QI. Abbiamo adottato un approccio di ricostruzione del percorso per descrivere processi biologici più complessi organizzati sotto forma di una cascata di reazioni biochimiche collegate o trasduzioni di segnalazione. In generale, la tecnologia sperimentale biologica molecolare ci permette di identificare le interazioni fisiche e funzionali tra le molecole nella cellula. Un sacco di reti e percorsi di segnalazione sono riassunti sulla base di prove sperimentali affidabili. In generale, i percorsi biologici sono sparsi in molti database e sono spesso rappresentati come diagrammi. Recentemente, Pathway Commons ha integrato i database dei percorsi popolari e ora fornisce un comodo formato basato sul testo semplice per l’ulteriore estrazione e ricostruzione dei percorsi24. Al fine di utilizzare i dati disponibili, abbiamo adottato l’algoritmo Klein-Ravi Steiner per estrarre le interazioni di base dai dati integrati percorso umano (vedi metodi). Il percorso ricostruito nucleo contiene 97 geni e 129 connessioni percorso completamente collegato in totale (Figura 1A). Tra i 97 nodi, 62 sono nei 158 geni legati al QI.
L’analisi di arricchimento dei percorsi biologici è uno dei modi più pratici per estrarre meccanismi molecolari sottostanti nei processi cellulari complessi25. Ulteriori analisi di arricchimento funzionale ha mostrato che 97 geni nella nostra mappa ricostruita sono stati arricchiti in 30 percorsi biologici (tabella 2). In termini di funzione legata ai neuroni, ci sono tre percorsi identificati: “Segnalazione delle neurotrofine”, “Potenziamento a lungo termine” e “Segnalazione GnRH”. È interessante notare che la maggior parte dei rimanenti 27 percorsi sono legati a vari eventi di segnalazione, tra cui la segnalazione nel cancro, recettore ErbB, TRAIL, syndecan proteoglicano, IFN-gamma, PI3K, MAPK, TSH, recettore Kit, TCR, IL-3 e recettore del fattore di crescita degli epatociti. Oltre al neuroormone GnRH, che è prodotto in una cellula neurale e rilasciato al suo terminale neurale, la mappa ha indicato che cinque ormoni aggiuntivi possono avere un effetto. Questi sono androgeni, endoteline, glicano, leptina e prolattina. In sintesi, la nostra mappa ricostruita ha rivelato percorsi multipli relativi a diverse vie di segnalazione note, suggerendo potenziali meccanismi cellulari che non sono stati presentati sul tema della trasduzione della segnalazione, per quanto ne sappiamo. Percorsi relativi agli ormoni, tra cui un percorso di segnalazione di ricezione degli androgeni relativi allo sviluppo delle caratteristiche sessuali secondarie maschili, potrebbe suggerire interessanti e nuovi componenti relativi alla differenza di sesso, estendendo la nostra conoscenza attuale.
La disposizione e la struttura dei nodi in un sistema complesso, come una rete biologica, spesso seguono regole specifiche che possono essere strettamente legate alla funzione in questo sistema11. Per decomporre le mappe ricostruite, l’analisi topologica è stata condotta (Figura 1B-D). In generale, il numero di connessioni ad ogni nodo è rappresentato come il grado in una rete11. Come mostrato nella Figura 1B, i gradi di tutte le molecole nella mappa ricostruita seguono una distribuzione legge di potenza: P(k) ~ k-b, dove P(k) è la probabilità che una molecola si collega con k molecole e b ha un valore stimato di 1,602. Quindi la maggior parte delle molecole nella nostra mappa sono scarsamente connesse. Al contrario, una piccola frazione di molecole ha più probabilità di essere collegata. In totale, ci sono 11 molecole con almeno cinque connessioni. Sono PRKACA (14), CREB1 (9), TP53 (8), SOS1 (8), JAK2 (7), PTPN11 (7), PIK3CA (6), CREBBP (6), CDC42 (6), RAF1 (5) e GNAI3 (5). Tra questi, quattro sono nel set di 158 geni legati al QI, cioè SOS1, PTPN11, CREBBP e RAF1. Le restanti sette molecole sono aggiunte attraverso percorsi collegati ai 158 geni.
I nodi hub in una rete spesso servono come connessioni comuni per mediare la trasduzione delle informazioni lungo un percorso breve. Così, spesso giocano un ruolo prominente nella rete biologica. Nella nostra mappa, il gene PRKACA è il più connesso, mostrando 14 connessioni. PRKACA (proteina chinasi, cAMP-dipendente, catalitica, alfa) svolge un ruolo fondamentale in varie funzioni cellulari relative a 76 KEGG e 59 percorsi REACTOME tra cui il ciclo cellulare, l’apoptosi, la trasduzione di segnalazione, la giunzione gap e l’interazione con l’HIV e il sistema immunitario. Inoltre, PRKACA coinvolge molti processi neurologici come il potenziamento a lungo termine, la segnalazione GnRH, l’attività della nicotina sui neuroni dopaminergici, la dipendenza (anfetamina, cocaina e morfina), le attività di sinapsi (colinergica, dopaminergica, glutamatergica e serotoninergica). Studi precedenti dimostrano che le protein chinasi cAMP-dipendenti sono coinvolte nell’apprendimento associativo della Drosophila (mosca della frutta)26. Inoltre, le protein chinasi cAMP/cAMP-dipendenti nella regione dell’ippocampo sono correlate a una fase tardiva di consolidamento della memoria nell’apprendimento aversivamente motivato nei ratti27. Inoltre, le protein chinasi cAMP-dipendenti possono anche cooperare con CaMKII nel recettore H3 per regolare la sintesi e il rilascio di istamina28. Oltre a PRKACA, CREB1 (cAMP response element-binding protein 1), il secondo gene più collegato nella nostra mappa ricostruita, può anche legarsi a elementi di risposta cAMP nel DNA. Questo gene è stato segnalato per facilitare la formazione della memoria a lungo termine. Inoltre, CREB1 interagisce con BDNF e NTRK2 per formare un percorso centrale nella depressione29. Nonostante questo volume di prove per il ruolo delle protein chinasi cAMP-dipendenti e della proteina legante l’elemento di risposta cAMP nel processo cognitivo, non c’è stata alcuna associazione tra le protein chinasi cAMP-dipendenti o la proteina legante l’elemento di risposta cAMP con il QI. Queste sovrapposizioni con molte cascate di segnalazione note con i geni legati al QI, che potrebbero fornire un indizio per il complesso cross-talk di segnalazione centrato da PRKACA/CREB1, che è in IQdb.
Oltre alle molecole legate al cAMP, ci sono almeno due geni legati al cancro identificati dal nostro approccio di ricostruzione del percorso. Uno è il più noto soppressore tumorale TP53. Infatti, ci sono prove che è giocare un ruolo nei disturbi mentali legati al QI come la schizofrenia30. Inoltre, l’altro oncogene, PIK3CA, è anche incluso nella nostra mappa finale ed è noto per influenzare diversi processi psichiatrici31,32,33. I prossimi tre geni più collegati (JAK2, CDC42 e GNAI3) sono stati anche segnalati per essere collegati a disturbi cognitivi o funzioni neuronali correlate. JAK2 è legato al deterioramento cognitivo nel modello murino34. CDC42 è associato alla neurofibromatosi e al ritardo mentale35. Nonostante il fatto che non ci sono prove dirette per il suo ruolo nel processo cognitivo, GNAI3 partecipa alla regolazione negativa della trasmissione delle sinapsi, depressione a lungo termine e guida dell’assone secondo l’annotazione del percorso KEGG. In sintesi, delle sette molecole hub nella nostra mappa ricostruita relative al QI, almeno sei (85,71%) di loro sono riportati in letteratura per essere potenzialmente associati con il QI o altri processi cognitivi. Questa alta rilevanza non solo dimostra l’accuratezza dell’approccio di ricostruzione basato sul percorso per identificare le molecole critiche, ma fornisce anche un percorso di segnalazione completamente collegato degno di ulteriori indagini.
Anche se la nostra mappa ricostruita è un percorso di segnalazione non orientato, fornisce molte molecole testabili in una tipica rete small-world coinvolta nei processi cognitivi, dove i loro gradi seguono una distribuzione power-law. La nostra ulteriore analisi topologica sul percorso breve (Figura 1C) e sulla centralità della vicinanza (Figura 1D) mostra che la mappa ricostruita è relativamente compatta. La lunghezza del percorso rappresenta quanti passi ci sono tra un nodo e gli altri nodi11. Come mostrato nella Figura 1C, la maggior parte dei nodi nella mappa sono facilmente raggiungibili da un altro nodo in tre o sei passi. La centralità della vicinanza è usata per rivelare il passo più breve da un nodo all’altro11. Come mostrato nella Figura 1D, i nodi con più vicini tendono ad avere più alta centralità di vicinanza.
Una rete collegata farmaco-target nel percorso centrale dei geni legati al QI
Basato sulla mappa percorso ricostruito, abbiamo ulteriormente identificato bersagli di droga arricchito in questa mappa. Utilizzando gli obiettivi di droga arricchiti come input, abbiamo combinato i farmaci e i loro obiettivi per formare una rete farmaco-target. Come mostrato nella Figura 2A, ci sono dieci farmaci arricchiti, vale a dire dopamina, ossido nitrico, L-tirosina, metamfetamina, norepinefrina, glutatione, anfetamina, tetraidrobiopterina, apomorfina e somatropina ricombinante. Tranne la somatropina ricombinante, tutti sono stati segnalati come attivi nel sistema nervoso o nelle funzioni mentali secondo l’annotazione farmacodinamica in DrugBank36. È interessante notare che sei di loro interagiscono con due neurotrasmettitori critici (dopamina e norepinefrina) sistemi che regolano l’umore e il comportamento. Questi includono anfetamina, apomorfina, dopamina, L-tirosina e norepinefrina. La dopamina è un neurotrasmettitore responsabile di vari comportamenti e attività cognitive, come quelli che si trovano nei sistemi di apprendimento basati sulla ricompensa. La dopamina è anche legata a molti disturbi neurologici come il morbo di Parkinson, la psicosi e la schizofrenia37. La norepinefrina gioca un ruolo critico nel processo decisionale e può influenzare l’attenzione; è anche usata come antidepressivo e anti-schizofrenico38,39. La L-tirosina è uno dei precursori nella sintesi della dopamina e della norepinefrina e può essere usata per trattare la depressione, migliorare la memoria e aumentare la vigilanza mentale secondo l’annotazione DrugBank36. L’anfetamina può stimolare i recettori adrenergici centrali a rilasciare norepinefrina e un alto dosaggio di anfetamina è riportato per aiutare il rilascio di dopamina. La metanfetamina, un’entità correlata, è neurotossica per i trasportatori di dopamina ed è spesso usata per marcare gli animali da laboratorio terminali di dopamina. Dal momento che è coinvolto nei sistemi di dopamina, la metamfetamina è stato segnalato per essere associato con funzione motoria più lenta e deterioramento della memoria40. Apomorfina è un agonisti della dopamina ed è usato per trattare il morbo di Parkinson basato su annotazione DrugBank, secondo annotazione DrugBank36.
I sei farmaci che influenzano i due neurotrasmettitori critici dopamina e norepinefrina coperto 66.7% dei geni bersaglio (32 geni) nella mappa farmaco-target (Figura 2A). Poiché abbiamo costruito questa mappa attraverso i farmaci arricchiti, questa mappa farmaco-target è per lo più centrata da farmaci. Pertanto, le connettività dei farmaci sono più alti di geni bersaglio di droga come mostrato nella Figura 2B. Utilizzando l’analisi topologica, la maggior parte dei nodi può essere raggiunto da un altro in due a quattro passi (Figura 2C). Poiché la maggior parte degli obiettivi e dei farmaci sono legati al sistema di dopamina e noradrenalina, questa rete è anche molto compatto basato su centralità vicinanza (Figura 2D). In sintesi, il nostro arricchimento e l’analisi basata sulla rete mostra che i sistemi di dopamina e noradrenalina sono critici per i geni legati al QI, che possono fornire una maggiore comprensione del processo cognitivo da un aspetto QI.