Geny związane z IQ są wzbogacone w wielu regionach chromosomów 7 i X
Aby zająć się genetyczną złożonością wyniku IQ, opracowaliśmy IQdb (http://IQdb.cbi.pku.edu.cn), publicznie dostępną bazę danych do eksploracji ludzkich genów związanych z IQ7. W IQdb, 158 eksperymentalnie zweryfikowanych genów z literatury służy jako podstawowy zestaw danych, wśród których około 16% genów związanych z IQ jest zlokalizowanych na chromosomie X. Według doniesień, tylko 3,4% wszystkich ludzkich genów należy do chromosomu X12. Ten oczywisty kontrast może wskazywać, że geny związane z IQ są nadreprezentowane na chromosomie X. Aby wyjaśnić bardziej szczegółowo, które regiony genomowe zawierają większą liczbę genów związanych z IQ, przyjęliśmy test hipergeometryczny oparty na zawartości genów w każdym cytobandzie na ludzkim genomie. Dalsza analiza wzbogacania zidentyfikowała 10 regionów genomowych z istotnie większą ilością genów związanych z IQ. Wśród 10 regionów, 4 należą do chromosomu X, w tym Xp, Xq, Xq28 i Xp11. Poprzednie badanie ekspresji genów wykazało, że geny na chromosomie X są bardziej skłonne do ekspresji w regionach mózgu i tkankach reprodukcyjnych13. Nasze wyniki mogą być zgodne z ideą, że geny na chromosomie X mogą być związane z ilościowym wynikiem IQ12. Ponieważ chromosom X jest ważny dla różnicowania płciowego, wzbogacenie genów związanych z IQ na chromosomie X może stanowić zachętę do zbadania różnic w wynikach IQ między płciami14,15.
Poprzednie badania zidentyfikowały 46 regionów genomowych zaangażowanych w IQ przy użyciu podejścia powiązania7. Chociaż żaden z tych regionów nie jest zlokalizowany na chromosomie X, sześć z nich pochodzi z chromosomu 7 u ludzi (13,04%). Spośród dziesięciu regionów genomowych z wzbogaconymi genami związanymi z IQ, sześć nie znajduje się na chromosomie X, w tym 7q, 7q11, 7q31, 8p12, 15q14 i 17p13. Z wyjątkiem 8p1216, żaden z tych regionów genomowych nie pokrywa się z regionami genomowymi we wcześniejszych badaniach powiązań. Trzy z sześciu regionów pochodzą z chromosomu 7, odpowiadając za 8,86% ze 158 genów związanych z IQ (Tabela 1). Jedno z wcześniejszych badań wykazało, że 7q31-36 może być związany z werbalnym IQ na podstawie 361 australijskich i holenderskich bliźniąt17. Nasze wyniki mogą odkryć komplementarne role genów na chromosomie 7 w inteligencji ogólnej.
Podsumowując, nasza analiza zawęża prawdopodobne regiony genomowe do kilku prawdopodobnych kandydatów, zapewniając lepsze zrozumienie genomiki związanej z IQ i wysoce racjonalny sposób interpretacji różnic, takich jak płeć. W szczególności, nasze podejście oparte na wzbogacaniu genów zidentyfikowało wiele regionów genomowych w chromosomie X, które zostały pominięte w poprzednich badaniach powiązań. Różnica ta może być spowodowana wielkością próby populacji w badaniach nad powiązaniami. Innym potencjalnym powodem jest fakt, że większość genów na chromosomie X w IQdb jest gromadzona na podstawie badań funkcjonalnych opartych na pojedynczym genie. Asocjacja genetyczna wyłania się jako narzędzie przesiewowe na dużą skalę. Te niewielkie proporcje regionów genomowych umożliwiły globalne badanie genomu/proteomu na większej populacji.
Wzbogacone geny docelowe w 158 genach związanych z IQ dla czynników transkrypcyjnych i miRNA związanych z zaburzeniami psychicznymi
Podstawowym problemem w systemach biologicznych jest odkrywanie potencjalnych regulatorów dla genów kandydujących, co może pomóc nam zrozumieć całą objętość informacji genetycznej. W porównaniu do wzbogaconych genów związanych z IQ, regulacja nie uczy nas o liniowej relacji z fizycznym chromosomem, ale o dynamicznych mechanizmach leżących u podstaw zmian środowiskowych.
Modyfikujące efekty kilku typów genów regulatorowych są szeroko badane i mogą być przewidywane w oparciu o cechy sekwencji ich potencjalnych genów docelowych. Czynnik transkrypcyjny (TF) może wpływać na ekspresję genów poprzez aktywację lub supresję transkrypcji genów docelowych z różną wydajnością wiązania w regionach promotorowych18. Inna główna grupa regulatorów, mikroRNA (miRNA), może regulować ekspresję mRNA na poziomie posttranskrypcyjnym, takim jak degradacja lub represja translacji, poprzez wiązanie się z genem docelowym za pomocą małych sekwencji komplementarnych19. Aby zidentyfikować potencjalne TF i miRNA jako możliwe regulatory zestawu 158 genów, przeprowadziliśmy analizę wzbogacania zarówno celów TF, jak i miRNA. W sumie zidentyfikowaliśmy siedem TF, które prawdopodobnie mogą regulować zestaw genów związanych z IQ. Są to FOXF2, FOXO4, MAZ, MEF2A, NFIL3, TCF3 i TFAP4. NFIL3 jest podobno związany z chorobami neuronów20. Co najważniejsze, wykazano, że MEF2 negatywnie reguluje indukowaną uczeniem się plastyczność strukturalną i tworzenie pamięci21. W zestawie 158 genów znajduje się 16 genów docelowych dla MEF2, w tym ATXN1, BDNF, BRAF, DBH, DMD, DMPK, DRD3, GNAS, GRIN2B, IL1RAPL1, IL6R, NR3C2, PHOX2B, SNAP25, TMEM67 i TSC1. Na podstawie anotacji szlaków stwierdzono, że sześć z nich (BDNF, BRAF, DRD3, GNAS, GRIN2B i SNAP25) pełniło funkcje w układzie neuronalnym. Ponadto, geny DRD3, GNAS i GRIN2B były związane z synapsą dopaminergiczną. Te cele MEF2 w zestawie genów związanych z IQ mogą tworzyć podstawowy obwód transkrypcyjny wpływający na tworzenie pamięci związanej z IQ, co wymaga dalszej walidacji eksperymentalnej.
W oparciu o podobne podejście stwierdziliśmy, że 16 ludzkich miRNA miało tendencję do regulowania genów związanych z IQ. Były to hsa-let-7i, hsa-mir-15b, hsa-mir-16, hsa-mir-181d, hsa-mir-195, hsa-mir-30a-3p, hsa-mir-30e-3p, hsa-mir-330, hsa-mir-374, hsa-mir-424, hsa-mir-429, hsa-mir-497, hsa-mir-515-5p, hsa-mir-519e, hsa-mir-522 i hsa-mir-96. Cztery z nich, hsa-let-7i, hsa-miR-15b, hsa-miR-195 i hsa-miR-330, były związane z zaburzeniami psychicznymi na podstawie anotacji choroby. Zarówno hsa-miR-15b, jak i hsa-miR-195 należą do rodziny miR-15, która została wyregulowana w górnym zakręcie skroniowym i grzbietowo-bocznej korze przedczołowej u schizofreników22. Te dwa miRNA mogą pośredniczyć w szerokim wyciszaniu genów w komórce. Wśród 158 genów związanych z IQ, celami tych dwóch miRNA są ADRB2, ATXN2, BDNF, GHR, IL1RAPL1, KCNJ2, MAP2K1, PAFAH1B1, RAF1, RELN, RPS6KA3, SIGMAR1, SLC6A4 i STX1A. Porównując ten zestaw z zestawem celów MEF2, tylko BDNF występuje w obu zestawach celów TF i miRNA związanych z zaburzeniami psychicznymi, co może podkreślać jego centralną rolę w szlakach sygnalizacyjnych związanych z ludzką inteligencją i jego potencjalną rolę jako węzła obwodów regulacyjnych w genach związanych z IQ23.
Rekonstrukcja ścieżki rdzeniowej dla genów związanych z IQ przy użyciu znanych ścieżek biologicznych
Jesteśmy teraz w stanie określić kilka regionów genomowych i regulatorów jako możliwe determinanty fenotypu IQ. Przyjęliśmy podejście rekonstrukcji ścieżek, aby opisać bardziej złożone procesy biologiczne zorganizowane w formie kaskady połączonych reakcji biochemicznych lub transdukcji sygnałów. Ogólnie, technologia eksperymentów biologii molekularnej pozwala na identyfikację fizycznych i funkcjonalnych interakcji pomiędzy cząsteczkami w komórce. Na podstawie wiarygodnych dowodów doświadczalnych podsumowuje się wiele sieci i szlaków sygnalizacyjnych. Ogólnie rzecz biorąc, szlaki biologiczne są rozproszone w wielu bazach danych i często są przedstawiane w formie diagramów. Ostatnio, Pathway Commons zintegrowało popularne bazy danych ścieżek i obecnie dostarcza wygodny format oparty na zwykłym tekście do dalszego wydobywania i rekonstrukcji ścieżek24. W celu wykorzystania dostępnych danych, przyjęliśmy algorytm Kleina-Raviego Steinera, aby wyodrębnić podstawowe interakcje ze zintegrowanych danych o ludzkich ścieżkach (patrz Metody). Zrekonstruowany szlak podstawowy zawiera 97 genów i 129 w pełni połączonych połączeń szlaku (Rysunek 1A). Wśród 97 węzłów 62 znajdują się w 158 genach związanych z IQ.
Analiza wzbogacania ścieżek biologicznych jest jednym z najbardziej praktycznych sposobów wydobywania mechanizmów molekularnych leżących u podstaw złożonych procesów komórkowych25. Dalsza analiza wzbogacenia funkcjonalnego wykazała, że 97 genów na naszej zrekonstruowanej mapie było wzbogaconych w 30 szlakach biologicznych (Tabela 2). W odniesieniu do funkcji związanych z neuronami, istnieją trzy zidentyfikowane ścieżki: „Neurotrophin signaling”, „Long-term potentiation” i „GnRH signaling”. Co ciekawe, większość z pozostałych 27 ścieżek jest związana z różnymi zdarzeniami sygnalizacyjnymi, w tym z sygnalizacją w nowotworach, receptorem ErbB, TRAIL, syndekanem proteoglikanu, IFN-gamma, PI3K, MAPK, TSH, receptorem Kit, TCR, IL-3 i receptorem czynnika wzrostu hepatocytów. Oprócz neurohormonu GnRH, który jest produkowany w komórce nerwowej i uwalniany w jej terminalu neuronalnym, mapa wskazała, że wpływ może mieć pięć dodatkowych hormonów. Są to androgeny, endoteliny, gliptyna, leptyna i prolaktyna. Podsumowując, nasza zrekonstruowana mapa ujawniła wiele ścieżek związanych z kilkoma znanymi szlakami sygnalizacyjnymi, sugerując potencjalne mechanizmy komórkowe, które nie zostały przedstawione na temat transdukcji sygnałów, o ile nam wiadomo. Ścieżki związane z hormonami, w tym ścieżka sygnalizacji recepcji androgenów związana z rozwojem męskich drugorzędowych cech płciowych, mogą sugerować interesujące i nowe komponenty związane z różnicami płciowymi, poszerzając naszą obecną wiedzę.
Układ i struktura węzłów w złożonym systemie, takim jak sieć biologiczna, często podlegają określonym regułom, które mogą być ściśle związane z funkcją w tym systemie11. Aby zdekomponować zrekonstruowane mapy, przeprowadzono analizę topologiczną (Rysunek 1B-D). Ogólnie rzecz biorąc, liczba połączeń w każdym węźle jest reprezentowana jako stopień w sieci11. Jak pokazano na Rysunku 1B, stopnie wszystkich molekuł na zrekonstruowanej mapie mają rozkład power law: P(k) ~ k-b, gdzie P(k) jest prawdopodobieństwem, że cząsteczka łączy się z k cząsteczkami, a b ma szacunkową wartość 1,602. W związku z tym większość cząsteczek na naszej mapie jest słabo połączona. Z kolei niewielka część cząsteczek ma większe prawdopodobieństwo połączenia. W sumie jest 11 cząsteczek z co najmniej pięcioma połączeniami. Są to PRKACA (14), CREB1 (9), TP53 (8), SOS1 (8), JAK2 (7), PTPN11 (7), PIK3CA (6), CREBBP (6), CDC42 (6), RAF1 (5) i GNAI3 (5). Spośród nich cztery znajdują się w zestawie 158 genów związanych z IQ, a mianowicie SOS1, PTPN11, CREBBP i RAF1. Pozostałe siedem cząsteczek jest dołączonych poprzez ścieżki połączone z 158 genami.
Węzły węzłowe w sieci często służą jako wspólne połączenia do pośredniczenia w przekazywaniu informacji wzdłuż krótkiej ścieżki. Tak więc, często odgrywają one znaczącą rolę w sieci biologicznej. Na naszej mapie gen PRKACA jest najbardziej połączony, wykazując 14 połączeń. PRKACA (protein kinase, cAMP-dependent, catalytic, alpha) odgrywa fundamentalną rolę w różnych funkcjach komórkowych związanych z 76 ścieżkami KEGG i 59 ścieżkami REACTOME, w tym w cyklu komórkowym, apoptozie, transdukcji sygnałów, połączeniach szczelinowych oraz interakcji z HIV i układem odpornościowym. Ponadto PRKACA bierze udział w wielu procesach neurologicznych, takich jak: długotrwałe potencjały, sygnalizacja GnRH, aktywność nikotyny na neurony dopaminergiczne, uzależnienia (amfetamina, kokaina i morfina), aktywność synaps (synapsy cholinergiczne, dopaminergiczne, glutamatergiczne i serotoninergiczne). Wcześniejsze badania wykazały, że kinazy białkowe zależne od cAMP są zaangażowane w uczenie asocjacyjne u Drosophila (muszki owocowej)26. Ponadto stwierdzono, że kinazy białkowe zależne od cAMP w rejonie hipokampa są związane z późną fazą konsolidacji pamięci w uczeniu się motywowanym awersyjnie u szczurów27. Co więcej, kinazy białkowe zależne od cAMP mogą również współpracować z CaMKII w receptorze H3 w celu regulacji syntezy i uwalniania histaminy28. Oprócz PRKACA, CREB1 (cAMP response element-binding protein 1), drugi najbardziej połączony gen na naszej zrekonstruowanej mapie, może również wiązać się z elementami odpowiedzi na cAMP w DNA. Wykazano, że gen ten ułatwia formowanie się pamięci długotrwałej. Co więcej, CREB1 współdziała z BDNF i NTRK2, tworząc główną ścieżkę w depresji29. Pomimo tak wielu dowodów na rolę kinaz białkowych zależnych od cAMP i białka wiążącego element odpowiedzi cAMP w procesach poznawczych, nie znaleziono związku między kinazami białkowymi zależnymi od cAMP i białkiem wiążącym element odpowiedzi cAMP a IQ. Pokrywają się one z wieloma znanymi kaskadami sygnalizacyjnymi z genami związanymi z IQ, co może stanowić wskazówkę dla złożonego sygnalizacyjnego cross-talk wyśrodkowanego przez PRKACA/CREB1, który jest w IQdb.
W uzupełnieniu do cząsteczek związanych z cAMP, istnieją co najmniej dwa geny związane z rakiem zidentyfikowane przez nasze podejście do rekonstrukcji ścieżek. Jednym z nich jest najbardziej znany supresor nowotworu TP53. W rzeczywistości istnieją dowody na to, że odgrywa on rolę w zaburzeniach psychicznych związanych z IQ, takich jak schizofrenia30. Co więcej, inny onkogen, PIK3CA, jest również uwzględniony w naszej ostatecznej mapie i wiadomo, że wpływa na kilka procesów psychiatrycznych31,32,33. Kolejne trzy najbardziej połączone geny (JAK2, CDC42 i GNAI3) również zostały zgłoszone jako związane z zaburzeniami poznawczymi lub powiązanymi funkcjami neuronów. JAK2 jest związany z upośledzeniem funkcji poznawczych w modelu mysim34. CDC42 jest związany z neurofibromatozą i opóźnieniem umysłowym35. Pomimo tego, że nie ma bezpośrednich dowodów na jego rolę w procesach poznawczych, GNAI3 bierze udział w negatywnej regulacji transmisji synaps, długotrwałej depresji i prowadzenia aksonów zgodnie z anotacją szlaku KEGG. Podsumowując, spośród siedmiu cząsteczek węzłowych na naszej zrekonstruowanej mapie związanych z IQ, co najmniej sześć (85,71%) z nich jest opisywanych w literaturze jako potencjalnie związane z IQ lub innymi procesami poznawczymi. Ta wysoka istotność nie tylko dowodzi dokładności podejścia rekonstrukcji opartego na ścieżkach do identyfikacji krytycznych molekuł, ale także dostarcza w pełni połączonej ścieżki sygnalizacyjnej wartej dalszych badań.
Chociaż nasza zrekonstruowana mapa jest niezorientowaną ścieżką sygnalizacyjną, dostarcza wielu możliwych do przetestowania molekuł w typowej sieci małego świata zaangażowanej w procesy poznawcze, gdzie ich stopnie podążają za rozkładem power-law. Nasza dalsza analiza topologiczna krótkich ścieżek (Rysunek 1C) i centralności bliskości (Rysunek 1D) pokazuje, że zrekonstruowana mapa jest stosunkowo zwarta. Długość ścieżki reprezentuje ile kroków jest pomiędzy jednym węzłem a innymi węzłami11. Jak widać na Rysunku 1C, do większości węzłów na mapie można łatwo dotrzeć z innego węzła w trzech do sześciu krokach. Centralność bliskości jest używana do określenia najkrótszego kroku pomiędzy węzłami11. Jak pokazano na Rysunku 1D, węzły z większą liczbą sąsiadów mają tendencję do wyższej centralności bliskości.
Połączona sieć lek-cel w głównej ścieżce genów związanych z IQ
Na podstawie zrekonstruowanej mapy ścieżek, dalej zidentyfikowaliśmy wzbogacone cele lekowe na tej mapie. Używając wzbogaconych celów farmakologicznych jako danych wejściowych, połączyliśmy leki i ich cele, aby utworzyć sieć drug-target. Jak pokazano na Rysunku 2A, istnieje dziesięć wzbogaconych leków, mianowicie dopamina, tlenek azotu, L-tyrozyna, metamfetamina, noradrenalina, glutation, amfetamina, tetrahydrobiopteryna, apomorfina i rekombinowana somatropina. Z wyjątkiem somatropiny rekombinowanej, wszystkie zostały zgłoszone jako aktywne w układach nerwowych lub funkcjach umysłowych zgodnie z adnotacją farmakodynamiczną w DrugBank36. Co ciekawe, sześć z nich wchodzi w interakcje z dwoma krytycznymi systemami neuroprzekaźników (dopaminą i noradrenaliną), które regulują nastrój i zachowanie. Należą do nich amfetamina, apomorfina, dopamina, L-tyrozyna i noradrenalina. Dopamina jest neuroprzekaźnikiem odpowiedzialnym za różne zachowania i czynności poznawcze, takie jak te, które występują w systemach uczenia się opartych na nagradzaniu. Dopamina jest również związana z wieloma zaburzeniami neurologicznymi, takimi jak choroba Parkinsona, psychozy i schizofrenia37. Noradrenalina odgrywa kluczową rolę w podejmowaniu decyzji i może wpływać na uwagę; jest również stosowana jako lek antydepresyjny i przeciw schizofreniczny38,39. L-tyrozyna jest jednym z prekursorów w syntezie dopaminy i noradrenaliny i może być stosowana w leczeniu depresji, poprawie pamięci i zwiększeniu czujności umysłowej zgodnie z adnotacją DrugBank36. Amfetamina może stymulować ośrodkowe receptory adrenergiczne do uwalniania noradrenaliny, a wysokie dawki amfetaminy mają pomagać w uwalnianiu dopaminy. Metamfetamina, jednostka powiązana, jest neurotoksyczna dla transporterów dopaminy i jest często stosowana do oznaczania terminalnego dopaminy u zwierząt laboratoryjnych. Ponieważ jest ona zaangażowana w układy dopaminergiczne, zgłaszano, że metamfetamina wiąże się ze spowolnieniem funkcji motorycznych i pogorszeniem pamięci40. Apomorfina jest agonistą dopaminy i jest stosowana w leczeniu choroby Parkinsona w oparciu o adnotację DrugBank, zgodnie z adnotacją DrugBank36.
Sześć leków, które wpływają na dwa krytyczne neuroprzekaźniki dopaminy i noradrenaliny, objęło 66,7% genów docelowych (32 geny) na mapie lek-cel (Figura 2A). Ponieważ skonstruowaliśmy tę mapę na podstawie wzbogaconych leków, mapa celu leku jest w większości skoncentrowana na lekach. W związku z tym powiązania leków są wyższe niż genów docelowych leków, jak pokazano na Rysunku 2B. Wykorzystując analizę topologiczną, do większości węzłów można dotrzeć z innego w dwóch do czterech krokach (Rysunek 2C). Ponieważ większość celów i leków związana jest z układem dopaminergicznym i noradrenergicznym, sieć ta jest również bardzo zwarta na podstawie centralności bliskości (Rysunek 2D). Podsumowując, nasza analiza oparta na wzbogacaniu i sieci pokazuje, że układy dopaminy i noradrenaliny są krytyczne dla genów związanych z IQ, co może zapewnić lepszy wgląd w proces poznawczy z punktu widzenia IQ.