7 RAG Binding Genomewide
Datorită proprietăților directe de legare la ADN ale RAG1, combinate cu abundența unică de RSS prezente în genele receptorilor de antigen, a fost rezonabil să presupunem că specificitatea situsului de recombinare V(D)J este pur și simplu pusă în aplicare prin recrutarea preferențială a RAG1 la substraturile sale preferate de ADN. RAG2, datorită PHD-ului său și a lipsei de activitate catalitică intrinsecă, nu ar trebui să prezinte restricții funcționale asupra tiparelor sale de localizare. În consecință, RAG2 se leagă pe scară largă în genomul limfocitelor, ocupând o fracțiune majoră (~ 60%) din TSS-urile active, care sunt îmbogățite în H3K4me3 (Ji et al., 2010; Teng et al., 2015). Cu toate acestea, RAG1 se localizează, de asemenea, în mii de situsuri (~ 3500 în timocitele de șoarece și în celulele pre-B) care sunt co-ocupate de RAG2 și H3K4me3, cuprinzând o parte substanțială a promotorilor și intensificatorilor foarte activi, specifici pentru fiecare linie (Teng et al., 2015). Această localizare larg răspândită este, de asemenea, observată pentru un mutant catalitic al RAG1 (D708A), ceea ce indică faptul că legarea larg răspândită a RAG1 nu reflectă acumularea postcleavage (Teng et al., 2015). Locurile de legare a RAG1 în afara genelor receptorilor de antigen nu au prezentat o corelație clară cu prezența motivelor de tip RSS (RSS criptice sau cRSS), indicând în continuare faptul că contactele specifice secvenței și activitatea de clivaj mediată de RAG nu ar putea explica modelele de legare a RAG1 în întregul genom. În schimb, markerii de accesibilitate a cromatinei sunt cei mai buni predictori ai recrutării RAG1: H3K4me3, H3K27Ac, conținutul ridicat de GC și conținutul ridicat de CpG (Teng et al., 2015).
De fapt, doar o mână de exemple demonstrează recrutarea specifică a RAG1 la genele receptorilor de antigen prin intermediul factorilor trans care interacționează atât cu RAG1, cât și cu motive specifice de ADN. În fiecare caz, specificitatea de locus a evenimentului de recrutare nu depinde de RSS în sine, ci de un motiv de legare a factorului de transcripție care se suprapune în mod fortuit cu un RSS. Locusul Tcrb de șoarece ilustrează un caz în care recrutarea selectivă a RAG1 contribuie la restricțiile „dincolo de 12/23” care ajută la menținerea ordinii corecte de recombinare (Dβ-Jβ înainte de Vβ-DJβ). Cele 3′ 23-RSS care flanchează Dβ1 și Dβ2 conțin situsuri de legare conservate pentru c-fos, o subunitate a factorului de transcripție AP-1 (Wang et al., 2008). Într-o manieră independentă de proprietățile sale de activare transcripțională, c-fos recrutează preferențial RAG1 la 3′ Dβ RSSs, favorizând astfel recombinarea Dβ-Jβ (Wang et al., 2008). În linia B, locația analogă a receptorului de antigen este gena Igh, unde recombinarea directă Vh-Dh este defavorizată în raport cu recombinarea Vh-DJh. Cu toate acestea, în acest caz, ordinea de recombinare pare să fie reglementată de modificări locale ale marcajelor epigenetice care urmează recombinării D-Jh și marchează produsul DJ pentru legarea și recombinarea preferențială a RAG1 în raport cu segmentele genei Dh din linia germinală (Subrahmanyam et al., 2012). În plus, recombinarea directă Vh-Dh este suprimată de un element de secvență cunoscut sub numele de IGCR1 care se află între grupurile de gene D și V (Guo et al., 2011). IGCR1 conține două situsuri CTCF vitale și se crede că funcționează ca un punct de ancorare pentru buclele de cromatină care sechestrează porțiunea DJ a locusului Igh de porțiunea V (Guo et al., 2011; Lin, Guo, Su, Zhang, & Alt, 2015; Medvedovic et al., 2013). Locusul uman Tcrd oferă un alt exemplu de depunere RAG1 specifică locusului, în care recrutarea RAG1 dependentă de Runx1 la Dδ2 favorizează un eveniment de rearanjare Dδ2-Dδ3 care precede recombinarea clasică Dδ-Jδ (Cieslak et al., 2014). Acest lucru are ca rezultat includerea specifică omului a două segmente ale genei D în rearanjamentele Tcrd. În cele din urmă, s-a sugerat că Pax5 interacționează cu RAG și facilitează recrutarea RAG la segmentele genei Vh (Zhang et al., 2006), deși nu s-a demonstrat încă că acest mecanism îmbunătățește asamblarea locusului Igh endogen.
În afară de aceste excepții, legarea RAG1 nu pare să se inițieze în principal din evenimente de recrutare specifice secvenței. Chiar și în cadrul genelor Tcr și Ig, legarea RAG1 se extinde dincolo de limitele RSS, ocupând regiuni intronice care sunt îmbogățite în H3K4me3, dar lipsite de RSS-uri (Teng et al., 2015). Acest lucru nu înseamnă că RSS-urile nu joacă roluri secundare în stabilizarea sau consolidarea legăturii RAG1 după recrutare. Genele Tcra și Igk sunt principalii recrutori ai legării RAG1 în timocitele dublu pozitive și, respectiv, în celulele pre-B, iar vârfurile definite de acumulare a RAG1 sunt observate în mod clar peste RSS-uri în centrele de recombinare (Teng et al., 2015). Densitatea excepțională a RSS în genele receptorilor de antigen este probabil una dintre cele mai importante caracteristici care le discriminează de restul genomului.
Genomul în general, cu toate acestea, prezintă o recrutare a RAG1 independentă de RSS, care are loc probabil prin interacțiuni nespecifice între RAG1 și ADN care sunt mediate de diverse domenii din nucleul RAG1, inclusiv NBD (Teng et al., 2015; Yin et al., 2009). În plus, recrutarea indirectă a RAG1 la cromatină poate avea loc prin interacțiunea sa cu RAG2, deși aceasta din urmă nu poate explica pe deplin modelele de legare a RAG1, care sunt parțial menținute în absența RAG2, deși cu o intensitate redusă (Teng et al., 2015).
Locul genomic al situsurilor de legare a RAG1, deși mai larg decât se preconiza, se extinde și mai mult în absența domeniilor noncore ale RAG1 sau RAG2. În absența regiunii C-terminale a RAG2 (care include PHD), RAG1 difuzează spre situri cu densități mai mici de H3K4me3, mai degrabă decât să se orienteze spre cele mai active TSS-uri (Teng et al., 2015). O posibilitate este ca acest lucru să rezulte dintr-o demascare a activităților suplimentare nespecifice de legare la ADN ale RAG1, având în vedere absența domeniului autoinhibitor care se află în regiunea C-terminală a RAG2 (Lu et al., 2015). O altă posibilitate este aceea că, în absența domeniului PHD al RAG2, complexul RAG are mai puțină propensiune de a se stabili în regiunile cu un nivel ridicat de H3K4me3. De asemenea, relevant pentru modelul mai larg de legare a RAG1 ar putea fi faptul că deleția regiunii C-terminale a RAG2 duce la creșterea nivelului de proteine RAG1 (Teng et al., 2015). Core RAG1 se leagă, de asemenea, mult mai promiscuu decât RAG1 complet și, în mod intrigant, prezintă o intensitate crescută de legare la multe situsuri de recepție non-antigenă, dar o intensitate scăzută la nivelul locusului Tcra, în raport cu RAG1 complet (Teng et al., 2015). Acest lucru ar putea reflecta modificări ale proprietăților intrinseci de legare la ADN ale proteinei RAG1 trunchiate sau absența activităților codificate în terminațiile non-core ale RAG1 (cum ar fi ubiquitylarea histonică mediată de RING sau autoinhibiția mediată de terminația C). Relevant ar putea fi, de asemenea, faptul, menționat mai sus, că RAG1 nucleu este exprimată la niveluri substanțial mai mari decât RAG1 de lungime completă.
Recombinaza RAG tolerează variația de secvență nu numai în substraturile sale, în special în spațierul RSS, ci și în heptamer și nonamer (Hesse et al, 1989; Lewis, Agard, Agard, Suh, & Czyzyk, 1997; Marculescu, Le, Simon, Jaeger, & Nadel, 2002; Ramsden, Baetz, & Wu, 1994; Zhang & Swanson, 2008). Chiar și interacțiunea RAG1-nonamer mediată de NBD se bazează pe relativ puține contacte specifice secvenței (Yin et al., 2009). RSS-urile care populează genele receptorilor de antigen sunt diverse în ceea ce privește conținutul secvenței lor (uneori divergente în mod semnificativ de la motivele consensuale heptamer și nonamer), iar recunoașterea substratului de către RAG trebuie să fie suficient de flexibilă pentru a permite o diversitate maximă a repertoriului. În afara genelor receptorilor de antigen, situsurile de legare a RAG1 nu prezintă nicio preferință cumulativă pentru o anumită semnătură de secvență (Teng et al., 2015).
Recunoașterea flexibilă a substratului de către RAG creează totuși o problemă pentru restul genomului. Cerințele de secvență destul de minime pentru un RSS funcțional (cel puțin, după regulile pe care le înțelegem în prezent) permit ca cRSS-urile să apară destul de frecvent în genomurile vertebratelor (Lewis et al., 1997). Pericolul pe care îl reprezintă cRSS-urile fortuite este pus în evidență de participarea lor la rearanjamentele genetice dependente de RAG care contribuie la limfomageneză (Larmonie et al., 2013). Deoarece majoritatea legării RAG1 în întregul genom este guvernată de recrutarea nespecifică la ADN sau la cromatina accesibilă, ar părea prudent din punct de vedere biologic să se limiteze disponibilitatea unor cRSS puternice în vecinătatea situsurilor de legare a RAG1 și, astfel, să se reducă la minimum potențialul de activitate RAG în afara țintei. Într-adevăr, situsurile de legare a RAG1 în limfocitele umane și de șoarece sunt în mod preferențial epuizate de cRSS (Teng et al., 2015), iar noi propunem că acest lucru s-a produs din cauza presiunilor selective impuse de rearanjamentele genetice care au loc în afara genelor receptorilor de antigen. Astfel, repertoriul de TSS-uri asociate cu RAG1 este protejat de activitatea RAG în timpul recombinării V(D)J. Noi speculăm că rarele cRSS care își păstrează activitatea și continuă să medieze rearanjamente ectopice rare au fost menținute în genom datorită suprapunerii lor cu secvențe reglatoare sau funcționale în locii lor gazdă, sau pur și simplu nu au exercitat consecințe negative suficient de puternice pentru a fi selectate împotriva lor.
.