7 RAG Binding Genomewide
Viste le proprietà di legame diretto al DNA di RAG1, combinate con l’abbondanza unica di RSSs presenti nei geni recettori dell’antigene, era ragionevole assumere che la specificità del sito di ricombinazione V(D)J è semplicemente applicata dal reclutamento preferenziale di RAG1 ai suoi substrati di DNA preferiti. RAG2, a causa del suo PHD e della sua mancanza di attività catalitica intrinseca, non dovrebbe presentare restrizioni funzionali sui suoi modelli di localizzazione. Di conseguenza, RAG2 si lega ampiamente in tutto il genoma dei linfociti, occupando una frazione importante (~ 60%) dei TSS attivi, che sono arricchiti in H3K4me3 (Ji et al., 2010; Teng et al., 2015). Tuttavia, RAG1 localizza anche a migliaia di siti (~ 3500 nei timociti di topo e nelle cellule pre-B) che sono co-occupati da RAG2 e H3K4me3, comprendendo una porzione sostanziale di promotori ed enhancer altamente attivi e specifici per il lineage (Teng et al., 2015). Questa localizzazione diffusa si osserva anche per un mutante catalitico di RAG1 (D708A), indicando che il legame diffuso di RAG1 non riflette l’accumulo postcleavage (Teng et al., 2015). I siti di legame di RAG1 al di fuori dei geni recettori dell’antigene non hanno mostrato una chiara correlazione con la presenza di motivi simili a RSS (cryptic RSSs, o cRSSs), indicando ulteriormente che i contatti sequenza-specifici e l’attività di scissione mediata da RAG non potrebbero spiegare i modelli di legame RAG1 in tutto il genoma. Invece, i marcatori di accessibilità della cromatina sono i migliori predittori del reclutamento di RAG1: H3K4me3, H3K27Ac, elevato contenuto di GC ed elevato contenuto di CpG (Teng et al., 2015).
In effetti, solo una manciata di esempi dimostra il reclutamento specifico di RAG1 ai geni recettori dell’antigene tramite fattori trans che interagiscono sia con RAG1 che con specifici motivi del DNA. In ogni caso, la specificità del locus dell’evento di reclutamento non dipende dall’RSS di per sé, ma da un motivo di legame del fattore di trascrizione che si sovrappone fortuitamente a un RSS. Il locus Tcrb del topo illustra un caso in cui il reclutamento mirato di RAG1 contribuisce alle restrizioni “oltre 12/23” che aiutano a mantenere il corretto ordine di ricombinazione (Dβ-Jβ prima di Vβ-DJβ). I 3′ 23-RSS che fiancheggiano Dβ1 e Dβ2 contengono siti di legame conservati per c-fos, una subunità del fattore di trascrizione AP-1 (Wang et al., 2008). In un modo indipendente dalle sue proprietà di attivazione trascrizionale, c-fos recluta preferenzialmente RAG1 al 3′ Dβ RSSs, favorendo così la ricombinazione Dβ-Jβ (Wang et al., 2008). Nella discendenza B, il locus analogo del recettore dell’antigene è il gene Igh, dove la ricombinazione diretta Vh-Dh è sfavorita rispetto alla ricombinazione Vh-DJh. In questo caso, tuttavia, l’ordine di ricombinazione sembra essere regolato da spostamenti locali di segni epigenetici che seguono la ricombinazione D-Jh, e marcano il prodotto DJ per il legame e la ricombinazione preferenziale di RAG1 rispetto ai segmenti del gene germinale Dh (Subrahmanyam et al., 2012). Inoltre, la ricombinazione diretta Vh-Dh è soppressa da un elemento di sequenza noto come IGCR1 che si trova tra i cluster di geni D e V (Guo et al., 2011). IGCR1 contiene due siti CTCF vitali e si pensa che funzioni come un punto di ancoraggio per i loop di cromatina che sequestrano la porzione DJ del locus Igh dalla porzione V (Guo et al., 2011; Lin, Guo, Su, Zhang, & Alt, 2015; Medvedovic et al., 2013). Il locus Tcrd umano fornisce un altro esempio di deposito di RAG1 locus-specifico, dove il reclutamento RAG1 dipendente da Runx1 a Dδ2 favorisce un evento di riarrangiamento Dδ2-Dδ3 che precede la ricombinazione classica Dδ-Jδ (Cieslak et al., 2014). Questo risulta nell’inclusione specifica per l’uomo di due segmenti del gene D nei riarrangiamenti Tcrd. Infine, è stato suggerito che Pax5 interagisca con RAG e faciliti il reclutamento di RAG ai segmenti del gene Vh (Zhang et al., 2006), anche se non è stato ancora dimostrato che questo meccanismo migliori l’assemblaggio del locus Igh endogeno.
Al di fuori di queste eccezioni, il legame di RAG1 non sembra iniziare principalmente da eventi di reclutamento specifici della sequenza. Anche all’interno dei geni Tcr e Ig, il legame di RAG1 si estende oltre i confini RSS, occupando regioni introniche che sono arricchite in H3K4me3 ma prive di RSS (Teng et al., 2015). Questo non vuol dire che le RSS non svolgano ruoli secondari nella stabilizzazione o nel potenziamento del legame di RAG1 dopo il reclutamento. I geni Tcra e Igk sono i principali reclutatori del legame di RAG1 nei timociti doppio-positivi e nelle cellule pre-B, rispettivamente, e picchi definiti di accumulo di RAG1 sono chiaramente osservati sopra gli RSS nei centri di ricombinazione (Teng et al., 2015). L’eccezionale densità di RSS nei geni recettori dell’antigene è probabilmente una delle caratteristiche più importanti che li discrimina dal resto del genoma.
Il genoma in generale, tuttavia, esibisce un reclutamento di RAG1 indipendente da RSS, che probabilmente avviene attraverso interazioni aspecifiche tra RAG1 e DNA che sono mediate da vari domini nel nucleo di RAG1, tra cui il NBD (Teng et al., 2015; Yin et al., 2009). Inoltre, il reclutamento indiretto di RAG1 alla cromatina può avvenire attraverso la sua interazione con RAG2, anche se quest’ultimo non può spiegare completamente i modelli di legame di RAG1, che sono parzialmente mantenuti in assenza di RAG2, anche se con intensità diminuita (Teng et al., 2015).
La gamma genomica dei siti di legame di RAG1, anche se più ampia del previsto, si espande ulteriormente in assenza di domini non core di RAG1 o RAG2. In assenza della regione C-terminale di RAG2 (che include il PHD), RAG1 si diffonde verso siti con densità inferiori di H3K4me3, piuttosto che dirigersi verso i TSS più attivi (Teng et al., 2015). Una possibilità è che questo risulti da uno smascheramento di ulteriori attività non specifiche di legame al DNA di RAG1, data l’assenza del dominio autoinibitorio che si trova nella regione C-terminale di RAG2 (Lu et al., 2015). Un’altra possibilità è che in assenza del dominio PHD di RAG2, il complesso RAG ha meno propensione a concentrarsi nelle regioni ad alto H3K4me3. Anche rilevante per il più ampio modello di legame di RAG1 potrebbe essere il fatto che la delezione della regione C-terminale di RAG2 porta a un upregulation dei livelli di proteina RAG1 (Teng et al., 2015). Core RAG1 si lega anche molto più promiscuamente di RAG1 a lunghezza intera e, curiosamente, esibisce un’elevata intensità di legame a molti siti di recettori non antigenici ma un’intensità diminuita al locus Tcra, rispetto a RAG1 a lunghezza intera (Teng et al., 2015). Questo potrebbe riflettere cambiamenti nelle proprietà intrinseche di legame al DNA della proteina troncata RAG1, o l’assenza di attività codificate nei termini non centrali di RAG1 (come l’ubiquitarizzazione degli istoni mediata dal RING o l’autoinibizione mediata dal C-terminale). Potrebbe anche essere rilevante il fatto, notato sopra, che il core RAG1 è espresso a livelli sostanzialmente più alti del RAG1 a lunghezza intera.
La ricombinasi RAG tollera la variazione di sequenza non solo nei suoi substrati, in particolare nello spaziatore RSS, ma anche nell’eptamero e nel nonmero (Hesse et al, 1989; Lewis, Agard, Suh, & Czyzyk, 1997; Marculescu, Le, Simon, Jaeger, & Nadel, 2002; Ramsden, Baetz, & Wu, 1994; Zhang & Swanson, 2008). Anche l’interazione RAG1-nonamer mediata dal NBD si basa su relativamente pochi contatti sequenza-specifici (Yin et al., 2009). Gli RSS che popolano i geni del recettore dell’antigene sono diversi nel loro contenuto di sequenza (a volte divergono significativamente dai motivi di consenso dell’eptamero e del nonmero), e il riconoscimento del substrato da parte di RAG deve essere sufficientemente flessibile per consentire la massima diversità del repertorio. Al di fuori dei geni del recettore dell’antigene, i siti di legame RAG1 non mostrano alcuna preferenza cumulativa per una particolare firma di sequenza (Teng et al., 2015).
Il riconoscimento flessibile del substrato da parte di RAG crea un problema per il resto del genoma, tuttavia. I requisiti di sequenza piuttosto minimi per un RSS funzionale (almeno, secondo le regole che comprendiamo attualmente) permettono ai cRSS di verificarsi abbastanza frequentemente nei genomi dei vertebrati (Lewis et al., 1997). La pericolosità dei cRSS fortuiti è resa evidente dalla loro partecipazione ai riarrangiamenti genetici RAG-dipendenti che contribuiscono alla linfomagenesi (Larmonie et al., 2013). Poiché la maggior parte del legame di RAG1 in tutto il genoma è governato dal reclutamento non specifico al DNA o alla cromatina accessibile, sembrerebbe biologicamente prudente limitare la disponibilità di forti cRSS nelle vicinanze dei siti di legame di RAG1 e quindi ridurre al minimo il potenziale di attività off-target di RAG. Infatti, i siti di legame a RAG1 nei linfociti murini e umani sono preferenzialmente impoveriti di cRSS (Teng et al., 2015), e noi proponiamo che ciò sia avvenuto a causa di pressioni selettive imposte da riarrangiamenti genetici che si verificano al di fuori dei geni del recettore dell’antigene. Così, il repertorio dei TSS associati a RAG1 è protetto dall’attività di RAG durante la ricombinazione V(D)J. Noi ipotizziamo che i rari cRSS che mantengono l’attività e continuano a mediare il riarrangiamento ectopico infrequente sono stati mantenuti nel genoma a causa della loro sovrapposizione con sequenze regolatrici o funzionali nei loro loci ospiti, o semplicemente non hanno esercitato conseguenze negative sufficientemente forti da essere selezionati contro.