Componente del núcleo de PRC1: RING1
Las proteínas RING finger de PRC1 están compuestas por los dos clados (archivo adicional 2), RING1 y BMI1, ambos caracterizados por una combinación conservada de dominios RING y Ring-finger And WD40 associated Ubiquitin-Like (RAWUL) (Figs. 2 y 3). La actividad ubiquitina ligasa de los escritores del complejo PRC1 depende de su dominio RING . En los animales, RING1b es un escritor clave de H2Aub, mientras que RING1a juega un papel menor. BMI1 no presenta actividad E3 ligasa pero puede estabilizar y potenciar las funciones de RING1b . En Arabidopsis, tanto las familias AtRING1a/b como AtBMI1a/b/c pueden catalizar H2Aub. En la etapa vegetativa, AtRING1a/1b puede reprimir la transición vegetativa a embrionaria y la formación de meristemos ectópicos principalmente a través de la supresión de la mala expresión de los reguladores maestros del embrión y de los reguladores de las células madre, respectivamente. En la etapa reproductiva, el doble mutante de Arabidopsis ring1a;ring1b presenta un número excesivamente alto de órganos florales, y fuertes fenotipos que muestran un gineceo dramáticamente hinchado y completamente estéril . Tanto AtRING1a como AtRING1b pueden controlar el mantenimiento de las células madre florales y el correcto desarrollo del carpelo reprimiendo la expresión de KNOX-I . La mutación de RING1a/b puede causar la transición temprana de la fase vegetativa regulando el estado de H2Aub en el locus SPL .
En un árbol filogenético, las proteínas RING1 de las plantas pueden dividirse en tres ramas: plantas de semilla (Grupo-I), musgos y helechos (Grupo-II) y algas (Grupo-III, Fig. 2). La relación filogenética de los homólogos de RING1 es coherente con la evolución de las plantas. RING1 ha sufrido una y dos duplicaciones en los ancestros eudicotes y monocotes, respectivamente. La mayoría de las proteínas RING1 presentan dos copias en cada especie, pero PtRING1 y ZmRING1 se presentan en cuatro copias, y BrRING1 presente en tres copias. Sin embargo, el evento de duplicación puede ocurrir después de la separación de las monocotiledóneas y las dicotiledóneas. Las proteínas RING1 en las eudicotas muestran organizaciones de dominio similares (Fig. 2). Las proteínas RING1 de las monocotiledóneas están representadas únicamente por las poáceas, mostrando pocas organizaciones de dominios variables. El típico dominio RING, POU, que es un dominio bipartito de unión al ADN, y el motivo de intercambio Ras también se encuentran en ZmRING1a, la proteína VirD5 de Agrobacterium, y los dominios de repetición de Spectrin se muestran en BdRING1b. El dominio Prion aparece en OsRING1b. Curiosamente, el dominio POU se identificó por primera vez en las plantas. El grupo II existe en el helecho y en Physcomitrella patens, mientras que el grupo III está presente en dos algas. Sin embargo, ambos grupos están bien conservados en la organización de los dominios.
Componente central de PRC1: BMI1
Las tres proteínas similares a BMI1, AtBMI1a, AtBMI1b y AtBMI1c existen en Arabidopsis . La deficiencia de BMI1 (mutante doble atbmi1a;atbmi1b) provoca una estructura similar a la de los embriones en la fase vegetativa y un elevado número de órganos florales en la fase reproductiva, una característica que se encuentra de forma similar en el mutante doble ring1a;ring1b . Al igual que las proteínas RING1, BMI1a/1b funciona como escritores de PRC1 para H2Aub, coordinándose con la H3K27me3 mediada por PRC2 para mantener la identidad celular . AtBMI1a/1b funciona como una ubiquitina ligasa E3, y está implicada en la respuesta a la sequía . MIR156A y MIR156C son también genes diana de AtBMI1, regulando la transición del desarrollo vegetal al productivo. En particular, AtBMI1c actúa como un gen impreso que expresa el alelo materno en el endospermo pero bialélicamente en el estambre. Las proteínas BMI1 pueden identificarse en todas las plantas y en el alga Volvox carteri, pero no en las algas Ostreococcus lucimarinus o Chlamydomonas reinhardtii; además, las BMI1 se dividen en dos grupos, a saber, los homólogos BMI1a/1b y BMI1c (Fig. 3). Todos los BMI1s contienen dominios RING y RAWUL altamente conservados, excepto BsBMI1a, PtBMI1d, y OrBMI1b, OrBMI1b carece de dominio RAWUL. La longitud de la secuencia de BMI1s suele estar entre 350 y 550 aa, pero FvBMI1c comprende 974 residuos aa con un C-terminal demasiado largo. Las dicotiledóneas contienen tres copias de BMI1, excepto el álamo y el algodón, que tienen cinco copias, y el naranjo, que tiene dos copias. Todas las proteínas BMI1a/1b muestran organizaciones de dominio similares, pero ThBMI1b alberga otro motivo de unión a TIM-fosfato adyacente al dominio RING; además, BdBMI1d posee un motivo de bisagra flexible de las proteínas de Mantenimiento Estructural de Cromosomas (SMC), que es responsable de la dimerización del ADN y como determinante esencial de las interacciones dinámicas SMC-ADN . El dominio RAWUL se identificó por primera vez en las proteínas RING finger de PRC1 y en las familias RING1 y BMI1, y está conservado en plantas y gusanos. El dominio RAWUL puede estar involucrado en la regulación epigenética mediante la unión a PRC1 u otros factores. En los mamíferos, se ha demostrado que RAWUL se une a los homólogos de Ph, aunque este fenómeno no se ha confirmado hasta la fecha. Así pues, el dominio RAWUL puede unirse a otras proteínas implicadas en la ubiquitinación de las histonas. Sánchez-Pulido et al. sugirieron que algunas otras proteínas demuestran funciones de ubiquitinación de histonas PRC1 . La HTA10 de Arabidopsis muestra la secuencia consenso conservada PKKT . La ubiquitinación de H2A en maíz puede estar implicada en la ubiquitinación de H2A . La proteína RAWUL del grano Gnp4/LAX2 regula la longitud del grano a través de la vía de señalización de la auxina interfiriendo con OsIAA3-OsARF25 . El dominio RAWUL puede formar un módulo de interacción proteína-proteína con el dominio PAL del N-terminal de AL6, que es un factor asociado de PRC1 .
El dominio RAWUL no está muy conservado entre animales y plantas. Sin embargo, un análisis de alineación de secuencias de los homólogos RING1a/1b muestra que los dominios están considerablemente conservados desde las plantas inferiores a las superiores, y BMI1a/1b/1c carece de β5. Las proteínas RING (BrRING1b, ZmRING1b y SmRING) y las proteínas BMI1 (AtBMI1c, BsBMI1a, OrBMI1b y VcBMI) no contienen dominios RAWUL (Figs. 2 y 3, archivo adicional 3). Es posible que los dominios RING y RAWUL sean dominios especiales para las familias RING1 y BMI1.
PRC1 Componente central: LHP1
En Arabidopsis, LHP1, un activador y un represor de la transcripción, se identifica por primera vez como un homólogo de la proteína 1 asociada a la heterocromatina de Drodophila (HP1) que se une a los marcadores H3K27m3 establecidos por PRC2 y cataliza la monoubiquitinación en la lisina 119 de la histona H2A . LHP1 puede tener un papel análogo al de la mosca Pc en un complejo similar a PRC1 . LHP1 contiene dos dominios típicos, el dominio modificador de la organización de la cromatina (CHROMO), que es esencial para la especificidad de la unión de H3K27me3 , y el dominio Chromo Shadow (ChSh) . A diferencia de su homólogo animal, LHP1 se localiza predominantemente en la eucromatina . La localización y retención de Fern LHP1 están controladas por dominios distintos, y su retención en el nucléolo y en los cromocentros está conferida por el dominio ChSh . P. patens PpLHP1 interactúa con PpCMT a través de sus dominios cromosómicos . Como lector de PRC1 en las plantas , LHP1 controla múltiples vías de desarrollo relacionadas con el desarrollo de los órganos, el tamaño de las células y las transiciones de la fase vegetativa a la reproductiva .
LHP1 homólogos también se someten a la evolución de las plantas. Aparte de los dominios distinguidos CHROMO y ChSh, algunos LHPs contienen otros motivos distintos (Fig. 4). Por ejemplo, los LHP1 del álamo tienen un dominio CDC37 adicional en su N-terminal, y los AtLHP1 comprenden un dominio B5 adicional que se encuentra en las subunidades β de la fenilalanina-ARNt. OsLHP1 consta de otro dominio de Factores de Liberación de Cadenas Peptídicas vinculado a la familia de proteínas; además, este dominio desempeña un papel importante en las cadenas polipeptídicas recién sintetizadas que se liberan del peptidil-ARNt . BdLHP1 contiene otra proteína SH3 de la membrana del RE, que se asocia con chaperonas localizadas en la membrana. PpLHP1 comprende un dominio adicional de ostepontina.
Factor asociado a PRC1: EMF1
EMF1 y VRN1 se encuentran específicamente en especies de dicotiledóneas . Tanto EMF1 como VRN1 son proteínas de unión al ADN no específicas de la secuencia que regulan la expresión génica durante el desarrollo de los órganos florales. Aubert et al. consideraron que EMF1 es una nueva proteína que interviene en el control de la arquitectura de los brotes y la floración en Arabidopsis; además, los mutantes de pérdida de función de EMF1 provocan una transición acelerada del desarrollo embrionario al reproductivo . EMF1 y EMF2 participan en el silenciamiento mediado por PcG de los genes homeóticos de la flor y son cruciales para el desarrollo vegetativo. EMF1, ATX1 y ULT1 pueden trabajar juntos para mantener la integridad de la cromatina y evitar la expresión precoz de los genes de las semillas después de la germinación . EMF1 se asocia con un lector de H3K27me3 que se requiere para H3K27me3 . EMF1, LHP1 y la histona H3 lisina-4 desmetilasa pueden formar un complejo EMF1c para desempeñar papeles importantes en la regulación de MIR172 y del locus de floración T (FT) .
Cada especie alberga un único gen homólogo de EMF1, excepto el pepino, el algodón y Eutrema con dos, y la col con cuatro. El análisis filogenético muestra que los EMF1 están bien conservados en las dicotiledóneas, pero pueden carecer de dominios representativos o intactos en la base de datos Pfam y SMART. La alineación de la secuencia de proteínas sugiere que seis motivos conservados, especialmente los motivos 4, 5 y 6 (Fig. 5, archivo adicional 4), y cuyas funciones se desconocen.
Factor asociado a PRC1: VRN1
VRN1 y VAL1/2/3 son componentes específicos de planta de PRC1, y son subclados de la familia de factores de transcripción de dominio B3 específicos de planta (Archivo adicional 5). Al igual que EMF1, los genes VRN de Arabidopsis pueden mediar en la vernalización y desempeñan un papel importante en la transición de la fase vegetativa a la reproductiva en respuesta a un tratamiento prolongado de frío. VRN1 se localiza en el núcleo y es inespecífico en cuanto a la secuencia de unión al ADN, la focalización en FLC y FT2 . Los mutantes con pérdida de función muestran fenotipos similares a los de otros mutantes de PRC1.
VRN1 y sus homólogos se subagrupan en dos clados, AtVRN1a/RTV1 y AtVRN1b/1c/1d. El dominio B3 es posiblemente un dominio especial de la familia VRN1 (71, Fig. 6). AtVRN1, que se denomina AtVRN1a en este estudio, se caracteriza por tener dos dominios B3, se encuentra sólo en especies de plantas superiores y se une específicamente al ADN . En el presente estudio, se identifican cinco homólogos de VRN1 en Arabidopsis, y también se encuentran múltiples homólogos en otras dicotiledóneas mediante BlastP. La organización del dominio mostró que AtVRN1a y sus homólogos constan de dos dominios B3 (Fig. 6). AtRTV1, AtVRN1b/1c/1d y sus homólogos principalmente en el grupo-II muestran una pérdida en el segundo dominio B3, que puede ser importante para sus funciones . Este dominio es reemplazado por la superfamilia BfiI_C_EcoRII_N_B3, que contiene un dominio de unión al ADN N-terminal de proteínas tipo IIE restringidas endonucleasa EcoRII, un dominio de unión al ADN C-terminal de proteínas tipo IIS restringidas endonucleasa BfiI, y proteínas B3 específicas de plantas .
Factor asociado a PRC1: VAL1/2/3
Las proteínas VAL, que se identifican como un represor transcripcional, son necesarias para la represión global de la expresión de genes embrionarios . Las plántulas del doble mutante va l1 val2 pueden formar proliferaciones de tipo embrionario en las raíces y en el meristemo apical, pero no en las hojas. Los mutantes val2/val3 presentan efectos dominantes similares a los de las plantas mutantes homocigotas val1 . En los mutantes val1, el 39% de los transcritos del regulador FUSCA3 están deprimidos, mientras que los factores de transcripción del núcleo de la red LAFL no lo están. Todos los supuestos transcritos objetivo de VAL1 actúan a través de la represión epigenética y/o transcripcional. Además, VAL1 y VAL2 participan en la vernalización a través de PcG. Las proteínas VAL trabajan junto con BMI1 para mediar la monoubiquitylation de H2AK119, e iniciar la represión de los genes de maduración de las semillas . Las proteínas VAL median la represión a través del reclutamiento de un complejo de histonas desacetilasas a los genes LEC1/AFL . VAL1 reprime la transcripción de FLC promoviendo la desacetilación de histonas. VAL1 regula a la baja AGL15 mediante la deposición de H3K27me3 en las secuencias upstream de AGL15 .
A excepción de los dominios B3 y zf-CW, que son posibles dominios especiales para la familia VAL1/2/3, la mayoría de los homólogos de VAL1/2/3 llevan motivos adicionales de dedos de Zinc, como PHD y ZnF-GATA, en el 3′-terminal (Fig. 7). El dominio VAL1-B3 es necesario para interactuar con el elemento canónico Sph/RY dentro de AGL15 y FLC . El dominio zf-CW es un miembro de los módulos lectores de modificaciones de histonas para la regulación epigenética . En el presente estudio, la familia VRN1 sólo se encuentra en dicotiledóneas (Fig. 6) y sus homólogos contienen uno o dos dominios B3. Por el contrario, las proteínas VAL1/2/3 se encuentran desde las algas hasta las angiospermas, y sólo tienen un dominio B3. Además, las proteínas VAL1/2/3 pueden agruparse en tres grupos (Fig. 7). Los homólogos VAL1 del grupo I sólo se encuentran en dicotiledóneas; los homólogos VAL2 del grupo II y los homólogos VAL3 del grupo III se encuentran tanto en dicotiledóneas como en monocotiledóneas. Como indican nuestros resultados, las algas y los helechos muestran sólo una proteína homóloga a VAL, mientras que el musgo muestra cinco miembros y O. lucimarinus no exhibe ninguno.
Factor asociado a PRC1: Las proteínas AL1-7
AL, que llevan un dominio PHD conservado, fueron identificadas como un factor de transcripción . Las proteínas Alfin de Arabidopsis se consideran lectores de H3K4me2/3 y funcionan como nuevos socios de AtRING1 y AtBMI1 . La proteína AL está implicada en muchos procesos de desarrollo, como el aumento de la expresión de MsPRP2 en las raíces de alfalfa y contribuye a la tolerancia a la sal . En Arabidopsis, tanto AL1 como AL5 pueden unirse a las regiones promotoras de genes objetivo y suprimir múltiples factores negativos para conferir tolerancia al estrés abiótico . La AL6 de Arabidopsis está implicada en la regulación de la expresión de los transcritos relacionados con la elongación del pelo de la raíz en caso de falta de fosfato; además, este proceso se debe a su dominio PHD que puede unirse a H3K4me3, que es una estrategia de regulación epigenética para la baja disponibilidad de fosfato . Sin embargo, AtAL7 juega un papel negativo en la tolerancia a la sal . En el presente estudio, las familias AL e ING comparten el dominio PHD, y el árbol filogenético muestra que pertenecen a diferentes ramas, lo que sugiere su estrecha relación (archivo adicional 6). La familia ALs es la mayor familia de factores asociados a PRC1. Arabidopsis comprende siete ALs que pueden dividirse en tres grupos, AtAL1/2, AtAL3/4/5 y AtAL6/7 . En el presente estudio, las proteínas AL de las plantas de semilla pueden dividirse en tres grupos, a saber, Grupo-I (AL1/2), Grupo-II (AL3/4/5) y Grupo-III (AL6/7). Las proteínas AL de las plantas de esporas se sitúan en la parte inferior del árbol filogenético (Fig. 7). El maíz y el algodón comprenden más miembros de la proteína AL que otras especies.
Aparte de FvAL5, que comprende 687aa con tres dominios Alfin y un dominio PHD, la mayoría de las plantas son extremadamente conservadas en las organizaciones de dominio, es decir un dominio Alfin y PHD, y exhiben una longitud de secuencia de aproximadamente 230-300aa. (Fig. 7, archivo adicional 1). Un dominio Alfin y PHD, el dominio especial para la familia AL, están distribuidos en el extremo N- o C- de las proteínas. El motivo PAL, situado en el dominio Alfin, de las proteínas AL2 y AL7 puede unirse a RING1 y BMI1 . Las proteínas PHD-finger se encuentran universalmente en los eucariotas y actúan como actores clave en la regulación de la transcripción y la estructura de la cromatina . El dedo PHD es necesario para la unión de H3K4me3/2 en las familias AL e ING .
Factor asociado a PRC1: ING1/2
Las proteínas AL existen sólo en plantas mientras que las proteínas ING están ampliamente distribuidas en levaduras, animales y plantas. ING se identificó por primera vez en mamíferos, y las cinco proteínas ING pueden unirse a H3K4me3/2 a través de dedos PHD y actuar como componentes de las modificaciones de las histonas . Sin embargo, estas proteínas rara vez se han estudiado en plantas. De forma similar a las proteínas AL, las proteínas AtING conservadas pueden reconocer H3K4me3/2 a través de dedos PHD, mientras que las funciones biológicas de AtING son desconocidas .
La mayoría de las plantas contienen dos genes ING (Fig. 8). Las proteínas ING llevan un dominio ING N-terminal que se une a las colas H3 no modificadas, y un dominio PHD C-terminal que es necesario para la unión de H3K4me2/3 . En contraste con trabajos anteriores, hemos identificado homólogos de VcING1/2, OlING1 y CrING1/2 en algas verdes. Los dedos PHD en VcING2 y CrING2 son sustituidos por los dominios Tudor, que también están implicados en las interacciones proteína-proteína. El dominio Tudor puede unirse a las argininas simétricamente dimetiladas de las secuencias ricas en arginina-glicina y a la histona H4 dimetilada en Lys20 .
Factor asociado a PRC1: EBS/SHL
Las EBS y SHL son proteínas que contienen dominios BAH , que sólo se encuentran en el reino vegetal y están ampliamente distribuidas desde las plantas inferiores a las superiores (Fig. 1, ). Las proteínas EBS de Arabidopsis son reguladores transcripcionales negativos, y las mutaciones en ebs dan lugar a fenotipos de floración temprana . EBS y SHL se unen a diferentes integradores florales, EBS regula FT y SHL reprime SOC1 . EBS y SHL actúan de forma redundante en la regulación de la latencia de las semillas . EBS/SHL son lectores de H3K27me3 que también pueden unirse a H3K4me3.
Proteínas EBS/SHL, subagrupadas en dos clados (homólogos de EBS del grupo-I y homólogos de SHL del grupo-II). El grupo-I existe en las plantas superiores, pero el grupo-II sólo en las angiospermas. Los tres homólogos EBS, PpEBSe/d/f de los musgos y los homólogos EBS/SHL de las algas se encuentran en la parte inferior del árbol filogenético. La mayoría de las especies comprenden una sola copia de SHL, pero múltiples copias de EBS, como se informó en el álamo, el algodón y el musgo (Figs. 1 y 9). Las proteínas EBS/SHL están muy conservadas en cuanto a su longitud, que oscila entre 199 y 336 aa (la mayoría está en torno a los 220 aa), y en cuanto a la organización de los dominios, un dominio BAH N-terminal y un dominio PHD C-terminal (Fig. 9). El dedo PHD está relacionado con H3K4me2/me3, y el dominio BAH lee la marca H3K27me2/me3. En general, H3K4me3 se correlaciona con la activación transcripcional, mientras que H3K27me3 se correlaciona con el silenciamiento de genes en plantas y animales. EBS posee un dominio BAH y un dominio PHD que lee y afecta a las marcas H3K27me2/me3 y H3K4me/me3, respectivamente. Además, el dominio BAH, y no el dedo PHD, media la interacción de SHL o EBS con EMF1 . Las interacciones BAH-H3K27me3 y PHD-H3K4me3 son importantes para la represión floral mediada por SHL . EBS/SHL equilibra los estados activos y represivos de la cromatina.