PRC1: RING1
PRC1 As proteínas do dedo do RING são compostas pelos dois clades (arquivo adicional 2), RING1 e BMI1, ambos caracterizados por uma combinação conservada dos domínios RING e Ring-finger e WD40 associados Ubiquitin-Like (RAWUL) (Figs. 2 e 3). A atividade da ubiquitina ligase dos escritores do complexo PRC1 se baseia no domínio RING . Em animais, o RING1b é um escritor chave de H2Aub, enquanto que o RING1a desempenha papéis menores. O IMC1 não exibe atividade ligase E3, mas pode estabilizar e melhorar as funções do RING1b . Em Arabidopsis, ambas as famílias AtRING1a/b e AtBMI1a/b/c podem catalisar o H2Aub. Na fase vegetativa, o AtRING1a/1b pode reprimir a transição vegetativa-embrionária e a formação de meristema ectópico principalmente através da supressão da expressão errada dos reguladores mestres embrionários e reguladores de células-tronco, respectivamente . Na fase reprodutiva, o anel duplo mutante Arabidopsis1a;anel1b exibe números excessivamente elevados de órgãos florais, e fenótipos fortes exibindo um inchaço dramático de gynoecium e completamente estéril . Tanto AtRING1a como AtRING1b podem controlar a manutenção das células estaminais florais e o desenvolvimento adequado do carpelo, reprimindo a expressão KNOX-I . A mutação RING1a/b pode causar transição de fase vegetativa precoce regulando o estado do H2Aub no locus SPL .
Numa árvore filogenética, as proteínas do RING1 podem ser divididas em três ramos: planta semente (Grupo I), xaxim (Grupo II) e algas (Grupo III, Fig. 2). A relação filogenética dos homólogos do RING1 é consistente com a evolução das plantas. O RING1 sofreu uma e duas duplicações nos antepassados eudicot e monocotiledôneas, respectivamente . A maioria das proteínas RING1 exibe duas cópias em cada espécie, mas PtRING1 e ZmRING1 ocorrem em quatro cópias, e BrRING1 presente em três cópias. Entretanto, o evento de duplicação pode ocorrer após a separação das monocotiledôneas e dicotiledôneas. As proteínas RING1 nos eudicópteros exibem organizações de domínio semelhantes (Fig. 2). As proteínas RING1 em monocotiledôneas são representadas apenas por Poaceae, exibindo poucas organizações de domínio variável. O domínio RING típico, POU, que é um domínio de ligação de DNA bipartido, e Ras Exchanger Motif também são encontrados em ZmRING1a, proteína Agrobacterium VirD5, e Spectrin repete domínios exibidos em BdRING1b. O domínio Prion ocorre em OsRING1b. Intrigantemente, o domínio POU foi identificado pela primeira vez nas plantas. O grupo II existe em samambaia e Physcomitrella patens, enquanto o grupo III está presente em duas algas. No entanto, ambos os grupos estão bem conservados em organizações de domínio.
PRC1 componente central: IMC1
As três proteínas semelhantes ao IMC1, AtBMI1a, AtBMI1b, e AtBMI1c existem em Arabidopsis . A deficiência de IMC1 (atbmi1a;atbmi1b duplo mutante) causa uma estrutura embrionária no estágio vegetativo e um alto número de órgãos florais no estágio reprodutivo, uma característica encontrada de forma semelhante no anel1a;anel1b duplo mutante . Similar às proteínas RING1, o IMC1a/1b funciona como um dos escritores do PRC1 para H2Aub, coordenando com o H3K27me3 mediado pelo PRC2 para manter a identidade celular . AtBMI1a/1b funciona como ligas de E3 ubiquitina, e está envolvido na resposta à seca . MIR156A e MIR156C também são genes alvo do AtBMI1, regulando a transição dos vegetais para o desenvolvimento produtivo . Notavelmente, o AtBMI1c atua como um gene impresso que expressa alelo materno no endosperma, mas biallelicamente no estame . As proteínas do IMC1 podem ser identificadas em todas as plantas, e nas algas Volvox carteri, mas não nas algas Ostreococcus lucimarinus ou Chlamydomonas reinhardtii; além disso, o IMC1 está dividido em dois grupos, a saber, IMC1a/1b e BMI1c homologs (Fig. 3). Todos os IMC1 contêm domínios RING e RAWUL altamente conservados, exceto BsBMI1a, PtBMI1d, e OrBMI1b, OrBMI1b carece de domínio RAWUL. O comprimento de seqüência dos BMI1s geralmente ocorre entre 350 e 550 aa, mas FvBMI1c compreende 974 aa resíduos com um termino C muito longo. Dicotyledon contém três cópias do IMC1 com exceção do choupo e algodão cinco cópias, e laranja duas cópias. Todas as proteínas BMI1a/1b mostram organizações de domínio semelhantes, mas o ThBMI1b abriga outro motivo de ligação TIM-fosfato adjacente ao domínio RING; além disso, o BdBMI1d possui um motivo de manutenção estrutural de cromossomas (SMC) Flexible hinge motif, que é responsável pela dimerização do DNA e como um determinante essencial das interacções dinâmicas SMC-DNA . O AtBMI1c altamente conservado e seus homólogos só são encontrados na Crucifera (Fig. 3).
O domínio RAWUL foi identificado pela primeira vez nas proteínas do dedo PRC1 RING1, famílias RING1 e BMI1, e é conservado em plantas e vermes . O domínio RAWUL pode estar envolvido na regulação epigenética através da ligação à PRC1 ou a outros factores. Em mamíferos, o domínio RAWUL tem demonstrado ligar-se a homólogos de Ph embora este fenómeno não tenha sido confirmado até à data. Assim, o domínio RAWUL pode ligar-se a outras proteínas envolvidas na ubiquitinação do histone. Sanchez-Pulido et al. sugeriram que algumas outras proteínas demonstram as funções de ubiquitinação do histone PRC1 . Arabidopsis HTA10 exibe a seqüência de consenso conservada de PKKT . O milho ubiquitinado H2A pode estar envolvido na ubiquitinação de H2A . A proteína Grain RAWUL Gnp4/LAX2 regula o comprimento do grão através da via de sinalização da auxina, interferindo no OsIAA3-OsARF25 . O domínio RAWUL pode formar um módulo de interação proteína-proteína com o domínio PAL do AL6 N-terminus, que é um fator associado do PRC1 .
O domínio RAWUL não é altamente conservado entre animais e plantas. No entanto, uma análise de alinhamento de sequência de homologs RING1a/1b mostra que os domínios estão consideravelmente conservados de plantas inferiores para plantas superiores, e o IMC1a/1b/1c carece de β5. As proteínas RING (BrRING1b, ZmRING1b e SmRING) e as proteínas BMI1 (AtBMI1c, BsBMI1a, OrBMI1b e VcBMI) não contêm domínios RAWUL (Figs. 2 e 3, arquivo adicional 3). Os domínios RING e RAWUL são possivelmente domínios especiais para as famílias RING1 e BMI1.
PRC1 Core component: LHP1
Em Arabidopsis, LHP1, um ativador e um repressor de transcrição, é primeiramente identificado como um homólogo Drodophila Heterochromatin-associated Protein 1 (HP1) que se liga aos marcadores H3K27m3 estabelecidos pela PRC2 e catalisa a monoubiquitinação em lisina 119 do histone H2A . A LHP1 pode ser um papel análogo ao da mosca Pc em um complexo do tipo PRC1 . LHP1 contém dois domínios típicos, o domínio Chromatin Organization Modifier (CHROMO) que é essencial para a especificidade de ligação H3K27me3 , e o domínio Chromo Shadow (ChSh) . Em contraste com seu homólogo animal, LHP1 está predominantemente localizado dentro do domínio eucromatina . A localização e retenção de Fern LHP1 são controladas por domínios distintos, e sua retenção no nucléolo e nos cromocentros é conferida pelo domínio ChSh . P. patens PpLHP1 interage com PpCMT através dos seus domínios cromo . Como um leitor PRC1 em plantas , LHP1 controla múltiplas vias de desenvolvimento relacionadas ao desenvolvimento de órgãos, tamanho celular e transições vegetativas para a fase reprodutiva .
LHP1 homologs também sofrem evolução de plantas. Além dos distintos domínios CHROMO e ChSh, alguns LHPs contêm outros motivos distintos (Fig. 4). Por exemplo, LHP1s álamo têm um domínio CDC37 adicional em seus termos N, e AtLHP1 compreende um domínio B5 adicional encontrado em subunidades de fenilalanina-tRNA synthetase β. OsLHP1 consiste em outro domínio Peptide Chain Release Factors ligado à família das proteínas; além disso, este domínio desempenha um papel importante em cadeias de polipéptidos recém-sintetizados liberados de peptidyl-tRNA . BdLHP1 contém outra proteína de membrana ER SH3, que está associada a chaperones de membrana localizada. PpLHP1 compreende um domínio adicional de ostepontin.
PRC1 factor associado: EMF1
EMF1 e VRN1 são especificamente encontrados nas espécies dicotiledôneas . Ambos EMF1 e VRN1 são proteínas não sequenciais específicas de DNA que regulam a expressão gênica durante o desenvolvimento dos órgãos florais. Aubert et al. consideraram o EMF1 como uma nova proteína envolvida no controle da arquitetura e floração de rebentos em Arabidopsis; além disso, os mutantes com perda de função EMF1 causam uma transição embrionária acelerada para o desenvolvimento reprodutivo . EMF1 e EMF2 participam do silenciamento mediado por PcG dos genes homeoticos das flores e são cruciais para o desenvolvimento vegetativo . Os CEM1, ATX1 e ULT1 podem trabalhar juntos para manter a integridade da cromatina e prevenir a expressão precoce do gene da semente após a germinação . EMF1 está associado a um leitor de H3K27me3 que é necessário para H3K27me3 . EMF1, LHP1, e histone H3 lisina-4 demetilase podem formar um complexo EMF1c para desempenhar papéis importantes na regulação de MIR172 e Lugar de Florescimento T (FT) .
Cada espécie abriga um único gene homólogo EMF1, exceto pepino, algodão e Eutrema com dois, e repolho com quatro. A análise filogenética mostra que os EMF1 estão bem conservados em dicotiledônea, mas podem não ter domínios representativos ou intactos na base de dados Pfam e SMART. O alinhamento da sequência proteica sugere que seis motivos conservados, especialmente o motivo 4, 5 e 6 (Fig. 5, arquivo adicional 4), e cujas funções são desconhecidas.
PRC1 fator associado: VRN1
VRN1 e VAL1/2/3 são componentes específicos da PRC1, e são subclades da família de fatores de transcrição de domínio B3 específicos da planta (arquivo adicional 5). Similar ao EMF1, os genes Arabidopsis VRN podem mediar a vernalização e desempenhar um papel importante na transição da fase vegetativa para a reprodutiva em resposta ao tratamento prolongado com frio. O VRN1 localiza-se no núcleo e é sequencialmente não específico na ligação do DNA, tendo como alvo a FLC e a FT2 . Os mutantes com perda de função apresentam fenótipos semelhantes a outros mutantes PRC1 .
VRN1 e seus homólogos são subagrupados nos dois clades, AtVRN1a/RTV1 e AtVRN1b/1c/1d. O domínio B3 é possivelmente um domínio especial da família VRN1 (71, Fig. 6). AtVRN1, que é chamado AtVRN1a neste estudo, é caracterizado com dois domínios B3, é encontrado apenas em espécies vegetais superiores e se liga especificamente ao DNA . No estudo atual, cinco homólogos VRN1 são identificados em Arabidopsis, e múltiplos homólogos também são encontrados em outras dicotiledôneas pela BlastP. A organização do domínio mostrou que o AtVRN1a e seus homólogos consistem em dois domínios B3 (Fig. 6). AtRTV1, AtVRN1b/1c/1d e seus homólogos principalmente no grupo II mostram uma perda no segundo domínio B3, o que pode ser importante para suas funções . Este domínio é substituído pela super família BfiI_C_EcoRII_N_B3, que contém um domínio N-terminal de ligação de DNA do tipo IIE, proteínas do tipo EcoRII restritas, um domínio C-terminal de ligação de DNA do tipo IIS, proteínas do tipo BfiI restritas, e proteínas B3 específicas da planta.
PRC1 fator associado: VAL1/2/3
Proteínas VAL, que são identificadas como um repressor transcripcional, são necessárias para a repressão global da expressão dos genes embrionários . As plântulas de va l1 val2 duplo mutante podem formar proliferações embrionárias em raízes e meristema apical, mas não em folhas. Os mutantes Val2/val3 apresentam efeitos dominantes semelhantes nas plantas homozigotas mutantes Val1 . Nos mutantes val1, 39% das transcrições no regulador FUSCA3 estão deprimidas, enquanto que os fatores de transcrição do núcleo da rede LAFL não estão. Todas as transcrições putativas de VAL1 agem através de repressão epigenética e/ou transcripcional . Além disso, VAL1 e VAL2 estão envolvidos na vernalização via PcG. As proteínas VAL trabalham em conjunto com o IMC1 para mediar a monoubiquilação de H2AK119 e iniciar a repressão dos genes de maturação das sementes . As proteínas VAL mediam a repressão através do recrutamento de um complexo deacetylase histone aos genes LEC1/AFL . VAL1 reprime a transcrição FLC promovendo a diacetilação da histona . VAL1 desce o AGL15 por H3K27me3 deposição na sequência upstream do AGL15 .
Exceto para domínios B3 e zf-CW, que são possíveis domínios especiais para a família VAL1/2/3, a maioria dos homólogos VAL1/2/3 carregam motivos adicionais de dedos de zinco, como PHD e ZnF-GATA, no terminal 3′ (Fig. 7). O domínio VAL1-B3 é necessário para interagir com o elemento Sph/RY canônico dentro do AGL15 e FLC . O domínio zf-CW é um membro dos módulos leitores de modificação de histone para regulação epigenética . No estudo atual, a família VRN1 é encontrada apenas em dicotiledôneas (Fig. 6) e seus homólogos contêm um ou dois domínios B3. Em contraste, as proteínas VAL1/2/3 são encontradas de algas a angiospermas, e apenas um domínio B3. Além disso, as proteínas VAL1/2/3 podem ser agrupadas em três grupos (Fig. 7). Homólogos VAL1 do grupo I só são encontrados em dicotiledôneas; homólogos VAL2 do grupo II e homólogos VAL3 do grupo III são encontrados tanto em dicotiledôneas quanto em monocotiledôneas. Como indicado pelos nossos resultados Algas e samambaia apresentam apenas uma proteína homóloga VAL, enquanto musgo demonstra cinco membros, e O. lucimarinus não apresenta nenhum.
PRC1 fator associado: AL1-7
AL proteínas, portadoras de um domínio PHD conservado, foram identificadas como um fator de transcrição . As proteínas Arabidopsis Alfin são consideradas como leitores de H3K4me2/3 e funcionam como novos parceiros de AtRING1 e AtBMI1 . A proteína AL está envolvida em muitos processos de desenvolvimento, como o melhoramento da expressão MsPRP2 nas raízes da alfafa e contribui para a tolerância ao sal . Na Arabidopsis, tanto a AL1 como a AL5 podem ligar-se às regiões promotoras dos genes alvo e suprimir múltiplos factores negativos para conferir tolerância ao stress abiótico . A Arabidopsis AL6 está implicada na regulação da expressão das transcrições relacionadas com o alongamento dos pêlos radiculares na inanição por fosfato; além disso, este processo deve-se ao seu domínio PHD que pode ligar-se a H3K4me3, que é uma estratégia de regulação epigenética para a baixa disponibilidade de fosfato . Entretanto, AtAL7 desempenha um papel negativo na tolerância ao sal . No estudo atual, as famílias AL e ING compartilham o domínio PHD, e a árvore filogenética mostra que eles pertencem a diferentes ramos, sugerindo sua relação próxima (arquivo adicional 6). A família ALs é a maior família de fatores associados ao PRC1. A Arabidopsis compreende sete ALs que podem ser divididas em três grupos, AtAL1/2, AtAL3/4/5 e AtAL6/7 . No estudo atual, as proteínas AL das plantas de sementes podem ser divididas em três grupos, a saber, Grupo-I (AL1/2), Grupo-II (AL3/4/5), e Grupo-III (AL6/7). As proteínas AL das plantas de esporos estão localizadas no fundo da árvore filogenética (Fig. 7). O milho e o algodão compreendem mais membros da proteína AL do que outras espécies.
Além do FvAL5, que compreende 687aa com três domínios Alfin e um domínio PHD, a maioria das plantas são extremamente conservadas em organizações de domínios, ou seja, um domínio Alfin e PHD, e apresentam um comprimento de sequência de aproximadamente 230-300aa. (Fig. 7, arquivo adicional 1). Um domínio Alfin e um domínio PHD, o domínio especial para a família AL, são distribuídos no terminal N ou C das proteínas. O motivo PAL, localizado no domínio Alfin, das proteínas AL2 e AL7 pode se ligar ao RING1 e IMC1 . As proteínas PHD-dedo são universalmente encontradas em eucariotas e atuam como atores chave na transcrição reguladora e estrutura cromatina . PHD-dedo é necessário para a ligação H3K4me3/2 nas famílias AL e ING .
PRC1 fator associado: As proteínas ING1/2
AL existem apenas nas plantas, enquanto as proteínas ING estão amplamente distribuídas em leveduras, animais e plantas. A ING foi inicialmente identificada em mamíferos, e todas as cinco proteínas ING podem ligar-se a H3K4me3/2 através de dedos PHD e atuar como componentes de modificações histônicas . No entanto, estas proteínas raramente têm sido estudadas em plantas. Similar às proteínas AL, as proteínas AtING conservadas podem reconhecer H3K4me3/2 mediadas pelos dedos PHD, enquanto as funções biológicas do AtING são desconhecidas .
A maioria das plantas contém dois genes ING (Fig. 8). As proteínas ING contêm um domínio N-terminal ING que se liga a caudas H3 não modificadas, e um domínio PHD-terminal C que é necessário para ligar H3K4me2/3 . Em contraste com trabalhos anteriores, identificamos os homólogos VcING1/2, OlING1 e CrING1/2 em algas verdes. Os dedos PHD em VcING2 e CrING2 são substituídos pelos domínios Tudor, que também estão implicados nas interacções proteína-proteína. O domínio Tudor pode ligar-se às argininas simetricamente dimetiladas de sequências ricas em arginina e glicina e histone H4 dimetiladas em Lys20 .
PRC1 fator associado: EBS/SHL
EBS e SHL são proteínas contendo BAH, que são encontradas apenas no reino vegetal e amplamente distribuídas de plantas inferiores para plantas superiores (Fig. 1, ). As proteínas SEE da Arabidopsis são reguladores transcripcionais negativos, e as mutações do SEE resultam em fenótipos de floração precoce. EBS e SHL se ligam a diferentes integradores florais, EBS regulando FT e SHL reprimindo SOC1 . O EBS e SHL atuam redundantemente na regulação da dormência das sementes . EBS/SHL são leitores de H3K27me3 que também podem ligar H3K4me3 .
proteínas EBS/SHL, subagrupadas em dois clades (homologs EBS grupo I e homologs SHL grupo II). O grupo I existe em plantas superiores, mas o grupo II só existe em angiospermas. Três homólogos EBS, PpEBSe/d/f de musgo e homólogos EBS/SHL de algas estão na base da árvore filogenética. A maioria das espécies compreende uma única cópia de SHL, mas múltiplas cópias de STE, como relatado em choupo, algodão e musgo (Figs. 1 e 9). As proteínas EBS/SHL são altamente conservadas em comprimento, que varia de 199 a 336 aa (a maioria está em torno de 220 aa), e na organização do domínio, um domínio N-terminal BAH e um domínio C-terminal PHD (Fig. 9). O dedo PHD está relacionado com H3K4me2/me3, e o domínio BAH lê a marca H3K27me2/me3. Em geral, H3K4me3 se correlaciona com ativação transcripcional, enquanto H3K27me3 se correlaciona com silenciamento gênico em plantas e animais. O EBS possui um domínio BAH e um domínio PHD que lê e afeta as marcas H3K27me2/me3 e H3K4me/me3, respectivamente . Além disso, o domínio BAH, não o dedo PHD, medeia a interação de SHL ou EBS com EMF1 . As interações BAH-H3K27me3 e PHD-H3K4me3 são importantes para a repressão floral mediada por SHL . EBS/SHL equilibra estados de cromatina ativa e repressiva.