PRC1 core component: RING1
PRC1 RING finger proteïnen zijn samengesteld uit de twee clades (Additional file 2), RING1 en BMI1, die beide gekarakteriseerd worden door een geconserveerde combinatie van RING en Ring-finger And WD40 associated Ubiquitin-Like (RAWUL) domeinen (Figs. 2 en 3). De ubiquitin-ligase-activiteit van PRC1-complexschrijvers berust op hun RING-domein . Bij dieren is RING1b een belangrijke H2Aub-ligase, terwijl RING1a een ondergeschikte rol speelt. BMI1 vertoont geen E3 ligase activiteit maar kan de functies van RING1b stabiliseren en versterken. In Arabidopsis kunnen zowel AtRING1a/b als AtBMI1a/b/c families H2Aub katalyseren. In het vegetatieve stadium kan AtRING1a/1b de vegetatieve-naar-embryonale overgang en ectopische meristeem vorming onderdrukken, voornamelijk door het onderdrukken van de verkeerde expressie van embryo master regulatoren en stamcel regulatoren, respectievelijk. In het reproductieve stadium vertoont de Arabidopsis dubbelmutant ring1a;ring1b uitzonderlijk hoge aantallen bloemorganen, en sterke fenotypen met dramatisch opzwellend gynoecium en volledig steriel. Zowel AtRING1a als AtRING1b kunnen het behoud van bloemstamcellen en een goede ontwikkeling van de carpel controleren door KNOX-I expressie te onderdrukken. RING1a/b mutatie kan een vroege vegetatieve faseovergang veroorzaken door de H2Aub status op de SPL locus te reguleren .
In een fylogenetische boom kunnen plantaardige RING1 eiwitten in drie takken worden verdeeld: zaadplant (Groep-I), mos-varens (Groep-II), en algen (Groep-III, Fig. 2). De fylogenetische verwantschap van de RING1 homologen is consistent met de evolutie van planten. RING1 heeft één en twee duplicaties ondergaan in respectievelijk eudicot en monocot voorouders. De meeste RING1-eiwitten vertonen twee kopieën in elke soort, maar PtRING1 en ZmRING1 komen in vier kopieën voor, en BrRING1 in drie kopieën. De duplicatie kan echter plaatsvinden na de scheiding van monocotyledonen en dicotyledonen. RING1 eiwitten in eudicots vertonen een gelijkaardige domein organisatie (Fig. 2). RING1 eiwitten in monocotylen worden alleen vertegenwoordigd door Poaceae, die weinig variabele domein organisaties vertonen. Het typische RING domein, POU, dat een bipartiet DNA bindend domein is, en Ras Exchanger Motif worden ook gevonden in ZmRING1a, Agrobacterium VirD5 proteïne, en Spectrin repeats domeinen vertonen in BdRING1b. Prion-domein komt voor in OsRING1b. Intrigerend is dat het POU-domein voor het eerst in planten werd geïdentificeerd. Groep-II komt voor in de varen en Physcomitrella patens, terwijl groep-III aanwezig is in twee algen. Beide groepen zijn echter goed geconserveerd in domein-organisaties.
PRC1 kerncomponent: BMI1
De drie BMI1-achtige eiwitten, AtBMI1a, AtBMI1b, en AtBMI1c bestaan in Arabidopsis . BMI1 deficiëntie (atbmi1a;atbmi1b dubbelmutant) veroorzaakt een embryonaal-achtige structuur in het vegetatieve stadium en een groot aantal bloeiende organen in het reproductieve stadium, een kenmerk dat vergelijkbaar is met de ring1a;ring1b dubbelmutant. Net als RING1 eiwitten fungeren BMI1a/1b als PRC1-schrijvers voor H2Aub, waarbij ze coördineren met PRC2-gemedieerde H3K27me3 om de celidentiteit te handhaven. AtBMI1a/1b functioneert als een E3 ubiquitine ligases, en is betrokken bij droogte-respons . MIR156A en MIR156C zijn ook doelgenen van AtBMI1, die de overgang van plantaardige naar productieve ontwikkeling reguleren . Met name AtBMI1c werkt als een ingeprent gen dat maternaal allel tot expressie komt in het endosperm maar biallel in de meeldraden. BMI1 eiwitten kunnen worden geïdentificeerd in alle planten, en in de alg Volvox carteri, maar niet in de algen Ostreococcus lucimarinus of Chlamydomonas reinhardtii; verder zijn BMI1 in twee groepen verdeeld, namelijk BMI1a/1b en BMI1c homologs (Fig. 3). Alle BMI1s bevatten sterk geconserveerde RING en RAWUL domeinen, behalve BsBMI1a, PtBMI1d, en OrBMI1b; bij OrBMI1b ontbreekt het RAWUL domein. De sequentielengte van BMI1s ligt meestal tussen 350 en 550 aa, maar FvBMI1c bestaat uit 974 aa residuen met een te lange C-terminus. Dicotyledon bevat drie kopieën van BMI1, behalve populier en katoen vijf kopieën, en sinaasappel twee kopieën. Alle BMI1a/1b eiwitten hebben vergelijkbare domein organisaties, maar BdBMI1b heeft een ander TIM-fosfaat bindend motief naast het RING domein; verder heeft BdBMI1d een Structural Maintenance of Chromosomes (SMC) eiwitten Flexible hinge motief, dat verantwoordelijk is voor DNA dimerisatie en als een essentiële determinant van dynamische SMC-DNA interacties. Sterk geconserveerde AtBMI1c en zijn homologen worden alleen gevonden in Crucifera (Fig. 3).
Het RAWUL domein werd voor het eerst geïdentificeerd in de PRC1 RING vinger eiwitten, RING1 en BMI1 families, en is geconserveerd in plant en worm . Het RAWUL domein kan betrokken zijn bij epigenetische regulatie door binding aan PRC1 of andere factoren. Bij zoogdieren is aangetoond dat RAWUL zich bindt aan Ph homologen hoewel dit fenomeen tot op heden niet is bevestigd. Het is dus mogelijk dat het RAWUL-domein zich bindt aan andere eiwitten die betrokken zijn bij histon-ubiquitinatie. Sanchez-Pulido et al. suggereerden dat sommige andere eiwitten PRC1 histon ubiquitinatiefuncties vertonen. Arabidopsis HTA10 vertoont de geconserveerde PKKT consensus sequentie. Maïs ubiquitinated H2A kan betrokken zijn bij H2A ubiquitinatie . Het RAWUL-eiwit Gnp4/LAX2 reguleert de graanlengte via de auxinesignaleringsroute door te interfereren met OsIAA3-OsARF25 . Het RAWUL domein kan een eiwit-eiwit interactie module vormen met het PAL domein van AL6 N-terminus, dat een geassocieerde factor is van PRC1 .
Het RAWUL domein is niet sterk geconserveerd tussen dieren en planten. Een sequentie alignment analyse van RING1a/1b homologe’s laat echter zien dat de domeinen aanzienlijk geconserveerd zijn van lagere tot hogere planten, en BMI1a/1b/1c mist β5. De RING eiwitten (BrRING1b, ZmRING1b en SmRING) en de BMI1 eiwitten (AtBMI1c, BsBMI1a, OrBMI1b en VcBMI) bevatten geen RAWUL domeinen (Figs. 2 en 3, Additional file 3). RING en RAWUL domeinen zijn mogelijk speciale domeinen voor RING1 en BMI1 families.
PRC1 Kern component: LHP1
In Arabidopsis is LHP1, een activator en repressor van transcriptie, voor het eerst geïdentificeerd als een Drodophila Heterochromatin-associated Protein 1 (HP1) homoloog dat zich bindt aan H3K27m3 markers vastgesteld door PRC2 en monoubiquitinatie katalyseert op lysine 119 van histon H2A . LHP1 kan een analoge rol spelen als de vlieg Pc in een PRC1-achtig complex . LHP1 bevat twee typische domeinen, het Chromatin Organization Modifier (CHROMO) domein, dat essentieel is voor de specificiteit van H3K27me3 binding, en het Chromo Shadow (ChSh) domein. In tegenstelling tot zijn dierlijke tegenhanger bevindt LHP1 zich voornamelijk in het euchromatine . De lokalisatie en retentie van Fern LHP1 worden gecontroleerd door verschillende domeinen, en zijn retentie op de nucleolus en chromocentra wordt toegekend door het ChSh domein . P. patens PpLHP1 interageert met PpCMT via hun chromo domeinen . Als PRC1 lezer in planten , controleert LHP1 meerdere ontwikkelingswegen met betrekking tot orgaanontwikkeling, celgrootte, en vegetatieve naar reproductieve faseovergangen .
LHP1 homologs ondergaan ook plantenevolutie. Naast de onderscheiden CHROMO en ChSh domeinen, bevatten sommige LHPs andere onderscheidende motieven (Fig. 4). Populier LHP1s hebben bijvoorbeeld een extra CDC37 domein in hun N-terminus, en AtLHP1 bevatten een extra B5 domein dat gevonden wordt in fenylalanine-tRNA synthetase β subeenheden. OsLHP1 bevat een ander Peptide Chain Release Factors domein dat aan de eiwitfamilie is gekoppeld; bovendien speelt dit domein een belangrijke rol bij nieuw gesynthetiseerde polypeptideketens die vrijkomen uit peptidyl-tRNA . BdLHP1 bevat een ander ER-membraaneiwit SH3, dat geassocieerd is met membraangelokaliseerde chaperones. PpLHP1 bevat een extra ostepontin-domein.
PRC1 geassocieerde factor: EMF1
EMF1 en VRN1 worden specifiek aangetroffen in dicotyledon soorten . Zowel EMF1 als VRN1 zijn niet-sequentie-specifieke DNA-bindende proteïnen die de genexpressie reguleren tijdens de ontwikkeling van de bloemorganen. Aubert et al. beschouwen EMF1 als een nieuw eiwit dat betrokken is bij de controle van de scheutarchitectuur en de bloei in Arabidopsis; bovendien veroorzaken EMF1 loss-of-function mutanten een versnelde overgang van embryonale naar reproductieve ontwikkeling. EMF1 en EMF2 nemen deel aan de PcG-gemedieerde silencing van bloem homeotische genen en zijn cruciaal voor vegetatieve ontwikkeling . EMF1, ATX1, en ULT1 kunnen samenwerken om de integriteit van het chromatine te handhaven en vroegtijdige expressie van zaadgenen na ontkieming te voorkomen . EMF1 is geassocieerd met een H3K27me3-lezer die vereist is voor H3K27me3 . EMF1, LHP1, en histon H3 lysine-4 demethylase kunnen een EMF1c complex vormen om belangrijke rollen te spelen in de regulatie van MIR172 en Flowering Locus T (FT) .
Elke soort herbergt een enkel EMF1 homoloog gen behalve komkommer, katoen en Eutrema met twee, en kool met vier. Fylogenetische analyse toont aan dat EMF1 goed geconserveerd zijn in dicotyledon, maar dat representatieve of intacte domeinen ontbreken in de Pfam en SMART database. Uit de alignment van de eiwitsequentie blijkt dat er zes geconserveerde motieven zijn, met name motief 4, 5 en 6 (Fig. 5, Additional file 4), waarvan de functies onbekend zijn.
PRC1-geassocieerde factor: VRN1
VRN1 en VAL1/2/3 zijn plant-specifieke componenten van PRC1, en zijn subclades van de plant-specifieke B3-domein transcriptiefactor familie (Additionalfile 5). Vergelijkbaar met EMF1, kunnen Arabidopsis VRN genen vernalisatie mediëren en spelen een belangrijke rol in de vegetatieve naar reproductieve fase overgang in reactie op langdurige koude behandeling. VRN1 lokaliseert in de celkern en is sequentie-non-specifiek in DNA binding, targeting op FLC, en FT2 . Verlies-van-functie mutanten vertonen vergelijkbare fenotypes als andere PRC1 mutanten.
VRN1 en zijn homologen zijn onderverdeeld in de twee clades, AtVRN1a/RTV1 en AtVRN1b/1c/1d. Het B3 domein is mogelijk een speciaal domein van de VRN1 familie (71, Fig. 6). AtVRN1, dat in deze studie AtVRN1a wordt genoemd, wordt gekenmerkt door twee B3 domeinen, wordt alleen gevonden in hogere plantensoorten en bindt specifiek aan DNA . In de huidige studie zijn vijf VRN1 homologs geïdentificeerd in Arabidopsis, en meerdere homologs zijn ook gevonden in andere dicotyledons door BlastP. De domein organisatie toonde aan dat AtVRN1a en zijn homologs bestaan uit twee B3 domeinen (Fig. 6). AtRTV1, AtVRN1b/1c/1d en hun homologs voornamelijk in groep-II vertonen een verlies in het tweede B3 domein, dat belangrijk kan zijn voor zijn functies. Dit domein wordt vervangen door de superfamilie BfiI_C_EcoRII_N_B3, die een N-terminaal DNA-bindend domein van type IIE beperkte endonuclease EcoRII-achtige eiwitten, een C-terminaal DNA-bindend domein van type IIS beperkte endonuclease BfiI-achtige eiwitten, en plant-specifieke B3-eiwitten bevat .
PRC1-geassocieerde factor: VAL1/2/3
VAL proteïnen, die geïdentificeerd zijn als een transcriptionele repressor, zijn nodig voor de globale repressie van embryonale genenexpressie . De zaailingen van de va l1 val2 dubbelmutant kunnen embryo-achtige proliferaties vormen in wortels en apicale meristeem, maar niet in bladeren. Val2/val3 mutanten vertonen gelijkaardige dominante effecten in de val1 homozygote mutant planten. In val1 mutanten zijn 39% van de transcripten in de FUSCA3 regulator onderdrukt, terwijl dit niet het geval is voor de kern transcriptiefactoren van het LAFL netwerk. Alle vermeende gerichte transcripten van VAL1 werken via epigenetische en/of transcriptionele repressie. Bovendien zijn VAL1 en VAL2 betrokken bij vernalisatie via PcG. VAL proteïnen werken samen met BMI1 om de monoubiquitylatie van H2AK119 te mediëren, en de repressie van zaad rijpingsgenen te initiëren. VAL proteïnen mediëren de repressie door het rekruteren van een histon deacetylase complex naar LEC1/AFL genen. VAL1 onderdrukt FLC transcriptie door het bevorderen van histon deacetylering . VAL1 downreguleert AGL15 door H3K27me3 depositie op de upstream sequenties van AGL15 .
Exception for B3 and zf-CW domains, which are possible special domains for the VAL1/2/3 family, most VAL1/2/3 homologs carry additional Zinc finger motifs, such as PHD and ZnF-GATA, at the 3′-terminal (Fig. 7). Het VAL1-B3 domein is noodzakelijk voor interactie met het canonieke Sph/RY element binnen AGL15 en FLC. Het zf-CW domein is een lid van de histon modificatie lezer modules voor epigenetische regulatie. In de huidige studie wordt de VRN1 familie alleen gevonden in dicotyledonen (Fig. 6) en zijn homologs bevatten één of twee B3 domeinen. Daarentegen worden VAL1/2/3 eiwitten gevonden van alg tot angiosperm, en slechts één B3 domein. Bovendien kunnen VAL1/2/3 proteïnen in drie groepen geclusterd worden (Fig. 7). Groep-I-bevattende VAL1 homologs worden alleen gevonden in dicotyledons; Groep-II-bevattende VAL2 homologs en Groep-III-bevattende VAL3 homologs worden gevonden in zowel dicotyledons als monocotyledons. Zoals uit onze resultaten blijkt, vertonen algen en varens slechts één VAL-homoloog eiwit, terwijl mossen vijf leden vertonen, en O. lucimarinus geen enkel.
PRC1-geassocieerde factor: AL1-7
AL-eiwitten, die een geconserveerd PHD-domein dragen, werden geïdentificeerd als een transcriptiefactor . Arabidopsis Alfin proteïnen worden beschouwd als H3K4me2/3 lezers en functioneren als nieuwe partners van AtRING1 en AtBMI1 . Het AL eiwit is betrokken bij vele ontwikkelingsprocessen, zoals de verhoging van de MsPRP2 expressie in alfalfa wortels en draagt bij tot zouttolerantie . In Arabidopsis kunnen zowel AL1 als AL5 zich binden aan de promotorregio’s van doelgenen en meerdere negatieve factoren onderdrukken om abiotische stresstolerantie te verlenen. Arabidopsis AL6 is betrokken bij het reguleren van de expressie van wortelhaarverlenging-gerelateerde transcripten bij fosfaattekort; verder is dit proces te danken aan zijn PHD domein dat zich kan binden aan H3K4me3, wat een epigenetische regulatiestrategie is voor lage fosfaatbeschikbaarheid . AtAL7 speelt echter een negatieve rol in zouttolerantie. In de huidige studie delen de AL en ING families het PHD domein, en de fylogenetische boom laat zien dat ze tot verschillende takken behoren, wat hun nauwe verwantschap suggereert (Additional file 6). De AL familie is de grootste PRC1 geassocieerde factor familie. Arabidopsis omvat zeven AL die kunnen worden onderverdeeld in drie groepen, AtAL1/2, AtAL3/4/5 en AtAL6/7 . In de huidige studie kunnen de AL-eiwitten van zaadplanten in drie groepen worden verdeeld, namelijk Groep-I (AL1/2), Groep-II (AL3/4/5), en Groep-III (AL6/7). De AL-eiwitten van sporenplanten bevinden zich onderaan de fylogenetische boom (Fig. 7). Maïs en katoen omvatten meer AL eiwit leden dan andere soorten.
Behalve FvAL5, dat 687aa omvat met drie Alfin domeinen en een PHD domein, zijn de meeste planten extreem geconserveerd in domein organisaties, dat wil zeggen een Alfin domein en PHD, en vertonen een sequentie lengte van ongeveer 230-300aa. (Fig. 7, Additional file 1). Eén Alfin- en PHD-domeinen, het speciale domein voor de AL-familie, zijn verdeeld over de N- of C- terminus van de eiwitten. Het PAL motief, gelegen in het Alfin domein, van AL2 en AL7 eiwitten kan binden aan RING1 en BMI1 . PHD-vinger eiwitten worden universeel aangetroffen in eukaryoten en spelen een sleutelrol bij de regulering van transcriptie en chromatine structuur. PHD finger is vereist voor H3K4me3/2 binding in de AL en ING families .
PRC1 geassocieerde factor: ING1/2
AL-eiwitten komen alleen in planten voor, terwijl ING-eiwitten wijd verspreid zijn in gist, dieren en planten. ING werd voor het eerst geïdentificeerd bij zoogdieren, en alle vijf ING-eiwitten kunnen zich via PHD-vingers binden aan H3K4me3/2 en fungeren als componenten van histon-modificaties . Deze eiwitten zijn echter zelden bestudeerd in planten. Net als AL-eiwitten kunnen geconserveerde AtING-eiwitten H3K4me3/2 herkennen via PHD-vingers, terwijl de biologische functies van AtING onbekend zijn.
De meeste planten bevatten twee ING-genen (fig. 8). ING-eiwitten hebben een N-terminaal ING-domein dat bindt aan ongemodificeerde H3-staarten, en een C-terminaal PHD-domein dat nodig is voor binding van H3K4me2/3 . In tegenstelling tot vorige werken identificeerden wij VcING1/2, OlING1 en CrING1/2 homologen in groene algen. De PHD vingers in VcING2 en CrING2 zijn vervangen door de Tudor domeinen, die ook betrokken zijn bij eiwit-eiwit interacties. Het Tudor-domein kan zich binden aan de symmetrisch gedimethyleerde arginines van arginine-glycine rijke sequenties en histon H4 gedimethyleerd op Lys20 .
PRC1-geassocieerde factor: EBS/SHL
EBS en SHL zijn BAH-domein-bevattende eiwitten, die alleen in het plantenrijk worden aangetroffen en wijd verspreid zijn van lagere tot hogere planten (Fig. 1, ). Arabidopsis EBS eiwitten zijn negatieve transcriptionele regulatoren, en ebs mutaties resulteren in vroege bloei fenotypes . EBS en SHL binden zich aan verschillende bloemintegratoren, waarbij EBS de FT reguleert en SHL de SOC1 onderdrukt. EBS en SHL werken redundant in de regulatie van zaad dormantie . EBS/SHL zijn H3K27me3 lezers die ook H3K4me3 kunnen binden .
EBS/SHL proteïnen, onderverdeeld in twee clades (groep-I EBS homologs en groep-II SHL homologs). Groep-I komt voor in hogere planten, maar groep-II alleen in angiospermen. Drie EBS-homologs, PpEBSe/d/f uit mossen en EBS/SHL-homologs uit algen staan onderaan de fylogenetische boom. De meeste soorten hebben een enkele SHL kopie, maar meerdere EBS kopieën, zoals gerapporteerd in populier, katoen en mos (Figs. 1 en 9). EBS/SHL proteïnen zijn zeer geconserveerd in lengte, die varieert van 199 tot 336 aa (de meeste zijn rond 220 aa), en in domein organisatie, een N-terminaal BAH domein en een C-terminaal PHD domein (Fig. 9). PHD vinger is gerelateerd aan H3K4me2/me3, en BAH domein leest H3K27me2/me3 markering. In het algemeen correleert H3K4me3 met transcriptionele activering, terwijl H3K27me3 correleert met het uitschakelen van genen in planten en dieren. EBS bezit een BAH domein en een PHD domein die respectievelijk H3K27me2/me3 en H3K4me/me3 markeringen lezen en beïnvloeden. Bovendien medieert het BAH domein, niet de PHD vinger, de interactie van SHL of EBS met EMF1 . BAH-H3K27me3 en PHD-H3K4me3 interacties zijn belangrijk voor SHL-gemedieerde florale repressie. EBS/SHL balanceert actieve en repressieve chromatinetoestanden.