PRC1 Kernkomponente: RING1
PRC1 RING-Finger-Proteine bestehen aus den beiden Kladen (Additional file 2) RING1 und BMI1, die beide durch eine konservierte Kombination von RING- und Ringfinger- und WD40-assoziierten Ubiquitin-ähnlichen Domänen (RAWUL) gekennzeichnet sind (Abb. 2 und 3). Die Ubiquitin-Ligase-Aktivität der Autoren des PRC1-Komplexes hängt von ihrer RING-Domäne ab. Bei Tieren ist RING1b ein wichtiger H2Aub-Schreiber, während RING1a eine untergeordnete Rolle spielt. BMI1 weist keine E3-Ligase-Aktivität auf, kann aber die Funktionen von RING1b stabilisieren und verstärken. In Arabidopsis können sowohl die AtRING1a/b- als auch die AtBMI1a/b/c-Familie H2Aub katalysieren. Im vegetativen Stadium kann AtRING1a/1b den Übergang vom Vegetativum zum Embryonalstadium und die ektopische Meristembildung unterdrücken, indem es die Fehlexpression von Embryo-Hauptregulatoren bzw. Stammzellregulatoren unterdrückt. Im Fortpflanzungsstadium zeigt die Arabidopsis-Doppelmutante ring1a;ring1b eine außerordentlich hohe Anzahl von Blütenorganen und starke Phänotypen, die ein dramatisch anschwellendes Gynoeceum und vollständige Sterilität aufweisen. Sowohl AtRING1a als auch AtRING1b können die Aufrechterhaltung der Blütenstammzellen und die korrekte Entwicklung der Karpelle kontrollieren, indem sie die KNOX-I-Expression unterdrücken. Eine RING1a/b-Mutation kann einen frühen Übergang in die vegetative Phase verursachen, indem sie den H2Aub-Status am SPL-Locus reguliert.
In einem phylogenetischen Baum können die pflanzlichen RING1-Proteine in drei Zweige unterteilt werden: Samenpflanzen (Gruppe-I), Moos-Farn (Gruppe-II) und Algen (Gruppe-III, Abb. 2). Die phylogenetische Beziehung der RING1-Homologe stimmt mit der Evolution der Pflanzen überein. RING1 hat eine bzw. zwei Duplikationen in eudikotylen bzw. monokotylen Vorfahren erfahren. Die meisten RING1-Proteine weisen in jeder Art zwei Kopien auf, aber PtRING1 und ZmRING1 kommen in vier Kopien und BrRING1 in drei Kopien vor. Die Verdopplung könnte jedoch nach der Trennung von Monokotyledonen und Dikotyledonen stattgefunden haben. RING1-Proteine in Eudikotyledonen weisen eine ähnliche Domänenorganisation auf (Abb. 2). RING1-Proteine in Monokotyledonen sind nur bei den Poaceae vertreten und weisen nur wenige variable Domänenorganisationen auf. Die typische RING-Domäne, POU, eine zweiteilige DNA-Bindungsdomäne, und das Ras-Exchanger-Motiv finden sich auch in ZmRING1a, dem Agrobacterium-VirD5-Protein, und Spectrin-Repeats-Domänen in BdRING1b. Die Prion-Domäne kommt in OsRING1b vor. Erstaunlicherweise wurde die POU-Domäne erstmals in Pflanzen identifiziert. Gruppe II kommt in Farn und Physcomitrella patens vor, während Gruppe III in zwei Algen zu finden ist. Beide Gruppen sind jedoch in der Domänenorganisation gut konserviert.
PRC1-Kernkomponente: BMI1
Die drei BMI1-ähnlichen Proteine AtBMI1a, AtBMI1b und AtBMI1c existieren in Arabidopsis. BMI1-Mangel (atbmi1a;atbmi1b-Doppelmutante) führt zu einer embryonalähnlichen Struktur im vegetativen Stadium und einer hohen Anzahl von Blütenorganen im reproduktiven Stadium, ein Merkmal, das auch bei der ring1a;ring1b-Doppelmutante zu finden ist. Ähnlich wie die RING1-Proteine fungiert BMI1a/1b als PRC1-Schreiber für H2Aub und koordiniert mit PRC2-vermitteltem H3K27me3 die Aufrechterhaltung der Zellidentität. AtBMI1a/1b fungiert als E3-Ubiquitin-Ligase und ist an der Reaktion auf Trockenheit beteiligt. MIR156A und MIR156C sind ebenfalls Zielgene von AtBMI1 und regulieren den Übergang von der pflanzlichen zur produktiven Entwicklung. Bemerkenswert ist, dass AtBMI1c als geprägtes Gen fungiert, das im Endosperm mütterlicherseits allele, im Staubblatt jedoch biallelisch exprimiert wird. BMI1-Proteine können in allen Pflanzen und in der Alge Volvox carteri identifiziert werden, jedoch nicht in den Algen Ostreococcus lucimarinus oder Chlamydomonas reinhardtii; darüber hinaus werden BMI1 in zwei Gruppen unterteilt, nämlich BMI1a/1b und BMI1c-Homologe (Abb. 3). Alle BMI1 enthalten hoch konservierte RING- und RAWUL-Domänen mit Ausnahme von BsBMI1a, PtBMI1d und OrBMI1b, wobei OrBMI1b keine RAWUL-Domäne besitzt. Die Sequenzlänge von BMI1s liegt normalerweise zwischen 350 und 550 aa, aber FvBMI1c umfasst 974 aa-Reste mit einem überlangen C-Terminus. Zweikeimblättrige Pflanzen enthalten drei Kopien von BMI1, außer Pappel und Baumwolle mit fünf Kopien und Orange mit zwei Kopien. Alle BMI1a/1b-Proteine weisen eine ähnliche Domänenorganisation auf, aber ThBMI1b besitzt neben der RING-Domäne ein weiteres TIM-Phosphat-bindendes Motiv; außerdem besitzt BdBMI1d ein flexibles Scharniermotiv der SMC-Proteine (Structural Maintenance of Chromosomes), das für die DNA-Dimerisierung verantwortlich ist und eine wesentliche Determinante der dynamischen SMC-DNA-Interaktionen darstellt. Das hoch konservierte AtBMI1c und seine Homologe kommen nur in Crucifera vor (Abb. 3).
Die RAWUL-Domäne wurde zuerst in den PRC1 RING-Fingerproteinen, den RING1- und BMI1-Familien identifiziert und ist in Pflanzen und Würmern konserviert. Die RAWUL-Domäne könnte durch Bindung an PRC1 oder andere Faktoren an der epigenetischen Regulierung beteiligt sein. Bei Säugetieren hat sich gezeigt, dass RAWUL an Ph-Homologe bindet, obwohl dieses Phänomen bisher noch nicht bestätigt wurde. Daher könnte die RAWUL-Domäne an andere Proteine binden, die an der Histon-Ubiquitinierung beteiligt sind. Sanchez-Pulido et al. schlugen vor, dass einige andere Proteine Funktionen der PRC1-Histon-Ubiquitinierung aufweisen. Arabidopsis HTA10 weist die konservierte PKKT-Konsensussequenz auf. Mais ubiquitiniertes H2A könnte an der H2A-Ubiquitinierung beteiligt sein. Das Getreide-RAWUL-Protein Gnp4/LAX2 reguliert die Kornlänge über den Auxin-Signalweg, indem es mit OsIAA3-OsARF25 interferiert. Die RAWUL-Domäne kann ein Protein-Protein-Interaktionsmodul mit der PAL-Domäne des N-Terminus von AL6 bilden, die ein assoziierter Faktor von PRC1 ist.
Die RAWUL-Domäne ist zwischen Tieren und Pflanzen nicht hoch konserviert. Eine Sequenz-Alignment-Analyse der RING1a/1b-Homologe zeigt jedoch, dass die Domänen von niederen zu höheren Pflanzen erheblich konserviert sind, und BMI1a/1b/1c fehlt β5. Die RING-Proteine (BrRING1b, ZmRING1b und SmRING) und die BMI1-Proteine (AtBMI1c, BsBMI1a, OrBMI1b und VcBMI) enthalten keine RAWUL-Domänen (Abb. 2 und 3, Additional file 3). Die RING- und RAWUL-Domänen sind möglicherweise spezielle Domänen für die RING1- und BMI1-Familien.
PRC1 Kernkomponente: LHP1
In Arabidopsis wurde LHP1, ein Aktivator und Repressor der Transkription, zuerst als ein Drodophila Heterochromatin-assoziiertes Protein 1 (HP1) Homolog identifiziert, das an H3K27m3-Marker bindet, die von PRC2 gesetzt werden, und die Monoubiquitinierung an Lysin 119 von Histon H2A katalysiert. LHP1 könnte eine analoge Rolle wie das Fliegen-Pc in einem PRC1-ähnlichen Komplex spielen. LHP1 enthält zwei typische Domänen, die Chromatin Organization Modifier (CHROMO)-Domäne, die für die Spezifität der H3K27me3-Bindung wesentlich ist, und die Chromo Shadow (ChSh)-Domäne. Im Gegensatz zu seinem tierischen Gegenstück ist LHP1 überwiegend im Euchromatin lokalisiert. Die Lokalisierung und der Verbleib von LHP1 in Fern werden durch verschiedene Domänen gesteuert, und der Verbleib im Nukleolus und in den Chromozentren wird durch die ChSh-Domäne gewährleistet. P. patens PpLHP1 interagiert mit PpCMT über deren Chromo-Domänen. Als PRC1-Leser in Pflanzen steuert LHP1 mehrere Entwicklungswege, die mit der Organentwicklung, der Zellgröße und den Übergängen von der vegetativen zur reproduktiven Phase zusammenhängen.
LHP1-Homologe durchlaufen auch die Pflanzenevolution. Abgesehen von den charakteristischen CHROMO- und ChSh-Domänen enthalten einige LHP1-Homologe weitere charakteristische Motive (Abb. 4). Zum Beispiel haben Pappel-LHP1s eine zusätzliche CDC37-Domäne in ihrem N-Terminus, und AtLHP1 umfasst eine zusätzliche B5-Domäne, die in Phenylalanin-tRNA-Synthetase-β-Untereinheiten zu finden ist. OsLHP1 besteht aus einer weiteren Peptidketten-Freisetzungsfaktor-Domäne, die mit der Proteinfamilie verbunden ist; außerdem spielt diese Domäne eine wichtige Rolle bei der Freisetzung neu synthetisierter Polypeptidketten aus Peptidyl-tRNA . BdLHP1 enthält ein weiteres ER-Membranprotein SH3, das mit membranlokalisierten Chaperonen assoziiert ist. PpLHP1 enthält eine zusätzliche Ostepontin-Domäne.
PRC1-assoziierter Faktor: EMF1
EMF1 und VRN1 werden spezifisch in zweikeimblättrigen Arten gefunden. Sowohl EMF1 als auch VRN1 sind nicht sequenzspezifische DNA-bindende Proteine, die die Genexpression während der Entwicklung der Blütenorgane regulieren. Aubert et al. betrachteten EMF1 als ein neuartiges Protein, das an der Kontrolle der Sprossarchitektur und der Blüte in Arabidopsis beteiligt ist; außerdem verursachen EMF1-Funktionsverlustmutanten einen beschleunigten Übergang von der Embryonal- zur Reproduktionsentwicklung. EMF1 und EMF2 sind am PcG-vermittelten Silencing von homöotischen Blütengenen beteiligt und für die vegetative Entwicklung von entscheidender Bedeutung. EMF1, ATX1 und ULT1 können zusammenarbeiten, um die Integrität des Chromatins aufrechtzuerhalten und eine frühzeitige Expression von Samengenen nach der Keimung zu verhindern. EMF1 ist mit einem H3K27me3-Leser verbunden, der für H3K27me3 erforderlich ist. EMF1, LHP1 und die Histon-H3-Lysin-4-Demethylase können einen EMF1c-Komplex bilden, der eine wichtige Rolle bei der Regulierung von MIR172 und Flowering Locus T (FT) spielt.
Jede Spezies beherbergt ein einzelnes homologes EMF1-Gen, außer Gurke, Baumwolle und Eutrema mit zwei und Kohl mit vier. Die phylogenetische Analyse zeigt, dass EMF1 in zweikeimblättrigen Pflanzen gut konserviert sind, aber möglicherweise repräsentative oder intakte Domänen in der Pfam- und SMART-Datenbank fehlen. Das Proteinsequenz-Alignment deutet auf sechs konservierte Motive hin, insbesondere Motiv 4, 5 und 6 (Abb. 5, Additional file 4), deren Funktionen unbekannt sind.
PRC1-assoziierter Faktor: VRN1
VRN1 und VAL1/2/3 sind pflanzenspezifische Komponenten von PRC1 und gehören zur Familie der pflanzenspezifischen B3-Domänen-Transkriptionsfaktoren (Zusatzdatei 5). Ähnlich wie EMF1 können die VRN-Gene von Arabidopsis die Vernalisation vermitteln und spielen eine wichtige Rolle beim Übergang von der vegetativen zur reproduktiven Phase als Reaktion auf eine längere Kältebehandlung. VRN1 lokalisiert sich im Zellkern und ist sequenzunspezifisch bei der DNA-Bindung, der Ausrichtung auf FLC und FT2 . Loss-of-function-Mutanten zeigen ähnliche Phänotypen wie andere PRC1-Mutanten.
VRN1 und seine Homologe werden in zwei Gruppen eingeteilt, AtVRN1a/RTV1 und AtVRN1b/1c/1d. Die B3-Domäne ist möglicherweise eine spezielle Domäne der VRN1-Familie (71, Abb. 6). AtVRN1, das in dieser Studie AtVRN1a genannt wird, ist durch zwei B3-Domänen charakterisiert, kommt nur in höheren Pflanzenarten vor und bindet spezifisch an DNA. In der aktuellen Studie wurden fünf VRN1-Homologe in Arabidopsis identifiziert, und mehrere Homologe wurden auch in anderen Zweikeimblättrigen durch BlastP gefunden. Die Domänenorganisation zeigte, dass AtVRN1a und seine Homologe aus zwei B3-Domänen bestehen (Abb. 6). AtRTV1, AtVRN1b/1c/1d und ihre Homologe hauptsächlich in Gruppe II weisen einen Verlust der zweiten B3-Domäne auf, die für ihre Funktionen wichtig sein könnte. Diese Domäne wird durch die Superfamilie BfiI_C_EcoRII_N_B3 ersetzt, die eine N-terminale DNA-Bindungsdomäne von Typ-IIE-restringierten Endonuklease-EcoRII-ähnlichen Proteinen, eine C-terminale DNA-Bindungsdomäne von Typ-IIS-restringierten Endonuklease-BfiI-ähnlichen Proteinen und pflanzenspezifische B3-Proteine enthält .
PRC1-assoziierter Faktor: VAL1/2/3
VAL-Proteine, die als Transkriptionsrepressoren identifiziert wurden, sind für die globale Unterdrückung der embryonalen Genexpression erforderlich. Die Keimlinge der va l1-val2-Doppelmutante können in Wurzeln und apikalem Meristem embryoähnliche Wucherungen ausbilden, nicht aber in Blättern. Val2/val3-Mutanten weisen ähnliche dominante Effekte auf wie die homozygoten val1-Mutanten. In val1-Mutanten sind 39 % der Transkripte des FUSCA3-Regulators unterdrückt, die zentralen Transkriptionsfaktoren des LAFL-Netzwerks dagegen nicht. Alle mutmaßlichen Zieltranskripte von VAL1 wirken durch epigenetische und/oder transkriptionelle Unterdrückung. Darüber hinaus sind VAL1 und VAL2 über PcG an der Vernalisation beteiligt. VAL-Proteine arbeiten mit BMI1 zusammen, um die Monoubiquitylierung von H2AK119 zu vermitteln und die Repression von Samenreifungsgenen einzuleiten. VAL-Proteine vermitteln die Unterdrückung durch die Rekrutierung eines Histon-Deacetylase-Komplexes an LEC1/AFL-Gene. VAL1 unterdrückt die FLC-Transkription durch Förderung der Histondeacetylierung . VAL1 reguliert AGL15 durch Ablagerung von H3K27me3 an den stromaufwärts gelegenen Sequenzen von AGL15 herunter.
Abgesehen von den B3- und zf-CW-Domänen, die mögliche Spezialdomänen für die VAL1/2/3-Familie sind, tragen die meisten VAL1/2/3-Homologe zusätzliche Zinkfingermotive, wie PHD und ZnF-GATA, am 3′-Terminus (Abb. 7). Die VAL1-B3-Domäne ist für die Interaktion mit dem kanonischen Sph/RY-Element in AGL15 und FLC erforderlich. Die zf-CW-Domäne gehört zu den Modulen der Histonmodifikationsleser für die epigenetische Regulation. In der aktuellen Studie wird die VRN1-Familie nur in Dikotyledonen gefunden (Abb. 6) und ihre Homologe enthalten eine oder zwei B3-Domänen. Im Gegensatz dazu sind VAL1/2/3-Proteine von Algen bis zu Angiospermen zu finden und enthalten nur eine B3-Domäne. Außerdem können VAL1/2/3-Proteine in drei Gruppen eingeteilt werden (Abb. 7). Gruppe-I-haltige VAL1-Homologe kommen nur in Dikotyledonen vor; Gruppe-II-haltige VAL2-Homologe und Gruppe-III-haltige VAL3-Homologe sind sowohl in Dikotyledonen als auch in Monokotyledonen zu finden. Wie unsere Ergebnisse zeigen, weisen Alge und Farn nur ein VAL-homologes Protein auf, während Moos fünf Mitglieder aufweist und O. lucimarinus kein einziges.
PRC1-assoziierter Faktor: AL1-7
AL-Proteine, die eine konservierte PHD-Domäne tragen, wurden als Transkriptionsfaktor identifiziert. Die Alfin-Proteine von Arabidopsis gelten als H3K4me2/3-Leser und fungieren als neue Partner von AtRING1 und AtBMI1. Das AL-Protein ist an vielen Entwicklungsprozessen beteiligt, z. B. an der Verstärkung der MsPRP2-Expression in Alfalfa-Wurzeln und trägt zur Salztoleranz bei. In Arabidopsis können sowohl AL1 als auch AL5 an die Promotorregionen von Zielgenen binden und mehrere negative Faktoren unterdrücken, um abiotische Stresstoleranz zu verleihen. Arabidopsis AL6 ist an der Regulierung der Expression von Transkripten beteiligt, die mit der Wurzelhaarverlängerung bei Phosphatmangel zusammenhängen; dieser Prozess ist auf seine PHD-Domäne zurückzuführen, die an H3K4me3 binden kann, was eine epigenetische Regulierungsstrategie bei geringer Phosphatverfügbarkeit ist. AtAL7 spielt jedoch eine negative Rolle bei der Salztoleranz. In der aktuellen Studie teilen sich die AL- und ING-Familien die PHD-Domäne, und der phylogenetische Baum zeigt, dass sie zu verschiedenen Zweigen gehören, was auf ihre enge Beziehung hindeutet (Additional file 6). Die ALs-Familie ist die größte PRC1-assoziierte Faktor-Familie. In Arabidopsis gibt es sieben ALs, die in drei Gruppen unterteilt werden können: AtAL1/2, AtAL3/4/5 und AtAL6/7. In der aktuellen Studie können die AL-Proteine von Samenpflanzen in drei Gruppen unterteilt werden, nämlich Gruppe I (AL1/2), Gruppe II (AL3/4/5) und Gruppe III (AL6/7). Die AL-Proteine der Sporenpflanzen befinden sich am unteren Ende des Stammbaums (Abb. 7). Mais und Baumwolle umfassen mehr AL-Proteinmitglieder als andere Arten.
Abgesehen von FvAL5, das 687aa mit drei Alfin-Domänen und einer PHD-Domäne umfasst, sind die meisten Pflanzen in der Domänenorganisation extrem konserviert, d.h. eine Alfin-Domäne und PHD, und weisen eine Sequenzlänge von etwa 230-300aa auf. (Abb. 7, Additional file 1). Eine Alfin- und eine PHD-Domäne, die spezielle Domäne für die AL-Familie, sind auf dem N- oder C-Terminus der Proteine verteilt. Das PAL-Motiv, das sich in der Alfin-Domäne befindet, kann bei AL2- und AL7-Proteinen an RING1 und BMI1 binden. PHD-Finger-Proteine sind in Eukaryonten weit verbreitet und spielen eine wichtige Rolle bei der Regulierung der Transkription und der Chromatinstruktur. PHD-Finger sind für die H3K4me3/2-Bindung in den AL- und ING-Familien erforderlich.
PRC1-assoziierter Faktor: ING1/2
AL-Proteine kommen nur in Pflanzen vor, während ING-Proteine in Hefe, Tieren und Pflanzen weit verbreitet sind. ING wurde erstmals bei Säugetieren identifiziert, und alle fünf ING-Proteine können über PHD-Finger an H3K4me3/2 binden und als Komponenten von Histonmodifikationen wirken. Diese Proteine wurden jedoch nur selten in Pflanzen untersucht. Ähnlich wie die AL-Proteine können die konservierten AtING-Proteine H3K4me3/2 über PHD-Finger erkennen, während die biologischen Funktionen von AtING unbekannt sind.
Die meisten Pflanzen enthalten zwei ING-Gene (Abb. 8). ING-Proteine tragen eine N-terminale ING-Domäne, die an unmodifizierte H3-Schwänze bindet, und eine C-terminale PHD-Domäne, die für die Bindung von H3K4me2/3 notwendig ist. Im Gegensatz zu früheren Arbeiten konnten wir in Grünalgen Homologe von VcING1/2, OlING1 und CrING1/2 identifizieren. Die PHD-Finger in VcING2 und CrING2 sind durch die Tudor-Domänen ersetzt, die ebenfalls an Protein-Protein-Wechselwirkungen beteiligt sind. Die Tudor-Domäne kann an die symmetrisch dimethylierten Arginine von Arginin-Glycin-reichen Sequenzen und an Histon H4, das an Lys20 dimethyliert ist, binden.
PRC1-assoziierter Faktor: EBS/SHL
EBS und SHL sind BAH-Domänen-haltige Proteine, die nur im Pflanzenreich vorkommen und von niederen bis zu höheren Pflanzen weit verbreitet sind (Abb. 1, ). Die EBS-Proteine der Ackerschmalwand sind negative Transkriptionsregulatoren, und EBS-Mutationen führen zu Phänotypen der frühen Blüte. EBS und SHL binden an verschiedene Blütenintegratoren, wobei EBS FT reguliert und SHL SOC1 unterdrückt. EBS und SHL wirken redundant bei der Regulierung der Samenruhe. EBS/SHL sind H3K27me3-Leser, die auch H3K4me3 binden können.
EBS/SHL-Proteine, die in zwei Gruppen eingeteilt sind (Gruppe-I-EBS-Homologe und Gruppe-II-SHL-Homologe). Gruppe I kommt in höheren Pflanzen vor, Gruppe II jedoch nur in Angiospermen. Drei EBS-Homologe, PpEBSe/d/f aus Moosen und EBS/SHL-Homologe aus Algen, befinden sich am unteren Ende des Stammbaums. Die meisten Arten enthalten eine einzige SHL-Kopie, aber mehrere EBS-Kopien, wie bei Pappel, Baumwolle und Moos berichtet (Abb. 1 und 9). EBS/SHL-Proteine sind in ihrer Länge, die von 199 bis 336 aa reicht (die meisten liegen bei 220 aa), und in ihrer Domänenorganisation, einer N-terminalen BAH-Domäne und einer C-terminalen PHD-Domäne, stark konserviert (Abb. 9). Der PHD-Finger ist mit H3K4me2/me3 verbunden, und die BAH-Domäne liest die H3K27me2/me3-Markierung ab. Im Allgemeinen korreliert H3K4me3 mit der Transkriptionsaktivierung, während H3K27me3 mit dem Gen-Silencing in Pflanzen und Tieren korreliert. EBS besitzt eine BAH-Domäne und eine PHD-Domäne, die H3K27me2/me3- bzw. H3K4me/me3-Markierungen ablesen und beeinflussen. Außerdem vermittelt die BAH-Domäne, nicht der PHD-Finger, die Interaktion von SHL oder EBS mit EMF1. BAH-H3K27me3- und PHD-H3K4me3-Interaktionen sind wichtig für die SHL-vermittelte florale Repression. EBS/SHL gleicht aktive und repressive Chromatinzustände aus.