Molekylær docking er blevet et effektivt værktøj til opdagelse og optimering af ledninger. Der er blevet udviklet et stort antal dockingprogrammer i løbet af de sidste tre årtier, baseret på forskellige søgealgoritmer og scoringfunktioner. For at gøre disse dockingprogrammer mere brugervenlige, især for nybegyndere, er der udviklet forskellige grafiske brugergrænseflader (GUI’er) til at hjælpe med forberedelsen af molekylære systemer, udførelsen af beregningerne og/eller analysen af resultaterne. Eksempler på tilgængelige GUI’er (som for det meste er udviklet til AutoDock og/eller Autodock Vina ) er AutoDock Tools (ADT), der er integreret i den grafiske pakke PMV , BDT , DOVIS , VSDocker , AUDocker LE , WinDock , DockoMatic , PyMOL AutoDock plugin (PyMOL/AutoDock) , PyRx , MOLA , DockingApp og JADOPPT .
Vi præsenterer her et nyt multiplatformsværktøj, AMDock (Assisted Molecular Docking), hvis største fordel i forhold til sine forgængere er integrationen af flere værdifulde eksterne værktøjer inden for en enkel og intuitiv grafisk grænseflade, der guider brugerne langs veletablerede dockingprotokoller – ved hjælp af enten Autodock4 eller AutoDock Vina – fra systemforberedelse til analyse af resultaterne.
Funktionaliteter og arbejdsgang
AMDock integrerer funktionaliteter fra Autodock Vina og Autodock4, ADT-scripts, AutoLigand , Open Babel , PDB2PQR og PyMOL . For proteiner, der indeholder en zinkion i det aktive sted, har AMDock mulighed for at bruge de specielt skræddersyede Autodock4Zn-parametre. AMDock er kodet i Python 2.7 og er tilgængelig for Windows og Linux. På Windows er det pakket sammen med alle de integrerede værktøjer, og der kræves derfor ingen yderligere softwareinstallation. På Linux skal kun Open Babel og PyMOL installeres (begge værktøjer er inkluderet i de fleste populære Linux-repositories).
Det primære AMDock-vindue har fem faner: 1) Home, 2) Docking Options, 3) Results Analysis, 4) Configuration, og 5) Info. En oversigt over AMDocks funktionaliteter og arbejdsgang præsenteres nedenfor (fig. 1) og diskuteres efterfølgende mere detaljeret.
I fanebladet “Home” kan brugeren vælge dockingmotor: Autodock Vina eller Autodock4, med den yderligere mulighed for at bruge Autodock4Zn-parametrene. Derefter ledes brugeren automatisk til fanen “Docking Options”, som indeholder fire paneler, der guider en sekventiel forberedelse af en docking-simulering.
Inputfiler til AMDock
Minimalt er der brug for de kartesiske koordinater for ligand- og receptormolekylerne, som kan leveres i flere almindelige strukturformater, f.eks. PDB eller PDBQT for proteinet og PDB, PDBQT eller Mol2 for liganden. Hvis proteinkoordinaterne kommer sammen med en bundet ligand, gemmes koordinaterne for sidstnævnte og kan efterfølgende bruges til at definere søgerummet.
Programmet fungerer ved at følge tre hovedtrin:
- 1-
Forberedelse af docking-inputfilerne: For det første kan brugeren indstille en pH-værdi for protonering af både liganden (valgfri, standardværdi 7,4) ved hjælp af Open Babel og proteinet (standardværdi: 7,4) ved hjælp af PDB2PQR. To forskellige dockingmuligheder er tilgængelige: a) “simpel docking”, til forudsigelse af bindingsmåden for et enkelt protein-ligandkompleks, og b) “off-target docking”, til forudsigelse af bindingsmåderne for en ligand med to forskellige receptorer, dvs. målreceptoren og off-target. Endelig giver indstillingen “Scoring” i denne fane mulighed for at score et allerede eksisterende protein-ligandkompleks ved hjælp af Autodock Vina-, Autodock4- eller Autodock4Zn-funktionerne. Når docking- eller scoringsprotokollen er blevet valgt, forberedes inputfilerne ved hjælp af ADT-scripts.
- 2-
Definering af søgerummet: Fire forskellige tilgange kan anvendes til at definere en boks centrum og dimensioner: a) “Automatisk” – programmet anvender AutoLigand til at forudsige mulige bindingssteder, hvorefter en boks med optimale dimensioner centreres på hvert AutoLigand objekt,fodnote 1 ved hvert forudsagt bindingssted. b) “Center on Residue(s)” – AutoLigand anvendes til at generere et objekt med et volumen svarende til ligandens størrelse, idet det geometriske centrum af de valgte rester anvendes som reference. Derefter centreres en boks med optimale dimensioner på det genererede objekt. c) “Center on Hetero” – en boks placeres på det geometriske centrum af en eksisterende ligand (hvis receptoren blev givet i kompleks med en ligand), og d) “Box” – boksens centrum og dimensioner defineres af brugeren. Boksen, der genereres med en af disse metoder, kan visualiseres i PyMOL og let ændres, når det passer brugeren, ved hjælp af det nye AMDock-plugin (tilpasset fra ), der er indlejret i PyMOL-menuvinduet.
- 3-
Kørsel af docking-simuleringerne og analyse af resultaterne: Efter at have kørt de molekylære dockingberegninger (startet ved at klikke på “Run” knappen), vil brugeren automatisk blive ført til fanen “Results Analysis”, hvor affinitet, estimerede Ki værdier og Ligand Efficiencies er listet for de forskellige bindingspositioner.
Den estimerede Ki er en meget nyttig værdi, da den er mere relateret til normalt målte eksperimentelle parametre, sammenlignet med affiniteten. Ligand effektivitet (LE) er på den anden side en vigtig informativ parameter ved udvælgelse af en ledende forbindelse . Her beregnes LE ved hjælp af følgende ligning:
hvor ΔG er den frie bindingsenergi eller den beregnede scoreværdi, og HA er antallet af tunge (ikke-vandstof-) atomer i liganden. Forbindelser med LE > 0,3 fremhæves som potentielle leadforbindelser .
Knappen “Show in PyMOL” starter PyMOL med en tilpasset visualisering af komplekset mellem receptoren og den valgte positur (som standard vælges den ligandpositur med lavenergi (den lavenergiske ligandpositur). De resulterende data under hele processen gemmes i en fil (*.amdock), som kan bruges til at undersøge resultaterne når som helst senere.
Differente dockingparametre kan indstilles i fanen “Configuration”, mens fanen “Info”, giver adgang til praktisk dokumentation, herunder en brugermanual og referencer.
Visualisering
AMDock er afhængig af PyMOL til visualisering på to forskellige stadier: 1) opsætning af gitterboksens placering og dimensioner (søgerummet) og 2) analyse af docking-resultaterne. PyMOL er et alsidigt og brugervenligt molekylært analyseprogram, som desuden gør det muligt at skabe billeder af høj kvalitet til publikation. Vi har i AMDock kodet flere forudbestemte PyMOL-repræsentationer for de to faser, idet vi har valgt det visuelle design og de oplysninger, som vi anså for optimale i hvert enkelt tilfælde. Disse forudbestemte repræsentationer kan ændres af brugeren i PyMOL.
Søgningsrum
De forudbestemte repræsentationer (i faldende rækkefølge efter kompleksitet, alt efter antallet af elementer i visualiseringsindholdet) er følgende: 1) Box – en simpel repræsentation, hvor det undersøgte protein vises som en tegneserie sammen med boksen med de specifikationer, der er defineret af brugeren (fig. 2a); 2-Centered on Hetero – omfatter receptorproteinet (tegneserie) og boksen med en optimal størrelse centreret på den valgte tidligere ligand (pinde) (fig. 2b); 3-Centered on Residue(s) – en repræsentation, der giver brugeren mulighed for at identificere de rester, der blev valgt til at definere søgerummet. Proteinet er repræsenteret som en tegning, de valgte rester som pinde og AutoLigand-objektet som punkter. Den beregnede boks er også vist, så brugeren let kan kontrollere og (om nødvendigt) justere dens position og dimensioner (fig. 2c). 4-Automatic – Her havde vi til hensigt at skabe en forenklet repræsentation for at vise alle de bindingssteder, der er forudsagt af AutoLigand. Proteinet er tegnet som en tegneserie, og hvert AutoLigand-objekt er repræsenteret med pinde, omgivet af en overflade, der er konstrueret på dets naborester. Da der skal udføres docking-simuleringer for hvert sted, der er forudsagt af AutoLigand, genereres der en boks for hvert sted, men den vises kun for et brugervalgt sted (fig. 2d). Som nævnt ovenfor kan boksens centrum og størrelse i enhver af disse varianter let ændres ved hjælp af AMDock-plugin’et implementeret i PyMOL.
Resultater analyse
Proteinet er repræsenteret i tegneserie. Hver ligandpose er tegnet med pinde, og dens polære kontakter med proteinet er vist som stiplede linjer. En lignende visualisering er også mulig for begge proteiner, hvis “Off-Target Docking”-proceduren blev valgt (fig. 3c). Dette giver mulighed for en samtidig sammenligning af ligandposer for både målproteinerne og off-target-proteinerne.
Caseundersøgelse: SAR405 bindingsselektivitet – PI3Kγ vs. Vps34
Phosphatidylinositol 3-kinase (PI3K) er et enzym, der er involveret i vækst, proliferation, motilitet, overlevelse og intracellulær trafikering . PI3K er også et lovende kræftmål, og flere af dets inhibitorer er allerede på det kliniske stadium. Nogle få af disse hæmmere er i øjeblikket i kliniske fase III-forsøg, og en af dem, alpelisib, har for nylig (maj 2019) modtaget FDA-godkendelse til brug i behandlingen af metastatisk brystkræft.
PI3K har flere isoformer, der er grupperet i 3 forskellige klasser. Klasse I omfatter fire forskellige isoformer (α, β, γ og δ), mens klasse III kun består af ét protein, kaldet Vps34 . På grund af deres sekvens- og strukturelle ligheder kan nogle inhibitorer binde forskellige isoformer, mens flere andre inhibitorer blev designet til at være isoformspecifikke. Vores forskningsgruppe fokuserer i øjeblikket på identifikation af PI3K-hæmmere med evne til at hæmme PI3K-ortologer, der findes i forskellige patogene mikroorganismer, som kun udtrykker den forfødte Vps34-isoform. Til dette formål er AMDock et værdifuldt værktøj, især dets “Off-Target Docking”-mulighed. Her demonstrerer vi dets anvendelse med en øvelse, der ligner vores eget forskningsarbejde.
Sar405 er en meget specifik inhibitor af Vps34 (IC50 = 1,2 nM), mens dens IC50 for andre isoformer er > 104 nM . En krystalstruktur af SAR405 i kompleks med humant Vps34 er tilgængelig i Protein Data Bank (PDB-kode: 4oys). Her bruger vi den humane Vps34 som “Target”-receptor, mens PI3K gamma-isoformen (PDB: 3apf) bruges som “Off-Target”-receptor. Begge strukturer indeholder en bundet ligand i det aktive sted, hvilket er praktisk for generering af gitterboksen. I det første trin vælges dockingprogrammet (Autodock Vina), hvorefter der oprettes en projektmappe på computerens harddisk. Efter indlæsning af begge proteinstrukturer udnytter vi deres sekvenslighed til at benytte den tilgængelige mulighed for at tilpasse og overlejre deres strukturer ved hjælp af PyMOL, hvilket gør det muligt at definere et fælles søgeområde og forenkler den efterfølgende analyse af dockingresultaterne. Dernæst forberedes inputfilerne automatisk, hvilket omfatter protonering af titrerbare rester, sammensmeltning af upolære hydrogenser og fjernelse af ioner/vand. Boksens centrum er defineret på grundlag af det geometriske centrum af de bundne ligander (fig. 3a), mens boksens størrelse er defineret på grundlag af radius gyrationen for den ligand, der skal docke , dvs. SAR405-inhibitoren i dette tilfælde. Den oprindelige ligandkonformation (dens torsionsvinkler) blev randomiseret ved hjælp af ADT.
Når processen er afsluttet, viser resultaterne, at SAR405 er mere selektiv for Vps34 (- 9,2 kcal/mol) end for Pi3Kγ (- 7,3 kcal/mol) som forventet (fig. 3b). Den forudsagte bindingspose for SAR405 i Vps34 er tæt på krystalgeometrien (rmsd = 1,9 Å for alle ligandatomer, rmsd = 0,5 Å for ringkernen). Den forudsagte Ki-værdi for dette kompleks er også i det nanomolære område, hvilket stemmer overens med den eksperimentelle værdi. På den anden side er der forudsagt en meget højere Ki-værdi for Pi3Kγ-SAR405-komplekset, og den forudsagte bindingspose adskiller sig betydeligt fra den krystallografiske struktur (rmsd = 4,7), som vist i fig. 3c, hvilket kan forklare den dårlige affinitetsværdi, der er forudsagt af AutoDock Vina. Denne undersøgelsescase er blevet indarbejdet som en tutorial i brugermanualen, som er inkluderet i AMDock-installationsmappen, og wikien på Github (https://github.com/Valdes-Tresanco-MS/AMDock-win/wiki/4.3-Off-target-docking).
Diskussion
AMDock giver en ny, brugervenlig og alsidig grænseflade til at arbejde med to molekylære dockingmotorer, Autodock4 og Autodock Vina, som har forskellige funktionaliteter og karakteristika. AMDock skulle være meget nyttigt for forskere med ringe erfaring med at arbejde med dockingprogrammer, da der ikke er behov for forudgående viden om disse programmers særlige funktion. Tre forskellige arbejdsgange (simpel docking, off-target docking og scoring) er inkluderet i AMDock-miljøet. Vi finder off-target docking-proceduren særlig nyttig til udførelse af ligand-selektivitetsundersøgelser – et kritisk trin i lægemiddeldesignprocessen.
Forberedelse af inputfilerne på en korrekt og konsistent måde samt korrekt definition af søgerummet er kritiske spørgsmål, når man udfører molekylære docking-undersøgelser. Flere eksterne programmer/skripter er integreret i AMDock for at gøre det muligt at forberede inputfilerne med minimal indsats og samtidig bevare kontrollen over processen. AMDock anvender OpenBabel og PDB2PQR til henholdsvis ligand- og receptorprotonering, mens de andre GUI’er, der er nævnt i indledningen, anvender ADT til både receptor- og ligandprotonering (med undtagelse af DockingApp, som også anvender OpenBabel til ligandprotonering).
For at definere søgerummet tilbyder AMDock flere muligheder for at indstille positionen af gitterboksen i forskellige scenarier, mens inputliganden bruges som standard til at bestemme boksens optimale dimensioner, hvilket mindsker beregningsomkostningerne, samtidig med at dockingprocessen optimeres . I denne henseende er det kun ADT og PyMOL/AutoDock-plugin’et, der tilbyder nogle begrænsede muligheder ud over et brugerdefineret søgeområde, men under alle omstændigheder skal boksstørrelsen defineres af brugeren. I nogle af disse GUI’er, som i DockingApp, dækker søgerummet hele receptoren, hvilket fører til yderligere beregningsomkostninger og muligvis går ud over simulationernes nøjagtighed. Med andre GUI’er skal brugeren bruge et eksternt program som f.eks. ADT til at definere boksparametrene.
Optionen “Centered on Residue(s)” er at foretrække, når bindingsstedsresterne er kendt. Med denne indstilling genereres et objekt, der er placeret i det geometriske centrum af de valgte rester, med AutoLigand på proteinoverfladen. Denne procedure optimerer både placeringen og størrelsen af søgerummet. Hvis boksen i stedet var centreret på det geometriske centrum af de valgte rester, vil en betydelig del af den sandsynligvis være indlejret i proteinet, hvilket kræver en større størrelse for at dække det nødvendige prøveudtagningsrum (fig. 4). Alternativet “Centered on Hetero” er nyttigt til redocking-undersøgelser af komplekser med krystallografiske strukturer eller ved undersøgelse af ligander med lignende bindingsmåder (Fig. 2b). Alternativet “Automatic” er på den anden side ønskeligt, når der ikke foreligger nogen oplysninger om bindingsstedet. I dette tilfælde udføres en uafhængig dockingkørsel for hvert bindingssted, der er forudsagt af AutoLigand (fig. 2d). På denne måde kombineres oplysningerne fra AutoLigand-klassificeringsmetoden med oplysningerne fra dockingmotoren, uden at der foretages et vilkårligt valg af et af de forudsagte steder. Denne proces foregår automatisk, og resultaterne for hvert af de forudsagte bindingssteder kan visualiseres i PyMOL. Alt i alt indebærer definitionen og visualiseringen af boksen en minimal indsats og kan altid ændres, hvilket udgør en fordel ikke kun for nybegyndere, men også for eksperter.
Det er værd at bemærke, at vi standardiserede boksstørrelsen til at være i Angström for at undgå almindeligt forekommende fejl, som rapporteret i forskellige fora og mailing-lister. Disse fejl skyldes de forskellige måder, hvorpå boksdimensionerne defineres i AutoDock (antal punkter + gitterafstand) og Autodock Vina (i angstrom), og kan medføre, at søgerummet bliver meget lille eller for stort, hvilket i sidste ende fører til uoverensstemmelser i de opnåede dockingresultater.
Den integration af AMDock med PyMOL udgør en betydelig fordel. PyMOL er nemlig en meget anvendt molekylær viewer med stor fællesskabsstøtte og aktiv udvikling. I PyMOL kan dockingresultater analyseres med flere værktøjer, især med den kraftfulde Protein-ligand Interaction Profiler . Andre applikationer såsom ADT, PyRx eller DockingApp har deres egne grafiske visere. PyRx og DockingApp tilbyder enkle løsninger med begrænsede analytiske muligheder, mens ADT kun giver mulighed for simpel analyse af protein-ligand-interaktioner.
Dertil kommer, at det med AMDock er muligt at starte docking-simuleringer for metalloproteiner ved hjælp af AutoDocks Zn-kraftfelt, som i ADT kun er tilgængelig via kommandolinjen. Dets off-target docking-mulighed, der er meget nyttig til undersøgelser af lægemiddelrepurposing, er kun tilgængelig i Dockomatic og PyRx (i sidstnævnte kun i betalingsversionen).
De fleste af de GUI’er til docking er fokuseret på virtuel screening. I øjeblikket har AMDock ikke støtte til virtuel screening, men vi arbejder i øjeblikket på implementeringen heraf for at gøre den tilgængelig i den næste programversion.
Sluttelig, og da ADT sandsynligvis er den mest udbredte docking-GUI, giver vi en mere detaljeret sammenligning mellem AMDock og ADT (tabel 1).
Konklusioner
AMDock er en brugervenlig GUI, der fungerer på en meget intuitiv og interaktiv måde, og som gør det muligt at udføre molekylære dockingundersøgelser med Autodock4 og AutoDock Vina med en minimal opsætningsindsats. Disse egenskaber gør AMDock til et attraktivt værktøj også til undervisningsformål. AMDock samler funktioner og procedurer, som ikke er til stede i andre lignende programmer. Det omfatter den seneste udvikling inden for AutoDock, såsom Autodock4Zn-parameteriseringen. For vores gruppe har AMDock været meget nyttig til at vurdere selektivitetsprofilen for forskellige PI3K-hæmmere i forhold til ortologproteiner i flere mikroorganismer. Yderligere udviklinger (hydreret ligand, kovalent docking og virtuel screening) vil blive inkluderet som dockingmuligheder i fremtidige versioner.