Molecular docking is een krachtig hulpmiddel geworden voor lead discovery en optimalisatie. Een groot aantal docking programma’s zijn ontwikkeld gedurende de laatste drie decennia, gebaseerd op verschillende zoekalgoritmen en scoringsfuncties. Om deze docking programma’s gebruiksvriendelijker te maken, vooral voor beginners, zijn verschillende grafische gebruikersinterfaces (GUIs) ontwikkeld om te helpen bij de voorbereiding van moleculaire systemen, de uitvoering van de berekeningen en/of de analyse van de resultaten. Voorbeelden van beschikbare GUIs (meestal ontwikkeld voor AutoDock en/of Autodock Vina ) zijn AutoDock Tools (ADT), geïntegreerd in het PMV grafisch pakket , BDT , DOVIS , VSDocker , AUDocker LE , WinDock , DockoMatic , PyMOL AutoDock plugin (PyMOL/AutoDock) , PyRx , MOLA , DockingApp en JADOPPT .

Wij presenteren hier een nieuwe multi-platform tool, AMDock (Assisted Molecular Docking), waarvan het belangrijkste voordeel ten opzichte van zijn voorgangers is de integratie van verschillende waardevolle externe tools binnen een eenvoudige en intuïtieve grafische interface die de gebruikers langs gevestigde docking protocollen leidt – met behulp van ofwel Autodock4 of AutoDock Vina – van systeem voorbereiding tot analyse van de resultaten.

Functionaliteiten en workflow

AMDock integreert functionaliteiten van Autodock Vina en Autodock4, ADT-scripts, AutoLigand , Open Babel , PDB2PQR en PyMOL . Voor eiwitten die een zink-ion in de actieve site bevatten, heeft AMDock de mogelijkheid om de speciaal aangepaste Autodock4Zn parameters te gebruiken. AMDock is gecodeerd in Python 2.7 en is beschikbaar voor Windows en Linux. Op Windows is het samen met alle geïntegreerde tools verpakt, zodat geen extra software-installatie nodig is. Op Linux moeten alleen Open Babel en PyMOL worden geïnstalleerd (beide tools zijn opgenomen in de meeste populaire Linux repositories).

Het AMDock hoofdvenster heeft vijf tabbladen: 1) Home, 2) Docking Options, 3) Results Analysis, 4) Configuration, en 5) Info. Een samenvatting van de functionaliteiten en de workflow van AMDock wordt hieronder gepresenteerd (Fig. 1) en daarna in meer detail besproken.

Fig. 1
figure1

AMDock-workflow

In het tabblad “Home” kan de gebruiker de docking-engine selecteren: Autodock Vina of Autodock4, met de extra optie om de Autodock4Zn parameters te gebruiken. Vervolgens wordt de gebruiker automatisch naar het tabblad “Docking Options” geleid, dat vier panelen bevat die een sequentiële voorbereiding van een docking-simulatie begeleiden.

Invoerbestanden voor AMDock

Minimaal zijn de cartesische coördinaten van de ligand- en receptormoleculen nodig, die in verschillende gangbare structuurformaten kunnen worden geleverd, bijv. PDB of PDBQT voor het eiwit, en PDB, PDBQT of Mol2 voor het ligand. Als de eiwitcoördinaten samenkomen met een gebonden ligand, worden de coördinaten van de laatste opgeslagen en kunnen naderhand worden gebruikt om de zoekruimte te definiëren.

Het programma werkt door drie hoofdstappen te volgen:

  1. 1-

    Voorbereiding van de docking-invoerbestanden: Eerst kan de gebruiker een pH-waarde instellen voor de protonering van zowel het ligand (optioneel, standaardwaarde 7,4), met behulp van Open Babel, als het eiwit (standaardwaarde: 7,4), met PDB2PQR. Er zijn twee verschillende docking-opties beschikbaar: a) “simple docking”, voor het voorspellen van de bindingsmodus van een enkel eiwit-ligand complex, en b) “off-target docking”, voor het voorspellen van de bindingsposities van een ligand met twee verschillende receptoren, d.w.z. het doelwit en het off-target. Tenslotte maakt de “Scoring” optie in dit tabblad het mogelijk om een reeds bestaand eiwit-ligand complex te scoren, met behulp van de Autodock Vina, Autodock4 of Autodock4Zn functies. Zodra het docking of scoring protocol is geselecteerd, worden de invoerbestanden voorbereid met behulp van ADT scripts.

  2. 2-

    Het definiëren van de zoekruimte: Vier verschillende benaderingen kunnen worden gebruikt om een box center en afmetingen te definiëren: a) “Automatisch” – het programma gebruikt AutoLigand om mogelijke bindingsplaatsen te voorspellen en vervolgens wordt een box met optimale afmetingen gecentreerd op elk AutoLigand object,Voetnoot 1 op elke voorspelde bindingsplaats. b) “Center on Residue(s)” – AutoLigand wordt gebruikt om een object te genereren met een volume dat overeenkomt met de ligand grootte, met als referentie het geometrische centrum van de geselecteerde residuen. Vervolgens wordt een doos met optimale afmetingen op het gegenereerde object gecentreerd. c) “Center on Hetero” – een doos wordt op het geometrische middelpunt van een bestaande ligand geplaatst (als de receptor in complex met een ligand is gegeven), en d) “Box” – het middelpunt en de afmetingen van de doos worden door de gebruiker gedefinieerd. De box gegenereerd met een van deze methoden kan worden gevisualiseerd in PyMOL en gemakkelijk worden gewijzigd op het gemak van de gebruiker met behulp van de nieuwe AMDock plugin (aangepast van ) ingebed in het PyMOL menuvenster.

  3. 3-

    Het uitvoeren van de docking simulaties en het analyseren van de resultaten: Na het uitvoeren van de moleculaire dockingberekeningen (gestart door op de knop “Run” te klikken), wordt de gebruiker automatisch naar het tabblad “Results Analysis” gebracht, waar de affiniteit, de geschatte Kiwaarden en de ligandefficiënties worden vermeld voor de verschillende bindingsposities.

De geschatte Ki is een zeer nuttige waarde, aangezien deze meer gerelateerd is aan de gewoonlijk gemeten experimentele parameters, in vergelijking met de affiniteit. Ligand efficiency (LE), anderzijds, is een belangrijke informatieve parameter bij de selectie van een lead verbinding. Hier wordt LE berekend met behulp van de volgende vergelijking:

$$ LE=Volrac{- Delta G}{HA}, $$
(1)

waarbij ΔG de vrije energie van binding of de berekende scorewaarde is en HA het aantal zware (niet-waterstof) atomen van het ligand. Verbindingen met LE > 0.3 worden gemarkeerd als potentiële lead-verbindingen.

De knop “Show in PyMOL” start PyMOL met een aangepaste visualisatie van het complex tussen de receptor en de gekozen pose (standaard wordt de ligand pose met de laagste energie gekozen). De resulterende gegevens gedurende het proces worden opgeslagen in een bestand (*.amdock), dat kan worden gebruikt om de resultaten op elk gewenst moment later te onderzoeken.

Verschillende docking parameters kunnen worden ingesteld in de “Configuratie” tab, terwijl de “Info” tab, toegang geeft tot handige documentatie, waaronder een gebruikershandleiding en referenties.

Visualisatie

AMDock vertrouwt op PyMOL voor visualisatie in twee verschillende stadia: 1) het instellen van de locatie en afmetingen van de gridbox (de zoekruimte), en 2) de analyse van de dockingresultaten. PyMOL is een veelzijdig en gebruiksvriendelijk programma voor moleculaire analyse, waarmee bovendien afbeeldingen van hoge kwaliteit kunnen worden gemaakt voor publicatie. Wij hebben in AMDock verschillende voorgedefinieerde PyMOL representaties voor de twee fasen gecodeerd, waarbij wij de visuele vormgeving en informatie hebben gekozen die wij in elk geval optimaal achtten. Deze voorgedefinieerde representaties kunnen door de gebruiker binnen PyMOL gewijzigd worden.

Zoekruimte

De voorgedefinieerde representaties (in aflopende volgorde van complexiteit, volgens het aantal elementen in de visualisatie-inhoud) zijn de volgende: 1) Box – een eenvoudige voorstelling waarin het bestudeerde eiwit als cartoon verschijnt, samen met de box met de door de gebruiker gedefinieerde specificaties (Fig. 2a); 2-Centered on Hetero – omvat het receptoreiwit (cartoon) en de box met een optimale grootte gecentreerd op het geselecteerde vorige ligand (staafjes) (Fig. 2b); 3-Centered on Residue(s) – een voorstelling die de gebruiker toelaat de residuen te identificeren die werden geselecteerd om de zoekruimte te definiëren. Het eiwit wordt voorgesteld als een cartoon, de geselecteerde residuen als stokjes en het AutoLigand object als punten. De berekende box wordt ook getoond, zodat de gebruiker gemakkelijk de positie en afmetingen ervan kan controleren en (indien nodig) aanpassen (Fig. 2c). 4-Automatisch – Hier wilden we een vereenvoudigde voorstelling maken om alle door AutoLigand voorspelde bindingsplaatsen te tonen. Het eiwit is in cartoon weergegeven, elk AutoLigand object is weergegeven in staafjes, omgeven door een oppervlak geconstrueerd op zijn naburige residuen. Aangezien docking-simulaties moeten worden uitgevoerd voor elke door AutoLigand voorspelde plaats, wordt voor elke plaats een vakje gegenereerd, maar alleen getoond voor een door de gebruiker geselecteerde plaats (fig. 2d). Zoals hierboven vermeld, kunnen in elk van deze varianten het midden en de grootte van de box gemakkelijk worden gewijzigd met behulp van de AMDock-plugin die in PyMOL is geïmplementeerd.

Fig. 2
figure2

Binding site visualisatie met PyMOL. a Door gebruiker gedefinieerde box. Dit is een voorbeeld dat is gebruikt in tutorials met AutoDock4Zn en farnesyltransferase (hFTase). b Gecentreerd op Hetero, (c) Gecentreerd op Residu(s) en (d) Automatische modus. Voorstellingen B, C en D komen overeen met Vps34 (PDB: 4uwh)

Resultaten analyse

Het eiwit is weergegeven in cartoon. Elke ligandpositie is getekend in staafjes en de polaire contacten met het eiwit zijn weergegeven als stippellijnen. Een soortgelijke visualisatie is ook mogelijk voor beide eiwitten als de “Off-Target Docking” procedure is gekozen (Fig. 3c). Dit maakt een gelijktijdige vergelijking mogelijk van ligandposities voor zowel de doeleiwitten als de off-target-eiwitten.

Fig. 3
figure3

Off-target docking van SAR405. a Visualisatie van de zoekruimte voor docking, gecentreerd op bekende liganden. b Vergelijking van de affiniteit. c Superpositie van de beste pose van SAR405 in complex met PI3Kγ (3apf) (eiwit in cyaan cartoon en ligand in magenta staafjes) op het referentiecomplex Vps34-SAR405 (4oys) (eiwit in grijs cartoon en ligand in groene staafjes)

Casestudie: SAR405 bindingselectiviteit – PI3Kγ vs. Vps34

Phosphatidylinositol 3-kinase (PI3K) is een enzym dat betrokken is bij groei, proliferatie, motiliteit, overleving, en intracellulaire trafficking . PI3K is ook een veelbelovend kankerdoelwit, waarvan verschillende remmers zich reeds in het klinische stadium bevinden. Een paar van deze remmers bevinden zich momenteel in fase III klinische studies en een van hen, alpelisib, heeft onlangs (mei 2019) de goedkeuring van de FDA gekregen voor gebruik bij de behandeling van uitgezaaide borstkanker.

PI3K heeft verschillende isovormen die zijn gegroepeerd in 3 verschillende klassen. Klasse I omvat vier verschillende isovormen (α, β, γ en δ), terwijl klasse III uit slechts één eiwit bestaat, Vps genaamd34 . Wegens hun sequentie en structurele gelijkenissen kunnen sommige remmers verschillende isovormen binden, terwijl verschillende andere remmers werden ontworpen om isovormspecifiek te zijn. Onze onderzoeksgroep richt zich momenteel op de identificatie van PI3K-remmers die in staat zijn om PI3K-orthologs te remmen die gevonden worden in verschillende pathogene micro-organismen, die alleen de voorouderlijke Vps34-isovorm tot expressie brengen. Voor dit doel is AMDock een waardevol hulpmiddel, met name de “Off-Target Docking” optie. Hier demonstreren we het gebruik ervan met een oefening die lijkt op ons eigen onderzoekswerk.

Sar405 is een zeer specifieke remmer van Vps34 (IC50 = 1.2 nM), terwijl zijn IC50 voor andere isovormen > 104 nM is. Een kristalstructuur van SAR405 in complex met menselijke Vps34 is beschikbaar in de Protein Data Bank (PDB code: 4oys). Hier gebruiken we de menselijke Vps34 als de “Target” receptor, terwijl de PI3K gamma isovorm (PDB: 3apf) wordt gebruikt als de “Off-Target” receptor. Beide structuren bevatten een gebonden ligand in de actieve site, wat handig is voor het genereren van de grid box. In de eerste stap selecteren we het dockingprogramma (Autodock Vina) en vervolgens wordt een projectmap gemaakt op de harde schijf van de computer. Nadat beide eiwitstructuren zijn geladen, maken we gebruik van hun sequentieovereenkomst om de beschikbare optie te gebruiken voor het uitlijnen en over elkaar leggen van hun structuren met behulp van PyMOL, wat het mogelijk maakt een gemeenschappelijke zoekruimte te definiëren en de daaropvolgende analyse van de dockingresultaten te vereenvoudigen. Vervolgens worden de invoerbestanden automatisch voorbereid, inclusief protonering van titreerbare residuen, samenvoeging van apolaire hydrogenen en ion/waterverwijdering. Het middelpunt van de box wordt gedefinieerd op basis van het geometrische middelpunt van de gebonden liganden (Fig. 3a), terwijl de grootte van de box wordt gedefinieerd op basis van de radius van gyratie van het ligand dat gedockt moet worden, in dit geval dus de SAR405 inhibitor. De initiële ligandconformatie (de torsiehoeken) is gerandomiseerd met behulp van ADT.

Als het proces is voltooid, laten de resultaten zien dat SAR405 selectiever is voor Vps34 (- 9.2 kcal/mol) dan voor Pi3Kγ (- 7.3 kcal/mol), zoals verwacht (Fig. 3b). De voorspelde bindingspose voor SAR405 in Vps34 ligt dicht bij de kristalgeometrie (rmsd = 1.9 Å voor alle ligandatomen, rmsd = 0.5 Å voor de ringkern). Ook ligt de voorspelde Ki waarde voor dit complex in het nanomolaire bereik, wat overeenkomt met de experimentele waarde. Aan de andere kant wordt een veel hogere Ki waarde voorspeld voor het Pi3Kγ-SAR405 complex, en de voorspelde bindingspose verschilt aanzienlijk van de kristallografische structuur (rmsd = 4.7), zoals te zien is in Fig. 3c, wat de slechte affiniteitswaarde voorspeld door AutoDock Vina kan verklaren. Deze studie casus is opgenomen als een tutorial in de handleiding, die is opgenomen in de AMDock installatie map, en de wiki op Github (https://github.com/Valdes-Tresanco-MS/AMDock-win/wiki/4.3-Off-target-docking).

Discussie

AMDock biedt een nieuwe, eenvoudig te gebruiken en veelzijdige interface om te werken met twee moleculaire docking engines, Autodock4 en Autodock Vina, met verschillende functionaliteiten en kenmerken. AMDock zou zeer nuttig moeten zijn voor onderzoekers met weinig ervaring in het werken met docking programma’s, aangezien geen voorkennis van de specifieke werking van deze programma’s nodig is. Drie verschillende workflows (simple docking, off-target docking en scoring) zijn opgenomen in de AMDock omgeving. Wij vinden de off-target docking procedure bijzonder nuttig voor het uitvoeren van ligand selectiviteit studies – een kritische stap in het drug design proces.

Het op een juiste en consistente manier voorbereiden van de invoer bestanden, alsmede het correct definiëren van de zoekruimte, zijn kritische kwesties bij het uitvoeren van moleculaire docking studies. Verschillende externe programma’s/scripts zijn geïntegreerd in AMDock om de invoerbestanden met minimale inspanning voor te bereiden terwijl de controle over het proces behouden blijft. AMDock gebruikt OpenBabel en PDB2PQR voor respectievelijk ligand- en receptorprotonatie, terwijl de andere GUI’s die in de inleiding worden genoemd ADT gebruiken voor zowel receptor- als ligandprotonatie (met uitzondering van DockingApp, die ook OpenBabel gebruikt voor ligandprotonatie).

Om de zoekruimte te definiëren, biedt AMDock verschillende opties om de positie van de grid box in verschillende scenario’s in te stellen, terwijl de input ligand standaard wordt gebruikt om de box optimale afmetingen te bepalen, wat de computationele kosten verlaagt terwijl het docking proces wordt geoptimaliseerd . In dit opzicht bieden alleen ADT en de PyMOL/AutoDock plugin enkele beperkte opties anders dan een door de gebruiker gedefinieerde zoekruimte, maar in elk geval moet de grootte van de box door de gebruiker worden gedefinieerd. In sommige van deze GUIs, zoals in DockingApp, beslaat de zoekruimte de hele receptor, wat leidt tot extra computerkosten en mogelijk de nauwkeurigheid van de simulaties in gevaar brengt. Bij andere GUIs moet de gebruiker een externe applicatie zoals ADT gebruiken om de box parameters te definiëren.

De “Centered on Residue(s)” optie verdient de voorkeur wanneer de bindingsplaats residuen bekend zijn. Met deze optie wordt met AutoLigand een object gegenereerd op het geometrische middelpunt van de geselecteerde residuen op het eiwitoppervlak. Deze procedure optimaliseert zowel de plaats als de grootte van de zoekruimte. Als de box in plaats daarvan was gecentreerd op het geometrische centrum van de geselecteerde residuen, zal een aanzienlijk deel ervan waarschijnlijk worden ingebed in het eiwit, waardoor een grotere grootte nodig is om de benodigde bemonsteringsruimte te bestrijken (Fig. 4). Het “Centered on Hetero” alternatief is nuttig voor redocking studies op complexen met kristallografische structuren of bij het bestuderen van liganden met vergelijkbare bindingsmodi (Fig. 2b). De “Automatic” optie daarentegen is wenselijk wanneer er geen informatie over de bindingsplaats beschikbaar is. In dit geval wordt voor elke door AutoLigand voorspelde bindingsplaats een onafhankelijke docking-run uitgevoerd (Fig. 2d). Op deze manier wordt de informatie van de AutoLigand ranking methode gecombineerd met die van de docking engine, zonder een willekeurige selectie te maken van één van de voorspelde sites. Dit proces wordt automatisch uitgevoerd en de resultaten voor elk van de voorspelde bindingsplaatsen kunnen in PyMOL worden gevisualiseerd. Over het geheel genomen vergt de definitie en visualisatie van de box een minimale inspanning en kan deze altijd worden aangepast, wat niet alleen een voordeel is voor de beginnende gebruiker, maar ook voor experts.

Fig. 4
figure4

Vergelijking tussen een vak (wit) dat zich bevindt in het geometrische middelpunt van de geselecteerde residuen (A:ILE:634, A:TYR:670, A:PHE:684, A:PHE:758, A:ILE:760; in zalm) en een vak (magenta) dat zich bevindt in het middelpunt van een object dat door AutoLigand wordt gegenereerd vanuit het geometrische middelpunt van de geselecteerde residuen. In het laatste geval definieert de box een meer optimale ligandbemonsteringsruimte

Het is vermeldenswaard dat we de boxgrootte hebben gestandaardiseerd in Angstroms om veel voorkomende fouten te vermijden, zoals gerapporteerd in verschillende forums en mailing-lists. Deze fouten komen voort uit de verschillende manieren waarop de box-afmetingen zijn gedefinieerd in AutoDock (aantal punten + rasterafstand) en Autodock Vina (in angstroms), en kunnen ertoe leiden dat de zoekruimte erg klein of te groot is, wat uiteindelijk leidt tot inconsistenties in de verkregen docking-resultaten.

De integratie van AMDock met PyMOL is een belangrijk voordeel. PyMOL is namelijk een veelgebruikte moleculaire viewer met grote steun van de gemeenschap en actieve ontwikkeling. Binnen PyMOL kunnen docking resultaten worden geanalyseerd met meerdere tools, in het bijzonder met de krachtige Protein-ligand Interaction Profiler . Andere toepassingen zoals ADT, PyRx of DockingApp hebben hun eigen grafische viewers. PyRx en DockingApp bieden eenvoudige oplossingen met beperkte analytische mogelijkheden, terwijl ADT alleen een eenvoudige analyse van eiwit-ligand interacties mogelijk maakt.

Daarnaast is het met AMDock mogelijk om docking simulaties voor metalloproteïnen te starten met behulp van het AutoDock Zn krachtveld, dat in ADT alleen beschikbaar is via de opdrachtregel. De off-target docking optie, zeer nuttig voor drug repurposing studies, is alleen beschikbaar in Dockomatic en PyRx (in de laatste alleen in de betaalversie).

De meeste docking GUIs zijn gericht op virtuele screening. Op dit moment heeft AMDock geen ondersteuning voor virtuele screening, maar we werken momenteel aan de implementatie ervan, om het beschikbaar te maken in de volgende programmaversie.

Finitief, en omdat ADT waarschijnlijk de meest gebruikte docking GUI is, geven we een meer gedetailleerde vergelijking tussen AMDock en ADT (tabel 1).

Tabel 1 Vergelijking van AMDock en AutoDock Tools kenmerken

Conclusies

AMDock is een gebruiksvriendelijke GUI die werkt op een zeer intuïtieve en interactieve manier, waardoor het mogelijk is om moleculaire docking studies uit te voeren met Autodock4 en AutoDock Vina met een minimale setup inspanning. Deze eigenschappen maken AMDock ook voor onderwijsdoeleinden een aantrekkelijk hulpmiddel. AMDock bevat functies en procedures die niet aanwezig zijn in andere vergelijkbare programma’s. Het omvat recente ontwikkelingen in AutoDock, zoals de Autodock4Zn parameterisatie. Voor onze groep is AMDock zeer nuttig geweest voor het schatten van het selectiviteitsprofiel van verschillende PI3K-remmers ten opzichte van orthologe eiwitten in verschillende micro-organismen. Verdere ontwikkelingen (gehydrateerde ligand, covalente docking en virtuele screening) zullen als docking opties worden opgenomen in toekomstige versies.

Articles

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.