Molekulares Docking hat sich zu einem leistungsfähigen Werkzeug für die Entdeckung und Optimierung von Leitstrukturen entwickelt. In den letzten drei Jahrzehnten wurde eine große Anzahl von Docking-Programmen entwickelt, die auf verschiedenen Suchalgorithmen und Bewertungsfunktionen basieren. Um diese Docking-Programme vor allem für Anfänger benutzerfreundlicher zu machen, wurden verschiedene grafische Benutzeroberflächen (GUIs) entwickelt, die bei der Vorbereitung der molekularen Systeme, der Durchführung der Berechnungen und/oder der Analyse der Ergebnisse helfen sollen. Beispiele für verfügbare GUIs (meist für AutoDock und/oder Autodock Vina entwickelt) sind AutoDock Tools (ADT), integriert in das PMV-Grafikpaket , BDT , DOVIS , VSDocker , AUDocker LE , WinDock , DockoMatic , PyMOL AutoDock Plugin (PyMOL/AutoDock) , PyRx , MOLA , DockingApp und JADOPPT .
Wir stellen hier ein neues Multiplattform-Tool, AMDock (Assisted Molecular Docking), vor, dessen Hauptvorteil gegenüber seinen Vorgängern in der Integration mehrerer wertvoller externer Tools innerhalb einer einfachen und intuitiven grafischen Oberfläche besteht, die den Benutzer entlang etablierter Docking-Protokolle – entweder mit Autodock4 oder AutoDock Vina – von der Systemvorbereitung bis zur Analyse der Ergebnisse führt.
Funktionalitäten und Arbeitsablauf
AMDock integriert Funktionalitäten von Autodock Vina und Autodock4, ADT-Skripte, AutoLigand , Open Babel , PDB2PQR und PyMOL . Für Proteine, die ein Zinkion im aktiven Zentrum enthalten, hat AMDock die Möglichkeit, die speziell zugeschnittenen Autodock4Zn-Parameter zu verwenden. AMDock ist in Python 2.7 kodiert und ist für Windows und Linux verfügbar. Unter Windows wird es zusammen mit allen integrierten Tools ausgeliefert, so dass keine zusätzliche Softwareinstallation erforderlich ist. Unter Linux sollten nur Open Babel und PyMOL installiert werden (beide Tools sind in den meisten gängigen Linux-Repositories enthalten).
Das AMDock-Hauptfenster hat fünf Registerkarten: 1) Home, 2) Docking Options, 3) Results Analysis, 4) Configuration und 5) Info. Eine Zusammenfassung der Funktionalitäten und des Arbeitsablaufs von AMDock wird im Folgenden dargestellt (Abb. 1) und anschließend näher erläutert.
In der Registerkarte „Home“ kann der Benutzer die Docking-Engine auswählen: Autodock Vina oder Autodock4, mit der zusätzlichen Möglichkeit, die Autodock4Zn-Parameter zu verwenden. Dann wird der Benutzer automatisch zur Registerkarte „Docking Options“ geleitet, die vier Panels enthält, die eine sequenzielle Vorbereitung einer Docking-Simulation anleiten.
Eingabedateien für AMDock
Minimal werden die kartesischen Koordinaten der Liganden- und Rezeptormoleküle benötigt, die in mehreren gängigen Strukturformaten bereitgestellt werden können, z.B. PDB oder PDBQT für das Protein und PDB, PDBQT oder Mol2 für den Liganden. Wenn die Proteinkoordinaten mit einem gebundenen Liganden zusammenkommen, werden die Koordinaten des letzteren gespeichert und können anschließend verwendet werden, um den Suchraum zu definieren.
Das Programm arbeitet in drei Hauptschritten:
- 1-
Vorbereitung der Docking-Eingabedateien: Zunächst kann der Benutzer einen pH-Wert für die Protonierung sowohl des Liganden (optional, Standardwert 7,4) mit Open Babel als auch des Proteins (Standardwert: 7,4) mit PDB2PQR einstellen. Es stehen zwei verschiedene Docking-Optionen zur Verfügung: a) „einfaches Docking“ für die Vorhersage des Bindungsmodus eines einzelnen Protein-Liganden-Komplexes und b) „Off-Target-Docking“ für die Vorhersage der Bindungspositionen eines Liganden mit zwei verschiedenen Rezeptoren, d. h. dem Target und dem Off-Target. Schließlich ermöglicht die Option „Scoring“ auf dieser Registerkarte die Bewertung eines bereits bestehenden Protein-Liganden-Komplexes unter Verwendung der Funktionen Autodock Vina, Autodock4 oder Autodock4Zn. Sobald das Docking- oder Scoring-Protokoll ausgewählt wurde, werden die Eingabedateien mit ADT-Skripten vorbereitet.
- 2-
Definieren des Suchraums: Vier verschiedene Ansätze können verwendet werden, um das Zentrum und die Abmessungen einer Box zu definieren: a) „Automatisch“ – das Programm verwendet AutoLigand, um mögliche Bindungsstellen vorherzusagen, und dann wird eine Box mit optimalen Abmessungen auf jedem AutoLigand-Objekt (Fußnote 1) an jeder vorhergesagten Bindungsstelle zentriert. b) „Center on Residue(s)“ – AutoLigand wird verwendet, um ein Objekt mit einem Volumen zu erzeugen, das der Ligandengröße entspricht, wobei als Referenz das geometrische Zentrum der ausgewählten Reste verwendet wird. Dann wird ein Kasten mit optimalen Abmessungen auf dem erzeugten Objekt zentriert. c) „Center on Hetero“ – ein Kasten wird auf dem geometrischen Mittelpunkt eines vorhandenen Liganden platziert (wenn der Rezeptor im Komplex mit einem Liganden gegeben wurde), und d) „Box“ – der Kastenmittelpunkt und die Abmessungen werden vom Benutzer definiert. Die mit einer dieser Methoden erzeugte Box kann in PyMOL visualisiert und mit dem neuen AMDock-Plugin (angepasst an ), das in das PyMOL-Menüfenster eingebettet ist, nach Belieben verändert werden.
- 3-
Ausführung der Docking-Simulationen und Analyse der Ergebnisse: Nach dem Ausführen der molekularen Docking-Berechnungen (durch Klicken auf die Schaltfläche „Ausführen“) wird der Benutzer automatisch zur Registerkarte „Ergebnisanalyse“ weitergeleitet, wo die Affinität, die geschätzten Ki-Werte und die Ligandeneffizienzen für die verschiedenen Bindungsposen aufgelistet sind.
Das geschätzte Ki ist ein sehr nützlicher Wert, da es im Vergleich zur Affinität eher mit den normalerweise gemessenen experimentellen Parametern in Verbindung steht. Die Ligandeneffizienz (LE) hingegen ist ein wichtiger informativer Parameter bei der Auswahl einer Leitverbindung. Hier wird LE anhand der folgenden Gleichung berechnet:
wobei ΔG die freie Bindungsenergie oder der berechnete Score-Wert und HA die Anzahl der schweren (Nicht-Wasserstoff-) Atome des Liganden ist. Verbindungen mit LE > 0,3 werden als potenzielle Leitverbindungen hervorgehoben.
Die Schaltfläche „In PyMOL anzeigen“ startet PyMOL mit einer angepassten Visualisierung des Komplexes zwischen dem Rezeptor und der ausgewählten Pose (standardmäßig wird die Ligandenpose mit der niedrigsten Energie gewählt). Die während des gesamten Prozesses anfallenden Daten werden in einer Datei (*.amdock) gespeichert, mit der die Ergebnisse später jederzeit überprüft werden können.
Unter der Registerkarte „Konfiguration“ können verschiedene Docking-Parameter eingestellt werden, während die Registerkarte „Info“ Zugang zu einer praktischen Dokumentation bietet, einschließlich eines Benutzerhandbuchs und Referenzen.
Visualisierung
AMDock stützt sich auf PyMOL für die Visualisierung in zwei verschiedenen Phasen: 1) Einstellung der Position und der Dimensionen der Gitterboxen (des Suchraums) und 2) Analyse der Docking-Ergebnisse. PyMOL ist ein vielseitiges und benutzerfreundliches Programm für die Molekularanalyse, mit dem sich außerdem qualitativ hochwertige Bilder für Veröffentlichungen erstellen lassen. Wir haben in AMDock mehrere vordefinierte PyMOL-Darstellungen für die beiden Phasen kodiert, wobei wir das visuelle Design und die Informationen ausgewählt haben, die wir in jedem Fall für optimal hielten. Diese vordefinierten Darstellungen können vom Benutzer innerhalb von PyMOL geändert werden.
Suchraum
Die vordefinierten Darstellungen (in absteigender Reihenfolge der Komplexität, entsprechend der Anzahl der Elemente im Visualisierungsinhalt) sind die folgenden: 1) Box – eine einfache Darstellung, bei der das untersuchte Protein als Cartoon erscheint, zusammen mit der Box mit den vom Benutzer definierten Spezifikationen (Abb. 2a); 2-Centered on Hetero – umfasst das Rezeptorprotein (Cartoon) und die Box mit einer optimalen Größe, die auf den ausgewählten vorherigen Liganden zentriert ist (Sticks) (Abb. 2b); 3-Centered on Residue(s) – eine Darstellung, die es dem Benutzer ermöglicht, die Reste zu identifizieren, die zur Definition des Suchraums ausgewählt wurden. Das Protein wird als Karikatur dargestellt, die ausgewählten Reste als Sticks und das AutoLigand-Objekt als Punkte. Das berechnete Feld wird ebenfalls angezeigt, so dass der Benutzer seine Position und Abmessungen leicht überprüfen und (falls erforderlich) anpassen kann (Abb. 2c). 4-Automatic – Hier wollten wir eine vereinfachte Darstellung erstellen, um alle von AutoLigand vorhergesagten Bindungsstellen zu zeigen. Das Protein ist als Karikatur dargestellt, jedes AutoLigand-Objekt ist in Stäbchen dargestellt, umgeben von einer Oberfläche, die aus den benachbarten Resten konstruiert ist. Da für jede von AutoLigand vorhergesagte Bindungsstelle Docking-Simulationen durchgeführt werden sollen, wird für jede Stelle ein Kasten erstellt, der jedoch nur für eine vom Benutzer ausgewählte Stelle angezeigt wird (Abb. 2d). Wie bereits erwähnt, können in jeder dieser Varianten das Zentrum und die Größe der Box mit dem in PyMOL implementierten AMDock-Plugin leicht geändert werden.
Ergebnisanalyse
Das Protein ist als Cartoon dargestellt. Jede Ligandenposition ist in Stäbchen gezeichnet und ihre polaren Kontakte mit dem Protein sind als gestrichelte Linien dargestellt. Eine ähnliche Visualisierung ist auch für beide Proteine möglich, wenn das Verfahren „Off-Target Docking“ gewählt wurde (Abb. 3c). Dies ermöglicht einen gleichzeitigen Vergleich der Ligandenpositionen für die Ziel- und Off-Target-Proteine.
Fallstudie: SAR405-Bindungsselektivität – PI3Kγ vs. Vps34
Phosphatidylinositol-3-Kinase (PI3K) ist ein Enzym, das an Wachstum, Proliferation, Motilität, Überleben und intrazellulärem Trafficking beteiligt ist. PI3K ist auch ein vielversprechendes Krebsziel, und mehrere seiner Inhibitoren befinden sich bereits im klinischen Stadium. Einige dieser Inhibitoren befinden sich derzeit in klinischen Studien der Phase III, und einer von ihnen, Alpelisib, erhielt kürzlich (Mai 2019) die FDA-Zulassung für die Behandlung von metastasierendem Brustkrebs.
PI3K hat mehrere Isoformen, die in drei verschiedene Klassen eingeteilt werden. Die Klasse I umfasst vier verschiedene Isoformen (α, β, γ und δ), während die Klasse III aus nur einem Protein besteht, das Vps34 genannt wird. Aufgrund ihrer Sequenz- und Strukturähnlichkeiten können einige Inhibitoren verschiedene Isoformen binden, während mehrere andere Inhibitoren isoformspezifisch konzipiert wurden. Unsere Forschungsgruppe konzentriert sich derzeit auf die Identifizierung von PI3K-Inhibitoren, die in der Lage sind, PI3K-Orthologe zu hemmen, die in verschiedenen pathogenen Mikroorganismen vorkommen, die nur die angestammte Isoform Vps34 exprimieren. Zu diesem Zweck stellt AMDock ein wertvolles Werkzeug dar, insbesondere seine „Off-Target Docking“-Option. Hier demonstrieren wir seine Verwendung anhand einer Übung, die unserer eigenen Forschungsarbeit ähnelt.
Sar405 ist ein hochspezifischer Inhibitor von Vps34 (IC50 = 1,2 nM), während seine IC50 für andere Isoformen > 104 nM beträgt. Eine Kristallstruktur von SAR405 im Komplex mit menschlichem Vps34 ist in der Protein Data Bank verfügbar (PDB-Code: 4oys). Hier verwenden wir das menschliche Vps34 als „Target“-Rezeptor, während die PI3K-Gamma-Isoform (PDB: 3apf) als „Off-Target“-Rezeptor verwendet wird. Beide Strukturen enthalten einen gebundenen Liganden im aktiven Zentrum, was sich für die Erstellung der Gitterbox anbietet. Im ersten Schritt wählen wir das Docking-Programm (Autodock Vina) aus und legen anschließend einen Projektordner auf der Festplatte des Computers an. Nach dem Laden der beiden Proteinstrukturen nutzen wir ihre Sequenzähnlichkeit, um die verfügbare Option des Alignings und der Überlagerung ihrer Strukturen mit PyMOL zu nutzen, was die Definition eines gemeinsamen Suchraums ermöglicht und die anschließende Analyse der Docking-Ergebnisse vereinfacht. Anschließend werden die Eingabedateien automatisch vorbereitet, was die Protonierung titrierbarer Reste, die Zusammenführung unpolarer Wasserstoffatome und die Entfernung von Ionen/Wasser einschließt. Das Zentrum der Box wird auf der Grundlage des geometrischen Zentrums der gebundenen Liganden definiert (Abb. 3a), während die Größe der Box auf der Grundlage des Gyrationsradius des anzudockenden Liganden, d. h. in diesem Fall des SAR405-Inhibitors, definiert wird. Die anfängliche Ligandenkonformation (seine Torsionswinkel) wurde mit ADT randomisiert.
Nach Abschluss des Prozesses zeigen die Ergebnisse, dass SAR405 wie erwartet selektiver für Vps34 (- 9,2 kcal/mol) als für Pi3Kγ (- 7,3 kcal/mol) ist (Abb. 3b). Die vorhergesagte Bindungsposition für SAR405 in Vps34 ist nahe an der Kristallgeometrie (rmsd = 1,9 Å für alle Ligandenatome, rmsd = 0,5 Å für den Ringkern). Auch der vorhergesagte Ki-Wert für diesen Komplex liegt im nanomolaren Bereich, was mit dem experimentellen Wert übereinstimmt. Andererseits wird für den Pi3Kγ-SAR405-Komplex ein viel höherer Ki-Wert vorhergesagt, und die vorhergesagte Bindungsposition weicht erheblich von der kristallographischen Struktur ab (rmsd = 4,7), wie in Abb. 3c gezeigt, was den schlechten Affinitätswert erklären könnte, der von AutoDock Vina vorhergesagt wurde. Dieser Studienfall wurde als Tutorial in das Benutzerhandbuch, das im AMDock-Installationsordner enthalten ist, und in das Wiki auf Github (https://github.com/Valdes-Tresanco-MS/AMDock-win/wiki/4.3-Off-target-docking) aufgenommen.
Diskussion
AMDock bietet eine neuartige, einfach zu bedienende und vielseitige Schnittstelle für die Arbeit mit zwei molekularen Docking-Engines, Autodock4 und Autodock Vina, die unterschiedliche Funktionalitäten und Eigenschaften aufweisen. AMDock dürfte für Forscher mit wenig Erfahrung in der Arbeit mit Docking-Programmen sehr nützlich sein, da keine Vorkenntnisse über die besondere Funktionsweise dieser Programme erforderlich sind. Drei verschiedene Arbeitsabläufe (einfaches Docking, Off-Target-Docking und Scoring) sind in der AMDock-Umgebung enthalten. Wir finden das Off-Target-Docking-Verfahren besonders hilfreich für die Durchführung von Ligandenselektivitätsstudien – ein kritischer Schritt im Prozess des Wirkstoffdesigns.
Die korrekte und konsistente Vorbereitung der Eingabedateien sowie die korrekte Definition des Suchraums sind kritische Punkte bei der Durchführung molekularer Docking-Studien. Mehrere externe Programme/Skripte sind in AMDock integriert, um die Vorbereitung der Eingabedateien mit minimalem Aufwand zu ermöglichen und gleichzeitig die Kontrolle über den Prozess zu behalten. AMDock verwendet OpenBabel und PDB2PQR für die Liganden- bzw. Rezeptorprotonierung, während die anderen in der Einleitung erwähnten GUIs ADT sowohl für die Rezeptor- als auch für die Ligandenprotonierung verwenden (mit Ausnahme von DockingApp, das ebenfalls OpenBabel für die Ligandenprotonierung verwendet).
Um den Suchraum zu definieren, bietet AMDock mehrere Optionen, um die Position der Gitterbox in verschiedenen Szenarien festzulegen, während der eingegebene Ligand standardmäßig verwendet wird, um die optimalen Abmessungen der Box zu bestimmen, was die Rechenkosten senkt und den Docking-Prozess optimiert. In dieser Hinsicht bieten nur ADT und das PyMOL/AutoDock-Plugin einige begrenzte Optionen außer einem benutzerdefinierten Suchraum, aber in jedem Fall muss die Boxgröße vom Benutzer definiert werden. Bei einigen dieser GUIs, wie z. B. bei DockingApp, erstreckt sich der Suchraum über den gesamten Rezeptor, was zu zusätzlichen Rechenkosten führt und möglicherweise die Genauigkeit der Simulationen beeinträchtigt. Bei anderen GUIs muss der Benutzer eine externe Anwendung wie ADT verwenden, um die Parameter der Box zu definieren.
Die Option „Centered on Residue(s)“ ist vorzuziehen, wenn die Reste der Bindungsstelle bekannt sind. Bei dieser Option wird mit AutoLigand auf der Proteinoberfläche ein Objekt erzeugt, das sich im geometrischen Zentrum der ausgewählten Reste befindet. Durch dieses Verfahren werden sowohl die Lage als auch die Größe des Suchraums optimiert. Wäre die Box stattdessen auf den geometrischen Mittelpunkt der ausgewählten Reste zentriert, wäre wahrscheinlich ein erheblicher Teil davon in das Protein eingebettet, was eine größere Größe erfordert, um den benötigten Probenraum abzudecken (Abb. 4). Die Alternative „Zentriert auf Hetero“ ist nützlich für Redocking-Studien an Komplexen mit kristallographischen Strukturen oder bei der Untersuchung von Liganden mit ähnlichen Bindungsmodi (Abb. 2b). Die Option „Automatisch“ ist dagegen wünschenswert, wenn keine Informationen über die Bindungsstelle verfügbar sind. In diesem Fall wird für jede von AutoLigand vorhergesagte Bindungsstelle ein unabhängiger Docking-Lauf durchgeführt (Abb. 2d). Auf diese Weise werden die Informationen der AutoLigand-Ranking-Methode mit denen der Docking-Engine kombiniert, ohne eine willkürliche Auswahl einer der vorhergesagten Stellen zu treffen. Dieser Prozess erfolgt automatisch und die Ergebnisse für jede der vorhergesagten Bindungsstellen können in PyMOL visualisiert werden. Insgesamt ist die Definition und Visualisierung der Box mit einem minimalen Aufwand verbunden und kann jederzeit modifiziert werden, was nicht nur für Anfänger, sondern auch für Experten von Vorteil ist.
Es ist erwähnenswert, dass wir die Größe der Box in Angström standardisiert haben, um häufig auftretende Fehler zu vermeiden, die in verschiedenen Foren und Mailing-Listen gemeldet werden. Diese Fehler ergeben sich aus den unterschiedlichen Definitionen der Boxabmessungen in AutoDock (Anzahl der Punkte + Gitterabstand) und Autodock Vina (in Angström) und können dazu führen, dass der Suchraum sehr klein oder zu groß ist, was letztlich zu Inkonsistenzen in den erzielten Docking-Ergebnissen führt.
Die Integration von AMDock mit PyMOL stellt einen erheblichen Vorteil dar. PyMOL ist ein weit verbreiteter molekularer Viewer, der von einer großen Gemeinschaft unterstützt und aktiv weiterentwickelt wird. Innerhalb von PyMOL können Docking-Ergebnisse mit mehreren Tools analysiert werden, insbesondere mit dem leistungsstarken Protein-Ligand-Interaktions-Profiler. Andere Anwendungen wie ADT, PyRx oder DockingApp haben ihre eigenen grafischen Betrachter. PyRx und DockingApp bieten einfache Lösungen mit begrenzten analytischen Möglichkeiten, während ADT nur eine einfache Analyse von Protein-Ligand-Interaktionen ermöglicht.
Mit AMDock ist es außerdem möglich, Docking-Simulationen für Metalloproteine unter Verwendung des Zn-Kraftfelds von AutoDock zu starten, das in ADT nur über die Befehlszeile verfügbar ist. Die Off-Target-Docking-Option, die für Studien zur Neuordnung von Arzneimitteln sehr nützlich ist, ist nur in Dockomatic und PyRx verfügbar (in letzterem nur in der Bezahlversion).
Die meisten Docking-GUIs sind auf virtuelles Screening ausgerichtet. AMDock bietet derzeit keine Unterstützung für virtuelles Screening, wir arbeiten jedoch an der Implementierung, um sie in der nächsten Programmversion zur Verfügung zu stellen.
Schließlich, und da ADT wahrscheinlich die am weitesten verbreitete Docking-GUI ist, bieten wir einen detaillierteren Vergleich zwischen AMDock und ADT (Tabelle 1).
Schlussfolgerungen
AMDock ist eine benutzerfreundliche GUI, die sehr intuitiv und interaktiv arbeitet und es ermöglicht, molekulare Docking-Studien mit Autodock4 und AutoDock Vina mit minimalem Einrichtungsaufwand durchzuführen. Diese Eigenschaften machen AMDock zu einem attraktiven Werkzeug auch für Lehrzwecke. AMDock enthält Funktionen und Verfahren, die in anderen ähnlichen Programmen nicht vorhanden sind. Es beinhaltet die neuesten Entwicklungen in AutoDock, wie z.B. die Autodock4Zn Parametrisierung. Für unsere Gruppe war AMDock sehr nützlich, um das Selektivitätsprofil verschiedener PI3K-Inhibitoren für orthologe Proteine in verschiedenen Mikroorganismen abzuschätzen. Weitere Entwicklungen (hydratisierter Ligand, kovalentes Docking und virtuelles Screening) werden als Docking-Optionen in zukünftige Versionen aufgenommen.