Dokowanie molekularne stało się potężnym narzędziem do odkrywania i optymalizacji związków wiodących. W ciągu ostatnich trzech dekad opracowano wiele programów dokowania, opartych na różnych algorytmach wyszukiwania i funkcjach punktacji. W celu uczynienia tych programów bardziej przyjaznymi dla użytkownika, szczególnie dla początkujących, opracowano różne graficzne interfejsy użytkownika (GUI), które pomagają w przygotowaniu układów molekularnych, wykonaniu obliczeń i/lub analizie wyników. Przykładami dostępnych GUI (opracowanych głównie dla AutoDock i/lub Autodock Vina ) są AutoDock Tools (ADT), zintegrowane z pakietem graficznym PMV , BDT , DOVIS , VSDocker , AUDocker LE , WinDock , DockoMatic , PyMOL AutoDock plugin (PyMOL/AutoDock) , PyRx , MOLA , DockingApp i JADOPPT .
Przedstawiamy tutaj nowe wieloplatformowe narzędzie, AMDock (Assisted Molecular Docking), którego główną zaletą w stosunku do poprzedników jest integracja kilku cennych narzędzi zewnętrznych w ramach prostego i intuicyjnego interfejsu graficznego, który prowadzi użytkowników wzdłuż dobrze ugruntowanych protokołów dokowania – przy użyciu Autodock4 lub AutoDock Vina – od przygotowania układu do analizy wyników.
Funkcjonalności i przepływ pracy
AMDock integruje funkcjonalności z Autodock Vina i Autodock4, skrypty ADT, AutoLigand , Open Babel , PDB2PQR i PyMOL . Dla białek zawierających jon cynku w miejscu aktywnym, AMDock ma możliwość użycia specjalnie dostosowanych parametrów Autodock4Zn. AMDock jest zakodowany w Pythonie 2.7 i jest dostępny dla systemów Windows i Linux. W systemie Windows, jest pakowany razem ze wszystkimi zintegrowanymi narzędziami, stąd nie jest wymagana żadna dodatkowa instalacja oprogramowania. W systemie Linux należy zainstalować jedynie Open Babel i PyMOL (oba narzędzia znajdują się w większości popularnych repozytoriów linuksowych).
Okno główne AMDock ma pięć zakładek: 1) Home, 2) Docking Options, 3) Results Analysis, 4) Configuration, oraz 5) Info. Podsumowanie funkcjonalności i przepływu pracy AMDock jest przedstawione poniżej (Rys. 1) i omówione później bardziej szczegółowo.
W zakładce „Home” użytkownik może wybrać silnik dokowania: Autodock Vina lub Autodock4, z dodatkową możliwością skorzystania z parametrów Autodock4Zn. Następnie użytkownik jest automatycznie kierowany do zakładki „Docking Options”, która zawiera cztery panele prowadzące do sekwencyjnego przygotowania symulacji dokowania.
Pliki wejściowe dla AMDock
Potrzebne są przede wszystkim współrzędne kartezjańskie cząsteczek liganda i receptora, które mogą być dostarczone w kilku popularnych formatach struktury, np. PDB lub PDBQT dla białka oraz PDB, PDBQT lub Mol2 dla liganda. PDB lub PDBQT dla białka i PDB, PDBQT lub Mol2 dla liganda. Jeśli współrzędne białka spotkają się ze związanym ligandem, współrzędne tego ostatniego są przechowywane i mogą być później użyte do określenia przestrzeni poszukiwań.
Program działa w trzech głównych krokach:
- 1-
Przygotowanie plików wejściowych dokowania: Po pierwsze, użytkownik może ustawić wartość pH dla protonacji zarówno liganda (opcjonalnie, wartość domyślna 7.4), używając Open Babel, jak i białka (wartość domyślna: 7.4), używając PDB2PQR. Dostępne są dwie różne opcje dokowania: a) „simple docking”, do przewidywania sposobu wiązania pojedynczego kompleksu białko-ligand, oraz b) „off-target docking”, do przewidywania pozycji wiązania liganda z dwoma różnymi receptorami, tj. docelowym i pozacelowym. Wreszcie, opcja „Scoring” zawarta w tej zakładce pozwala na ocenę już istniejącego kompleksu białko-ligand przy użyciu funkcji Autodock Vina, Autodock4 lub Autodock4Zn. Po wybraniu protokołu dokowania lub punktacji, pliki wejściowe są przygotowywane przy użyciu skryptów ADT.
- 2-
Definiowanie przestrzeni poszukiwań: Do określenia centrum i wymiarów pudełka można zastosować cztery różne podejścia: a) „Automatic” – program wykorzystuje AutoLigand do przewidywania możliwych miejsc wiązania, a następnie na każdym obiekcie AutoLigand,Przypis 1 w każdym przewidywanym miejscu wiązania centrowane jest pudełko o optymalnych wymiarach. b) „Center on Residue(s)” – AutoLigand jest wykorzystywany do generowania obiektu o objętości odpowiadającej rozmiarom liganda, wykorzystując jako odniesienie geometryczne centrum wybranych reszt. Następnie na wygenerowanym obiekcie centrowane jest pudełko o optymalnych wymiarach. c) „Center on Hetero” – pudełko umieszczane jest na geometrycznym środku istniejącego liganda (jeśli receptor został podany w kompleksie z ligandem), oraz d) „Box” – środek pudełka i jego wymiary definiowane są przez użytkownika. Pudełko wygenerowane dowolną z tych metod może być wizualizowane w PyMOLu i łatwo modyfikowane w dogodny dla użytkownika sposób za pomocą nowego pluginu AMDock (zaadaptowanego z ) osadzonego w oknie menu PyMOLa.
- 3-
Running the docking simulations and analyzing the results: Po uruchomieniu obliczeń dokowania molekularnego (uruchamianych przez kliknięcie przycisku „Run”), użytkownik zostanie automatycznie przeniesiony do zakładki „Results Analysis”, gdzie wyszczególnione są wartości Affinity, Estimated Ki oraz Ligand Efficiencies dla różnych póz wiążących.
Oszacowane Ki jest bardzo użyteczną wartością, ponieważ w porównaniu z powinowactwem jest bardziej związane z zazwyczaj mierzonymi parametrami eksperymentalnymi. Wydajność liganda (LE), z drugiej strony, jest ważnym parametrem informacyjnym przy wyborze związku wiodącego. W tym przypadku LE jest obliczana za pomocą następującego równania:
gdzie ΔG jest swobodną energią wiązania lub obliczoną wartością wyniku, a HA jest liczbą ciężkich (nie-wodorowych) atomów liganda. Związki z LE > 0.3 są wyróżnione jako potencjalne związki wiodące .
Przycisk „Show in PyMOL” uruchamia PyMOL z dostosowaną wizualizacją kompleksu pomiędzy receptorem a wybraną pozycją (domyślnie wybierana jest pozycja liganda o najniższej energii). Dane wynikowe całego procesu są przechowywane w pliku (*.amdock), który może być później użyty do analizy wyników w dowolnym momencie.
Różne parametry dokowania mogą być ustawione w zakładce „Configuration”, podczas gdy zakładka „Info” daje dostęp do podręcznej dokumentacji, w tym do podręcznika użytkownika i referencji.
Wizualizacja
AMDock polega na PyMOLu do wizualizacji na dwóch różnych etapach: 1) ustawiania położenia i wymiarów pola siatki (przestrzeni poszukiwań), oraz 2) analizy wyników dokowania. PyMOL jest wszechstronnym i przyjaznym dla użytkownika programem do analizy molekularnej, który ponadto pozwala na tworzenie wysokiej jakości obrazów do publikacji. Zakodowaliśmy w AMDock kilka predefiniowanych reprezentacji PyMOL dla tych dwóch etapów, wybierając wizualny projekt i informacje, które uznaliśmy za optymalne w każdym przypadku. Te predefiniowane reprezentacje mogą być modyfikowane przez użytkownika w PyMOLu.
Przestrzeń wyszukiwania
Predefiniowane reprezentacje (w kolejności malejącej złożoności, zgodnie z liczbą elementów w zawartości wizualizacji) są następujące: 1) Box – prosta reprezentacja, w której badane białko występuje jako cartoon, wraz z pudełkiem o specyfikacji zdefiniowanej przez użytkownika (Rys. 2a); 2-Centered on Hetero – zawiera białko receptorowe (cartoon) oraz pudełko o optymalnym rozmiarze wyśrodkowane na wybranym wcześniej ligandzie (sticks) (Rys. 2b); 3-Centered on Residue(s) – reprezentacja pozwalająca użytkownikowi na identyfikację reszt, które zostały wybrane do zdefiniowania przestrzeni poszukiwań. Białko przedstawiane jest w postaci kreskówki, wybrane reszty jako patyczki, a obiekt AutoLigand jako punkty. Obliczone pole jest również pokazane, tak aby użytkownik mógł łatwo sprawdzić i dostosować (jeśli to konieczne) jego położenie i wymiary (Rys. 2c). 4-Automatic – Tutaj chcieliśmy stworzyć uproszczoną reprezentację, aby pokazać wszystkie miejsca wiązania przewidywane przez AutoLigand. Białko jest przedstawione w karykaturze, każdy obiekt AutoLigand jest reprezentowany w postaci pałeczek, otoczonych powierzchnią skonstruowaną na sąsiednich resztach. Ponieważ symulacje dokowania mają być przeprowadzone dla każdego miejsca przewidywanego przez AutoLigand, dla każdego miejsca generowane jest pole, ale pokazywane tylko dla miejsca wybranego przez użytkownika (Rys. 2d). Jak wspomniano powyżej, w każdym z tych wariantów środek i rozmiar pudełka można łatwo modyfikować za pomocą pluginu AMDock zaimplementowanego w PyMOLu.
Analiza wyników
Białko jest przedstawione w postaci kreskówki. Każda pozycja liganda jest narysowana w postaci pałeczki, a jego polarne kontakty z białkiem są pokazane jako linie przerywane. Podobna wizualizacja jest również możliwa dla obu białek, jeśli wybrano procedurę „Off-Target Docking” (Rys. 3c). Pozwala to na jednoczesne porównanie pozycji ligandów zarówno dla białek docelowych jak i pozacelowych.
Studium przypadku: SAR405 binding selectivity – PI3Kγ vs. Vps34
Fosfatydyloinozytolowa 3-kinaza (PI3K) jest enzymem zaangażowanym we wzrost, proliferację, ruchliwość, przeżycie i wewnątrzkomórkową trafficking . PI3K jest również obiecującym celem nowotworów, a kilka jej inhibitorów znajduje się już w fazie klinicznej. Kilka z tych inhibitorów jest obecnie w fazie III badań klinicznych, a jeden z nich, alpelisib, niedawno (maj 2019) otrzymał zatwierdzenie FDA do stosowania w leczeniu przerzutowego raka piersi.
PI3K ma kilka izoform, które są zgrupowane w 3 różnych klasach. Klasa I obejmuje cztery różne izoformy (α, β, γ i δ), podczas gdy klasa III składa się tylko z jednego białka, zwanego Vps34 . Ze względu na podobieństwo sekwencji i struktury, niektóre inhibitory mogą wiązać różne izoformy, podczas gdy kilka innych inhibitorów zostało zaprojektowanych jako specyficzne dla danej izoformy. Nasza grupa badawcza koncentruje się obecnie na identyfikacji inhibitorów PI3K zdolnych do hamowania ortologów PI3K występujących w różnych mikroorganizmach chorobotwórczych, które wykazują ekspresję tylko rodowej izoformy Vps34. Do tego celu AMDock jest cennym narzędziem, szczególnie jego opcja „Off-Target Docking”. Tutaj demonstrujemy jej użycie w ćwiczeniu, które przypomina naszą własną pracę badawczą.
Sar405 jest wysoce specyficznym inhibitorem Vps34 (IC50 = 1.2 nM), podczas gdy jego IC50 dla innych izoform wynosi > 104 nM . Struktura krystaliczna SAR405 w kompleksie z ludzkim Vps34 jest dostępna w Protein Data Bank (kod PDB: 4oys). Tutaj używamy ludzkiego Vps34 jako receptora „Target”, podczas gdy izoforma PI3K gamma (PDB: 3apf) jest używana jako receptor „Off-Target”. Obie struktury zawierają związany ligand w miejscu aktywnym, co jest wygodne przy generowaniu pola siatki. W pierwszym kroku wybieramy program do dokowania (Autodock Vina), a następnie na dysku twardym komputera tworzony jest folder projektu. Po załadowaniu obu struktur białkowych, wykorzystując ich podobieństwo sekwencyjne, korzystamy z dostępnej opcji wyrównywania i nakładania ich struktur za pomocą programu PyMOL, co umożliwia zdefiniowanie wspólnej przestrzeni poszukiwań i upraszcza późniejszą analizę wyników dokowania. Następnie, pliki wejściowe są przygotowywane automatycznie, co obejmuje protonowanie reszt titratowalnych, łączenie hydrogenów niepolarnych oraz usuwanie jonów/wody. Środek pola definiowany jest na podstawie geometrycznego środka związanego liganda (Rys. 3a), natomiast rozmiar pola definiowany jest na podstawie promienia giracji dokowanego liganda, czyli w tym przypadku inhibitora SAR405. Początkowa konformacja liganda (jego kąty torsyjne) została randomizowana przy użyciu ADT.
Po zakończeniu procesu, wyniki pokazują, że SAR405 jest bardziej selektywny dla Vps34 (- 9.2 kcal/mol) niż dla Pi3Kγ (- 7.3 kcal/mol), zgodnie z oczekiwaniami (Rys. 3b). Przewidywana pozycja wiązania dla SAR405 w Vps34 jest bliska geometrii krystalicznej (rmsd = 1,9 Å dla wszystkich atomów ligandu, rmsd = 0,5 Å dla rdzenia pierścienia). Również przewidywana wartość Ki dla tego kompleksu jest w zakresie nanomolarnym, co zgadza się z wartością doświadczalną. Z drugiej strony, znacznie wyższa wartość Ki jest przewidywana dla kompleksu Pi3Kγ-SAR405, a przewidywana pozycja wiązania różni się znacznie od struktury krystalograficznej (rmsd = 4.7), jak pokazano na Rys. 3c, co może tłumaczyć niską wartość powinowactwa przewidywaną przez AutoDock Vina. Ten przypadek badawczy został włączony jako samouczek do podręcznika użytkownika, który jest zawarty w folderze instalacyjnym AMDock, oraz do wiki na Githubie (https://github.com/Valdes-Tresanco-MS/AMDock-win/wiki/4.3-Off-target-docking).
Dyskusja
AMDock dostarcza nowatorski, łatwy w użyciu i wszechstronny interfejs do pracy z dwoma silnikami dokowania molekularnego, Autodock4 i Autodock Vina, posiadającymi różne funkcjonalności i charakterystyki. AMDock powinien być bardzo użyteczny dla badaczy z niewielkim doświadczeniem w pracy z programami do dokowania, ponieważ nie jest wymagana wcześniejsza wiedza na temat działania tych programów. Środowisko AMDock zawiera trzy różne przepływy pracy (proste dokowanie, dokowanie poza celem i scoring). Uważamy, że procedura dokowania poza celem jest szczególnie pomocna w przeprowadzaniu badań selektywności ligandów – krytycznego kroku w procesie projektowania leków.
Przygotowanie plików wejściowych w odpowiedni i spójny sposób, jak również prawidłowe zdefiniowanie przestrzeni poszukiwań, są krytycznymi zagadnieniami podczas przeprowadzania badań dokowania molekularnego. Kilka zewnętrznych programów/skryptów jest zintegrowanych z AMDock, aby umożliwić przygotowanie plików wejściowych przy minimalnym wysiłku, zachowując kontrolę nad procesem. AMDock używa OpenBabel i PDB2PQR do protonowania odpowiednio ligandu i receptora, podczas gdy inne GUI wymienione we wstępie używają ADT do protonowania zarówno receptora jak i liganda (z wyjątkiem DockingApp, który również używa OpenBabel do protonowania liganda).
Opcja „Centered on Residue(s)” jest preferowana, gdy znane są reszty miejsca wiązania. Dzięki tej opcji, obiekt umieszczony w geometrycznym środku wybranych reszt jest generowany przez AutoLigand na powierzchni białka. Procedura ta optymalizuje zarówno lokalizację jak i rozmiar przestrzeni poszukiwań. Jeśli zamiast tego pole byłoby wyśrodkowane na geometrycznym środku wybranych reszt, to prawdopodobnie znaczna jego część byłaby osadzona w białku, co wymagałoby większego rozmiaru, aby pokryć potrzebną przestrzeń próbkowania (Rys. 4). Alternatywa „Centered on Hetero” jest przydatna w badaniach redokingu kompleksów o strukturze krystalograficznej lub podczas badania ligandów o podobnych sposobach wiązania (Rys. 2b). Z kolei opcja „Automatic” jest pożądana w przypadku braku informacji o miejscu wiązania. W tym przypadku, dla każdego miejsca wiązania przewidywanego przez AutoLigand wykonywany jest niezależny przebieg dokowania (Rys. 2d). W ten sposób informacje pochodzące z metody rankingowej AutoLigand są łączone z informacjami pochodzącymi z silnika dokowania, bez dokonywania arbitralnego wyboru jednego z przewidywanych miejsc. Proces ten odbywa się automatycznie, a wyniki dla każdego z przewidywanych miejsc wiązania mogą być wizualizowane w programie PyMOL. Ogólnie rzecz biorąc, definicja i wizualizacja pola wymaga minimalnego wysiłku i zawsze może być modyfikowana, co stanowi zaletę nie tylko dla początkującego użytkownika, ale także dla ekspertów.
Warto zauważyć, że ustandaryzowaliśmy rozmiar ramki w Angstremach, aby uniknąć powszechnie występujących błędów, zgłaszanych na różnych forach i listach dyskusyjnych. Błędy te wynikają z różnych sposobów definiowania wymiarów pudełka w AutoDock (liczba punktów + odstępy między siatkami) i Autodock Vina (w angstremach) i mogą powodować, że przestrzeń poszukiwań będzie bardzo mała lub zbyt duża, prowadząc ostatecznie do niespójności w uzyskanych wynikach dokowania.
Integracja AMDock z PyMOL stanowi znaczącą zaletę. Rzeczywiście, PyMOL jest szeroko stosowaną przeglądarką molekularną z dużym wsparciem społeczności i aktywnym rozwojem. W ramach PyMOL, wyniki dokowania mogą być analizowane za pomocą wielu narzędzi, w szczególności za pomocą potężnego Profiler Interakcji białko-ligand. Inne aplikacje takie jak ADT, PyRx czy DockingApp mają swoje własne graficzne przeglądarki. PyRx i DockingApp oferują proste rozwiązania z ograniczonymi możliwościami analitycznymi, podczas gdy ADT pozwala tylko na prostą analizę interakcji białko-ligand.
Ponadto, dzięki AMDock możliwe jest uruchomienie symulacji dokowania dla metaloprotein przy użyciu pola siłowego Zn programu AutoDock, które w ADT dostępne jest tylko z linii poleceń. Opcja dokowania poza celem, bardzo przydatna w badaniach nad repozycjonowaniem leków, jest dostępna tylko w Dockomatic i PyRx (w tym ostatnim, tylko w wersji płatnej).
Większość graficznych interfejsów dokowania skupia się na wirtualnych badaniach przesiewowych. Obecnie AMDock nie posiada wsparcia dla wirtualnego przesiewania, jednak pracujemy nad jego implementacją, aby udostępnić je w następnej wersji programu.
Na koniec, i ponieważ ADT jest prawdopodobnie najczęściej używanym GUI do dokowania, przedstawiamy bardziej szczegółowe porównanie AMDock i ADT (Tabela 1).
Wnioski
AMDock jest przyjaznym dla użytkownika GUI, które działa w wysoce intuicyjny i interaktywny sposób, pozwalając na przeprowadzenie badań dokowania molekularnego z Autodock4 i AutoDock Vina przy minimalnym wysiłku konfiguracyjnym. Te cechy sprawiają, że AMDock jest atrakcyjnym narzędziem również do celów dydaktycznych. AMDock gromadzi funkcje i procedury, które nie są obecne w innych podobnych programach. Zawiera on ostatnie osiągnięcia w AutoDock, takie jak parametryzacja Autodock4Zn. Dla naszej grupy, AMDock był bardzo przydatny do oszacowania profilu selektywności różnych inhibitorów PI3K w stosunku do ortologicznych białek w kilku mikroorganizmach. Dalsze rozwiązania (ligand uwodniony, dokowanie kowalencyjne i wirtualny screening) zostaną włączone jako opcje dokowania w przyszłych wersjach.