Andocarea moleculară a devenit un instrument puternic pentru descoperire și optimizare. Un număr mare de programe de andocare au fost dezvoltate în ultimele trei decenii, bazate pe diferiți algoritmi de căutare și funcții de scor. Cu scopul de a face aceste programe de docking mai ușor de utilizat, în special pentru începători, au fost dezvoltate diferite interfețe grafice de utilizator (GUI) pentru a ajuta la pregătirea sistemelor moleculare, la executarea calculelor și/sau la analiza rezultatelor. Exemple de interfețe grafice disponibile (dezvoltate în principal pentru AutoDock și/sau Autodock Vina ) sunt AutoDock Tools (ADT), integrat în pachetul grafic PMV , BDT , DOVIS , VSDocker , AUDocker LE , WinDock , DockoMatic , DockoMatic , PyMOL AutoDock plugin (PyMOL/AutoDock) , PyRx , MOLA , DockingApp și JADOPPT .
Prezentăm aici un nou instrument multi-platformă, AMDock (Assisted Molecular Docking), al cărui principal avantaj față de predecesorii săi este integrarea mai multor instrumente externe valoroase în cadrul unei interfețe grafice simple și intuitive care ghidează utilizatorii de-a lungul unor protocoale de andocare bine stabilite – folosind fie Autodock4, fie AutoDock Vina – de la pregătirea sistemului până la analiza rezultatelor.
Funcționalități și flux de lucru
AMDock integrează funcționalități din Autodock Vina și Autodock4, scripturi ADT, AutoLigand , Open Babel , PDB2PQR și PyMOL . Pentru proteinele care conțin un ion zinc în situsul activ, AMDock are opțiunea de a utiliza parametrii Autodock4Zn special adaptați. AMDock este codat în Python 2.7 și este disponibil pentru Windows și Linux. Pe Windows, este împachetat împreună cu toate instrumentele integrate, prin urmare nu este necesară instalarea unui software suplimentar. Pe Linux, trebuie instalate doar Open Babel și PyMOL (ambele instrumente sunt incluse în cele mai populare depozite Linux).
Fereastra principală AMDock are cinci file: 1) Home, 2) Docking Options, 3) Results Analysis, 4) Configuration și 5) Info. Un rezumat al funcționalităților și al fluxului de lucru al AMDock este prezentat mai jos (Fig. 1) și discutat ulterior mai detaliat.
În fila „Home”, utilizatorul poate selecta motorul de andocare: Autodock Vina sau Autodock4, cu opțiunea suplimentară de a utiliza parametrii Autodock4Zn. Apoi, utilizatorul este direcționat automat către fila „Docking Options” (Opțiuni de andocare), care conține patru panouri care ghidează pregătirea secvențială a unei simulări de andocare.
Filete de intrare pentru AMDock
Minimal, sunt necesare coordonatele carteziene ale moleculelor ligandului și receptorului, care pot fi furnizate în mai multe formate de structură comune, de exemplu PDB sau PDBQT pentru proteină și PDB, PDBQT sau Mol2 pentru ligand. Dacă coordonatele proteinei se întâlnesc cu un ligand legat, coordonatele acestuia din urmă sunt stocate și pot fi folosite ulterior pentru a defini spațiul de căutare.
Programul funcționează urmând trei etape principale:
- 1-
Pregătirea fișierelor de intrare pentru docking: În primul rând, utilizatorul poate stabili o valoare a pH-ului pentru protonarea atât a ligandului (opțional, valoare implicită 7,4), utilizând Open Babel, cât și a proteinei (valoare implicită: 7,4), utilizând PDB2PQR. Sunt disponibile două opțiuni de andocare diferite: a) „andocare simplă”, pentru prezicerea modului de legare a unui singur complex proteină-ligand și b) „andocare în afara țintei”, pentru prezicerea pozițiilor de legare a unui ligand cu doi receptori diferiți, adică ținta și în afara țintei. În cele din urmă, opțiunea „Scoring” inclusă în această filă permite punctarea unui complex proteină-ligand deja existent, utilizând funcțiile Autodock Vina, Autodock4 sau Autodock4Zn. După ce a fost selectat protocolul de andocare sau de scorare, fișierele de intrare sunt pregătite cu ajutorul scripturilor ADT.
- 2-
Definirea spațiului de căutare: Patru abordări diferite pot fi utilizate pentru a defini centrul și dimensiunile unei cutii: a) „Automatic” – programul utilizează AutoLigand pentru a prezice posibilele situsuri de legare și apoi o cutie cu dimensiuni optime este centrată pe fiecare obiect AutoLigand,Nota 1 la fiecare situs de legare prezis. b) „Center on Residue(s)” – AutoLigand este utilizat pentru a genera un obiect cu un volum în corespondență cu dimensiunea ligandului, utilizând ca referință centrul geometric al reziduurilor selectate. Apoi, o cutie cu dimensiuni optime este centrată pe obiectul generat. c) „Center on Hetero” – se plasează o cutie pe centrul geometric al unui ligand existent (dacă receptorul a fost dat în complex cu un ligand), și d) „Box” – centrul și dimensiunile cutiei sunt definite de utilizator. Cutia generată cu oricare dintre aceste metode poate fi vizualizată în PyMOL și poate fi ușor modificată după bunul plac al utilizatorului folosind noul plugin AMDock (adaptat din ) încorporat în fereastra de meniu PyMOL.
- 3-
Executarea simulărilor de docking și analiza rezultatelor: După rularea calculelor de andocare moleculară (demarate prin apăsarea butonului „Run”), utilizatorul va fi condus automat la fila „Results Analysis” (Analiza rezultatelor), unde sunt listate valorile Affinity (afinitate), Estimated Ki (Ki estimat) și Ligand Efficiencies (eficiență a ligandului) pentru diferitele poziții de legare.
Chi estimat este o valoare foarte utilă, deoarece este mai mult legată de parametrii experimentali măsurați de obicei, în comparație cu afinitatea. Eficiența ligandului (LE), pe de altă parte, este un parametru informativ important atunci când se selectează un compus principal . Aici, LE se calculează cu ajutorul următoarei ecuații:
unde ΔG este energia liberă de legare sau valoarea scorului calculat, iar HA este numărul de atomi grei (non-hidrogeni) ai ligandului. Compușii cu LE > 0,3 sunt evidențiați ca potențiali compuși principali .
Botonul „Show in PyMOL” (Afișare în PyMOL) pornește PyMOL cu o vizualizare personalizată a complexului dintre receptor și poziția selectată (poziția ligandului cu cea mai mică energie este aleasă în mod implicit). Datele rezultate pe parcursul procesului sunt stocate într-un fișier (*.amdock), care poate fi utilizat pentru a examina rezultatele în orice moment ulterior.
Diferiți parametri de andocare pot fi setați în fila „Configuration”, în timp ce fila „Info”, oferă acces la documentația la îndemână, inclusiv un manual de utilizare și referințe.
Vizualizare
AMDock se bazează pe PyMOL pentru vizualizare în două etape diferite: 1) setarea locației și dimensiunilor cutiei de grilă (spațiul de căutare) și 2) analiza rezultatelor de andocare. PyMOL este un program de analiză moleculară versatil și ușor de utilizat care, în plus, permite crearea de imagini de înaltă calitate pentru publicare. Am codificat în AMDock mai multe reprezentări PyMOL predeterminate pentru cele două etape, selectând designul vizual și informațiile pe care le-am considerat optime în fiecare caz. Aceste reprezentări predefinite pot fi modificate de către utilizator în PyMOL.
Spațiu de căutare
Reprezentările predeterminate (în ordinea descrescătoare a complexității, în funcție de numărul de elemente din conținutul vizualizării) sunt următoarele: 1) Box – o reprezentare simplă în care proteina studiată apare sub formă de desen animat, împreună cu caseta cu specificațiile definite de utilizator (Fig. 2a); 2-Centered on Hetero – include proteina receptoare (desen animat) și caseta cu o dimensiune optimă centrată pe ligandul anterior selectat (bețe) (Fig. 2b); 3-Centered on Residue(s) – o reprezentare care permite utilizatorului să identifice reziduurile care au fost selectate pentru a defini spațiul de căutare. Proteina este reprezentată sub formă de desen animat, reziduurile selectate sub formă de bastoane și obiectul AutoLigand sub formă de puncte. Caseta calculată este, de asemenea, prezentată, astfel încât utilizatorul să poată verifica și ajusta cu ușurință (dacă este necesar) poziția și dimensiunile acesteia (Fig. 2c). 4-Automatic – Aici am intenționat să creăm o reprezentare simplificată pentru a arăta toate situsurile de legare prezise de AutoLigand. Proteina este în desen animat, fiecare obiect AutoLigand este reprezentat în bastonașe, înconjurat de o suprafață construită pe reziduurile sale vecine. Deoarece simulările de andocare urmează să fie efectuate pentru fiecare situs prezis de AutoLigand, se generează o casetă pentru fiecare situs, dar se afișează numai pentru un situs selectat de utilizator (Fig. 2d). După cum s-a menționat mai sus, în oricare dintre aceste variante, centrul și dimensiunea cutiei pot fi modificate cu ușurință cu ajutorul plugin-ului AMDock implementat în PyMOL.
Rezultatele analizei
Proteina este reprezentată în desene animate. Fiecare poziție a ligandului este desenată în bastonașe, iar contactele sale polare cu proteina sunt reprezentate prin linii punctate. O vizualizare similară este, de asemenea, posibilă pentru ambele proteine dacă a fost aleasă procedura „Off-Target Docking” (Fig. 3c). Acest lucru permite o comparație simultană a pozițiilor liganzilor atât pentru proteinele țintă, cât și pentru cele din afara țintei.
Studiu de caz: Selectivitatea de legare a SAR405 – PI3Kγ vs. Vps34
Phosfatidilinositol-3-kinaza (PI3K) este o enzimă implicată în creștere, proliferare, motilitate, supraviețuire și trafic intracelular . PI3K este, de asemenea, o țintă promițătoare pentru cancer, mai mulți dintre inhibitorii săi fiind deja în stadiul clinic. Câțiva dintre acești inhibitori se află în prezent în faza III de studii clinice, iar unul dintre ei, alpelisib, a primit recent (mai 2019) aprobarea FDA pentru utilizarea în tratamentul cancerului de sân metastatic.
PI3K are mai multe izoforme care sunt grupate în 3 clase diferite. Clasa I include patru izoforme diferite (α, β, γ și δ), în timp ce clasa III este compusă dintr-o singură proteină, numită Vps34 . Datorită similarităților de secvență și structurale, unii inhibitori pot lega diferite izoforme, în timp ce alți câțiva inhibitori au fost concepuți pentru a fi specifici pentru fiecare izoformă. Grupul nostru de cercetare se concentrează în prezent asupra identificării inhibitorilor PI3K cu capacitatea de a inhiba ortologii PI3K găsiți în diferite microorganisme patogene, care exprimă doar izoforma ancestrală Vps34. În acest scop, AMDock reprezintă un instrument valoros, în special opțiunea sa „Off-Target Docking”. Aici demonstrăm utilizarea sa cu un exercițiu care seamănă cu propriile noastre lucrări de cercetare.
Sar405 este un inhibitor foarte specific al Vps34 (IC50 = 1,2 nM), în timp ce IC50 pentru alte izoforme este > 104 nM . O structură cristalină a SAR405 în complex cu Vps34 uman este disponibilă în Protein Data Bank (cod PDB: 4oys). Aici folosim Vps34 uman ca receptor „Țintă”, în timp ce izoforma PI3K gamma (PDB: 3apf) este folosită ca receptor „Off-Target”. Ambele structuri conțin un ligand legat în situsul activ, ceea ce este convenabil pentru a genera caseta de grilă. În prima etapă, selectăm programul de andocare (Autodock Vina) și, ulterior, se creează un dosar de proiect pe discul dur al computerului. După încărcarea ambelor structuri proteice, profităm de similitudinea de secvență a acestora pentru a utiliza opțiunea disponibilă de aliniere și suprapunere a structurilor lor folosind PyMOL, ceea ce face posibilă definirea unui spațiu de căutare comun și simplificarea analizei ulterioare a rezultatelor docking-ului. În continuare, fișierele de intrare sunt pregătite automat, ceea ce include protonarea reziduurilor titrabile, fuzionarea hidrogenilor nepolari și eliminarea ionilor/apă. Centrul cutiei este definit pe baza centrului geometric al liganzilor legați (Fig. 3a), în timp ce dimensiunea cutiei este definită pe baza razei de girație a ligandului care urmează să fie andocat , adică inhibitorul SAR405 în acest caz. Conformația inițială a ligandului (unghiurile de torsiune ale acestuia) a fost randomizată cu ajutorul ADT.
După ce procesul este finalizat, rezultatele arată că SAR405 este mai selectiv pentru Vps34 (- 9,2 kcal/mol) decât pentru Pi3Kγ (- 7,3 kcal/mol), așa cum era de așteptat (Fig. 3b). Poziția de legare prezisă pentru SAR405 în Vps34 este apropiată de geometria cristalină (rmsd = 1,9 Å pentru toți atomii de ligand, rmsd = 0,5 Å pentru nucleul inelului). De asemenea, valoarea Ki prezisă pentru acest complex este în intervalul nanomolar, ceea ce este în concordanță cu valoarea experimentală. Pe de altă parte, o valoare Ki mult mai mare este prezisă pentru complexul Pi3Kγ-SAR405, iar poziția de legare prezisă diferă semnificativ de structura cristalografică (rmsd = 4,7), așa cum se arată în Fig. 3c, ceea ce poate explica valoarea slabă a afinității prezise de AutoDock Vina. Acest caz de studiu a fost încorporat ca tutorial în manualul de utilizare, care este inclus în dosarul de instalare AMDock, și în wiki-ul de pe Github (https://github.com/Valdes-Tresanco-MS/AMDock-win/wiki/4.3-Off-target-docking).
Discuție
AMDock oferă o interfață nouă, ușor de utilizat și versatilă pentru a lucra cu două motoare de andocare moleculară, Autodock4 și Autodock Vina, având funcționalități și caracteristici diferite. AMDock ar trebui să fie foarte util cercetătorilor cu puțină experiență în lucrul cu programele de andocare, deoarece nu sunt necesare cunoștințe prealabile despre funcționarea specifică a acestor programe. În mediul AMDock sunt incluse trei fluxuri de lucru diferite (docking simplu, docking în afara țintei și scoring). Considerăm că procedura de andocare în afara țintei este deosebit de utilă pentru realizarea studiilor de selectivitate a liganzilor – o etapă critică în procesul de proiectare a medicamentelor.
Pregătirea fișierelor de intrare într-un mod adecvat și coerent, precum și definirea corectă a spațiului de căutare, sunt aspecte critice atunci când se realizează studii de andocare moleculară. Mai multe programe/scripturi externe sunt integrate în AMDock pentru a permite pregătirea fișierelor de intrare cu un efort minim, păstrând în același timp controlul asupra procesului. AMDock utilizează OpenBabel și PDB2PQR pentru protonarea ligandului și, respectiv, a receptorului, în timp ce celelalte interfețe grafice menționate în introducere utilizează ADT atât pentru protonarea receptorului, cât și a ligandului (cu excepția DockingApp, care utilizează, de asemenea, OpenBabel pentru protonarea ligandului).
Pentru a defini spațiul de căutare, AMDock oferă mai multe opțiuni pentru a seta poziția cutiei de grilă în diferite scenarii, în timp ce ligandul de intrare este utilizat în mod implicit pentru a determina dimensiunile optime ale cutiei, ceea ce scade costul de calcul în timp ce optimizează procesul de andocare . În această privință, numai ADT și plugin-ul PyMOL/AutoDock oferă unele opțiuni limitate, altele decât un spațiu de căutare definit de utilizator, dar în orice caz dimensiunea cutiei trebuie definită de utilizator. În unele dintre aceste interfețe grafice, precum în DockingApp, spațiul de căutare acoperă întregul receptor, ceea ce duce la costuri de calcul suplimentare și poate compromite acuratețea simulărilor. În cazul altor GUI, utilizatorul trebuie să utilizeze o aplicație externă, cum ar fi ADT, pentru a defini parametrii casetei.
Opțiunea „Centered on Residue(s)” este preferabilă atunci când reziduurile situsului de legare sunt cunoscute. Cu această opțiune, un obiect plasat în centrul geometric al reziduurilor selectate este generat cu AutoLigand pe suprafața proteinei. Această procedură optimizează atât locația, cât și dimensiunea spațiului de căutare. Dacă caseta ar fi fost centrată, în schimb, pe centrul geometric al reziduurilor selectate, o parte semnificativă a acesteia va fi probabil încorporată în proteină, cerând o dimensiune mai mare pentru a acoperi spațiul de eșantionare necesar (Fig. 4). Alternativa „Centered on Hetero” (Centrat pe hetero) este utilă pentru studiile de redocking pe complexe cu structuri cristalografice sau atunci când se studiază liganzi cu moduri de legare similare (Fig. 2b). Opțiunea „Automatic”, pe de altă parte, este de dorit atunci când nu sunt disponibile informații referitoare la situsul de legare. În acest caz, se efectuează o rulare de andocare independentă pentru fiecare situs de legare prezis de AutoLigand (Fig. 2d). În acest fel, informațiile provenite din metoda de clasificare AutoLigand sunt combinate cu cele ale motorului de andocare, fără a se face o selecție arbitrară a unuia dintre situsurile prezise. Acest proces se realizează automat, iar rezultatele pentru fiecare dintre situsurile de legare prezise pot fi vizualizate în PyMOL. În general, definirea și vizualizarea casetei implică un efort minim și poate fi oricând modificată, reprezentând astfel un avantaj nu numai pentru utilizatorul începător, ci și pentru experți.
Este demn de remarcat faptul că am standardizat dimensiunea casetei pentru a fi în angstromi pentru a evita erorile care apar frecvent, așa cum au fost raportate în diferite forumuri și liste de discuții. Aceste erori apar din cauza modurilor diferite în care sunt definite dimensiunile cutiei în AutoDock (număr de puncte + distanța dintre grile) și Autodock Vina (în angstromi) și pot face ca spațiul de căutare să fie foarte mic sau prea mare, ceea ce duce în cele din urmă la inconsecvențe în rezultatele de andocare obținute.
Integrarea AMDock cu PyMOL reprezintă un avantaj semnificativ. Într-adevăr, PyMOL este un vizualizator molecular utilizat pe scară largă, cu un mare sprijin din partea comunității și o dezvoltare activă. În cadrul PyMOL, rezultatele de docking pot fi analizate cu mai multe instrumente, în special cu puternicul Protein-ligand Interaction Profiler . Alte aplicații, cum ar fi ADT, PyRx sau DockingApp, dispun de propriile vizualizatoare grafice. PyRx și DockingApp oferă soluții simple cu capacități analitice limitate, în timp ce ADT permite doar o analiză simplă a interacțiunilor proteină-ligand.
În plus, cu AMDock este posibil să se lanseze simulări de andocare pentru metalo-proteine folosind câmpul de forță Zn al AutoDock, care este disponibil în ADT doar prin linia de comandă. Opțiunea sa de andocare în afara țintei, foarte utilă pentru studiile de reproiectare a medicamentelor, este disponibilă doar în Dockomatic și PyRx (în ultimul, doar în versiunea de plată).
Majoritatea interfețelor grafice de andocare se concentrează pe screening-ul virtual. În prezent, AMDock nu are suport pentru screeningul virtual, însă, în prezent, lucrăm la implementarea acestuia, pentru a-l face disponibil în următoarea versiune a programului.
În cele din urmă, și deoarece ADT este probabil cel mai utilizat GUI de andocare, oferim o comparație mai detaliată între AMDock și ADT (Tabelul 1).
Concluzii
AMDock este o interfață grafică ușor de utilizat, care funcționează într-o manieră foarte intuitivă și interactivă, permițând realizarea de studii de andocare moleculară cu Autodock4 și AutoDock Vina cu un efort minim de configurare. Aceste caracteristici fac din AMDock un instrument atractiv și pentru scopuri didactice. AMDock reunește caracteristici și proceduri care nu sunt prezente în alte programe similare. Acesta include evoluții recente în AutoDock, cum ar fi parametrizarea Autodock4Zn. Pentru grupul nostru, AMDock a fost foarte util pentru estimarea profilului de selectivitate a diferiților inhibitori PI3K asupra proteinelor ortologe în mai multe microorganisme. Alte dezvoltări (ligand hidratat, andocare covalentă și screening virtual) vor fi incluse ca opțiuni de andocare în versiunile viitoare.
.