Il docking molecolare è diventato un potente strumento per la scoperta e l’ottimizzazione dei lead. Un gran numero di programmi di docking sono stati sviluppati negli ultimi tre decenni, basati su diversi algoritmi di ricerca e funzioni di punteggio. Allo scopo di rendere questi programmi di docking più facili da usare, specialmente per i principianti, sono state sviluppate diverse interfacce grafiche (GUI) per assistere nella preparazione dei sistemi molecolari, nell’esecuzione dei calcoli e/o nell’analisi dei risultati. Esempi di GUI disponibili (sviluppati principalmente per AutoDock e/o Autodock Vina ) sono AutoDock Tools (ADT), integrato nel pacchetto grafico PMV , BDT , DOVIS , VSDocker , AUDocker LE , WinDock , DockoMatic , PyMOL AutoDock plugin (PyMOL/AutoDock) , PyRx , MOLA , DockingApp e JADOPPT .

Presentiamo qui un nuovo strumento multipiattaforma, AMDock (Assisted Molecular Docking), il cui principale vantaggio rispetto ai suoi predecessori è l’integrazione di diversi preziosi strumenti esterni all’interno di un’interfaccia grafica semplice e intuitiva che guida gli utenti lungo protocolli di docking ben stabiliti – utilizzando Autodock4 o AutoDock Vina – dalla preparazione del sistema all’analisi dei risultati.

Funzionalità e flusso di lavoro

AMDock integra funzionalità di Autodock Vina e Autodock4, script ADT, AutoLigand, Open Babel, PDB2PQR e PyMOL. Per le proteine che contengono uno ione di zinco nel sito attivo, AMDock ha la possibilità di utilizzare i parametri Autodock4Zn appositamente adattati. AMDock è codificato in Python 2.7 ed è disponibile per Windows e Linux. Su Windows, è impacchettato insieme a tutti gli strumenti integrati, quindi non è richiesta alcuna installazione aggiuntiva di software. Su Linux, solo Open Babel e PyMOL devono essere installati (entrambi gli strumenti sono inclusi nei repository Linux più popolari).

La finestra principale di AMDock ha cinque schede: 1) Home, 2) Docking Options, 3) Results Analysis, 4) Configuration e 5) Info. Un riassunto delle funzionalità e del flusso di lavoro di AMDock è presentato di seguito (Fig. 1) e discusso successivamente in modo più dettagliato.

Fig. 1
figura1

Flusso di lavoro AMDock

Nella scheda “Home” l’utente può selezionare il motore di docking: Autodock Vina o Autodock4, con l’opzione aggiuntiva di utilizzare i parametri di Autodock4Zn. Poi l’utente viene automaticamente indirizzato alla scheda “Docking Options”, che contiene quattro pannelli che guidano la preparazione sequenziale di una simulazione di docking.

File di input per AMDock

Minimamente, sono necessarie le coordinate cartesiane delle molecole del ligando e del recettore, che possono essere fornite in diversi formati di struttura comuni, ad esempio PDB o PDBQT per la proteina, e PDB, PDBQT o Mol2 per il ligando. Se le coordinate della proteina si incontrano con un ligando legato, le coordinate di quest’ultimo vengono memorizzate e possono essere usate in seguito per definire lo spazio di ricerca.

Il programma funziona seguendo tre passi principali:

  1. 1-

    Preparazione dei file di input di docking: In primo luogo, l’utente può impostare un valore di pH per la protonazione sia del ligando (opzionale, valore di default 7.4), usando Open Babel e la proteina (valore di default: 7.4), usando PDB2PQR. Sono disponibili due diverse opzioni di docking: a) “simple docking”, per predire la modalità di legame di un singolo complesso proteina-ligando, e b) “off-target docking”, per predire le posizioni di legame di un ligando con due recettori diversi, cioè il target e l’off-target. Infine, l’opzione “Scoring” inclusa in questa scheda permette di segnare un complesso proteina-ligando già esistente, utilizzando le funzioni Autodock Vina, Autodock4 o Autodock4Zn. Una volta selezionato il protocollo di docking o scoring, i file di input vengono preparati utilizzando gli script ADT.

  2. 2-

    Definizione dello spazio di ricerca: Quattro diversi approcci possono essere utilizzati per definire il centro e le dimensioni di un box: a) “Automatico” – il programma utilizza AutoLigand per prevedere i possibili siti di legame e poi un box con dimensioni ottimali viene centrato su ogni oggetto AutoLigand,Footnote 1 ad ogni sito di legame previsto. b) “Centro su Residuo(i)” – AutoLigand viene utilizzato per generare un oggetto con un volume in corrispondenza delle dimensioni del ligando, utilizzando come riferimento il centro geometrico dei residui selezionati. Poi, una scatola con dimensioni ottimali viene centrata sull’oggetto generato. c) “Center on Hetero” – una scatola viene posta sul centro geometrico di un ligando esistente (se il recettore è stato dato in complesso con un ligando), e d) “Box” – il centro della scatola e le dimensioni sono definite dall’utente. Il box generato con uno qualsiasi di questi metodi può essere visualizzato in PyMOL e facilmente modificato a piacimento dell’utente usando il nuovo plugin AMDock (adattato da ) incorporato nella finestra del menu di PyMOL.

  3. 3-

    Esecuzione delle simulazioni di docking e analisi dei risultati: Dopo aver eseguito i calcoli di docking molecolare (avviati cliccando il pulsante “Run”), l’utente sarà portato automaticamente alla scheda “Results Analysis”, dove sono elencati l’affinità, i valori Ki stimati e le efficienze dei ligandi per le diverse posizioni di legame.

Il Ki stimato è un valore molto utile in quanto è più legato ai parametri sperimentali solitamente misurati, rispetto all’affinità. L’efficienza del ligando (LE), d’altra parte, è un parametro informativo importante quando si seleziona un composto principale. Qui, LE è calcolato utilizzando la seguente equazione:

$$ LE=\frac{-\varDelta G}{HA}, $$
(1)

dove ΔG è l’energia libera di legame o il valore di punteggio calcolato e HA è il numero di atomi pesanti (non idrogeno) del ligando. I composti con LE > 0.3 sono evidenziati come potenziali composti di piombo.

Il pulsante “Show in PyMOL” avvia PyMOL con una visualizzazione personalizzata del complesso tra il recettore e la posa selezionata (la posa del ligando a più bassa energia è scelta per default). I dati risultanti durante il processo sono memorizzati in un file (*.amdock), che può essere utilizzato per esaminare i risultati in qualsiasi momento in seguito.

Diversi parametri di docking possono essere impostati nella scheda “Configuration”, mentre la scheda “Info”, dà accesso a una pratica documentazione, compreso un manuale utente e riferimenti.

Visualizzazione

AMDock si basa su PyMOL per la visualizzazione in due fasi diverse: 1) impostazione della posizione e delle dimensioni della griglia (lo spazio di ricerca), e 2) analisi dei risultati del docking. PyMOL è un programma di analisi molecolare versatile e facile da usare che, inoltre, permette di creare immagini di alta qualità per la pubblicazione. Abbiamo codificato in AMDock diverse rappresentazioni PyMOL predeterminate per le due fasi, selezionando il design visivo e le informazioni che abbiamo considerato ottimali in ogni caso. Queste rappresentazioni predefinite possono essere modificate dall’utente all’interno di PyMOL.

Spazio di ricerca

Le rappresentazioni predeterminate (in ordine decrescente di complessità, secondo il numero di elementi nel contenuto della visualizzazione) sono le seguenti: 1) Box – una rappresentazione semplice in cui la proteina in studio appare come cartone animato, insieme al box con le specifiche definite dall’utente (Fig. 2a); 2-Centered on Hetero – include la proteina recettore (cartone animato) e il box con una dimensione ottimale centrato sul ligando precedente selezionato (sticks) (Fig. 2b); 3-Centered on Residue(s) – una rappresentazione che permette all’utente di identificare i residui che sono stati selezionati per definire lo spazio di ricerca. La proteina è rappresentata come cartone, i residui selezionati come bastoncini e l’oggetto AutoLigand come punti. Viene anche mostrato il box calcolato, in modo che l’utente possa facilmente controllare e regolare (se necessario) la sua posizione e le sue dimensioni (Fig. 2c). 4-Automatico – Qui abbiamo voluto creare una rappresentazione semplificata per mostrare tutti i siti di legame predetti da AutoLigand. La proteina è in cartone animato, ogni oggetto AutoLigand è rappresentato in bastoncini, circondato da una superficie costruita sui suoi residui vicini. Poiché le simulazioni di docking devono essere eseguite per ogni sito predetto da AutoLigand, viene generato un box per ogni sito, ma mostrato solo per un sito selezionato dall’utente (Fig. 2d). Come detto sopra, in ognuna di queste varianti il centro e la dimensione del box possono essere facilmente modificati usando il plugin AMDock implementato in PyMOL.

Fig. 2
figura2

Visualizzazione del sito di legame con PyMOL. a Box definito dall’utente. Questo è un esempio usato nei tutorial con AutoDock4Zn e la farnesiltransferasi (hFTase). b Centrato su Hetero, (c) Centrato su Residuo(i) e (d) Modalità automatica. Le rappresentazioni B, C e D corrispondono a Vps34 (PDB: 4uwh)

Risultati analisi

La proteina è rappresentata in cartone. Ogni posizione del ligando è disegnata in bastoncini e i suoi contatti polari con la proteina sono mostrati come linee tratteggiate. Una visualizzazione simile è anche possibile per entrambe le proteine se è stata scelta la procedura “Off-Target Docking” (Fig. 3c). Questo permette un confronto simultaneo delle posizioni dei ligandi sia per le proteine target che per quelle off-target.

Fig. 3
figura3

Off-target docking di SAR405. a Visualizzazione dello spazio di ricerca per il docking, centrato su ligandi noti. b Confronto di affinità. c Superposizione della migliore posizione di SAR405 in complesso con PI3Kγ (3apf) (proteina in fumetto ciano e ligando in bastoncini magenta) sul complesso di riferimento Vps34-SAR405 (4oys) (proteina in fumetto grigio e ligando in bastoncini verdi)

Caso di studio: SAR405 binding selectivity – PI3Kγ vs. Vps34

Phosphatidylinositol 3-kinase (PI3K) è un enzima coinvolto nella crescita, proliferazione, motilità, sopravvivenza e traffico intracellulare. PI3K è anche un promettente bersaglio del cancro, con diversi suoi inibitori già in fase clinica. Alcuni di questi inibitori sono attualmente in studi clinici di fase III e uno di loro, alpelisib, ha recentemente (maggio 2019) ricevuto l’approvazione della FDA per l’uso nel trattamento del cancro al seno metastatico.

PI3K ha diverse isoforme che sono raggruppate in 3 diverse classi. La classe I comprende quattro diverse isoforme (α, β, γ e δ), mentre la classe III è composta da una sola proteina, chiamata Vps34 . A causa delle loro somiglianze di sequenza e strutturali, alcuni inibitori possono legare diverse isoforme, mentre diversi altri inibitori sono stati progettati per essere specifici delle isoforme. Il nostro gruppo di ricerca è attualmente concentrato sull’identificazione di inibitori PI3K con la capacità di inibire gli ortologhi PI3K trovati in diversi microrganismi patogeni, che esprimono solo l’isoforma ancestrale Vps34. Per questo scopo, AMDock rappresenta uno strumento prezioso, in particolare la sua opzione “Off-Target Docking”. Qui dimostriamo il suo uso con un esercizio che assomiglia al nostro lavoro di ricerca.

Sar405 è un inibitore altamente specifico di Vps34 (IC50 = 1,2 nM), mentre il suo IC50 per altre isoforme è > 104 nM . Una struttura cristallina di SAR405 in complesso con Vps34 umano è disponibile nella Protein Data Bank (codice PDB: 4oys). Qui usiamo la Vps34 umana come recettore “Target”, mentre l’isoforma PI3K gamma (PDB: 3apf) è usata come recettore “Off-Target”. Entrambe le strutture contengono un ligando legato nel sito attivo, che è conveniente per generare la casella della griglia. Nel primo passo, selezioniamo il programma di docking (Autodock Vina) e successivamente viene creata una cartella di progetto nel disco rigido del computer. Dopo aver caricato entrambe le strutture proteiche, approfittiamo della loro somiglianza di sequenza per utilizzare l’opzione disponibile di allineare e sovrapporre le loro strutture utilizzando PyMOL, che rende possibile definire uno spazio di ricerca comune e semplificare la successiva analisi dei risultati di docking. Successivamente, i file di input vengono preparati automaticamente, il che include la protonazione dei residui titolabili, la fusione degli idrogeni non polari e la rimozione di ioni/acqua. Il centro della scatola è definito in base al centro geometrico dei ligandi legati (Fig. 3a), mentre la dimensione della scatola è definita in base al raggio di rotazione del ligando da agganciare, cioè l’inibitore SAR405 in questo caso. La conformazione iniziale del ligando (i suoi angoli di torsione) è stata randomizzata usando ADT.

Una volta completato il processo, i risultati mostrano che SAR405 è più selettivo per Vps34 (- 9,2 kcal/mol) che per Pi3Kγ (- 7,3 kcal/mol) come previsto (Fig. 3b). La posizione di legame prevista per SAR405 in Vps34 è vicina alla geometria del cristallo (rmsd = 1,9 Å per tutti gli atomi del ligando, rmsd = 0,5 Å per il nucleo dell’anello). Inoltre, il valore Ki previsto per questo complesso è nell’intervallo nanomolare, che concorda con il valore sperimentale. D’altra parte, un valore Ki molto più alto è previsto per il complesso Pi3Kγ-SAR405, e la posizione prevista legame differisce significativamente dalla struttura cristallografica (rmsd = 4.7), come mostrato in Fig. 3c, che può spiegare il valore povero affinità previsto da AutoDock Vina. Questo caso di studio è stato incorporato come tutorial nel manuale utente, che è incluso nella cartella di installazione di AMDock, e nel wiki su Github (https://github.com/Valdes-Tresanco-MS/AMDock-win/wiki/4.3-Off-target-docking).

Discussione

AMDock fornisce un’interfaccia nuova, facile da usare e versatile per lavorare con due motori di docking molecolare, Autodock4 e Autodock Vina, con diverse funzionalità e caratteristiche. AMDock dovrebbe essere molto utile ai ricercatori con poca esperienza di lavoro con i programmi di docking poiché non è necessaria alcuna conoscenza precedente del funzionamento particolare di questi programmi. Tre diversi flussi di lavoro (docking semplice, docking off-target e scoring) sono inclusi nell’ambiente AMDock. Troviamo la procedura di docking off-target particolarmente utile per condurre studi di selettività dei ligandi – un passo critico nel processo di progettazione dei farmaci.

La preparazione dei file di input in modo adeguato e coerente, così come la corretta definizione dello spazio di ricerca, sono questioni critiche quando si eseguono studi di docking molecolare. Diversi programmi/script esterni sono integrati in AMDock per consentire la preparazione dei file di input con il minimo sforzo, mantenendo il controllo del processo. AMDock usa OpenBabel e PDB2PQR per la protonazione del ligando e del recettore, rispettivamente, mentre le altre GUI menzionate nell’introduzione usano ADT per la protonazione sia del recettore che del ligando (ad eccezione di DockingApp, che usa anche OpenBabel per la protonazione del ligando).

Per definire lo spazio di ricerca, AMDock offre diverse opzioni per impostare la posizione della casella della griglia in diversi scenari, mentre il ligando in ingresso viene utilizzato per impostazione predefinita per determinare le dimensioni ottimali della casella, che diminuisce il costo computazionale durante l’ottimizzazione del processo di docking. A questo proposito, solo ADT e il plugin PyMOL/AutoDock offrono alcune opzioni limitate oltre ad uno spazio di ricerca definito dall’utente, ma in ogni caso la dimensione del box deve essere definita dall’utente. In alcune di queste GUI, come in DockingApp, lo spazio di ricerca copre l’intero recettore, il che porta a costi computazionali aggiuntivi e forse compromette la precisione delle simulazioni. Con altre GUI, l’utente deve usare un’applicazione esterna come ADT per definire i parametri del box.

L’opzione “Centered on Residue(s)” è preferibile quando i residui del sito di legame sono noti. Con questa opzione, un oggetto posto al centro geometrico dei residui selezionati viene generato con AutoLigand sulla superficie della proteina. Questa procedura ottimizza sia la posizione che la dimensione dello spazio di ricerca. Se il box fosse centrato invece sul centro geometrico dei residui selezionati, una parte significativa di esso sarebbe probabilmente incorporata nella proteina, richiedendo una dimensione maggiore per coprire lo spazio di campionamento necessario (Fig. 4). L’alternativa “Centered on Hetero” è utile per studi di redocking su complessi con strutture cristallografiche o quando si studiano ligandi con modalità di legame simili (Fig. 2b). L’opzione “Automatic”, d’altra parte, è auspicabile quando non sono disponibili informazioni riguardanti il sito di legame. In questo caso, un docking indipendente viene eseguito per ogni sito di legame previsto da AutoLigand (Fig. 2d). In questo modo, le informazioni del metodo di classificazione di AutoLigand sono combinate con quelle del motore di docking, senza fare una selezione arbitraria di uno dei siti predetti. Questo processo è fatto automaticamente e i risultati per ciascuno dei siti di legame predetti possono essere visualizzati in PyMOL. Nel complesso, la definizione e la visualizzazione del box comporta uno sforzo minimo e può essere sempre modificata, rappresentando così un vantaggio non solo per l’utente inesperto ma anche per gli esperti.

Fig. 4
figura4

Confronto tra un box (bianco) situato al centro geometrico dei residui selezionati (A:ILE:634, A:TYR:670, A:PHE:684, A:PHE:758, A:ILE:760; in salmone) e un box (magenta) centrato su un oggetto generato da AutoLigand dal centro geometrico dei residui selezionati. In quest’ultimo caso, il riquadro definisce uno spazio di campionamento del ligando più ottimale

E’ da notare che abbiamo standardizzato la dimensione del riquadro in Angstrom per evitare errori che si verificano comunemente, come riportato in diversi forum e mailing-list. Questi errori derivano dai diversi modi in cui le dimensioni del box sono definite in AutoDock (numero di punti + spaziatura della griglia) e Autodock Vina (in angstrom), e possono causare uno spazio di ricerca molto piccolo o troppo grande, portando alla fine a incongruenze nei risultati di docking ottenuti.

L’integrazione di AMDock con PyMOL rappresenta un vantaggio significativo. Infatti, PyMOL è un visualizzatore molecolare ampiamente utilizzato con grande supporto della comunità e sviluppo attivo. All’interno di PyMOL, i risultati del docking possono essere analizzati con molteplici strumenti, in particolare con il potente Protein-ligand Interaction Profiler . Altre applicazioni come ADT, PyRx o DockingApp hanno i loro propri visualizzatori grafici. PyRx e DockingApp offrono soluzioni semplici con capacità analitiche limitate, mentre ADT permette solo una semplice analisi delle interazioni proteina-ligando.

Inoltre, con AMDock è possibile lanciare simulazioni di docking per le metalloproteine usando il campo di forza Zn di AutoDock, che è disponibile in ADT solo attraverso la linea di comando. La sua opzione di docking off-target, molto utile per gli studi di repurposing dei farmaci, è disponibile solo in Dockomatic e PyRx (in quest’ultimo, solo nella versione a pagamento).

La maggior parte delle GUI di docking sono concentrate sullo screening virtuale. Attualmente, AMDock non ha il supporto per lo screening virtuale, tuttavia, stiamo lavorando sulla sua implementazione, per renderla disponibile nella prossima versione del programma.

Infine, e poiché ADT è probabilmente la GUI di docking più utilizzata, forniamo un confronto più dettagliato tra AMDock e ADT (Tabella 1).

Tabella 1 Confronto tra le caratteristiche degli strumenti AMDock e AutoDock

Conclusioni

AMDock è una GUI facile da usare che funziona in modo altamente intuitivo e interattivo, permettendo di eseguire studi di docking molecolare con Autodock4 e AutoDock Vina con un minimo sforzo di configurazione. Queste caratteristiche rendono AMDock uno strumento attraente anche per scopi didattici. AMDock raccoglie caratteristiche e procedure che non sono presenti in altri programmi simili. Include i recenti sviluppi di AutoDock, come la parametrizzazione di Autodock4Zn. Per il nostro gruppo, AMDock è stato molto utile per stimare il profilo di selettività di diversi inibitori PI3K su proteine ortologhe in diversi microrganismi. Ulteriori sviluppi (legante idrato, docking covalente e screening virtuale) saranno inclusi come opzioni di docking nelle versioni future.

Articles

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.