El docking molecular se ha convertido en una poderosa herramienta para el descubrimiento y optimización de pistas. Durante las últimas tres décadas se ha desarrollado un gran número de programas de docking, basados en diferentes algoritmos de búsqueda y funciones de puntuación. Con el objetivo de que estos programas de docking sean más fáciles de usar, especialmente para los principiantes, se han desarrollado diferentes interfaces gráficas de usuario (GUI) para ayudar en la preparación de los sistemas moleculares, la ejecución de los cálculos y/o el análisis de los resultados. Ejemplos de GUIs disponibles (desarrollados principalmente para AutoDock y/o Autodock Vina ) son AutoDock Tools (ADT), integrado en el paquete gráfico PMV , BDT , DOVIS , VSDocker , AUDocker LE , WinDock , DockoMatic , PyMOL AutoDock plugin (PyMOL/AutoDock) , PyRx , MOLA , DockingApp y JADOPPT .

Presentamos aquí una nueva herramienta multiplataforma, AMDock (Assisted Molecular Docking), cuya principal ventaja sobre sus predecesoras es la integración de varias herramientas externas de gran valor dentro de una interfaz gráfica sencilla e intuitiva que guía a los usuarios a lo largo de protocolos de docking bien establecidos -utilizando Autodock4 o AutoDock Vina- desde la preparación del sistema hasta el análisis de los resultados.

Funcionalidades y flujo de trabajo

AMDock integra funcionalidades de Autodock Vina y Autodock4, scripts ADT, AutoLigand , Open Babel , PDB2PQR y PyMOL . Para las proteínas que contienen un ion de zinc en el sitio activo, AMDock tiene la opción de utilizar los parámetros especialmente adaptados de Autodock4Zn. AMDock está codificado en Python 2.7 y está disponible para Windows y Linux. En Windows, está empaquetado junto con todas las herramientas integradas, por lo que no se requiere la instalación de software adicional. En Linux, sólo hay que instalar Open Babel y PyMOL (ambas herramientas están incluidas en los repositorios más populares de Linux).

La ventana principal de AMDock tiene cinco pestañas: 1) Inicio, 2) Opciones de acoplamiento, 3) Análisis de resultados, 4) Configuración y 5) Información. A continuación se presenta un resumen de las funcionalidades y el flujo de trabajo de AMDock (Fig. 1), que se analiza posteriormente con más detalle.

Fig. 1
figure1

Flujo de trabajo de AMDock

En la pestaña «Home», el usuario puede seleccionar el motor de acoplamiento: Autodock Vina o Autodock4, con la opción adicional de utilizar los parámetros de Autodock4Zn. A continuación, el usuario es dirigido automáticamente a la pestaña «Docking Options», que contiene cuatro paneles que guían la preparación secuencial de una simulación de docking.

Ficheros de entrada para AMDock

Mínimamente, se necesitan las coordenadas cartesianas de las moléculas del ligando y del receptor, que pueden proporcionarse en varios formatos de estructura comunes, por ejemplo, PDB o PDBQT para la proteína, y PDB, PDBQT o Mol2 para el ligando. Si las coordenadas de la proteína se juntan con un ligando ligado, las coordenadas de este último se almacenan y pueden utilizarse posteriormente para definir el espacio de búsqueda.

El programa funciona siguiendo tres pasos principales:

  1. 1-

    Preparación de los archivos de entrada del docking: En primer lugar, el usuario puede establecer un valor de pH para la protonación tanto del ligando (opcional, valor por defecto 7,4), utilizando Open Babel y la proteína (valor por defecto: 7,4), utilizando PDB2PQR. Hay dos opciones de acoplamiento diferentes: a) «acoplamiento simple», para predecir el modo de unión de un solo complejo proteína-ligando, y b) «acoplamiento fuera del objetivo», para predecir las posturas de unión de un ligando con dos receptores diferentes, es decir, el objetivo y el fuera del objetivo. Por último, la opción «Scoring» incluida en esta pestaña permite puntuar un complejo proteína-ligando ya existente, utilizando las funciones Autodock Vina, Autodock4 o Autodock4Zn. Una vez seleccionado el protocolo de docking o scoring, los archivos de entrada se preparan mediante scripts ADT.

  2. 2-

    Definición del espacio de búsqueda: Se pueden utilizar cuatro enfoques diferentes para definir el centro y las dimensiones de una caja: a) «Automático» – el programa utiliza AutoLigand para predecir los posibles sitios de unión y luego se centra una caja con dimensiones óptimas en cada objeto de AutoLigand,Nota al pie 1 en cada sitio de unión predicho. b) «Centro en residuo(s)» – se utiliza AutoLigand para generar un objeto con un volumen en correspondencia con el tamaño del ligando, utilizando como referencia el centro geométrico de los residuos seleccionados. Luego, se centra una caja con dimensiones óptimas en el objeto generado. c) «Center on Hetero» – se coloca una caja en el centro geométrico de un ligando existente (si el receptor fue dado en complejo con un ligando), y d) «Box» – el centro y las dimensiones de la caja son definidos por el usuario. La caja generada con cualquiera de estos métodos puede visualizarse en PyMOL y modificarse fácilmente a conveniencia del usuario utilizando el nuevo plugin AMDock (adaptado de ) incrustado en la ventana de menú de PyMOL.

  3. 3-

    Correr las simulaciones de docking y analizar los resultados: Después de ejecutar los cálculos de docking molecular (iniciados haciendo clic en el botón «Run»), el usuario será llevado automáticamente a la pestaña «Results Analysis», donde se listan los valores de Afinidad, Ki estimado y Eficiencia del ligando para las diferentes poses de unión.

El Ki estimado es un valor muy útil ya que está más relacionado con los parámetros experimentales habitualmente medidos, en comparación con la afinidad. La eficiencia del ligando (LE), por otro lado, es un parámetro informativo importante a la hora de seleccionar un compuesto principal. Aquí, la LE se calcula utilizando la siguiente ecuación:

$$ LE=\frac{-\varDelta G}{HA}, $$
(1)

donde ΔG es la energía libre de unión o el valor de puntuación calculado y HA es el número de átomos pesados (no hidrógeno) del ligando. Los compuestos con LE > 0,3 se destacan como potenciales compuestos principales .

El botón «Show in PyMOL» inicia PyMOL con una visualización personalizada del complejo entre el receptor y la pose seleccionada (por defecto se elige la pose de menor energía del ligando). Los datos resultantes a lo largo del proceso se almacenan en un archivo (*.amdock), que puede ser utilizado para examinar los resultados en cualquier momento posterior.

Los diferentes parámetros de docking se pueden establecer en la pestaña «Configuration», mientras que la pestaña «Info», da acceso a la documentación práctica, incluyendo un manual de usuario y referencias.

Visualización

AMDock se basa en PyMOL para la visualización en dos etapas diferentes: 1) la configuración de la ubicación y las dimensiones de la caja de rejilla (el espacio de búsqueda), y 2) el análisis de los resultados del acoplamiento. PyMOL es un programa de análisis molecular versátil y fácil de usar que, además, permite crear imágenes de alta calidad para su publicación. Hemos codificado en AMDock varias representaciones predeterminadas de PyMOL para las dos etapas, seleccionando el diseño visual y la información que consideramos óptima en cada caso. Estas representaciones predefinidas pueden ser modificadas por el usuario dentro de PyMOL.

Espacio de búsqueda

Las representaciones predeterminadas (en orden descendente de complejidad, según el número de elementos del contenido de la visualización) son las siguientes: 1) Caja – una representación simple donde la proteína en estudio aparece como caricatura, junto con la caja con las especificaciones definidas por el usuario (Fig. 2a); 2-Centrada en Hetero – incluye la proteína receptora (caricatura) y la caja con un tamaño óptimo centrada en el ligando anterior seleccionado (palos) (Fig. 2b); 3-Centrada en Residuo(s) – una representación que permite al usuario identificar los residuos que fueron seleccionados para definir el espacio de búsqueda. La proteína se representa como un dibujo animado, los residuos seleccionados como palos y el objeto AutoLigando como puntos. También se muestra la caja calculada, para que el usuario pueda comprobar y ajustar fácilmente (si es necesario) su posición y dimensiones (Fig. 2c). 4-Automatic – Aquí pretendemos crear una representación simplificada para mostrar todos los sitios de unión predichos por AutoLigand. La proteína está en dibujos animados, cada objeto de AutoLigand está representado en palos, rodeado por una superficie construida sobre sus residuos vecinos. Dado que las simulaciones de acoplamiento deben realizarse para cada sitio predicho por AutoLigand, se genera una caja para cada sitio, pero se muestra sólo para un sitio seleccionado por el usuario (Fig. 2d). Como se ha mencionado anteriormente, en cualquiera de estas variantes el centro y el tamaño de la caja pueden modificarse fácilmente utilizando el plugin AMDock implementado en PyMOL.

Fig. 2
figure2

Visualización de sitios de unión con PyMOL. a Caja definida por el usuario. Este es un ejemplo utilizado en los tutoriales con AutoDock4Zn y la farnesiltransferasa (hFTase). b Centrado en Hetero, (c) Centrado en Residuo(s) y (d) Modo automático. Las representaciones B, C y D corresponden a Vps34 (PDB: 4uwh)

Análisis de resultados

La proteína se representa en viñetas. Cada postura del ligando se dibuja en palos y sus contactos polares con la proteína se muestran como líneas discontinuas. También es posible una visualización similar para ambas proteínas si se elige el procedimiento «Off-Target Docking» (Fig. 3c). Esto permite una comparación simultánea de las poses de los ligandos tanto para las proteínas objetivo como para las no objetivo.

Fig. 3
figure3

Docking no objetivo de SAR405. a Visualización del espacio de búsqueda para el docking, centrado en los ligandos conocidos. b Comparación de afinidad. c Superposición de la mejor pose de SAR405 en complejo con PI3Kγ (3apf) (proteína en dibujo cian y ligando en palos magenta) sobre el complejo de referencia Vps34-SAR405 (4oys) (proteína en dibujo gris y ligando en palos verdes)

Estudio de caso: Selectividad de unión de SAR405 – PI3Kγ frente a Vps34

La fosfatidilinositol 3-cinasa (PI3K) es una enzima implicada en el crecimiento, la proliferación, la motilidad, la supervivencia y el tráfico intracelular . La PI3K es también una prometedora diana contra el cáncer, y varios de sus inhibidores se encuentran ya en fase clínica. Algunos de estos inhibidores se encuentran actualmente en ensayos clínicos de fase III y uno de ellos, el alpelisib, ha recibido recientemente (mayo de 2019) la aprobación de la FDA para su uso en el tratamiento del cáncer de mama metastásico.

La PI3K tiene varias isoformas que se agrupan en 3 clases diferentes. La clase I incluye cuatro isoformas diferentes (α, β, γ y δ), mientras que la clase III está compuesta por una sola proteína, denominada Vps34. Debido a sus similitudes estructurales y de secuencia, algunos inhibidores pueden unirse a diferentes isoformas, mientras que otros inhibidores fueron diseñados para ser específicos de la isoforma. Nuestro grupo de investigación se centra actualmente en la identificación de inhibidores de PI3K con capacidad para inhibir los ortólogos de PI3K encontrados en diferentes microorganismos patógenos, que sólo expresan la isoforma ancestral Vps34. Para este propósito, AMDock representa una valiosa herramienta, particularmente su opción «Off-Target Docking». Aquí demostramos su uso con un ejercicio que se asemeja a nuestro propio trabajo de investigación.

Sar405 es un inhibidor altamente específico de Vps34 (IC50 = 1,2 nM), mientras que su IC50 para otras isoformas es > 104 nM . Una estructura cristalina de SAR405 en complejo con Vps34 humano está disponible en el Protein Data Bank (código PDB: 4oys). Aquí utilizamos el Vps34 humano como receptor «Target», mientras que la isoforma gamma de PI3K (PDB: 3apf) se utiliza como receptor «Off-Target». Ambas estructuras contienen un ligando ligado en el sitio activo, lo cual es conveniente para generar la caja de rejilla. En el primer paso, seleccionamos el programa de docking (Autodock Vina) y a continuación se crea una carpeta de proyecto en el disco duro del ordenador. Una vez cargadas las estructuras de ambas proteínas, aprovechamos su similitud de secuencia para utilizar la opción disponible de alinear y superponer sus estructuras mediante PyMOL, lo que permite definir un espacio de búsqueda común y simplificar el posterior análisis de los resultados del docking. A continuación, se preparan automáticamente los archivos de entrada, lo que incluye la protonación de los residuos titulables, la fusión de los hidrógenos no polares y la eliminación de iones/agua. El centro de la caja se define en base al centro geométrico de los ligandos unidos (Fig. 3a), mientras que el tamaño de la caja se define en base al radio de giro del ligando a acoplar, es decir, el inhibidor SAR405 en este caso. La conformación inicial del ligando (sus ángulos de torsión) se aleatorizó utilizando ADT.

Una vez completado el proceso, los resultados muestran que el SAR405 es más selectivo para el Vps34 (- 9,2 kcal/mol) que para el Pi3Kγ (- 7,3 kcal/mol) como se esperaba (Fig. 3b). La pose de unión predicha para SAR405 en Vps34 es cercana a la geometría del cristal (rmsd = 1,9 Å para todos los átomos del ligando, rmsd = 0,5 Å para el núcleo del anillo). Además, el valor Ki predicho para este complejo está en el rango nanomolar, lo que coincide con el valor experimental. Por otro lado, se predice un valor de Ki mucho mayor para el complejo Pi3Kγ-SAR405, y la pose de unión predicha difiere significativamente de la estructura cristalográfica (rmsd = 4,7), como se muestra en la Fig. 3c, lo que puede explicar el pobre valor de afinidad predicho por AutoDock Vina. Este caso de estudio se ha incorporado como tutorial en el manual de usuario, que se incluye en la carpeta de instalación de AMDock, y en el wiki en Github (https://github.com/Valdes-Tresanco-MS/AMDock-win/wiki/4.3-Off-target-docking).

Discusión

AMDock proporciona una interfaz novedosa, fácil de usar y versátil para trabajar con dos motores de acoplamiento molecular, Autodock4 y Autodock Vina, que tienen diferentes funcionalidades y características. AMDock debería ser muy útil para los investigadores con poca experiencia en el trabajo con programas de docking, ya que no es necesario un conocimiento previo del funcionamiento particular de estos programas. El entorno AMDock incluye tres flujos de trabajo diferentes (docking simple, docking off-target y scoring). El procedimiento de docking off-target nos parece especialmente útil para realizar estudios de selectividad de ligandos, un paso crítico en el proceso de diseño de fármacos.

La preparación de los archivos de entrada de forma adecuada y consistente, así como la definición correcta del espacio de búsqueda, son cuestiones críticas a la hora de realizar estudios de docking molecular. Varios programas/scripts externos están integrados en AMDock para permitir la preparación de los archivos de entrada con el mínimo esfuerzo y manteniendo el control del proceso. AMDock utiliza OpenBabel y PDB2PQR para la protonación del ligando y del receptor, respectivamente, mientras que las otras GUIs mencionadas en la Introducción utilizan ADT tanto para la protonación del receptor como del ligando (con la excepción de DockingApp, que utiliza también OpenBabel para la protonación del ligando).

Para definir el espacio de búsqueda, AMDock ofrece varias opciones para establecer la posición de la caja de rejilla en diferentes escenarios, mientras que el ligando de entrada se utiliza por defecto para determinar las dimensiones óptimas de la caja, lo que disminuye el coste computacional mientras se optimiza el proceso de docking . En este sentido, sólo ADT y el plugin PyMOL/AutoDock ofrecen algunas opciones limitadas aparte de un espacio de búsqueda definido por el usuario, pero en cualquier caso el tamaño de la caja debe ser definido por el usuario. En algunas de estas GUIs, como en DockingApp, el espacio de búsqueda cubre todo el receptor, lo que conlleva costes computacionales adicionales y posiblemente compromete la precisión de las simulaciones. Con otras GUIs, el usuario debe utilizar una aplicación externa como ADT para definir los parámetros de la caja.

La opción «Centered on Residue(s)» es preferible cuando se conocen los residuos del sitio de unión. Con esta opción, se genera con AutoLigand un objeto situado en el centro geométrico de los residuos seleccionados en la superficie de la proteína. Este procedimiento optimiza tanto la localización como el tamaño del espacio de búsqueda. Si la caja se centrara en cambio en el centro geométrico de los residuos seleccionados, es probable que una parte significativa de la misma quedara incrustada en la proteína, exigiendo un tamaño mayor para cubrir el espacio de muestreo necesario (Fig. 4). La alternativa «Centered on Hetero» es útil para estudios de redocking en complejos con estructuras cristalográficas o cuando se estudian ligandos con modos de unión similares (Fig. 2b). La opción «Automatic», en cambio, es deseable cuando no se dispone de información sobre el sitio de unión. En este caso, se realiza una ejecución de docking independiente para cada sitio de unión predicho por AutoLigand (Fig. 2d). De este modo, la información del método de clasificación de AutoLigand se combina con la del motor de acoplamiento, sin hacer una selección arbitraria de uno de los sitios predichos. Este proceso se realiza de forma automática y los resultados de cada uno de los sitios de unión predichos pueden visualizarse en PyMOL. En general, la definición y visualización de la caja supone un esfuerzo mínimo y siempre se puede modificar, lo que representa una ventaja no sólo para el usuario novato sino también para los expertos.

Fig. 4
figura4

Comparación entre una caja (blanca) situada en el centro geométrico de los residuos seleccionados (A:ILE:634, A:TYR:670, A:PHE:684, A:PHE:758, A:ILE:760; en salmón) y una caja (magenta) centrada en un objeto generado por AutoLigand desde el centro geométrico de los residuos seleccionados. En este último caso, la caja define un espacio de muestreo de ligando más óptimo

Cabe destacar que hemos estandarizado el tamaño de la caja en Angstroms para evitar los errores que se producen habitualmente, tal y como se informa en diferentes foros y listas de correo. Estos errores surgen de las diferentes formas en que se definen las dimensiones de la caja en AutoDock (número de puntos + espaciado de la rejilla) y Autodock Vina (en angstroms), y pueden hacer que el espacio de búsqueda sea muy pequeño o demasiado grande, lo que en última instancia conduce a inconsistencias en los resultados de acoplamiento obtenidos.

La integración de AMDock con PyMOL representa una ventaja significativa. De hecho, PyMOL es un visor molecular ampliamente utilizado con un gran apoyo de la comunidad y un desarrollo activo. Dentro de PyMOL, los resultados de docking pueden ser analizados con múltiples herramientas, en particular con el potente Protein-ligand Interaction Profiler . Otras aplicaciones como ADT, PyRx o DockingApp tienen sus propios visores gráficos. PyRx y DockingApp ofrecen soluciones simples con capacidades analíticas limitadas, mientras que ADT sólo permite un análisis simple de las interacciones proteína-ligando.

Además, con AMDock es posible lanzar simulaciones de docking para metaloproteínas utilizando el campo de fuerza Zn de AutoDock, que está disponible en ADT sólo a través de la línea de comandos. Su opción de docking off-target, muy útil para estudios de repurposing de fármacos, sólo está disponible en Dockomatic y PyRx (en este último, sólo en la versión de pago).

La mayoría de las GUIs de docking están enfocadas al screening virtual. Actualmente, AMDock no tiene soporte para el screening virtual, sin embargo, estamos trabajando en su implementación, para que esté disponible en la próxima versión del programa.

Por último, y dado que ADT es probablemente la GUI de docking más utilizada, ofrecemos una comparación más detallada entre AMDock y ADT (Tabla 1).

Tabla 1 Comparación de las características de AMDock y AutoDock Tools

Conclusiones

AMDock es una GUI fácil de usar que funciona de forma muy intuitiva e interactiva, permitiendo realizar estudios de docking molecular con Autodock4 y AutoDock Vina con un mínimo esfuerzo de configuración. Estas características hacen de AMDock una herramienta atractiva también para la enseñanza. AMDock reúne características y procedimientos que no están presentes en otros programas similares. Incluye desarrollos recientes de AutoDock, como la parametrización de Autodock4Zn. Para nuestro grupo, AMDock ha sido muy útil para estimar el perfil de selectividad de diferentes inhibidores de PI3K sobre proteínas ortólogas en varios microorganismos. Otros desarrollos (ligando hidratado, docking covalente y cribado virtual) serán incluidos como opciones de docking en futuras versiones.

Articles

Deja una respuesta

Tu dirección de correo electrónico no será publicada.