Molecular docking tornou-se uma ferramenta poderosa para a descoberta e otimização de chumbo. Um grande número de programas de docking foi desenvolvido durante as últimas três décadas, com base em diferentes algoritmos de busca e funções de pontuação. Com o objetivo de tornar esses programas de docking mais amigáveis ao usuário, especialmente para iniciantes, diferentes interfaces gráficas de usuário (GUIs) foram desenvolvidas para auxiliar na preparação de sistemas moleculares, na execução dos cálculos e/ou na análise dos resultados. Exemplos de GUIs disponíveis (desenvolvidas principalmente para AutoDock e/ou Autodock Vina ) são as Ferramentas AutoDock (ADT), integradas no pacote gráfico PMV , BDT , DOVIS , VSDocker , AUDocker LE , WinDock , DockoMatic , PyMOL AutoDock plugin (PyMOL/AutoDock) , PyRx , MOLA , DockingApp e JADOPPT .
Apresentamos aqui uma nova ferramenta multiplataforma, AMDock (Assisted Molecular Docking), cuja principal vantagem sobre as suas antecessoras é a integração de várias ferramentas externas valiosas dentro de uma interface gráfica simples e intuitiva que guia os utilizadores ao longo de protocolos de docking bem estabelecidos – utilizando o Autodock4 ou o AutoDock Vina – desde a preparação do sistema até à análise dos resultados.
Funcionalidades e workflow
AMDock integra funcionalidades do Autodock Vina e Autodock4, scripts ADT, AutoLigand , Open Babel , PDB2PQR e PyMOL . Para proteínas contendo um íon de zinco no site ativo, a AMDock tem a opção de usar os parâmetros especialmente adaptados do Autodock4Zn. A AMDock é codificada em Python 2.7 e está disponível para Windows e Linux. No Windows, ele é empacotado juntamente com todas as ferramentas integradas, portanto, não é necessária a instalação de software adicional. No Linux, apenas Open Babel e PyMOL devem ser instalados (ambas ferramentas estão incluídas na maioria dos repositórios Linux populares).
A janela principal do AMDock tem cinco abas: 1) Início, 2) Opções de docking, 3) Análise de resultados, 4) Configuração, e 5) Informação. Um resumo das funcionalidades e workflow do AMDock é apresentado abaixo (Fig. 1) e discutido posteriormente com mais detalhes.
Na aba “Home”, o usuário pode selecionar o motor de docking: Autodock Vina ou Autodock4, com a opção adicional de utilizar os parâmetros do Autodock4Zn. Então o utilizador é automaticamente direccionado para o separador “Docking Options”, que contém quatro painéis que guiam a preparação sequencial de uma simulação de docking.
Arquivos de entrada para AMDock
Minimalmente, são necessárias as coordenadas cartesianas do ligando e moléculas receptoras, que podem ser fornecidas em vários formatos de estrutura comuns, por exemplo PDB ou PDBQT para a proteína, e PDB, PDBQT ou Mol2 para o ligando. Se as coordenadas proteicas se juntarem a um ligando encadernado, as coordenadas do último são armazenadas e podem ser utilizadas posteriormente para definir o espaço de pesquisa.
O programa funciona seguindo três passos principais:
- 1-
Preparando os ficheiros de entrada da doca: Primeiro, o usuário pode definir um valor de pH para a protonação de ambos os ligandos (opcional, valor padrão 7,4), utilizando o Babel aberto e a proteína (valor padrão: 7,4), utilizando o PDB2PQR. Estão disponíveis duas opções diferentes de acoplamento: a) “acoplamento simples”, para prever o modo de ligação de um único complexo proteína-ligante, e b) “acoplamento fora do alvo”, para prever as posições de ligação de um ligando com dois receptores diferentes, ou seja, o alvo e o fora do alvo. Finalmente, a opção “Scoring” incluída neste separador permite marcar um complexo proteína-ligante já existente, utilizando as funções Autodock Vina, Autodock4 ou Autodock4Zn. Uma vez selecionado o protocolo de docking ou pontuação, os arquivos de entrada são preparados usando scripts ADT.
- 2-
Definindo o espaço de busca: Quatro abordagens diferentes podem ser usadas para definir um centro e dimensões da caixa: a) “Automático” – o programa usa AutoLigand para prever possíveis locais de ligação e depois uma caixa com dimensões óptimas é centrada em cada objecto AutoLigand,nota de rodapé 1 em cada local de ligação previsto. b) “Centro no(s) resíduo(s)” – o AutoLigand é usado para gerar um objecto com um volume em correspondência com o tamanho do ligando, usando como referência o centro geométrico dos resíduos seleccionados. Em seguida, uma caixa com dimensões ótimas é centrada no objeto gerado. c) “Centro no Hetero” – uma caixa é colocada no centro geométrico de um ligando existente (se o receptor foi dado em complexo com um ligando), e d) “Caixa” – o centro e as dimensões da caixa são definidos pelo usuário. A caixa gerada com qualquer um destes métodos pode ser visualizada em PyMOL e facilmente modificada à conveniência do usuário usando o novo plugin AMDock (adaptado de ) embutido na janela do menu PyMOL.
- 3-
Executar as simulações de acoplamento e analisar os resultados: Após executar os cálculos de acoplamento molecular (iniciado clicando no botão “Run”), o usuário será levado automaticamente para a guia “Results Analysis”, onde os valores de Afinidade, Ki Estimado e Eficiências de Ligand são listados para as diferentes posições de ligação.
O Ki Estimado é um valor muito útil, pois está mais relacionado aos parâmetros experimentais normalmente medidos, em comparação com a afinidade. A eficiência de Ligand (LE), por outro lado, é um parâmetro informativo importante ao selecionar um composto de chumbo . Aqui, o LE é calculado usando a seguinte equação:
onde ΔG é a energia livre de ligação ou o valor da pontuação calculada e HA é o número de átomos pesados (não-hidrogênicos) do ligando. Compostos com LE > 0,3 são destacados como potenciais compostos de chumbo .
O botão “Show in PyMOL” inicia o PyMOL com uma visualização personalizada do complexo entre o receptor e a pose seleccionada (a pose mais baixa do ligando de energia é escolhida por defeito). Os dados resultantes ao longo do processo são armazenados em um arquivo (*.amdock), que pode ser usado para examinar os resultados a qualquer momento depois.
Diferentes parâmetros de docking podem ser definidos na aba “Configuration”, enquanto a aba “Info” dá acesso a documentação útil, incluindo um manual do usuário e referências.
Visualização
AMDock conta com PyMOL para visualização em dois estágios diferentes: 1) configuração da localização e dimensões da caixa de grade (o espaço de busca), e 2) análise dos resultados da doca. PyMOL é um programa de análise molecular versátil e fácil de usar que, além disso, permite criar imagens de alta qualidade para publicação. Temos codificado na AMDock várias representações PyMOL pré-determinadas para as duas etapas, selecionando o design visual e a informação que consideramos ótima em cada caso. Estas representações pré-definidas podem ser modificadas pelo usuário dentro de PyMOL.
Espaço de pesquisa
As representações pré-determinadas (em ordem decrescente de complexidade, de acordo com o número de elementos no conteúdo da visualização) são as seguintes: 1) Caixa – uma representação simples onde a proteína em estudo aparece como desenho animado, juntamente com a caixa com as especificações definidas pelo usuário (Fig. 2a); 2-Centered on Hetero – inclui a proteína receptora (desenho animado) e a caixa com um tamanho ótimo centrado no ligando anterior selecionado (paus) (Fig. 2b); 3-Centered on Residue(s) – uma representação que permite ao usuário identificar os resíduos que foram selecionados para definir o espaço de busca. A proteína é representada como desenho animado, os resíduos selecionados como paus e o objeto AutoLigand como pontos. A caixa calculada também é apresentada, para que o usuário possa verificar e ajustar facilmente (se necessário) sua posição e dimensões (Fig. 2c). 4-Automático – Aqui pretendemos criar uma representação simplificada para mostrar todos os locais de encadernação previstos pelo AutoLigand. A proteína está em desenho animado, cada objeto AutoLigand é representado em paus, rodeado por uma superfície construída sobre seus resíduos vizinhos. Como as simulações de acoplamento devem ser feitas para cada local previsto pela AutoLigand, uma caixa é gerada para cada local, mas mostrada apenas para um local selecionado pelo usuário (Fig. 2d). Como mencionado acima, em qualquer destas variantes o centro e tamanho da caixa pode ser facilmente modificado usando o plugin AMDock implementado em PyMOL.
Análise de resultados
A proteína é representada em desenho animado. Cada pose de ligando é desenhada em paus e seus contatos polares com a proteína são mostrados como linhas tracejadas. Uma visualização semelhante também é possível para ambas as proteínas se o procedimento “Off-Target Docking” tiver sido escolhido (Fig. 3c). Isto permite uma comparação simultânea de poses ligand para ambas as proteínas alvo e fora do alvo.
Estudo de caso: SAR405 seletividade de ligação – PI3Kγ vs. Vps34
Fosfatidilinositol 3-quinase (PI3K) é uma enzima envolvida no crescimento, proliferação, motilidade, sobrevivência e tráfico intracelular . A PI3K é também um promissor alvo de câncer, com vários de seus inibidores já na fase clínica. Alguns desses inibidores estão atualmente na fase III de ensaios clínicos e um deles, o alpelisibe, recebeu recentemente (maio de 2019) a aprovação do FDA para uso no tratamento do câncer de mama metastático.
PI3K tem várias isoformas que estão agrupadas em 3 classes diferentes. A classe I inclui quatro isoformas diferentes (α, β, γ e δ), enquanto a classe III é composta por apenas uma proteína, chamada Vps34 . Devido à sua sequência e semelhanças estruturais, alguns inibidores podem ligar diferentes isoformas, enquanto que vários outros inibidores foram desenhados para serem específicos da isoforma. Nosso grupo de pesquisa está atualmente focado na identificação de inibidores PI3K com a capacidade de inibir ortologs PI3K encontrados em diferentes microrganismos patogênicos, que expressam apenas a isoforma Vps34 ancestral. Para este fim, o AMDock representa uma ferramenta valiosa, particularmente a sua opção “Off-Target Docking”. Aqui demonstramos seu uso com um exercício que se assemelha ao nosso próprio trabalho de pesquisa.
Sar405 é um inibidor altamente específico do Vps34 (IC50 = 1,2 nM), enquanto seu IC50 para outras isoformas é > 104 nM . Uma estrutura cristalina do SAR405 em complexo com Vps34 humano está disponível no Banco de Dados de Proteínas (código PDB: 4oys). Aqui utilizamos o Vps34 humano como receptor “Target”, enquanto a isoforma gama PI3K (PDB: 3apf) é utilizada como receptor “Off-Target”. Ambas as estruturas contêm um ligante ligado no local ativo, o que é conveniente para gerar a caixa de grade. No primeiro passo, selecionamos o programa de acoplamento (Autodock Vina) e depois é criada uma pasta de projeto no disco rígido do computador. Depois de carregar ambas as estruturas de proteínas, aproveitamos a sua semelhança de sequência para utilizar a opção disponível de alinhamento e sobreposição das suas estruturas utilizando PyMOL, o que torna possível definir um espaço de pesquisa comum e simplificar a análise subsequente dos resultados do docking. Em seguida, os arquivos de entrada são preparados automaticamente, o que inclui a protonação de resíduos tituláveis, fusão de hidrogênios não-polares e remoção de íons/água. O centro da caixa é definido com base no centro geométrico dos ligandos ligados (Fig. 3a), enquanto que o tamanho da caixa é definido com base no raio de giração do ligando a ser acoplado, ou seja, o inibidor da SAR405 neste caso. A conformação inicial do ligando (seus ângulos de torção) foi randomizada usando ADT.
Após o processo estar concluído, os resultados mostram que a SAR405 é mais seletiva para Vps34 (- 9,2 kcal/mol) do que para Pi3Kγ (- 7,3 kcal/mol), como esperado (Fig. 3b). A pose de ligação prevista para o SAR405 em Vps34 é próxima da geometria do cristal (rmsd = 1,9 Å para todos os átomos ligando, rmsd = 0,5 Å para o núcleo do anel). Além disso, o valor Ki previsto para este complexo está na faixa nanomolar, o que concorda com o valor experimental. Por outro lado, está previsto um valor de Ki muito superior para o complexo Pi3Kγ-SAR405 e a pose de ligação prevista difere significativamente da estrutura cristalográfica (rmsd = 4,7), como se mostra na Fig. 3c, o que pode explicar o fraco valor de afinidade previsto pela AutoDock Vina. Este caso de estudo foi incorporado como um tutorial no manual do utilizador, que está incluído na pasta de instalação da AMDock, e no wiki do Github (https://github.com/Valdes-Tresanco-MS/AMDock-win/wiki/4.3-Off-target-docking).
Discussão
AMDock fornece uma interface nova, fácil de usar e versátil para trabalhar com dois motores de acoplamento molecular, Autodock4 e Autodock Vina, tendo diferentes funcionalidades e características. AMDock deve ser muito útil para pesquisadores com pouca experiência no trabalho com programas de docking, já que não é necessário nenhum conhecimento prévio sobre o funcionamento particular destes programas. Três fluxos de trabalho diferentes (docking simples, docking off-target e scoring) estão incluídos no ambiente AMDock. Consideramos o procedimento de docking fora do alvo particularmente útil para a realização de estudos de seletividade ligand – uma etapa crítica no processo de design de medicamentos.
Preparar os arquivos de entrada de forma adequada e consistente, bem como definir corretamente o espaço de busca, são questões críticas ao realizar estudos de docking molecular. Vários programas/scripts externos são integrados ao AMDock para permitir a preparação dos arquivos de entrada com o mínimo de esforço, mantendo o controle do processo. A AMDock usa OpenBabel e PDB2PQR para protonação de ligantes e receptores, respectivamente, enquanto as outras GUIs mencionadas na Introdução usam ADT para protonação de receptores e ligantes (com exceção da DockingApp, que também usa OpenBabel para protonação de ligantes).
Para definir o espaço de busca, a AMDock oferece várias opções para definir a posição da caixa de grade em diferentes cenários, enquanto o ligando de entrada é usado por padrão para determinar as dimensões ótimas da caixa, o que diminui o custo computacional enquanto otimiza o processo de docking . A este respeito, apenas ADT e o plugin PyMOL/AutoDock oferecem algumas opções limitadas além de um espaço de busca definido pelo usuário, mas em qualquer caso o tamanho da caixa deve ser definido pelo usuário. Em algumas destas GUIs, como no DockingApp, o espaço de busca cobre todo o receptor, o que leva a custos computacionais adicionais e possivelmente compromete a precisão das simulações. Com outras GUIs, o usuário deve usar uma aplicação externa como ADT para definir os parâmetros da caixa.
A opção “Centrado no(s) resíduo(s)” é preferível quando os resíduos do local de ligação são conhecidos. Com esta opção, um objeto colocado no centro geométrico dos resíduos selecionados é gerado com AutoLigand na superfície da proteína. Este procedimento otimiza tanto a localização quanto o tamanho do espaço de busca. Se a caixa foi centralizada no centro geométrico dos resíduos selecionados, uma parte significativa da mesma provavelmente será embutida na proteína, exigindo um tamanho maior para cobrir o espaço de amostragem necessário (Fig. 4). A alternativa “Centrado no Hetero” é útil para estudos de redocking em complexos com estruturas cristalográficas ou quando se estuda ligandos com modos de ligação similares (Fig. 2b). A opção “Automático”, por outro lado, é desejável quando não há informação disponível sobre o local de ligação. Neste caso, é realizada uma docagem independente para cada local de ligação previsto pelo AutoLigand (Fig. 2d). Desta forma, a informação do método de classificação AutoLigand é combinada com a do motor de acoplamento, sem fazer uma selecção arbitrária de um dos locais previstos. Este processo é feito automaticamente e os resultados para cada um dos sites de ligação previstos podem ser visualizados em PyMOL. Em geral, a definição e visualização da caixa envolve um esforço mínimo e pode sempre ser modificada, representando assim uma vantagem não só para o usuário novato mas também para os especialistas.
Vale a pena notar que padronizamos o tamanho da caixa para estar em Angstroms para evitar erros comuns, como relatado em diferentes fóruns e listas de discussão. Estes erros surgem das diferentes formas em que as dimensões da caixa são definidas no AutoDock (número de pontos + espaçamento entre grades) e no Autodock Vina (em angstroms), e podem fazer com que o espaço de busca seja muito pequeno ou muito grande, levando em última análise a inconsistências nos resultados de docking obtidos.
A integração do AMDock com o PyMOL representa uma vantagem significativa. Na verdade, PyMOL é um visualizador molecular amplamente utilizado com grande suporte da comunidade e desenvolvimento ativo. Dentro do PyMOL, os resultados do docking podem ser analisados com múltiplas ferramentas, em particular com o poderoso Protein-ligand Interaction Profiler . Outras aplicações tais como ADT, PyRx ou DockingApp têm os seus próprios visualizadores gráficos. PyRx e DockingApp oferecem soluções simples com capacidades analíticas limitadas, enquanto o ADT permite apenas uma análise simples das interacções proteína-ligante.
Outras, com o AMDock é possível lançar simulações de docking para metaloproteínas usando o campo de força Zn do AutoDock, que está disponível no ADT apenas através de linha de comando. A sua opção de docking off-target, muito útil para estudos de redireccionamento de medicamentos, está disponível apenas em Dockomatic e PyRx (na versão mais recente, apenas na versão de pagamento).
A maior parte das GUIs de docking estão focadas na triagem virtual. Atualmente, a AMDock não tem suporte para triagem virtual, no entanto, estamos atualmente trabalhando em sua implementação, para torná-la disponível na próxima versão do programa.
Finalmente, e como o ADT é provavelmente a GUI de docking mais utilizada, fornecemos uma comparação mais detalhada entre a AMDock e o ADT (Tabela 1).
Conclusions
AMDock é uma GUI de fácil utilização que funciona de uma forma altamente intuitiva e interactiva, permitindo realizar estudos de acoplagem molecular com o Autodock4 e o AutoDock Vina com um esforço de configuração mínimo. Estas características fazem da AMDock uma ferramenta atractiva também para efeitos de ensino. A AMDock reúne características e procedimentos que não estão presentes em outros programas similares. Inclui desenvolvimentos recentes no AutoDock, tais como a parametrização do Autodock4Zn. Para o nosso grupo, a AMDock tem sido muito útil para estimar o perfil de seletividade de diferentes inibidores PI3K sobre proteínas ortológicas em vários microorganismos. Outros desenvolvimentos (ligando hidratado, docking covalente e triagem virtual) serão incluídos como opções de docking em versões futuras.