Le docking moléculaire est devenu un outil puissant pour la découverte et l’optimisation des pistes. Un grand nombre de programmes de docking ont été développés au cours des trois dernières décennies, basés sur différents algorithmes de recherche et fonctions de notation. Afin de rendre ces programmes de docking plus conviviaux, notamment pour les débutants, différentes interfaces graphiques (GUI) ont été développées pour aider à la préparation des systèmes moléculaires, à l’exécution des calculs et/ou à l’analyse des résultats. Des exemples d’interfaces graphiques disponibles (développées principalement pour AutoDock et/ou Autodock Vina ) sont AutoDock Tools (ADT), intégré dans le paquet graphique PMV , BDT , DOVIS , VSDocker , AUDocker LE , WinDock , DockoMatic , PyMOL AutoDock plugin (PyMOL/AutoDock) , PyRx , MOLA , DockingApp et JADOPPT .
Nous présentons ici un nouvel outil multiplateforme, AMDock (Assisted Molecular Docking), dont le principal avantage par rapport à ses prédécesseurs est l’intégration de plusieurs outils externes précieux au sein d’une interface graphique simple et intuitive qui guide les utilisateurs le long de protocoles de docking bien établis – utilisant soit Autodock4, soit AutoDock Vina – de la préparation du système à l’analyse des résultats.
Fonctionnalités et flux de travail
AMDock intègre les fonctionnalités d’Autodock Vina et d’Autodock4, les scripts ADT, AutoLigand , Open Babel , PDB2PQR et PyMOL . Pour les protéines contenant un ion zinc dans le site actif, AMDock a la possibilité d’utiliser les paramètres Autodock4Zn spécialement adaptés. AMDock est codé en Python 2.7 et est disponible pour Windows et Linux. Sous Windows, il est emballé avec tous les outils intégrés et ne nécessite donc aucune installation de logiciel supplémentaire. Sur Linux, seuls Open Babel et PyMOL doivent être installés (les deux outils sont inclus dans les dépôts Linux les plus populaires).
La fenêtre principale d’AMDock comporte cinq onglets : 1) Accueil, 2) Options d’amarrage, 3) Analyse des résultats, 4) Configuration et 5) Info. Un résumé des fonctionnalités et du flux de travail d’AMDock est présenté ci-dessous (Fig. 1) et discuté ensuite plus en détail.
Dans l’onglet « Home », l’utilisateur peut sélectionner le moteur de docking : Autodock Vina ou Autodock4, avec la possibilité supplémentaire d’utiliser les paramètres d’Autodock4Zn. Ensuite, l’utilisateur est automatiquement dirigé vers l’onglet « Docking Options », qui contient quatre panneaux qui guident une préparation séquentielle d’une simulation de docking.
Fichiers d’entrée pour AMDock
Minimalement, les coordonnées cartésiennes des molécules de ligand et de récepteur sont nécessaires, qui peuvent être fournies dans plusieurs formats de structure communs, par exemple PDB ou PDBQT pour la protéine, et PDB, PDBQT ou Mol2 pour le ligand. Si les coordonnées de la protéine se rencontrent avec un ligand lié, les coordonnées de ce dernier sont stockées et peuvent être utilisées par la suite pour définir l’espace de recherche.
Le programme fonctionne en suivant trois étapes principales :
- 1-
Préparation des fichiers d’entrée de docking : Tout d’abord, l’utilisateur peut définir une valeur de pH pour la protonation à la fois du ligand (facultatif, valeur par défaut 7,4), en utilisant Open Babel et de la protéine (valeur par défaut : 7,4), en utilisant PDB2PQR. Deux options de docking différentes sont disponibles : a) « docking simple », pour prédire le mode de liaison d’un complexe protéine-ligand unique, et b) « docking off-target », pour prédire les poses de liaison d’un ligand avec deux récepteurs différents, c’est-à-dire la cible et le off-target. Enfin, l’option « Scoring » incluse dans cet onglet permet de marquer un complexe protéine-ligand déjà existant, en utilisant les fonctions Autodock Vina, Autodock4 ou Autodock4Zn. Une fois le protocole de docking ou de scoring sélectionné, les fichiers d’entrée sont préparés à l’aide de scripts ADT.
- 2-
Définir l’espace de recherche : Quatre approches différentes peuvent être utilisées pour définir le centre et les dimensions d’une boîte : a) « Automatique » – le programme utilise AutoLigand pour prédire les sites de liaison possibles, puis une boîte avec des dimensions optimales est centrée sur chaque objet AutoLigand,Footnote 1 à chaque site de liaison prédit. b) « Centre sur le(s) résidu(s) » – AutoLigand est utilisé pour générer un objet avec un volume en correspondance avec la taille du ligand, en utilisant comme référence le centre géométrique des résidus sélectionnés. Ensuite, une boîte aux dimensions optimales est centrée sur l’objet généré. c) « Center on Hetero » – une boîte est placée sur le centre géométrique d’un ligand existant (si le récepteur a été donné en complexe avec un ligand), et d) « Box » – le centre et les dimensions de la boîte sont définis par l’utilisateur. La boîte générée avec l’une de ces méthodes peut être visualisée dans PyMOL et facilement modifiée à la convenance de l’utilisateur en utilisant le nouveau plugin AMDock (adapté de ) intégré dans la fenêtre du menu PyMOL.
- 3-
Exécution des simulations de docking et analyse des résultats : Après avoir exécuté les calculs de docking moléculaire (lancés en cliquant sur le bouton « Run »), l’utilisateur sera automatiquement amené à l’onglet « Results Analysis », où l’affinité, les valeurs estimées de Ki et les efficacités de ligand sont listées pour les différentes poses de liaison.
Le Ki estimé est une valeur très utile car il est plus lié aux paramètres expérimentaux habituellement mesurés, par rapport à l’affinité. L’efficacité du ligand (LE), d’autre part, est un paramètre informatif important lors de la sélection d’un composé principal . Ici, LE est calculé en utilisant l’équation suivante :
où ΔG est l’énergie libre de liaison ou la valeur du score calculé et HA est le nombre d’atomes lourds (non hydrogène) du ligand. Les composés avec LE > 0,3 sont mis en évidence comme composés principaux potentiels .
Le bouton « Show in PyMOL » démarre PyMOL avec une visualisation personnalisée du complexe entre le récepteur et la pose sélectionnée (la pose du ligand de plus basse énergie est choisie par défaut). Les données résultantes tout au long du processus sont stockées dans un fichier (*.amdock), qui peut être utilisé pour examiner les résultats à tout moment par la suite.
Différents paramètres de docking peuvent être définis dans l’onglet « Configuration », tandis que l’onglet « Info », donne accès à une documentation pratique, y compris un manuel d’utilisation et des références.
Visualisation
AMDock s’appuie sur PyMOL pour la visualisation à deux étapes différentes : 1) la mise en place de l’emplacement et des dimensions de la boîte de grille (l’espace de recherche), et 2) l’analyse des résultats de l’amarrage. PyMOL est un programme d’analyse moléculaire polyvalent et convivial qui, en outre, permet de créer des images de haute qualité pour la publication. Nous avons codé dans AMDock plusieurs représentations PyMOL prédéterminées pour les deux étapes, en sélectionnant la conception visuelle et les informations que nous considérions comme optimales dans chaque cas. Ces représentations prédéfinies peuvent être modifiées par l’utilisateur dans PyMOL.
Espace de recherche
Les représentations prédéterminées (par ordre décroissant de complexité, en fonction du nombre d’éléments dans le contenu de la visualisation) sont les suivantes : 1) Boîte – une représentation simple où la protéine étudiée apparaît sous forme de dessin animé, ainsi que la boîte avec les spécifications définies par l’utilisateur (Fig. 2a) ; 2-Centré sur Hetero – comprend la protéine réceptrice (dessin animé) et la boîte avec une taille optimale centrée sur le ligand précédent sélectionné (bâtons) (Fig. 2b) ; 3-Centré sur Résidu(s) – une représentation qui permet à l’utilisateur d’identifier les résidus qui ont été sélectionnés pour définir l’espace de recherche. La protéine est représentée comme un dessin animé, les résidus sélectionnés comme des bâtons et l’objet AutoLigand comme des points. La boîte calculée est également représentée, de sorte que l’utilisateur peut facilement vérifier et ajuster (si nécessaire) sa position et ses dimensions (Fig. 2c). 4-Automatique – Ici, nous avons voulu créer une représentation simplifiée pour montrer tous les sites de liaison prédits par AutoLigand. La protéine est en dessin animé, chaque objet AutoLigand est représenté en bâtonnets, entouré d’une surface construite sur ses résidus voisins. Comme les simulations de docking doivent être effectuées pour chaque site prédit par AutoLigand, une boîte est générée pour chaque site, mais n’est montrée que pour un site sélectionné par l’utilisateur (Fig. 2d). Comme mentionné ci-dessus, dans toutes ces variantes, le centre et la taille de la boîte peuvent être facilement modifiés en utilisant le plugin AMDock implémenté dans PyMOL.
Résultats analyse
La protéine est représentée en dessin animé. Chaque pose de ligand est dessinée en bâtonnets et ses contacts polaires avec la protéine sont représentés en pointillés. Une visualisation similaire est également possible pour les deux protéines si la procédure « Off-Target Docking » a été choisie (Fig. 3c). Cela permet une comparaison simultanée des poses des ligands pour les protéines cibles et hors cible.
Etude de cas : Sélectivité de liaison du SAR405 – PI3Kγ vs Vps34
La phosphatidylinositol 3-kinase (PI3K) est une enzyme impliquée dans la croissance, la prolifération, la motilité, la survie et le trafic intracellulaire . La PI3K est également une cible prometteuse pour le cancer, plusieurs de ses inhibiteurs étant déjà au stade clinique. Quelques-uns de ces inhibiteurs sont actuellement en phase III des essais cliniques et l’un d’entre eux, l’alpelisib, a récemment (mai 2019) reçu l’approbation de la FDA pour une utilisation dans le traitement du cancer du sein métastatique.
La PI3K possède plusieurs isoformes qui sont regroupées en 3 classes différentes. La classe I comprend quatre isoformes différentes (α, β, γ et δ), tandis que la classe III est composée d’une seule protéine, appelée Vps34 . En raison de leurs similarités de séquence et de structure, certains inhibiteurs peuvent se lier à différentes isoformes, tandis que plusieurs autres inhibiteurs ont été conçus pour être spécifiques aux isoformes. Notre groupe de recherche se concentre actuellement sur l’identification d’inhibiteurs de PI3K capables d’inhiber les orthologues de PI3K présents dans différents micro-organismes pathogènes, qui n’expriment que l’isoforme ancestrale Vps34. Dans ce but, AMDock représente un outil précieux, notamment son option « Off-Target Docking ». Nous démontrons ici son utilisation avec un exercice qui ressemble à nos propres travaux de recherche.
Sar405 est un inhibiteur hautement spécifique de Vps34 (IC50 = 1,2 nM), alors que son IC50 pour les autres isoformes est > 104 nM . Une structure cristalline du SAR405 en complexe avec le Vps34 humain est disponible dans la Banque de données des protéines (code PDB : 4oys). Ici, nous utilisons le Vps34 humain comme récepteur » cible « , tandis que l’isoforme gamma de la PI3K (PDB : 3apf) est utilisée comme récepteur » hors cible « . Les deux structures contiennent un ligand lié dans le site actif, ce qui est pratique pour générer la maille. Dans la première étape, nous sélectionnons le programme de docking (Autodock Vina), puis un dossier de projet est créé sur le disque dur de l’ordinateur. Après avoir chargé les deux structures protéiques, nous profitons de leur similarité de séquence pour utiliser l’option disponible d’alignement et de superposition de leurs structures à l’aide de PyMOL, ce qui permet de définir un espace de recherche commun et de simplifier l’analyse ultérieure des résultats du docking. Ensuite, les fichiers d’entrée sont préparés automatiquement, ce qui inclut la protonation des résidus titrables, la fusion des hydrogènes non polaires et l’élimination des ions et de l’eau. Le centre de la boîte est défini sur la base du centre géométrique des ligands liés (Fig. 3a), tandis que la taille de la boîte est définie sur la base du rayon de giration du ligand à docker, c’est-à-dire l’inhibiteur SAR405 dans ce cas. La conformation initiale du ligand (ses angles de torsion) a été randomisée en utilisant ADT.
Une fois le processus terminé, les résultats montrent que le SAR405 est plus sélectif pour Vps34 (- 9,2 kcal/mol) que pour Pi3Kγ (- 7,3 kcal/mol) comme prévu (Fig. 3b). La pose de liaison prédite pour SAR405 dans Vps34 est proche de la géométrie du cristal (rmsd = 1,9 Å pour tous les atomes du ligand, rmsd = 0,5 Å pour le noyau de l’anneau). De même, la valeur prédite de Ki pour ce complexe est de l’ordre du nanomolaire, ce qui correspond à la valeur expérimentale. En revanche, une valeur Ki beaucoup plus élevée est prédite pour le complexe Pi3Kγ-SAR405, et la position de liaison prédite diffère considérablement de la structure cristallographique (rmsd = 4,7), comme le montre la figure 3c, ce qui peut expliquer la faible valeur d’affinité prédite par AutoDock Vina. Ce cas d’étude a été intégré comme un tutoriel dans le manuel de l’utilisateur, qui est inclus dans le dossier d’installation d’AMDock, et le wiki sur Github (https://github.com/Valdes-Tresanco-MS/AMDock-win/wiki/4.3-Off-target-docking).
Discussion
AMDock fournit une interface nouvelle, facile à utiliser et polyvalente pour travailler avec deux moteurs de docking moléculaire, Autodock4 et Autodock Vina, ayant des fonctionnalités et des caractéristiques différentes. AMDock devrait être très utile aux chercheurs ayant peu d’expérience dans le travail avec des programmes de docking puisqu’aucune connaissance préalable du fonctionnement particulier de ces programmes n’est nécessaire. Trois flux de travail différents (docking simple, docking hors cible et scoring) sont inclus dans l’environnement AMDock. Nous trouvons la procédure de docking hors cible particulièrement utile pour mener des études de sélectivité des ligands – une étape critique dans le processus de conception de médicaments.
Préparer les fichiers d’entrée de manière appropriée et cohérente, ainsi que définir correctement l’espace de recherche, sont des questions critiques lors de la réalisation d’études de docking moléculaire. Plusieurs programmes/scripts externes sont intégrés dans AMDock pour permettre de préparer les fichiers d’entrée avec un effort minimal tout en gardant le contrôle du processus. AMDock utilise OpenBabel et PDB2PQR pour la protonation du ligand et du récepteur, respectivement, tandis que les autres interfaces graphiques mentionnées dans l’introduction utilisent ADT pour la protonation du récepteur et du ligand (à l’exception de DockingApp, qui utilise également OpenBabel pour la protonation du ligand).
Pour définir l’espace de recherche, AMDock offre plusieurs options pour définir la position de la boîte de grille dans différents scénarios, tandis que le ligand d’entrée est utilisé par défaut pour déterminer les dimensions optimales de la boîte, ce qui diminue le coût de calcul tout en optimisant le processus de docking . À cet égard, seuls ADT et le plugin PyMOL/AutoDock offrent quelques options limitées autres qu’un espace de recherche défini par l’utilisateur, mais dans tous les cas, la taille de la boîte doit être définie par l’utilisateur. Dans certaines de ces interfaces graphiques, comme dans DockingApp, l’espace de recherche couvre la totalité du récepteur, ce qui entraîne des coûts de calcul supplémentaires et peut compromettre la précision des simulations. Avec d’autres GUI, l’utilisateur doit utiliser une application externe telle que ADT pour définir les paramètres de la boîte.
L’option « Centré sur le(s) résidu(s) » est préférable lorsque les résidus du site de liaison sont connus. Avec cette option, un objet placé au centre géométrique des résidus sélectionnés est généré avec AutoLigand sur la surface de la protéine. Cette procédure optimise à la fois l’emplacement et la taille de l’espace de recherche. Si la boîte était plutôt centrée sur le centre géométrique des résidus sélectionnés, une partie importante de celle-ci serait probablement incrustée dans la protéine, ce qui exigerait une taille plus grande pour couvrir l’espace d’échantillonnage nécessaire (Fig. 4). L’alternative « Centré sur Hetero » est utile pour les études de redocking sur des complexes avec des structures cristallographiques ou lors de l’étude de ligands avec des modes de liaison similaires (Fig. 2b). L’option « Automatique », par contre, est souhaitable lorsqu’aucune information concernant le site de liaison n’est disponible. Dans ce cas, un cycle de docking indépendant est effectué pour chaque site de liaison prédit par AutoLigand (Fig. 2d). De cette façon, les informations provenant de la méthode de classement d’AutoLigand sont combinées à celles du moteur d’arrimage, sans qu’une sélection arbitraire de l’un des sites prédits ne soit effectuée. Ce processus est réalisé automatiquement et les résultats pour chacun des sites de liaison prédits peuvent être visualisés dans PyMOL. Globalement, la définition et la visualisation de la boîte impliquent un effort minimal et peuvent toujours être modifiées, ce qui représente un avantage non seulement pour l’utilisateur novice mais aussi pour les experts.
Il convient de noter que nous avons normalisé la taille de la boîte pour qu’elle soit en Angströms afin d’éviter les erreurs fréquemment rencontrées, telles que signalées dans différents forums et listes de diffusion. Ces erreurs proviennent des différentes façons dont les dimensions de la boîte sont définies dans AutoDock (nombre de points + espacement de la grille) et Autodock Vina (en angströms), et peuvent entraîner un espace de recherche très petit ou trop grand, conduisant finalement à des incohérences dans les résultats de docking obtenus.
L’intégration d’AMDock avec PyMOL représente un avantage significatif. En effet, PyMOL est un visualiseur moléculaire largement utilisé avec un grand soutien communautaire et un développement actif. Au sein de PyMOL, les résultats de docking peuvent être analysés avec de multiples outils, en particulier avec le puissant Protein-ligand Interaction Profiler . D’autres applications telles que ADT, PyRx ou DockingApp ont leurs propres visualisateurs graphiques. PyRx et DockingApp offrent des solutions simples avec des capacités analytiques limitées, tandis qu’ADT ne permet qu’une analyse simple des interactions protéine-ligand.
De plus, avec AMDock, il est possible de lancer des simulations de docking pour les métalloprotéines en utilisant le champ de force Zn d’AutoDock, qui n’est disponible dans ADT que par ligne de commande. Son option de docking off-target, très utile pour les études de repurposing de médicaments, est disponible uniquement dans Dockomatic et PyRx (dans ce dernier, uniquement dans la version de paiement).
La plupart des interfaces graphiques de docking sont axées sur le criblage virtuel. Actuellement, AMDock n’a pas de support pour le criblage virtuel, cependant, nous travaillons actuellement sur son implémentation, pour le rendre disponible dans la prochaine version du programme.
Enfin, et puisque ADT est probablement l’interface graphique de docking la plus largement utilisée, nous fournissons une comparaison plus détaillée entre AMDock et ADT (tableau 1).
Conclusions
AMDock est une interface graphique conviviale qui fonctionne de manière très intuitive et interactive, permettant d’effectuer des études de docking moléculaire avec Autodock4 et AutoDock Vina avec un effort de configuration minimal. Ces caractéristiques font d’AMDock un outil attrayant, y compris à des fins d’enseignement. AMDock rassemble des fonctionnalités et des procédures qui ne sont pas présentes dans d’autres programmes similaires. Il inclut les développements récents d’AutoDock, tels que le paramétrage d’Autodock4Zn. Pour notre groupe, AMDock a été très utile pour estimer le profil de sélectivité de différents inhibiteurs de PI3K sur des protéines orthologues dans plusieurs micro-organismes. D’autres développements (ligand hydraté, docking covalent et criblage virtuel) seront inclus comme options de docking dans les futures versions.