Une avancée révolutionnaire dans l’ingénierie des protéines grâce à l’IA
Des chercheurs de l’EPFL ont mis au point un modèle innovant basé sur l’intelligence artificielle, capable de prédire les séquences de protéines à partir de structures de base, tout en tenant compte des environnements moléculaires complexes. Cette avancée promet d’importants progrès dans le domaine de l’ingénierie des protéines, avec des applications potentielles dans divers secteurs, notamment la médecine et la biotechnologie.
La conception de protéines : un défi majeur
La création de protéines capables d’exécuter des fonctions spécifiques nécessite une compréhension approfondie de leurs séquences et structures. Ce processus est essentiel pour le développement de traitements ciblés contre les maladies et pour la création d’enzymes destinées à des applications industrielles.
L’un des défis majeurs en ingénierie des protéines est la conception de protéines de novo, c’est-à-dire à partir de zéro, afin d’adapter leurs propriétés à des tâches spécifiques. Cela a des implications profondes pour la biologie, la médecine et la science des matériaux. Par exemple, les protéines conçues peuvent cibler des maladies avec une grande précision, offrant une alternative compétitive aux médicaments traditionnels à base de petites molécules.
Les enzymes sur mesure : catalyseurs naturels
Les enzymes conçues sur mesure, qui agissent comme des catalyseurs naturels, peuvent faciliter des réactions rares ou inexistantes dans la nature. Cette capacité est particulièrement précieuse dans l’industrie pharmaceutique pour la synthèse de molécules médicamenteuses complexes, ainsi que dans la technologie environnementale pour décomposer plus efficacement les polluants ou les plastiques.
CARBonAra : un modèle d’IA innovant
Une équipe de scientifiques dirigée par Matteo Dal Peraro à l’EPFL a développé CARBonAra (Récupération d’acides aminés contextuels à partir d’atomes de base et d’hétéroatomes), un modèle d’IA capable de prédire des séquences de protéines tout en prenant en compte les contraintes imposées par différents environnements moléculaires. CARBonAra a été formé sur un ensemble de données d’environ 370 000 sous-unités, avec 100 000 supplémentaires pour la validation et 70 000 pour les tests, provenant de la Banque de données des protéines (PDB).
CARBonAra s’appuie sur l’architecture du cadre de transformation de structure protéique (PeSTo), également développé par Lucien Krapp dans le groupe de Dal Peraro. Il utilise des transformateurs géométriques, qui sont des modèles d’apprentissage profond traitant les relations spatiales entre les points, comme les coordonnées atomiques, pour apprendre et prédire des structures complexes.
Amélioration des taux de récupération des séquences
CARBonAra est capable de prédire des séquences d’acides aminés à partir de structures de base, qui constituent les cadres structurels des molécules protéiques. L’une des caractéristiques remarquables de CARBonAra est sa conscience contextuelle, qui se manifeste particulièrement dans l’amélioration des taux de récupération des séquences – le pourcentage d’acides aminés corrects prédits à chaque position d’une séquence protéique par rapport à une séquence de référence connue.
Les taux de récupération se sont considérablement améliorés lorsque le modèle intègre des « contextes » moléculaires, tels que les interfaces protéiques avec d’autres protéines, des acides nucléiques, des lipides ou des ions. « Cela est dû au fait que le modèle est formé avec toutes sortes de molécules et repose uniquement sur des coordonnées atomiques, ce qui lui permet de traiter non seulement des protéines », explique Dal Peraro. Cette caractéristique renforce le pouvoir prédictif du modèle et son applicabilité dans des systèmes biologiques complexes et réels.
Validation expérimentale et applications industrielles
Le modèle ne se limite pas à des benchmarks synthétiques, mais a également été validé expérimentalement. Les chercheurs ont utilisé CARBonAra pour concevoir de nouvelles variantes de l’enzyme TEM-1 β-lactamase, impliquée dans le développement de la résistance aux antimicrobiens. Certaines des séquences prédites, présentant environ 50 % de différences par rapport à la séquence sauvage, ont été correctement repliées et conservent une certaine activité catalytique à des températures élevées, alors que l’enzyme sauvage est déjà inactive.
La flexibilité et la précision de CARBonAra ouvrent de nouvelles perspectives pour l’ingénierie des protéines. Sa capacité à prendre en compte des environnements moléculaires complexes en fait un outil précieux pour concevoir des protéines avec des fonctions spécifiques, renforçant ainsi les futures campagnes de découverte de médicaments. De plus, le succès de CARBonAra dans l’ingénierie des enzymes démontre son potentiel pour des applications industrielles et des recherches scientifiques.