Une IA prédit la structure de presque toutes les protéines connues

La structure de plus de 200 millions de protéines, issues aussi des plantes, des animaux, de l’être humain ou des bactéries, est désormais disponible en un simple clic aux scientifiques du monde entier. Cette révolution est possible grâce au projet AlphaFold, porté par DeepMind, une société experte en Intelligence artificielle détenue par Google, et l’EMB-EMI, l’Institut européen de bioinformatique.

Lancée en juillet 2021, la base de données d’AlphaFold contenait déjà la structure en trois dimensions de 350.000 protéines dont l’intégralité du protéome humain. En moins d’un an et au fil des ajouts réguliers, elle contient désormais plus de 200 millions de protéines issus d’un million d’espèces différentes. Presque toutes les protéines ont désormais une structure tridimensionelle, prédite par l’Intelligence artificielle.

Les protéines sont des longues chaînes constituées d’acides aminés qui, selon la nature de ces derniers, prennent des formes tridimensionnelles différentes. La structure 3D d’une protéine est intimement liée à son rôle biologique. La connaître est donc indispensable pour créer des nouveaux médicaments ou étudier une maladie par exemple.

Une nouvelle ère de la biologie
« En résumé, vous pouvez considérer qu’il couvre l’ensemble de l’univers des protéines. Nous sommes au début d’une nouvelle ère de la biologie digitale », a déclaré Demis Hassabis, P.-D.G. de DeepMind. AlphaFold est un outil précieux pour les scientifiques puisque, depuis son lancement, il a été utilisé dans plus de 1.000 publications scientifiques couvrant des domaines aussi variés que la recherche sur les microplastiques, la maladie de Parkinson, la biologie des abeilles ou la formation des glaciers.

Les prédictions faites par l’IA sont d’une grande précision : 35 % des structures de la base de données sont considérées comme « très précises », comparables à ce que pourraient obtenir les scientifiques en faisant de longues manipulations de cristallographie à rayon X ou de microscopie électronique. Ces 23 terrabytes de données ouvrent un champ presque infini de recherche scientifique.

futura

You may like