La base de données AlphaFold contient désormais la structure 3D de plus de 200 millions de protéines. Couvrant tous les règnes du vivant, elle devrait révolutionner la biologie.
La structure de plus de 200 millions de protéines, issues également des plantes, des animaux, de l’être humain ou des bactéries, est désormais disponible en un simple clic aux scientifiques du monde entier. Cette révolution est possible grâce au projet AlphaFold, porté par DeepMind, une société experte en Intelligence artificielle détenue par Google, et l’EMB-EMI, l’Institut européen de bioinformatique.
Lancée en juillet 2021, la base de données d’AlphaFold contenait déjà la structure en trois dimensions de 350.000 protéines dont l’intégralité du protéome humain. En moins d’un an et au fil des ajouts réguliers, elle contient désormais plus de 200 millions de protéines issues d’un million d’espèces différentes. Presque toutes les protéines ont désormais une structure tridimensionelle, prédite par l’Intelligence artificielle.
Une nouvelle ère de la biologie
« En résumé, vous pouvez considérer qu’il couvre l’ensemble de l’univers des protéines. Nous sommes au début d’une nouvelle ère de la biologie digitale », a déclaré Demis Hassabis, P.-D.G. de DeepMind. AlphaFold est un outil précieux pour les scientifiques puisque, depuis son lancement, il a été utilisé dans plus de 1.000 publications scientifiques couvrant des domaines aussi variés que la recherche sur les microplastiques, la maladie de Parkinson, la biologie des abeilles ou la formation des glaciers.
Les prédictions faites par l’IA sont d’une grande précision : 35 % des structures de la base de données sont considérées comme « très précises », comparables à ce que pourraient obtenir les scientifiques en faisant de longues manipulations de cristallographie à rayon X ou de microscopie électronique. Ces 23 terrabytes de données ouvrent un champ presque infini de recherche scientifique.
futura