L’intelligence artificielle prédit la structure des protéines

DeepMind, le laboratoire d’IA de Google, a résolu un défi de 50 ans, avec AlphaFold, en décembre 2020. Celui d’une intelligence artificielle, IA, prédisant la structure des protéines. Ce qui permettra, entre autres, de mieux comprendre les maladies et de « développer de nouveaux médicaments ou d’identifier des organismes qui peuvent aider à lutter contre la pollution et le changement climatique ».

La société technologique et filiale de Google, DeepMind, a publié tous les détails de cette structure ainsi que son code open source en juillet 2021. Récemment, la société a annoncé avoir « utilisé son IA pour prédire les formes de presque toutes les protéines du corps humain », ainsi que celles « de centaines de milliers d’autres protéines trouvées dans 20 des organismes les plus étudiés », incluant la levure, les drosophiles et les souris.

Actuellement, la base de données se compose de 350 000 structures protéiques nouvellement prédites. Dans les mois prochains, DeepMind envisage de prédire et publier les structures de plus de 100 millions de protéines supplémentaires, ce qui, plus ou moins, équivaudrait à toutes les protéines connues de la science.

« Notre objectif chez DeepMind a toujours été de développer l’IA, puis de l’utiliser comme un outil pour aider à accélérer le rythme de la découverte scientifique elle-même, faisant ainsi progresser notre compréhension du monde qui nous entoure. Nous avons utilisé AlphaFold pour générer l’image la plus complète et la plus précise du protéome humain. Nous pensons que cela représente la contribution la plus importante que l’IA ait apportée à l’avancement des connaissances scientifiques à ce jour et illustre parfaitement les types d’avantages que l’IA peut apporter à la société », a déclaré Demis Hassabis, fondateur et PDG de Deepmind.

De nombreuses contributions de la communauté scientifique internationale, ainsi que les innovations algorithmiques de Deepmind servent d’appui pour la base de données.

« Rendre les prédictions d’AlphaFold accessibles à la communauté scientifique internationale ouvre de nombreuses nouvelles voies de recherche, des maladies négligées aux nouvelles enzymes pour la biotechnologie et tout le reste. Il s’agit d’un nouvel outil scientifique formidable, qui complète les technologies existantes, et nous permettra de repousser les limites de notre compréhension du monde », a affirmé le directeur général adjoint de l’EMBL, Ewan Birney.

Les protéines, etant constitué de longs rubans entrecroisés d’acides aminés, les connaître afin de comprendre les maladies et « développer de nouveaux médicaments ou identifier des organismes qui peuvent aider à lutter contre la pollution et le changement climatique » est un processus habituellement long, durant des semaines ou des mois. Avec AlphaFold, « prédire des formes à l’atome le plus proche » peut se faire en un jour ou deux.

David Baker de l’Institute for Protein Design de l’Université de Washington a apporté quelques précisions sur ce logiciel qui est très important pour les chercheurs, mais peut être difficile à exploiter pour des particuliers qui voudraient l’utiliser par eux-mêmes. « Il est beaucoup plus facile de récupérer une structure dans la base de données que de l’exécuter sur votre propre ordinateur », a expliqué ce premier dont le laboratoire a développé RoseTTAFold, son propre outil de prédiction des structures protéiques basé sur l’approche d’AlphaFold.

Déclarant que « beaucoup de recherches biologiques assez intéressantes ont été vraiment accélérées », Baker prévient que certaines des formes prédites restent à être vérifiées en laboratoire.

Le biologiste des systèmes à l’Université Columbia, qui a développé son propre logiciel pour prédire la structure des protéines, Mohammed AlQuraish estime « impressionnant » le fait qu’il puisse être appliqué à un tel niveau de qualité. Soulignant que « le fait d’avoir des structures pour la plupart des protéines d’un organisme permettra d’étudier comment ces protéines fonctionnent en tant que système, et pas seulement de manière isolée », Mohammed AlQuraish a déclaré que  c’est ce qui lui « semble le plus excitant ».

D’un autre côté, Demis Hassabis a déclaré : « Le repliement des protéines est un problème que je surveille depuis plus de 20 ans. Cela a été un énorme projet pour nous. Je dirais que c’est notre plus grand accomplissement jusqu’à présent. Et c’est le plus excitant d’une certaine manière, car il devrait avoir le plus grand impact dans le monde en dehors de l’IA ».

Esther LARRIEUX

Read Previous

Le lien entre perte de dent et démence scientifiquement démontré

Read Next

Variant Delta: Les voyageurs internationaux interdits d’entrée aux États-Unis