Aujourd’hui, les systèmes d’intelligence artificielle (IA) possèdent de nombreuses compétences, mais ils rencontrent souvent des difficultés avec des problèmes mathématiques complexes. C’est pourquoi Google se réjouit que deux de ses systèmes d’IA DeepMind aient réussi à résoudre plusieurs défis lors d’une compétition mathématique prestigieuse.
Dans un article publié récemment, Google a mis en avant les prouesses et les réalisations de ses modèles d’IA, AlphaProof et AlphaGeometry 2. Lors de la 2024 International Mathematical Olympiad (IMO), ces deux systèmes ont résolu quatre des six problèmes posés. Pour la première fois dans ce concours, généralement destiné aux jeunes mathématiciens, l’IA de Google a obtenu un niveau équivalent à celui d’un médaillé d’argent.
Chaque année, l’IMO invite des mathématiciens d’élite pré-universitaires à se confronter à six problèmes extrêmement difficiles en algèbre, combinatoire, géométrie et théorie des nombres. En s’étendant au-delà des humains, cette compétition est également devenue un moyen d’évaluer les systèmes d’apprentissage automatique et d’IA en matière de raisonnement mathématique avancé.
Les problèmes ayant été traduits dans un langage formel compréhensible par l’IA de Google, AlphaProof a résolu deux problèmes d’algèbre et un problème de théorie des nombres, prouvant non seulement les réponses, mais aussi leur validité. Google a souligné que le défi de théorie des nombres était le plus difficile de la compétition, n’ayant été résolu que par cinq des participants humains. AlphaGeometry 2 a quant à lui résolu le problème de géométrie, mais aucun des deux modèles n’a réussi à résoudre les deux problèmes de combinatoire.
AlphaProof est un système d’IA capable de s’auto-entraîner pour prouver des énoncés mathématiques en utilisant le langage formel Lean. En combinant un modèle de langage pré-entraîné avec l’algorithme d’apprentissage par renforcement AlphaZero, AlphaProof a déjà appris à jouer et à gagner aux échecs, au shogi et au Go.
AlphaGeometry 2, quant à lui, est une version améliorée d’AlphaGeometry. Basé sur l’IA Gemini de Google, ce modèle est capable de traiter des problèmes de géométrie très complexes, y compris ceux impliquant des mouvements d’objets et des équations d’angles, de rapports et de distances.
En plus de tester les compétences mathématiques d’AlphaProof et d’AlphaGeometry 2, Google a profité de l’IMO pour expérimenter un système de raisonnement en langage naturel basé sur Gemini, doté de capacités avancées de résolution de problèmes. Contrairement aux deux autres modèles, celui-ci n’a pas besoin que les problèmes soient traduits dans un langage formel.
Bien que les réalisations de ces modèles puissent sembler abstraites, Google les considère comme une avancée vers l’avenir de l’IA.
L’entreprise a exprimé son enthousiasme pour un avenir où les mathématiciens collaborent avec des outils d’IA pour explorer des hypothèses, essayer de nouvelles approches audacieuses pour résoudre des problèmes anciens et compléter rapidement des éléments chronophages de preuves. Google envisage également un avenir où des systèmes d’IA comme Gemini deviendront plus compétents en mathématiques et en raisonnement général.