Technologie

Le 12 septembre 2024 à 10h42

Robot diplômé

Depuis le lancement du modèle de langage avancé GPT-4 d’OpenAI en mars 2023, les utilisateurs et développeurs se sont interrogés sur la date de sortie de la prochaine version, souvent appelée GPT-5. Cependant, il semble que la série GPT soit pour l’instant éclipsée par une toute nouvelle gamme de modèles.

Récemment, OpenAI a dévoilé sa nouvelle famille de modèles d’IA, nommée « o1 », qui commence avec deux variantes : o1-preview et o1-mini. Ces modèles sont conçus pour « raisonner à travers des tâches complexes et résoudre des problèmes plus difficiles » que ceux de la série GPT.

Actuellement, ces modèles sont accessibles aux utilisateurs de ChatGPT Plus, mais avec des limitations initiales de 30 messages par semaine pour o1-preview et 50 pour o1-mini. OpenAI précise que, étant encore en phase bêta, ces modèles ne disposent pas encore de nombreuses fonctionnalités qui rendent ChatGPT utile, comme la navigation sur le web ou le téléchargement de fichiers et d’images. Pour de nombreuses tâches courantes, GPT-4o pourrait encore être plus performant à court terme.

Les Avantages de o1 par Rapport à GPT

OpenAI affirme que sa nouvelle série o1 est particulièrement adaptée aux utilisateurs confrontés à des problèmes complexes dans des domaines tels que la science, la santé et la technologie. Les modèles sont envisagés pour une variété d’applications, allant de l’aide aux physiciens pour générer des formules mathématiques en optique quantique à l’assistance aux chercheurs en santé pour annoter des données de séquençage cellulaire. Les développeurs trouveront également le modèle o1-mini efficace pour construire et exécuter des flux de travail multi-étapes, déboguer du code et résoudre des défis de programmation de manière efficace.

Performances de o1-preview au Niveau Doctoral

Le modèle o1-preview est conçu pour aborder des tâches difficiles en consacrant plus de temps à la réflexion et à l’affinement de ses réponses, à l’instar d’une personne face à un problème complexe. Les tests ont montré que ce modèle atteint des performances proches de celles d’étudiants en doctorat dans des domaines tels que la physique, la chimie et la biologie. De plus, o1-preview excelle en programmation, se classant dans le 89e percentile lors des compétitions Codeforces, démontrant sa capacité à gérer des flux de travail complexes, à déboguer du code et à générer des solutions précises. Dans des épreuves de référence comme l’examen de qualification de l’Olympiade Internationale de Mathématiques (IMO), o1-preview a résolu 83 % des problèmes, une nette amélioration par rapport au taux de réussite de 13 % de son prédécesseur, GPT-4o.

Ce modèle est déjà accessible aux utilisateurs de ChatGPT Plus et Team, tandis que les utilisateurs Enterprise et Edu y auront accès la semaine prochaine. Les modèles sont également disponibles via l’API d’OpenAI pour les développeurs qualifiés pour le niveau d’utilisation de l’API 5, bien que des limites de taux initiales s’appliquent.

o1-mini : Moins Puissant mais 80 % Moins Cher

En parallèle de o1-preview, OpenAI a également lancé le modèle o1-mini, une version plus simplifiée conçue pour offrir des capacités de raisonnement plus rapides et moins coûteuses. Bien qu’optimisé principalement pour les tâches de codage et STEM, o1-mini maintient de bonnes performances, notamment en mathématiques et en programmation. Sur le benchmark mathématique de l’IMO, o1-mini a obtenu un score de 70 %, presque équivalent aux 74 % de o1-preview, tout en offrant un coût d’inférence nettement inférieur. Il a également obtenu un score Elo de 1650 sur Codeforces, le plaçant parmi les 86 % des meilleurs programmeurs.

Avec un prix 80 % inférieur à celui de o1-preview, o1-mini s’adresse aux développeurs et chercheurs qui nécessitent des capacités de raisonnement sans avoir besoin de la connaissance plus étendue que propose le modèle o1-preview. Cette solution économique sera également accessible aux utilisateurs de ChatGPT Plus, Team, Enterprise et Edu, avec des projets d’extension de l’accès aux utilisateurs de ChatGPT Free à l’avenir.

Améliorations en Matière de Sécurité

Conformément à l’engagement d’OpenAI en matière de sécurité, les deux modèles intègrent une nouvelle approche de formation à la sécurité qui améliore leur capacité à respecter les directives de sécurité et d’alignement. OpenAI souligne que o1-preview a obtenu un score impressionnant de 84 lors de l’un de ses tests de contournement les plus difficiles, une amélioration significative par rapport au score de 22 de GPT-4o. La capacité de raisonner sur les règles de sécurité dans un contexte donné permet à ces modèles de mieux gérer les demandes dangereuses et d’éviter de générer du contenu inapproprié.

Dans le cadre de ses efforts de sécurité, OpenAI a établi des partenariats avec les instituts de sécurité de l’IA aux États-Unis et au Royaume-Uni. Ces collaborations incluent l’octroi d’un accès anticipé à une version de recherche des modèles o1 pour aider à l’évaluation et aux tests des futurs systèmes d’IA. Le travail d’OpenAI en matière de sécurité comprend également une gouvernance interne complète et une collaboration avec le gouvernement fédéral, renforcée par des tests réguliers, des simulations de menaces et une supervision au niveau du conseil d’administration par le comité de sécurité et de sûreté de l’entreprise.

Perspectives d’Avenir pour la Série o1 d’OpenAI

Bien que les modèles o1-preview et o1-mini soient des outils puissants pour le raisonnement et la résolution de problèmes, OpenAI reconnaît que ce n’est que le début. L’entreprise prévoit de mettre à jour et d’améliorer régulièrement ces modèles, y compris l’ajout de fonctionnalités telles que la navigation, le téléchargement de fichiers et d’images, ainsi que l’appel de fonctions, qui ne sont actuellement pas disponibles dans la version API.

À l’avenir, OpenAI continuera de développer à la fois sa série GPT et sa série o1, élargissant encore les capacités de l’IA dans divers domaines. Les utilisateurs peuvent s’attendre à des avancées continues alors que l’entreprise s’efforce d’accroître l’utilité et l’accessibilité de ces modèles dans différentes applications.

Show Comments (0)
Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *