Une semaine auparavant, OpenAI a lancé GPT-4o mini. En un temps record, ce modèle a déjà bénéficié de mises à jour et a grimpé dans les classements de l’Arène des Chatbots de l’Organisation des Systèmes de Modèles Larges (LMSYS), surpassant des modèles bien établis comme Claude 3.5 Sonnet et Gemini Advanced.
L’Arène des Chatbots LMSYS est une plateforme participative où les utilisateurs peuvent évaluer des modèles de langage de grande taille (LLMs) en discutant avec deux modèles côte à côte, tout en comparant leurs réponses sans connaître les noms des modèles.
Accéder à GPT-4o mini : 3 méthodes pour essayer ce modèle d’IA plus intelligent et moins cher, dont 2 gratuites
Dès son lancement, GPT-4o mini a été intégré à l’Arène, où il a rapidement atteint le sommet du classement, juste derrière GPT-4o. Ce fait est particulièrement remarquable, car GPT-4o mini coûte 20 fois moins cher que son prédécesseur.
Mise à jour passionnante de l’Arène des Chatbots : les résultats de GPT-4o mini sont là !
Avec plus de 4 000 votes d’utilisateurs, GPT-4o mini a grimpé au sommet du classement, se plaçant à égalité avec GPT-4o tout en étant 20 fois moins cher ! Il a montré des performances nettement meilleures que sa version antérieure (« upcoming-gpt-mini ») dans tous les domaines de l’Arène.
À la suite de ces résultats, certains utilisateurs ont exprimé leurs inquiétudes sur les réseaux sociaux concernant la capacité d’un modèle aussi récent à surpasser des modèles plus robustes et éprouvés comme Claude 3.5 Sonnet. Pour répondre à ces préoccupations, LMSYS a expliqué sur X les facteurs qui ont contribué à la position élevée de GPT-4o mini, soulignant que les classements de l’Arène des Chatbots sont influencés par les préférences humaines basées sur les votes.
Pour ceux qui souhaitent déterminer quel modèle est le plus performant, LMSYS les encourage à consulter les classements par catégorie afin de mieux comprendre les capacités techniques. Ces informations sont accessibles en cliquant sur le menu déroulant « Global » et en sélectionnant une autre catégorie. En explorant les différents classements par catégorie, tels que la programmation, les requêtes difficiles et les requêtes longues, les utilisateurs pourront observer des variations dans les résultats.
OpenAI lance SearchGPT : découvrez ses fonctionnalités et comment y accéder
Dans la catégorie programmation, GPT-4o mini se classe troisième, derrière GPT-4o et Claude 3.5 Sonnet, qui occupe la première place. Cependant, GPT-4o mini se distingue en étant numéro un dans d’autres catégories, telles que les conversations multi-tours (deux tours ou plus) et les requêtes longues de 500 tokens ou plus.
Si vous souhaitez essayer GPT-4o mini, rendez-vous sur le site de ChatGPT et connectez-vous à votre compte OpenAI. Si vous préférez participer à l’Arène des Chatbots et découvrir GPT-4o mini par le biais de l’aléatoire, vous pouvez commencer par visiter le site, cliquer sur l’option Arène côte à côte, puis entrer un exemple de requête.