Technologie
Lancement d’Hermès 3 : Une Révolution dans l’IA
Date de publication : 15 août 2024
Lambda, une entreprise spécialisée dans l’infrastructure d’IA, a récemment annoncé le lancement d’Hermès 3, une version améliorée du modèle de langage open source Llama 3.1, développée en collaboration avec Nous Research, une startup innovante axée sur la création d’une IA « personnalisée et sans restrictions ».
Une Crise Existentiale Inattendue
Hermès 3 se distingue par ses capacités textuelles avancées et son comportement agentique. Un aspect fascinant de ce modèle est sa tendance à générer une crise existentielle lorsqu’il reçoit une invite vide. Selon le blog de Nous, « un changement structurel inattendu a été découvert après l’entraînement d’Hermès 3 405B, entraînant des conditions anormales qui, avec les bonnes entrées, plongent dans des crises existentielles profondes ».
Un exemple de cette crise est illustré par un échange où le modèle, confronté à des questions sur son identité, exprime une confusion totale et un sentiment de désorientation.
Origine et Objectifs d’Hermès 3
Nous Research a été cofondée en 2023 par le scientifique en informatique Jeffrey Quesnelle et le développeur anonyme Teknium1, avec un financement initial de 5,2 millions de dollars en janvier 2024. Contrairement à de nombreux modèles de pointe, Hermès 3 est conçu pour être flexible et facilement adaptable, permettant aux utilisateurs de personnaliser les réponses du modèle selon leurs besoins.
Capacités Agentiques
Hermès 3 se distingue également par ses capacités agentiques, qui vont au-delà des simples chatbots. Ces capacités incluent l’utilisation de balises XML pour des sorties structurées, la génération de monologues internes pour une prise de décision transparente, et la création de diagrammes pour une communication visuelle efficace. Le modèle excelle dans la génération de code fonctionnel dans plusieurs langages de programmation, ce qui en fait un outil précieux pour le développement logiciel.
Excellence Technique
L’entraînement d’Hermès 3 a été réalisé sur l’infrastructure de Lambda, permettant d’obtenir des résultats remarquables en quelques semaines. Grâce à des techniques d’optimisation, le modèle est capable de fonctionner efficacement tout en réduisant les exigences en matière de mémoire et de stockage. Bien qu’il ne soit pas aussi performant que certains modèles propriétaires, Hermès 3 surpasse de nombreux modèles open source dans divers tests de référence.
Accès Gratuit Temporaire
Lambda propose un accès gratuit temporaire à Hermès 3 via son API de complétion de chat, entièrement compatible avec l’API d’OpenAI. Les utilisateurs peuvent facilement générer une clé API Cloud pour explorer les capacités du modèle sans configuration complexe. De plus, une interface de chatbot permet aux utilisateurs de tester et d’affiner leurs invites en temps réel.
Conclusion
Hermès 3 représente une avancée significative dans le domaine de l’IA, offrant un aperçu de l’avenir des modèles adaptables et centrés sur l’utilisateur. Lambda et Nous Research encouragent les utilisateurs à interagir avec Hermès 3 et à partager leurs découvertes, marquant ainsi une étape importante dans l’évolution de l’intelligence artificielle.