Connect with us

Général

La nouvelle fonction de mise en cache des invites de Claude d’Anthropic : une révolution économique pour les développeurs !

Anthropic a récemment lancé une fonctionnalité révolutionnaire : le caching des prompts. Imaginez que vous êtes dans un café et que vous n’avez plus besoin de répéter votre commande à chaque visite ! Grâce à cette innovation, les développeurs peuvent économiser jusqu’à 90 % sur les coûts d’API et réduire la latence de 80 %. En stockant les contextes fréquemment utilisés, les utilisateurs peuvent enrichir leurs interactions sans alourdir leur budget. Une véritable avancée pour optimiser les performances des modèles d’IA !

Published

on

La nouvelle fonction de mise en cache des invites de Claude d’Anthropic : une révolution économique pour les développeurs !

Technologie

illustration d'un robot humanoïde en profil avec une coupe révélant des circuits

Crédit : VentureBeat

Anthropic a récemment lancé une fonctionnalité de mise en cache des invites sur son API, permettant de mémoriser le contexte entre les appels API et d’éviter ainsi de répéter les invites.

Cette fonctionnalité de mise en cache est actuellement en version bêta publique sur Claude 3.5 Sonnet et Claude 3 Haiku, tandis que le support pour le modèle le plus grand, Opus, sera disponible prochainement.

La mise en cache des invites, expliquée dans un document de 2023, permet aux utilisateurs de conserver des contextes fréquemment utilisés au cours de leurs sessions. Grâce à cette fonctionnalité, les utilisateurs peuvent ajouter des informations supplémentaires sans augmenter les coûts. Cela est particulièrement utile lorsque quelqu’un souhaite envoyer un grand volume de contexte dans une invite et y faire référence dans différentes conversations avec le modèle. Cela permet également aux développeurs et aux autres utilisateurs d’affiner les réponses du modèle de manière plus efficace.

Selon Anthropic, les premiers utilisateurs ont constaté des améliorations significatives en termes de rapidité et de coûts grâce à la mise en cache des invites pour divers cas d’utilisation, allant de l’inclusion d’une base de connaissances complète à des exemples de 100 coups, en passant par l’intégration de chaque échange d’une conversation dans leur invite.

Les cas d’utilisation potentiels incluent la réduction des coûts et de la latence pour des instructions longues et des documents téléchargés pour des agents conversationnels, une autocomplétion de code plus rapide, la fourniture de multiples instructions à des outils de recherche agentiques et l’intégration de documents entiers dans une invite.

Anthropic (@AnthropicAI) vient d’annoncer une avancée majeure pour leur API : la mise en cache des invites.

Pensez à la mise en cache des invites comme ceci : vous êtes dans un café. La première fois que vous visitez, vous devez expliquer votre commande au barista. Mais la prochaine fois ? Il vous suffit de dire « la d’habitude ».

C’est la mise en cache des invites… pic.twitter.com/ASB1nkdY4U

Tarification des invites mises en cache

Un des avantages de la mise en cache des invites est la réduction des prix par token. Anthropic a indiqué que l’utilisation des invites mises en cache est « significativement moins coûteuse » que le prix de base des tokens d’entrée.

Pour Claude 3.5 Sonnet, la rédaction d’une invite à mettre en cache coûtera 3,75 $ par million de tokens (MTok), tandis que l’utilisation d’une invite mise en cache coûtera 0,30 $ par MTok. Le prix de base d’une entrée pour le modèle Claude 3.5 Sonnet est de 3 $/MTok, donc en payant un peu plus à l’avance, vous pouvez vous attendre à une économie de 10x si vous utilisez l’invite mise en cache la prochaine fois.

Nous venons de déployer la mise en cache des invites dans l’API d’Anthropic.

Elle réduit les coûts d’entrée de l’API jusqu’à 90 % et diminue la latence jusqu’à 80 %.

Voici comment cela fonctionne :

En ce qui concerne les coûts, l’appel API initial est légèrement plus cher (pour tenir compte du stockage de l’invite dans le cache), mais tous les appels suivants coûtent un dixième du prix normal. pic.twitter.com/3cPkz8c0rm

Les utilisateurs de Claude 3 Haiku paieront 0,30 $/MTok pour mettre en cache et 0,03 $/MTok lors de l’utilisation des invites stockées.

Bien que la mise en cache des invites ne soit pas encore disponible pour Claude 3 Opus, Anthropic a déjà publié ses tarifs. Écrire pour mettre en cache coûtera 18,75 $/MTok, mais accéder à l’invite mise en cache coûtera 1,50 $/MTok.

Cependant, comme l’a noté l’influenceur AI Simon Willison sur X, le cache d’Anthropic n’a qu’une durée de vie de 5 minutes et est rafraîchi à chaque utilisation.

Ressemble à la mise en cache de contexte de Gemini, mais le modèle de tarification d’Anthropic est différent.

Gemini facture 4,50 $/million de tokens/heure pour garder le cache de contexte actif.

Anthropic facture pour les écritures de cache, et « le cache a une durée de vie de 5 minutes, rafraîchi chaque fois que le contenu mis en cache est utilisé » https://t.co/rfMQE2J3Rs

Il ne s’agit pas de la première fois qu’Anthropic tente de rivaliser avec d’autres plateformes d’IA par le biais de la tarification. Avant le lancement de la famille de modèles Claude 3, Anthropic avait déjà réduit les prix de ses tokens.

Actuellement, l’entreprise est engagée dans une sorte de « course vers le bas » face à des concurrents tels que Google et OpenAI pour offrir des options à bas prix aux développeurs tiers construisant sur sa plateforme.

Fonctionnalité très demandée

D’autres plateformes proposent une version de la mise en cache des invites. Lamina, un système d’inférence LLM, utilise la mise en cache KV pour réduire le coût des GPU. Une simple recherche dans les forums de développeurs d’OpenAI ou sur GitHub mettra en évidence des questions sur la manière de mettre en cache les invites.

Il est important de noter que la mise en cache des invites n’est pas la même chose que la mémoire des grands modèles de langage. Par exemple, le GPT-4o d’OpenAI propose une mémoire où le modèle se souvient des préférences ou des détails, mais ne stocke pas les invites et les réponses réelles comme le fait la mise en cache des invites.

Général

Le pare-brise de la BMW Panoramic iDrive : une expérience immersive à couper le souffle !

BMW a révélé son nouveau système Panoramic iDrive, révolutionnant l’expérience de conduite avec un affichage tête haute 3D qui s’étend sur tout le pare-brise. Imaginez un intérieur où toutes les informations essentielles, comme la vitesse et les directions, sont projetées directement dans votre champ de vision ! C’est une véritable couche de réalité augmentée qui connecte le conducteur à la route.

Avec des boutons haptiques sur le volant et un écran tactile central innovant, chaque détail est conçu pour une personnalisation optimale. Préparez-vous à découvrir cette technologie futuriste dans le prochain SUV électrique X-Class de BMW fin 2025 !

Published

on

Le pare-brise de la BMW Panoramic iDrive : une expérience immersive à couper le souffle !

Une ‌Révolution Technologique : Le Nouveau Système BMW : un aperçu captivant du futur de l'infodivertissement »>iDrive Panoramique de BMW

une Vision d’Avenir

BMW a récemment présenté son innovant système iDrive Panoramique,qui ​se distingue par un affichage tête haute en 3D ⁢impressionnant,occupant l’intégralité du pare-brise. si vous pensiez que l’intérieur‌ épuré des ‌Tesla ‌était à la pointe, attendez de découvrir cette nouvelle⁢ approche.

Un Affichage Révolutionnaire

Fini le tableau de ⁣bord traditionnel ​devant le volant. Désormais, toutes les informations sont projetées directement dans le champ de⁢ vision du conducteur via le pare-brise. Cela inclut la vitesse, les données d’assistance à la conduite, ⁢les feux ​de ⁢circulation, les panneaux routiers⁢ et ⁢même des indications ​de navigation et niveaux de batterie. Chaque ​élément est personnalisable pour ⁤que chaque conducteur puisse choisir ce ​qu’il souhaite afficher. Par ‍exemple,​ lorsque l’assistance ⁣au⁢ conducteur est activée, le chemin navigué s’illumine⁤ en vert.

Frank Weber, directeur technique chez BMW, décrit cette configuration ⁢comme une couche de réalité augmentée ‌qui maintient le ⁤conducteur connecté à la⁤ route.

Intégration des Retours Clients

La société a déclaré que l’intégration des instructions de⁤ navigation avec les données d’assistance au conducteur représente une évolution naturelle alors que⁤ nous nous dirigeons vers des niveaux plus élevés d’automatisation⁣ dans la conduite.De plus,​ ils ont souligné que les retours clients ont été ‌essentiels ⁢pour façonner plusieurs fonctionnalités intelligentes affichées sur‌ ce nouveau système.

!Image

Un Volant Repensé

Les⁣ innovations ⁣ne s’arrêtent pas au pare-brise ‍; BMW ‍a‍ également repensé son volant‍ en y intégrant des ⁣boutons haptiques qui s’illuminent selon différents réglages.

Un nouvel écran tactile central en forme de ⁣losange accompagne cet interface sur le pare-brise et⁣ permet aux utilisateurs d’interagir directement avec lui.Ce dernier offre une interface hautement personnalisable où chacun peut prioriser ses applications favorites (appelées « pixels » par BMW) pour un accès rapide et⁤ facile. La marque envisage également‍ un magasin d’applications pour ⁢encore plus ⁤de fonctionnalités et personnalisations.

Un Système opérationnel ‌Innovant

Le logiciel qui alimente ​ce système est appelé BMW Operating System‍ X ; il ⁤est développé entièrement en interne par l’entreprise et repose sur Android Open Source Project.

!Image

L’Intelligence Artificielle au Service du Conducteur‍

Aucun ​lancement technologique en 2025 ne serait complet sans une touche d’intelligence artificielle (IA).Le système ⁤iDrive ⁣utilise cette technologie⁢ pour apprendre les ‍habitudes et comportements des conducteurs afin d’afficher automatiquement les applications pertinentes ainsi que leurs réglages préférés. Par exemple, si un utilisateur emprunte souvent un itinéraire spécifique vers ⁤son domicile tout en activant⁢ le mode sport, ces paramètres seront proposés proactivement lors du prochain trajet.De plus, selon ‍BMW ,les modèles linguistiques avancés rendent les commandes vocales beaucoup plus naturelles et conversationnelles ; ⁤plutôt que d’utiliser⁣ des mots-clés spécifiques comme « station », il suffit simplement aux conducteurs dire‌ quelque chose comme « trouve une station de recharge près du‍ supermarché ».

Début D’une Nouvelle Ère

Ce design⁣ intérieur audacieux fera​ ses débuts dans le ⁤futur SUV électrique ‌X-Class prévu fin 2025;​ plusieurs autres véhicules basés sur la ⁣nouvelle plateforme « Neue Klasse » suivront bientôt après cela.

!image

Considérations Sécuritaires⁣ Émergentes

Un changement⁢ aussi radical pourrait diviser l’opinion parmi ceux attachés aux⁢ intérieurs‍ classiques ⁤dotés depuis longtemps d’aiguilles traditionnelles et compteurs analogiques caractéristiques chez BMW . Il sera également intéressant d’observer comment la marque abordera‍ les‌ préoccupations relatives à la sécurité; celles-ci étant​ devenues cruciales pour toutes ⁤entreprises automobiles électriques adoptant entièrement interfaces tactiles . En effet , Euro NCAP introduira dès 2026 nouvelles directives exigeant certaines fonctions essentielles soient accessibles via⁣ boutons physiques⁣ afin qu’un véhicule puisse obtenir cinq étoiles lors évaluations sécurité .

Continue Reading

Général

Nvidia révolutionne le monde physique avec GenAI et Cosmos !

Lors de la keynote très attendue du CES 2025, le PDG de Nvidia, Jensen Huang, a captivé l’audience avec des annonces révolutionnaires. Parmi les innovations présentées, le modèle Cosmos se distingue par sa capacité à transformer l’IA générative en actions physiques. Cela signifie que des robots et véhicules autonomes pourront réagir plus efficacement aux stimuli du monde réel. Nvidia ouvre ainsi la voie à une nouvelle ère d’applications robotiques et automobiles, tout en rendant ses modèles disponibles gratuitement pour encourager l’expérimentation.

Published

on

Nvidia révolutionne le monde physique avec GenAI et Cosmos !

Innovations Technologiques : les Annonces Marquantes de Nvidia au CES 2025

Un Événement Incontournable

Lors du CES 2025, l’une des conférences les plus attendues a été celle de Jensen Huang, le PDG de Nvidia. Ce dernier a présenté une série d’annonces captivantes touchant à divers sujets technologiques d’actualité tels que l’intelligence artificielle (IA), la robotique et les véhicules autonomes.

Nouveaux Produits et Progrès Technologiques

Vêtu d’une version scintillante de son emblématique blouson en cuir noir,Huang a détaillé les dernières cartes graphiques GeForce RTX 50 ainsi que des modèles fondamentaux d’IA appelés Nemotron. Il a également partagé des plans pour des agents alimentés par IA.

Parmi les innovations notables figurent des extensions à la plateforme Omniverse, qui permet la création de jumeaux numériques et simule l’interaction entre l’IA et le monde physique. De plus, un superordinateur AI compact nommé Project Digits a été introduit, propulsé par le GPU Grace Blackwell.

Cosmos : Une Révolution dans l’Intelligence Artificielle

Une annonce particulièrement intrigante fut celle du projet Cosmos. Ce dernier est défini comme un ensemble complet de modèles fondamentaux mondiaux intégrant des tokenizers avancés et une pipeline vidéo sophistiquée.L’objectif principal est d’étendre les capacités génératives de l’IA au-delà du numérique vers le monde physique.

En termes simples, alors que la plupart des systèmes génératifs se concentrent sur la création numérique basée sur une vaste base documentaire ou visuelle, Cosmos vise à produire des actions physiques en s’appuyant sur ses données issues d’environnements simulés numériquement.

Implications pratiques pour Divers secteurs

Les implications pratiques sont significatives pour divers domaines tels que la robotique ou les véhicules autonomes. Par exemple, grâce à Cosmos, il devient possible pour un robot humanoïde d’apprendre à exécuter efficacement une tâche spécifique comme retourner une omelette ou manipuler des pièces dans une chaîne de production.De même,un véhicule autonome peut s’adapter dynamiquement aux différentes situations rencontrées sur la route.

Actuellement,ces formations reposent souvent sur un travail manuel intensif où il faut filmer plusieurs fois chaque action humaine ou faire parcourir aux voitures autonomes plusieurs millions de kilomètres. Avec Cosmos cependant,ces méthodes peuvent être automatisées ce qui réduit considérablement coûts et délais tout en élargissant le volume de données disponibles pour entraîner ces systèmes.

La Plateforme cosmo : Un Outil Puissant

Nvidia présente donc Cosmos comme une plateforme dédiée au développement mondial fondée sur l’IA générative qui intègre divers outils facilitant cette évolution technologique rapide. En tant qu’extension directe du simulateur Omniverse déjà existant chez Nvidia, elle permet non seulement d’extrapoler les modèles numériques mais aussi leur request concrète dans notre réalité quotidienne.

Au cœur même du projet se trouvent ces modèles fondamentaux construits grâce à millions heures vidéos accumulées permettant ainsi aux machines formées avec cette technologie réagir avec précision face aux stimuli physiques variés qu’elles rencontrent dans leur environnement réel.

Vers un Avenir Prometteur

Jensen Huang n’a pas manqué souligner lors sa présentation comment nous assistons actuellement à une transition majeure vers ce qu’il appelle « l’IA physique ». en rendant ses modèles disponibles gratuitement afin encourager recherche avancée en robotique et véhicules autonomes , Nvidia montre sa volonté soutenir innovation tout en anticipant tendances futures .

À court terme cependant , cet impact pourrait rester limité car principalement destiné développeurs spécialisés . Néanmoins , son potentiel transformationnel pourrait accélérer considérablement progrès produits concernés tout en améliorant sécurité efficacité systèmes associés .Ces développements témoignent également transformation continue chez Nvidia vers entreprise axée logiciel capable bâtir plateformes adaptées nouvelles applications émergentes. Pour ceux intéressés comprendre direction future société , ces annonces offrent perspectives fascinantes quant maintien croissance impressionnante entreprise .

Continue Reading

Général

L’écran tactile secondaire Corsair Xeneon Edge : un 32:9 qui s’installe partout !

Qu’est-ce qui vient de se passer ? Le CES est toujours une vitrine incroyable de produits technologiques, et cette année, Corsair nous surprend avec son écran tactile Xeneon Edge. Avec ses 14,5 pouces et un rapport d’aspect 32:9, cet écran secondaire pourrait bien devenir l’outil indispensable pour les passionnés de technologie. Grâce à sa résolution impressionnante de 2560 par 720 pixels et à sa connectivité polyvalente via USB Type-C ou HDMI, il s’adapte à tous vos besoins. Imaginez pouvoir gérer vos réseaux sociaux tout en surveillant votre système ! Restez à l’affût pour plus d’infos !

Published

on

L’écran tactile secondaire Corsair Xeneon Edge : un 32:9 qui s’installe partout !

Nouveaux Horizons Technologiques : Le Xeneon Edge de Corsair

Qu’est-ce qui se passe ?

Chaque année, le CES présente une multitude de nouveaux produits technologiques, certains étant plus pratiques que d’autres. L’intérêt que vous portez à l’écran tactile Xeneon Edge de Corsair dépendra probablement de votre besoin d’un écran secondaire de 14,5 pouces au format 32:9.

Une Évolution des Écrans Secondaires

Bien que les écrans secondaires ne soient pas une nouveauté, leur complexité a considérablement augmenté ces dernières années. Le Xeneon Edge se distingue par son design innovant et ses caractéristiques techniques impressionnantes. Avec une résolution LCD de 2560 x 720 pixels, il offre une densité d’affichage remarquable de 183 PPI, un niveau de luminosité atteignant 350 nits et un taux de rafraîchissement à 60 Hz sur son panneau IPS.

!Image du Xeneon Edge

Flexibilité et Installation

Le Xeneon Edge est conçu pour s’adapter à divers environnements. Il peut être placé sur un bureau grâce au support inclus ou fixé à un PC ou toute surface ferromagnétique grâce aux quatorze aimants intégrés. De plus, il peut être installé dans un boîtier via un point de montage pour radiateur de 360 mm, ce qui est plutôt séduisant. Corsair affirme également qu’il est plus mince qu’un ventilateur classique, minimisant ainsi les préoccupations liées à l’espace.

!Installation du Xeneon Edge

Connectivité et Utilisation Pratique

Pour la connexion, le dispositif utilise soit le port USB Type-C DP-Alt Mode soit un port HDMI standard. Une caractéristique intéressante est sa capacité à fonctionner en orientation verticale ou horizontale.Cela en fait un outil idéal pour ceux qui souhaitent faire défiler leurs fils d’actualités sur les réseaux sociaux ou surveiller Discord simultanément. Windows reconnaîtra le Xeneon Edge comme écran additionnel.

Corsair indique également que cet écran tactile capacitif multi-touch à cinq points fonctionne comme n’importe quel autre affichage tactile sous Windows.!Fonctionnalités du Xeneon Edge

Intégration avec iCue

L’écran s’intègre parfaitement avec le logiciel iCue de Corsair permettant aux utilisateurs d’accéder facilement aux informations concernant la vitesse des ventilateurs du système, les températures ainsi que l’utilisation du CPU et GPU. Les utilisateurs peuvent aussi ajuster différents paramètres tels que les profils lumineux et la gestion des ventilateurs directement depuis l’écran tactile.

Disponibilité et Prix

Aucune details précise n’a encore été communiquée concernant le prix du xeneon Edge; cependant, il pourrait s’avérer assez onéreux compte tenu des fonctionnalités avancées proposées par cet appareil innovant. La disponibilité est prévue pour le deuxième trimestre 2025 chez les revendeurs Corsair ainsi que sur leur site officiel.

Dans cette même veine technologique, nous avons déjà vu plusieurs écrans LCD intégrés dans des systèmes AIO (All-in-One) refroidis par liquide auparavant; notamment celui proposé par Lamptron l’année dernière qui servait également d’écran secondaire ou encore Tryx qui a dévoilé en mars dernier ce qui était considéré comme le premier refroidisseur AIO doté d’un écran AMOLED incurvé.

Continue Reading

Trending

Copyright © 2024 Tecknews.