Connect with us

Technologie

Le premier modèle d’IA de classe GPT-4 à télécharger est enfin là : Découvrez Llama 405B !

Une nouvelle ère pour l’IA : Meta a récemment lancé Llama 3.1 405B, un modèle de langage révolutionnaire qui pourrait bien redéfinir le paysage de l’intelligence artificielle. Pour la première fois, il est possible de télécharger gratuitement un modèle de classe GPT-4 et de l’exécuter sur son propre matériel. Ce modèle, avec ses 405 milliards de paramètres, rivalise avec les plus grands noms de l’industrie. Mark Zuckerberg affirme que « l’IA open source est la voie de l’avenir », mais cette déclaration soulève des questions sur l’utilisation du terme. Restez à l’écoute pour découvrir les implications de cette avancée !

Published

on

Le premier modèle d’IA de classe GPT-4 à télécharger est enfin là : Découvrez Llama 405B !

Une nouvelle version de Llama fait son apparition

« L’IA open source est l’avenir, » déclare Mark Zuckerberg, en utilisant mal le terme.

Benj Edwards

Une illustration d'un lama rouge dans un désert bleu, basée sur une photo.

Dans le domaine de l’intelligence artificielle, une nouvelle excitation entoure le lancement du modèle de langage Meta AI est désormais disponible en espagnol, portugais, français et bien plus encore ! »>Llama 3.1 405B par Meta, annoncé mardi. Pour la première fois, il est possible de télécharger gratuitement un modèle de langage de classe GPT-4 et de l’exécuter sur son propre matériel. Bien que cela nécessite un équipement puissant, Meta précise qu’il peut fonctionner sur un « nœud de serveur unique », ce qui n’est pas à la portée d’un PC de bureau classique. Cela représente un défi significatif pour les fournisseurs de modèles d’IA « fermés » comme OpenAI et Anthropic.

Meta affirme que « Llama 3.1 405B est le premier modèle ouvert qui rivalise avec les meilleurs modèles d’IA en matière de capacités de pointe en connaissances générales, d’orientabilité, de mathématiques, d’utilisation d’outils et de traduction multilingue. » Le PDG de l’entreprise, Mark Zuckerberg, qualifie le 405B de « premier modèle d’IA open source de niveau frontière. »

Dans le secteur de l’IA, le terme « modèle de frontière » désigne un système d’IA conçu pour repousser les limites des capacités actuelles. Meta positionne ainsi le 405B aux côtés des modèles d’IA les plus performants, tels que GPT-4o d’OpenAI, Claude 3.5 Sonnet et Google Gemini 1.5 Pro.

Un graphique publié par Meta indique que le 405B se rapproche des performances de GPT-4 Turbo, GPT-4o et Claude 3.5 Sonnet dans des benchmarks tels que MMLU (connaissances de niveau universitaire), GSM8K (mathématiques de l’école primaire) et HumanEval (programmation).

Cependant, comme nous l’avons souligné à plusieurs reprises depuis mars, ces benchmarks ne sont pas nécessairement scientifiquement valables et ne reflètent pas l’expérience subjective d’interaction avec les modèles de langage IA. En fait, cette série traditionnelle de benchmarks est si peu utile pour le grand public que même le département de communication de Meta a simplement publié quelques images de graphiques numériques sans tenter d’expliquer leur signification en détail.

Un graphique fourni par Meta montrant les résultats de benchmark de Llama 3.1 405B par rapport à d'autres modèles d'IA majeurs.

Agrandir / Un graphique fourni par Meta montrant les résultats de benchmark de Llama 3.1 405B par rapport à d’autres modèles d’IA majeurs.

Nous avons plutôt constaté que mesurer l’expérience subjective d’utilisation d’un modèle d’IA conversationnelle (ce que l’on pourrait appeler « vibemarking ») sur des classements A/B comme Chatbot Arena est une meilleure méthode pour évaluer les nouveaux LLM. En l’absence de données de Chatbot Arena, Meta a fourni les résultats de ses propres évaluations humaines des sorties du 405B, qui semblent montrer que le nouveau modèle de Meta se défend bien face à GPT-4 Turbo et Claude 3.5 Sonnet.

Un graphique fourni par Meta montrant comment les humains ont évalué les sorties de Llama 3.1 405B par rapport à GPT-4 Turbo, GPT-4o et Claude 3.5 Sonnet dans ses propres études.

Agrandir / Un graphique fourni par Meta montrant comment les humains ont évalué les sorties de Llama 3.1 405B par rapport à GPT-4 Turbo, GPT-4o et Claude 3.5 Sonnet dans ses propres études.

Quoi qu’il en soit, les premières impressions (après que le modèle ait fuité sur 4chan hier) semblent corroborer l’affirmation selon laquelle le 405B est à peu près équivalent à GPT-4. Cela a nécessité beaucoup de temps d’entraînement informatique coûteux pour y parvenir, et Meta a investi massivement dans ce projet. Le modèle 405B a été formé sur plus de 15 trillions de tokens de données d’entraînement extraites du web (puis analysées, filtrées et annotées par Llama 2), en utilisant plus de 16 000 GPU H100.

Mais que signifie le nom 405B ? Dans ce cas, « 405B » fait référence à 405 milliards de paramètres, qui sont des valeurs numériques stockant des informations entraînées dans un réseau de neurones. Plus il y a de paramètres, plus le réseau de neurones qui alimente le modèle d’IA est grand, ce qui signifie généralement (mais pas toujours) une meilleure capacité à établir des connexions contextuelles entre les concepts. Cependant, les modèles avec un plus grand nombre de paramètres nécessitent également plus de puissance de calcul pour fonctionner.

Nous attendions la sortie d’un modèle de plus de 400 milliards de paramètres de la famille Llama 3 depuis que Meta a annoncé qu’il en formait un en avril. L’annonce d’aujourd’hui ne concerne pas seulement le plus grand membre de la famille Llama 3 : il y a également une toute nouvelle itération de modèles Llama améliorés désignée « Llama 3.1. » Cela inclut des versions mises à jour de ses modèles plus petits de 8B et 70B, qui disposent désormais d’un support multilingue et d’une longueur de contexte étendue de 128 000 tokens (la « longueur de contexte » correspond à la capacité de mémoire de travail du modèle, et les « tokens » sont des morceaux de données utilisés par les LLM pour traiter l’information).

Meta indique que le 405B est utile pour la synthèse de textes longs, les agents conversationnels multilingues, les assistants de codage et pour créer des données synthétiques utilisées pour former de futurs modèles de langage IA. Notamment, ce dernier cas d’utilisation — permettant aux développeurs d’utiliser les sorties des modèles Llama pour améliorer d’autres modèles d’IA — est désormais officiellement soutenu par la licence Llama 3.1 de Meta pour la première fois.

Une utilisation abusive du terme « open source »

Llama 3.1 405B est un modèle à poids ouverts, ce qui signifie que tout le monde peut télécharger les fichiers du réseau de neurones entraîné et les exécuter ou les affiner. Cela remet directement en question un modèle commercial où des entreprises comme OpenAI conservent les poids pour elles-mêmes et monétisent plutôt le modèle via des abonnements comme ChatGPT ou facturent l’accès par token via une API.

Pour Mark Zuckerberg, combattre les modèles d’IA « fermés » est crucial. Il a également publié aujourd’hui un manifeste de 2 300 mots expliquant pourquoi l’entreprise croit en la libération ouverte des modèles d’IA, intitulé « L’IA Open Source est l’Avenir. » Plus de détails sur la terminologie dans un instant. Mais brièvement, il évoque la nécessité de modèles d’IA personnalisables qui offrent un contrôle aux utilisateurs et favorisent une meilleure sécurité des données, une plus grande rentabilité et une meilleure pérennité, contrairement aux solutions verrouillées par les fournisseurs.

Tout cela semble raisonnable, mais perturber vos concurrents avec un modèle subventionné par un budget de médias sociaux est également une manière efficace de jouer les trouble-fêtes sur un marché où vous ne pouvez pas toujours gagner avec la technologie la plus avancée. Les libérations ouvertes de modèles d’IA profitent à Meta, selon Zuckerberg, car il ne veut pas être enfermé dans un système où des entreprises comme la sienne doivent payer un péage pour accéder aux capacités d’IA, comparant cela à des « taxes » qu’Apple impose aux développeurs via son App Store.

Une capture d'écran de l'essai de Mark Zuckerberg,

Agrandir / Une capture d’écran de l’essai de Mark Zuckerberg, « L’IA Open Source est l’Avenir, » publié le 23 juillet 2024.

Concernant le terme « open source », comme nous l’avons d’abord mentionné dans une mise à jour de notre article sur le lancement de Llama 2 l’année dernière, « open source » a une signification très précise qui a été traditionnellement définie par l’Open Source Initiative. L’industrie de l’IA n’a pas encore établi de terminologie pour les libérations de modèles d’IA qui expédient soit du code, soit des poids avec des restrictions (comme Llama 3.1) ou qui expédient sans fournir de données d’entraînement. Nous avons commencé à appeler ces libérations « poids ouverts » à la place.

Malheureusement pour les puristes de la terminologie, Zuckerberg a maintenant intégré l’étiquette erronée « open source » dans le titre de son essai potentiellement historique mentionné précédemment sur les libérations d’IA ouvertes, donc se battre pour le terme correct dans l’IA pourrait être une bataille perdue. Néanmoins, son utilisation agace des personnes comme le chercheur indépendant en IA Simon Willison, qui apprécie par ailleurs l’essai de Zuckerberg.

« Je considère l’utilisation abusive du terme ‘open source’ par Zuck comme un acte de vandalisme culturel à petite échelle, » a déclaré Willison à Ars Technica. « L’open source devrait avoir une signification convenue. L’abus de ce terme en affaiblit le sens, ce qui le rend moins utile en général, car si quelqu’un dit ‘c’est open source’, cela ne me dit plus rien d’utile. Je dois alors creuser pour comprendre de quoi il s’agit réellement. »

Les modèles Llama 3.1 sont disponibles en téléchargement sur le site de Meta et sur Hugging Face. Les deux nécessitent de fournir des informations de contact et d’accepter une licence ainsi qu’une politique d’utilisation acceptable, ce qui signifie que Meta peut techniquement retirer votre accès à Llama 3.1 ou à ses sorties à tout moment.

Technologie

Le PDG de Broadcom anticipe la montée en puissance des hyperscalers avec des clusters d’un million d’accélérateurs !

Hock Tan, le PDG de Broadcom, a des prévisions audacieuses pour l’avenir des clusters d’IA. Selon lui, les clients hyperscale continueront à construire ces infrastructures pendant encore trois à cinq ans, chaque génération doublant en taille. Lors d’une interview avec Jim Cramer, Tan a souligné que la demande pour des puces AI personnalisées pourrait être forte, malgré une légère baisse initiale des actions de Broadcom. Avec des besoins en puissance de calcul multipliés par deux ou trois, l’avenir s’annonce prometteur pour les « XPUs », des silicons d’accélération AI qui pourraient surpasser les GPU. L’innovation est en marche !

Published

on

Le PDG de Broadcom anticipe la montée en puissance des hyperscalers avec des clusters d’un million d’accélérateurs !

Perspectives‌ sur l’Avenir des ⁢Semi-conducteurs et​ de l’IA

Prévisions de Croissance dans le Secteur des ⁣Semi-conducteurs

Hock‌ Tan, le PDG de Broadcom, a ‍exprimé sa conviction que ses clients hyperscale continueront‌ à développer des clusters d’intelligence artificielle (IA) pendant encore trois⁣ à cinq ans, avec chaque nouvelle génération de machines doublant⁢ en taille. ⁣Lors ⁣d’une interview avec Jim Cramer sur CNBC, Tan a été interrogé ​sur la récente fluctuation de ‌l’action de Broadcom, ‌qui avait⁣ chuté après des résultats du troisième trimestre jugés décevants par certains⁣ analystes, suggérant un‌ ralentissement de l’intérêt pour les puces⁢ d’IA. Cependant, une semaine plus tard, l’action a rebondi, soutenue par des signaux de marché indiquant une demande potentiellement forte pour des ‌puces d’IA sur mesure.

Une‌ Demande Croissante pour des Capacités de Calcul

Tan ⁢a souligné que les plans ​des hyperscalers montrent une intention claire de construire de grands clusters, nécessaires au développement de nouveaux modèles de langage. Ces constructions pourraient être réalisées chaque année, nécessitant deux à trois fois plus de puissance‍ de calcul que⁢ leurs prédécesseurs. Cela engendrera⁤ une opportunité de calcul plus vaste, que Tan ‍prévoit d’être satisfaite par‍ des « XPUs » – des puces⁤ d’accélération d’IA pour les ⁤réseaux et autres composants, dont la croissance devrait surpasser‍ celle des GPU dans les années à‍ venir. Broadcom est prêt à ⁣produire⁣ ces XPUs en grande quantité pour ses clients hyperscale.

Évolution des Clusters d’IA

Actuellement, les clusters d’IA que construisent les‍ hyperscalers utilisent environ 100 000⁤ accélérateurs, mais​ les futures configurations pourraient nécessiter⁤ jusqu’à un ⁢million‍ d’accélérateurs. Broadcom ‌vise⁢ à concevoir ces⁤ systèmes spécifiquement pour ses clients hyperscale, un segment que Tan considère comme son meilleur potentiel⁤ de marché. Pendant ce temps, Nvidia et AMD se préparent à ‌une compétition acharnée pour​ le marché des GPU et les logiciels associés, tandis que Meta‌ a déjà exprimé son intention‍ de‍ développer des puces d’IA personnalisées pour compléter ⁣ses 600 000 GPU‍ Nvidia.

Perspectives du Marché des Semi-conducteurs

Tan⁤ a également noté que ‍le marché des semi-conducteurs a atteint un creux cette année, ⁤dans ​le cadre des ⁣cycles normaux de l’industrie.​ Cependant, la pandémie⁢ de ​COVID-19 a ⁢provoqué un cycle de croissance atypique qui‍ a ⁢commencé à‌ s’inverser à la⁢ fin de‌ 2023 et au début de‌ 2024. Il prévoit que 2025 et 2026‍ seront des années de croissance pour les⁤ semi-conducteurs non liés à l’IA.

Amélioration ⁣des‌ Ventes de Connectivité

Interrogé sur ‌l’impact de cette inversion sur ⁣les ⁣ventes de semi-conducteurs pour⁤ la connectivité Wi-Fi et le‌ stockage, qui avaient stagné ou chuté au dernier trimestre, Tan a⁢ affirmé que cela « sera absolument le ‌cas ». Il a mentionné que des signes de croissance séquentielle forte sont déjà visibles depuis le creux du deuxième trimestre, grâce à la ​demande des entreprises.

Réformes chez VMware

Concernant VMware, Tan a exprimé sa satisfaction quant ​aux réformes mises ⁢en place au sein de‌ la société de virtualisation. Il a⁤ expliqué ⁢que les améliorations apportées aux ⁢produits ont permis de passer d’une simple virtualisation de calcul à une virtualisation complète des centres de données, créant ainsi ‌une expérience⁣ cloud sur site. ‌VMware propose des solutions de virtualisation de calcul, de stockage ⁣et ⁣de⁢ réseau depuis une décennie, et Tan a probablement fait référence à Cloud Foundation 5.2, qui​ permet pour la première fois de gérer ces trois aspects sous une ‍seule plateforme de gestion. Cela représente⁢ environ 80 % du travail nécessaire pour⁢ réaliser la vision de Broadcom ​d’un ⁣centre de ⁤données entièrement virtualisé, bien que Tan n’ait‌ pas précisé de calendrier pour cette réalisation.

Continue Reading

Général

Tor défend la sécurité de son réseau après la condamnation d’un administrateur du dark web pour CSAM par la police allemande

Le projet Tor défend avec vigueur ses capacités de protection de la vie privée, malgré des allégations selon lesquelles l’anonymat des utilisateurs aurait été compromis par la police allemande. Un rapport de Panorama et de STRG_F évoque des techniques d’analyse temporelle permettant d’identifier des utilisateurs de Tor. Bien que Tor utilise un réseau complexe de nœuds pour masquer l’origine des connexions, des failles dans des logiciels obsolètes pourraient exposer certains utilisateurs. Le message est clair : ne paniquez pas.

Published

on

Tor défend la sécurité de son réseau après la condamnation d’un administrateur du dark web pour CSAM par la police allemande

Technologie

Le projet Tor a réaffirmé la robustesse de ses capacités de protection de la vie privée, en réponse à des rapports allemands suggérant que l’anonymat des utilisateurs sur son réseau pourrait avoir été compromis par les forces de l’ordre.

Une enquête menée par le magazine allemand Panorama et la chaîne de journalisme d’investigation STRG_F indique que la police criminelle fédérale allemande (BKA) et le bureau du procureur général de Francfort ont réussi à identifier au moins un utilisateur de Tor après avoir effectué une surveillance du réseau.

Le rapport évoque l’analyse temporelle comme la méthode clé pour identifier les utilisateurs de Tor. Il explique que « la chronométrie des paquets de données individuels permet de retracer des connexions anonymisées jusqu’à l’utilisateur de Tor, même si les connexions de données sur le réseau Tor sont chiffrées plusieurs fois », sans toutefois détailler le fonctionnement de cette technique.

Tor offre une anonymité renforcée à ses utilisateurs en faisant passer leur trafic à travers un réseau de nœuds, rendant ainsi l’origine réelle d’une connexion difficile à déterminer. Le trafic envoyé vers Tor est enveloppé dans des couches de chiffrement et atteint d’abord un nœud d’entrée ou de garde. Ensuite, il rebondit à travers au moins trois serveurs choisis au hasard, appelés « relays », avant de revenir sur des réseaux publics via un nœud de sortie ou de se connecter à un service .onion. Ce processus masque la source d’une connexion et complique l’observation des activités en ligne d’un utilisateur à partir de son trafic réseau.

L’observation des tendances d’utilisation à long terme, comme le suggère la méthodologie d’analyse temporelle, pourrait potentiellement affaiblir l’efficacité de Tor en fournissant des indices aux observateurs sur les utilisateurs qui envoient du trafic dans le réseau. Par exemple, une personne pourrait ajouter des nœuds au réseau Tor et noter le timing des paquets observés entrant et sortant. Avec le temps, ces chronométries pourraient révéler l’identité de ceux qui se connectent à un service .onion particulier.

Matthias Marx, porte-parole du célèbre collectif de hackers européen Chaos Computer Club (CCC), a confirmé la méthode en déclarant que les preuves disponibles « suggèrent fortement que les autorités judiciaires ont mené à plusieurs reprises et avec succès des attaques d’analyse temporelle contre des utilisateurs de Tor sélectionnés afin de les dé-anonymiser. »

Le projet Tor, bien qu’il admette ne pas avoir eu accès à tous les documents impliqués malgré ses demandes aux journalistes, pense que la police allemande a pu démasquer un utilisateur de Tor en raison de l’utilisation par cette personne d’un logiciel obsolète, plutôt que d’exploiter une vulnérabilité inconnue.

Le rapport allemand indique que l’attaque par analyse temporelle a été utilisée lors d’enquêtes sur un individu connu sous le nom de « Andres G », soupçonné d’être l’opérateur d’un site .onion appelé Boystown, qui hébergeait du matériel d’abus sexuel d’enfants (CSAM).

« G » aurait utilisé l’application de messagerie anonyme Ricochet, qui transmet des données entre expéditeurs et destinataires via Tor. Plus précisément, il est dit qu’il utilisait une version du programme de chat qui ne sécurisait pas ses connexions Tor contre les méthodes de dé-anonymisation basées sur le timing utilisées par la police.

Le rapport indique que les autorités allemandes ont obtenu la coopération de l’opérateur de télécommunications Telefónica, qui a fourni des données sur tous les clients O2 connectés à un nœud Tor connu. En associant ces informations avec les observations des temps de connexion Tor, les autorités ont pu identifier « G », qui a été arrêté en Rhénanie-du-Nord-Westphalie, inculpé, condamné et emprisonné pendant plusieurs années en 2022.

Tor soutient que cette méthode ne prouve pas que son service est défaillant. L’organisation avance plutôt l’hypothèse qu’en utilisant le Ricochet non sécurisé, « G » a été victime d’une attaque de découverte de nœud de garde. En d’autres termes, la police a pu déterminer le nœud d’entrée ou de garde qu’il utilisait pour envoyer des données sur le réseau Tor. La police peut demander à Telefónica de lister les abonnés qui se sont connectés à ce nœud de garde et déduire l’identité de l’utilisateur de Tor.

Tor affirme que « G » a probablement utilisé une ancienne version de Ricochet qui ne comportait pas de protections contre de telles attaques. « Cette protection existe dans Ricochet-Refresh, un fork maintenu du projet Ricochet, depuis la version 3.0.12 publiée en juin 2022 », indique le rapport de Tor.

Pour l’analyse temporelle du trafic, il est nécessaire de compromettre un nœud de garde, car c’est le premier dans le circuit Tor et il peut voir l’adresse IP de l’utilisateur, a déclaré Bill Budington, technologue senior à l’EFF. Si le nœud de garde ne peut pas être compromis directement, les temps de réseau peuvent être obtenus pour compléter la surveillance.

Les utilisateurs de Tor s’inquiètent de la possibilité que le réseau soit submergé par des nœuds contrôlés par la police, compromettant ainsi leur anonymat. Cependant, le nombre de nœuds nécessaires pour cela devrait être considérable. Le projet Tor a reconnu avoir constaté une augmentation des nœuds de sortie déployés, dépassant les 2 000 récemment, mais a affirmé qu’il n’y avait pas de quoi s’inquiéter.

« La déclaration selon laquelle le réseau est ‘mal en point’ est tout simplement fausse », a déclaré Pavel Zoneff, directeur des relations publiques de Tor. « L’équipe de santé du réseau a mis en place des processus pour identifier de possibles grands groupes de relais soupçonnés d’être gérés par des opérateurs uniques et des acteurs malveillants, et de ne pas les laisser rejoindre le réseau. En conséquence, elle a signalé de nombreux mauvais relais pour suppression, qui ont ensuite été bannis par les autorités de répertoire. Beaucoup d’entre eux ne représentaient probablement aucune menace réelle pour les utilisateurs », a-t-il ajouté.

Le projet a également demandé de l’aide pour comprendre exactement ce que la police a fait. « Nous avons besoin de plus de détails sur cette affaire », a déclaré l’équipe. « En l’absence de faits, il est difficile pour nous de fournir des conseils officiels ou des divulgations responsables à la communauté Tor, aux opérateurs de relais et aux utilisateurs. »

Pour l’instant, le message est : « Ne paniquez pas. »

Continue Reading

Général

NTT Data et IBM s’associent pour révolutionner le cloud mainframe des banques !

La technologie des mainframes</strong connaît une renaissance grâce à NTT Data, le géant japonais des services informatiques. Ils lancent SimpliZCloud, un service hybride basé sur la plateforme IBM LinuxONE, exclusivement destiné aux acteurs des services financiers en Inde. Cette innovation promet d’optimiser les applications bancaires et de gestion des risques, tout en consolidant les ressources informatiques. NTT Data affirme que cette solution surpassera les serveurs x86, notamment en matière de coûts de licences logicielles et d’applications IA/ML. Une nouvelle ère pour les mainframes s’annonce !

Published

on

NTT Data et IBM s’associent pour révolutionner le cloud mainframe des banques !

Le Mainframe : Une Nouvelle Vie dans le Cloud Hybride

Le mainframe a trouvé une nouvelle vocation grâce à NTT Data, un géant des services informatiques japonais, qui a décidé de développer un service de cloud hybride basé sur la plateforme IBM LinuxONE.

Ce service, nommé SimpliZCloud, sera pour l’instant exclusivement proposé aux acteurs des services financiers en Inde.

NTT Data prévoit que cette solution sera bénéfique pour les charges de travail liées aux applications bancaires essentielles, aux prêts et à la gestion des risques, tout en permettant une consolidation des ressources informatiques et des budgets.

Une Réduction de l’Empreinte Écologique

Selon NTT Data, « À mesure que les entreprises consolident leurs charges de travail, elles pourront réduire leur empreinte des centres de données, favorisant ainsi une durabilité accrue. » L’entreprise met en avant des performances supérieures à celles des serveurs x86, notamment en ce qui concerne les coûts des licences de logiciels d’entreprise et l’exécution d’applications d’intelligence artificielle et d’apprentissage automatique.

  • Une banque indienne rejette les accusations d’exposition des comptes de 180 millions de clients
  • IBM procède à des suppressions de postes en silence, selon des sources
  • Les mainframes ne sont pas obsolètes, ils apprennent simplement des techniques d’IA
  • L’IA pourrait menacer la démocratie et provoquer des guerres, avertit NTT du Japon

Une Perception Évolutive des Mainframes

La sagesse conventionnelle suggère que les mainframes demeurent une option coûteuse mais puissante pour certaines applications. En avril, le cabinet d’analyses Gartner a noté que « les organisations possédant un mainframe remettent périodiquement en question l’avenir de cette plateforme, car elle est perçue comme dépassée, difficile à gérer et coûteuse par rapport à des alternatives telles que le client/serveur et le cloud public. »

Gartner a également souligné que le succès continu d’IBM dans la vente de mainframes est en grande partie dû aux caractéristiques de ces machines, mais aussi à la crainte des coûts, de la complexité et des risques associés à une migration.

Pour information, IBM affirme que près de 70 % des transactions mondiales en valeur transitent par ses mainframes, et son dernier modèle a enregistré des ventes record.

Une Réévaluation dans le Secteur Financier Indien

Quoi qu’il en soit, NTT Data est convaincu que ces machines sont pertinentes pour l’industrie des services financiers en Inde. L’entreprise a même collaboré avec le cabinet d’analyses International Data Corp (IDC) pour rédiger un rapport qui arrive à une conclusion similaire.

Peter Marston d’IDC a écrit : « Les recherches d’IDC ont révélé que les organisations s’attendent à s’appuyer davantage sur leurs applications mainframe à l’avenir, considérées comme des moteurs clés pour alimenter les opérations d’entreprise, l’intimité client et l’innovation. »

Cette résurgence est en partie attribuée à l’essor de l’IA et de l’apprentissage automatique, selon Avinash Joshi, PDG de NTT Data India.

Joshi a expliqué : « Les applications commerciales critiques, en particulier celles intégrant l’IA et l’apprentissage automatique, disposeront désormais de l’infrastructure nécessaire pour offrir des performances bien supérieures aux architectures x86 traditionnelles, le tout dans un modèle entièrement géré et en tant que service. »

NTT Data et IBM n’ont pas encore divulgué les spécifications du cloud, ni s’ils envisagent de l’étendre à d’autres pays, ce qui semble tout à fait envisageable étant donné que ces deux géants de la technologie, tout comme l’industrie bancaire, opèrent à l’échelle mondiale. Nous avons posé la question et nous vous tiendrons informés si une réponse substantielle nous parvient.

Continue Reading

Trending

Copyright © 2024 Tecknews.