Technologie
Date de publication : 31 juillet 2024, 3h00
Il n’existe pas un modèle de langage unique (LLM) capable de répondre à tous les besoins, du moins selon les responsables informatiques d’entreprise interrogés par IBM.
Cette conclusion fait partie d’un rapport récemment publié par l’IBM Institute for Business Value, intitulé « Le Guide du PDG sur l’IA générative : Optimisation des modèles d’IA ». Ce rapport repose sur une enquête menée auprès d’exécutifs basés aux États-Unis en collaboration avec Oxford Economics. IBM vise à fournir aux PDG des informations pratiques pour prendre des décisions éclairées concernant l’implémentation et l’optimisation de l’IA au sein de leurs organisations. Il offre également des perspectives intéressantes sur la manière dont l’adoption de l’IA en entreprise se déroule réellement.
Résultats clés du rapport
-
Spécialisation des modèles : L’étude remet en question l’idée d’un modèle d’IA universel, soulignant la nécessité de choisir des modèles spécifiques en fonction des tâches.
-
Diversité des modèles : Les organisations utilisent actuellement en moyenne 11 modèles d’IA différents et prévoient une augmentation de 50 % dans les trois prochaines années.
-
Barrières financières : 63 % des dirigeants citent le coût des modèles comme le principal obstacle à l’adoption de l’IA générative.
-
Complexité des modèles : 58 % des répondants considèrent la complexité des modèles comme une préoccupation majeure.
-
Techniques d’optimisation : L’ajustement fin et l’ingénierie des prompts peuvent améliorer la précision des modèles de 25 %, mais seulement 42 % des dirigeants utilisent systématiquement ces méthodes.
-
Croissance des modèles ouverts : Les entreprises s’attendent à augmenter leur adoption de modèles ouverts de 63 % au cours des trois prochaines années, surpassant d’autres types de modèles.
Shobhit Varshney, vice-président et partenaire senior chez IBM Consulting, a déclaré dans une interview exclusive que les responsables technologiques d’entreprise sont bien informés sur les types de modèles disponibles et comprennent que chaque modèle a ses forces et ses limites selon les cas d’utilisation spécifiques. En revanche, d’autres dirigeants de la direction générale sont encore en train de se familiariser avec les capacités et les limites des LLM, pensant souvent qu’un seul modèle d’IA générative peut gérer différentes tâches.
Optimisation de l’efficacité des coûts de l’IA en entreprise
Le coût est toujours une préoccupation pour tout projet informatique en entreprise, et cela est particulièrement vrai pour les modèles d’IA générative.
Varshney a souligné que de nombreux facteurs influencent l’efficacité des coûts des modèles d’IA en entreprise. Il a expliqué que les entreprises peuvent héberger des modèles en interne, en payant pour les ressources informatiques et de stockage sous-jacentes, ou faire appel à des fournisseurs de cloud qui facturent généralement en fonction des tokens d’entrée et de sortie consommés.
Le rapport préconise une approche nuancée. Il est recommandé de déployer de grands modèles pour des tâches complexes et critiques nécessitant une large connaissance et une grande précision. Les entreprises devraient envisager d’utiliser des modèles de niche pour des applications spécialisées où l’efficacité est cruciale.
« Les entreprises peuvent obtenir d’excellentes performances dès le départ avec des modèles plus grands, mais elles pourraient également investir un peu dans l’ajustement d’un petit modèle pour atteindre des performances similaires », a déclaré Varshney. Avant de se lancer dans un cas d’utilisation d’IA générative, les entreprises doivent quantifier l’impact commercial que ce cas d’utilisation pourrait avoir et le coût supplémentaire d’utilisation du LLM par rapport à d’autres alternatives d’IA traditionnelles.
Importance des modèles ouverts pour le déploiement de l’IA en entreprise
Une découverte clé de l’étude est le désir de la plupart des responsables informatiques d’entreprise d’utiliser des modèles ouverts plutôt que des modèles fermés pour l’IA générative.
Cette constatation n’est pas surprenante, compte tenu de l’élan et des progrès réalisés par les modèles ouverts. Avec la récente sortie de Llama 3.1 par Meta et de Mistral’s Large 2, les chercheurs commencent à évaluer les modèles ouverts par rapport à leurs concurrents propriétaires.
Varshney a souligné la valeur de la communauté et de la sécurité en ce qui concerne les modèles ouverts pour le déploiement de l’IA en entreprise. « Avec les modèles ouverts, vous bénéficiez d’une communauté plus large pour examiner et renforcer les systèmes d’IA », a-t-il déclaré. « Les entreprises peuvent adapter ces modèles à leur domaine spécifique, à leurs données et à leurs cas d’utilisation. »
Bien que les entreprises préfèrent de plus en plus les modèles ouverts, Varshney a noté que les entreprises devraient commencer par une stratégie d’IA, et non par les modèles eux-mêmes.
Il a expliqué qu’IBM Consulting aide ses clients à examiner l’ensemble de l’entreprise et à déterminer les processus et les cas d’utilisation où l’IA peut avoir le plus grand impact — le service client, les opérations informatiques et les processus administratifs comme les ressources humaines et la chaîne d’approvisionnement sont quelques-uns des meilleurs domaines à explorer. Une fois qu’un cas d’utilisation est priorisé, IBM peut décomposer le flux de travail en étapes et intégrer la bonne technologie pour la tâche, qu’il s’agisse d’automatisation, d’IA traditionnelle ou d’IA générative.
« Si l’IA générative est la bonne technologie pour la tâche, il faut prendre en compte divers facteurs et contraintes pour choisir le bon modèle, comme la complexité de la tâche, le budget, le niveau de précision requis, la latence de réponse, l’auditabilité pour la conformité et la fenêtre de contexte », a-t-il déclaré. « Vous devez adapter le modèle à la tâche et aux contraintes du processus commercial lui-même, et dans l’ensemble, vous aurez le bon mélange de modèles pour votre stratégie d’IA. »