Exploration de la liberté d’expression avec Grok

Les nouvelles capacités de génération d’images de Grok

Le mardi 14 août 2024, la société d’intelligence artificielle d’Elon Musk, xAI, a annoncé le lancement en version bêta de deux nouveaux modèles linguistiques, Grok-2 et Grok-2 mini, accessibles aux abonnés de la plateforme sociale X (anciennement Twitter). Ces modèles sont également associés au modèle de synthèse d’images Flux, permettant aux utilisateurs de X de créer des images photoréalistes largement non censurées à partager sur le site.

Image générée par IA de Donald Trump et de catgirls créée avec Grok, utilisant le modèle de synthèse d'images Flux.

Image générée par IA de Donald Trump et de catgirls créée avec Grok, utilisant le modèle de synthèse d’images Flux.

Selon Ethan Mollick, un commentateur régulier sur l’IA, « Flux, accessible via Grok, est un excellent générateur d’images à partir de texte, mais il excelle également dans la création de photographies truquées de lieux et de personnes réels, envoyées directement sur Twitter. » Il s’interroge également sur l’absence de filigranes pour ces images, suggérant que cela pourrait être une bonne idée.

Des images controversées sans garde-fous

Un rapport de The Verge a révélé que les capacités de génération d’images de Grok semblent avoir peu de protections, permettant aux utilisateurs de créer du contenu potentiellement controversé. Lors de leurs tests, Grok a produit des images représentant des figures politiques dans des situations compromettantes, des personnages protégés par des droits d’auteur, et des scènes de violence.

Image générée par IA de Donald Trump et Kamala Harris dans un avion créée avec Grok.

Image générée par IA de Donald Trump et Kamala Harris dans un avion créée avec Grok, utilisant le modèle de synthèse d’images Flux.

Bien que Grok prétende avoir certaines limitations, comme éviter le contenu pornographique ou excessivement violent, ces règles semblent inconsistantes. Contrairement à d’autres générateurs d’images IA majeurs, Grok ne refuse pas les demandes impliquant des personnes réelles et n’ajoute pas de filigranes à ses résultats.

Les utilisateurs de Grok ont déjà commencé à générer des images provocantes, y compris des représentations de Donald Trump et Kamala Harris dans des situations compromettantes. Cela soulève une question ancienne dans le domaine de l’IA : la responsabilité de l’utilisation abusive d’un générateur d’images IA incombe-t-elle à l’utilisateur, à l’organisation qui a créé le modèle, ou à la plateforme qui héberge les images ? Actuellement, il n’existe pas de consensus clair, bien qu’une nouvelle loi proposée aux États-Unis, le NO FAKES Act, pourrait tenir X responsable de la création de deepfakes réalistes.

Les avancées de Grok-2 dans le domaine de l’IA

En se concentrant sur les capacités linguistiques, xAI affirme que Grok-2 et Grok-2 mini représentent des avancées significatives, Grok-2 surpassant certains concurrents dans des benchmarks récents. Bien qu’il soit prudent de rester sceptique face à ces affirmations, il semble que la classe des modèles linguistiques de type « GPT-4 » s’élargisse, sans toutefois dépasser la barrière de GPT-4.

Selon Mollick, « Il existe désormais cinq modèles de classe GPT-4 : GPT-4o, Claude 3.5, Gemini 1.5, Llama 3.1, et maintenant Grok 2. » Tous les laboratoires affirment qu’il reste de la place pour des améliorations majeures, mais aucun modèle n’a encore véritablement surpassé GPT-4.

xAI a récemment introduit une version précoce de Grok-2 dans l’arène des chatbots LMSYS sous le nom de « sus-column-r », où il aurait obtenu un score Elo global supérieur à des modèles comme Claude 3.5 Sonnet et GPT-4 Turbo. Cependant, cette arène a été sujette à controverse récemment, certains désaccords ayant surgi concernant le classement élevé du modèle GPT-4o mini d’OpenAI.

Les nouveaux modèles Grok montrent des améliorations par rapport à leur prédécesseur Grok-1.5 dans des domaines tels que les connaissances scientifiques de niveau universitaire, les connaissances générales et la résolution de problèmes mathématiques. xAI a également mis en avant les performances de Grok-2 dans des tâches visuelles, affirmant des résultats à la pointe dans le raisonnement mathématique visuel et la réponse à des questions basées sur des documents.

Résultats des tests de benchmark de Grok-2 fournis par xAI.

Résultats des tests de benchmark de Grok-2 fournis par xAI.

Les modèles sont désormais disponibles pour les abonnés X Premium et Premium+ via une interface d’application mise à jour. Contrairement à certains de ses concurrents, xAI ne publie pas les poids des modèles pour téléchargement ou vérification indépendante, adoptant une approche fermée qui contraste avec les récentes initiatives de Meta, qui a récemment rendu son modèle Llama 3.1 405B accessible à tous.

xAI prévoit de lancer les deux modèles via une API d’entreprise plus tard ce mois-ci, avec des options de déploiement multi-régions et des mesures de sécurité telles que l’authentification multifactorielle obligatoire. Les détails concernant les prix, les limites d’utilisation ou les politiques de gestion des données n’ont pas encore été communiqués.

En dépit de ses capacités de génération d’images photoréalistes, le principal inconvénient de Grok-2 réside dans son lien étroit avec X, ce qui peut entraîner des informations inexactes provenant des tweets. Cela rappelle un ami qui consulte systématiquement les réseaux sociaux avant de répondre à vos questions, même lorsque cela n’est pas pertinent.

Comme l’a souligné Mollick, cette connexion peut être frustrante : « J’ai seulement accès à Grok 2 mini pour le moment, et bien qu’il semble être un modèle solide, il est souvent mal servi par sa connexion RAG à Twitter, » a-t-il écrit. « Le modèle reçoit des résultats de Twitter qui semblent hors sujet par rapport à la demande, et tente désespérément de les relier à quelque chose de cohérent. »

Show Comments (0)
Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *