Technologie

Apple vise à comprendre l’intention des utilisateurs sur leurs appareils grâce aux modèles UI-JEPA !

Découvrez UI-JEPA, une architecture révolutionnaire développée par des chercheurs d’Apple, qui promet de transformer la compréhension des intentions des utilisateurs à partir des interactions avec l’interface utilisateur (UI). Grâce à une approche innovante, UI-JEPA réduit considérablement les besoins computationnels tout en maintenant des performances élevées. Cette avancée pave la voie à des applications d’assistants AI plus réactives et respectueuses de la vie privée. En intégrant des modèles légers, UI-JEPA pourrait bien redéfinir l’avenir de l’intelligence artificielle sur les appareils Apple, offrant une expérience utilisateur inégalée.

Published

11 mois ago

13 septembre 2024

Julien Parker

Apple aims for on-device user intent understanding with UI-JEPA models

Technologie

Date de publication : 13 septembre 2024 à 11h58

Robot observant une interface utilisateur

Comprendre les intentions des utilisateurs à travers les interactions avec l’interface utilisateur (UI) représente un défi majeur dans le développement d’applications d’IA intuitives et utiles.

Dans un article récent, des chercheurs d’Apple présentent UI-JEPA, une architecture qui réduit considérablement les exigences computationnelles liées à la compréhension des interfaces utilisateur tout en maintenant un haut niveau de performance. L’objectif de UI-JEPA est de permettre une compréhension légère et locale des interfaces, ouvrant la voie à des applications d’assistants IA plus réactives et respectueuses de la vie privée. Cela s’inscrit dans la stratégie plus large d’Apple visant à améliorer son IA sur appareil.

Les défis de la compréhension des interfaces utilisateur

La compréhension des intentions des utilisateurs à partir des interactions avec l’UI nécessite le traitement de caractéristiques multimodales, incluant des images et du langage naturel, afin de saisir les relations temporelles dans les séquences d’interaction.

« Bien que les avancées dans les Modèles de Langage Multimodal (MLLM), tels que Claude 3.5 de Anthropic et GPT-4 Turbo d’OpenAI, offrent des voies pour une planification personnalisée en intégrant des contextes personnels dans les prompts pour mieux s’aligner avec les utilisateurs, ces modèles exigent des ressources computationnelles considérables, des tailles de modèles énormes et introduisent une latence élevée », expliquent Yicheng Fu, chercheur en apprentissage automatique chez Apple, et Raviteja Anantha, scientifique principal en ML chez Apple. « Cela les rend impraticables dans des scénarios où des solutions légères, sur appareil, avec une faible latence et une meilleure confidentialité sont nécessaires. »

D’autre part, les modèles légers actuels capables d’analyser l’intention des utilisateurs restent trop gourmands en ressources pour fonctionner efficacement sur les appareils des utilisateurs.

L’architecture JEPA

UI-JEPA s’inspire de l’Architecture Prédictive d’Emballage Commun (JEPA), une approche d’apprentissage auto-supervisé introduite par Yann LeCun, scientifique en chef de Meta AI, en 2022. JEPA vise à apprendre des représentations sémantiques en prédisant des régions masquées dans des images ou des vidéos. Plutôt que de tenter de recréer chaque détail des données d’entrée, JEPA se concentre sur l’apprentissage de caractéristiques de haut niveau qui capturent les éléments les plus importants d’une scène.

JEPA réduit considérablement la dimensionnalité du problème, permettant à des modèles plus petits d’apprendre des représentations riches. De plus, étant un algorithme d’apprentissage auto-supervisé, il peut être formé sur de grandes quantités de données non étiquetées, éliminant ainsi le besoin d’annotations manuelles coûteuses. Meta a déjà publié I-JEPA et V-JEPA, deux implémentations de l’algorithme conçues pour les images et les vidéos.

« Contrairement aux approches génératives qui tentent de remplir chaque détail manquant, JEPA peut écarter les informations imprévisibles », ajoutent Fu et Anantha. « Cela améliore l’efficacité de l’entraînement et des échantillons, avec un facteur de 1,5 à 6 observé dans V-JEPA, ce qui est crucial compte tenu de la disponibilité limitée de vidéos UI de haute qualité et étiquetées. »

UI-JEPA

Architecture UI-JEPA

UI-JEPA s’appuie sur les forces de JEPA et l’adapte à la compréhension des interfaces utilisateur. Le cadre se compose de deux composants principaux : un encodeur vidéo basé sur JEPA et un modèle de langage uniquement décodeur.

L’encodeur vidéo transforme les vidéos d’interactions UI en représentations abstraites. Le modèle de langage génère une description textuelle de l’intention de l’utilisateur à partir des embeddings vidéo. Les chercheurs ont utilisé Microsoft Phi-3, un modèle léger avec environ 3 milliards de paramètres, ce qui le rend adapté pour des expérimentations et déploiements sur appareil.

Cette combinaison d’un encodeur basé sur JEPA et d’un modèle de langage léger permet à UI-JEPA d’atteindre des performances élevées avec beaucoup moins de paramètres et de ressources computationnelles par rapport aux MLLM de pointe.

Pour faire avancer la recherche dans la compréhension des interfaces, les chercheurs ont introduit deux nouveaux ensembles de données multimodales et des benchmarks : « Intent in the Wild » (IIW) et « Intent in the Tame » (IIT).

Exemples des ensembles de données IIT et IIW pour UI-JEPA

IIW capture des séquences ouvertes d’actions UI avec des intentions d’utilisateur ambiguës, comme la réservation d’un logement de vacances. L’ensemble de données comprend des divisions few-shot et zero-shot pour évaluer la capacité des modèles à généraliser à des tâches non vues. IIT se concentre sur des tâches plus courantes avec une intention plus claire, comme créer un rappel ou appeler un contact.

« Nous croyons que ces ensembles de données contribueront au développement de MLLM plus puissants et légers, ainsi qu’à des paradigmes d’entraînement avec des capacités de généralisation améliorées », écrivent les chercheurs.

UI-JEPA en action

Les chercheurs ont évalué les performances de UI-JEPA sur les nouveaux benchmarks, en le comparant à d’autres encodeurs vidéo et à des MLLM privés comme GPT-4 Turbo et Claude 3.5.

Sur les ensembles IIT et IIW, UI-JEPA a surpassé d’autres modèles d’encodeurs vidéo dans des contextes few-shot. Il a également atteint des performances comparables à celles de modèles fermés beaucoup plus grands. Avec 4,4 milliards de paramètres, il est de plusieurs ordres de grandeur plus léger que les modèles basés sur le cloud. Les chercheurs ont constaté que l’incorporation de texte extrait de l’UI à l’aide de la reconnaissance optique de caractères (OCR) améliorait encore les performances de UI-JEPA. Dans des contextes zero-shot, UI-JEPA a montré des performances inférieures par rapport aux modèles de pointe.

Performance de UI-JEPA par rapport à d'autres encodeurs

« Cela indique que, bien que UI-JEPA excelle dans les tâches impliquant des applications familières, il rencontre des défis avec des tâches moins connues », notent les chercheurs.

Les chercheurs envisagent plusieurs applications potentielles pour les modèles UI-JEPA. Une application clé est la création de boucles de rétroaction automatisées pour les agents IA, leur permettant d’apprendre en continu à partir des interactions sans intervention humaine. Cette approche peut réduire considérablement les coûts d’annotation et garantir la confidentialité des utilisateurs.

« À mesure que ces agents collectent plus de données via UI-JEPA, ils deviennent de plus en plus précis et efficaces dans leurs réponses », expliquent les auteurs. « De plus, la capacité de UI-JEPA à traiter un flux continu de contextes à l’écran peut enrichir considérablement les prompts pour les planificateurs basés sur LLM. Ce contexte amélioré aide à générer des plans plus informés et nuancés, en particulier lors de la gestion de requêtes complexes ou implicites qui s’appuient sur des interactions multimodales passées (par exemple, le suivi du regard pour l’interaction vocale). »

Une autre application prometteuse est l’intégration de UI-JEPA dans des cadres agentiques conçus pour suivre l’intention des utilisateurs à travers différentes applications et modalités. UI-JEPA pourrait fonctionner comme un agent de perception, capturant et stockant l’intention des utilisateurs à divers moments. Lorsqu’un utilisateur interagit avec un assistant numérique, le système peut alors récupérer l’intention la plus pertinente et générer l’appel API approprié pour satisfaire la demande de l’utilisateur.

« UI-JEPA peut améliorer tout cadre d’agent IA en exploitant les données d’activité à l’écran pour s’aligner plus étroitement avec les préférences des utilisateurs et prédire leurs actions », concluent Fu et Anantha. « Associé à des informations temporelles (par exemple, heure de la journée, jour de la semaine) et géographiques (par exemple, au bureau, à la maison), il peut inférer l’intention de l’utilisateur et permettre une large gamme d’applications directes. »

UI-JEPA semble bien s’intégrer dans l’Intelligence d’Apple, qui est une suite d’outils d’IA générative légers visant à rendre les appareils Apple plus intelligents et productifs. Étant donné l’accent mis par Apple sur la confidentialité, le faible coût et l’efficacité accrue des modèles UI-JEPA peuvent donner à ses assistants IA un avantage sur d’autres qui dépendent de modèles basés sur le cloud.

Up Next

Obtenez une Apple Watch Series 10 gratuite en précommandant l’iPhone 16 chez Freedom !

Don't Miss

Les coques incontournables de l’iPhone 16 et de l’iPhone 16 Pro en 2024 : Testées par des experts !

Click to comment

Général

Anker SOLIX dévoile la Solarbank 2 AC : la nouvelle ère du stockage d’énergie ultra-compatible !

Découvrez le Solarbank 2 AC, une véritable révolution dans le domaine de l’énergie solaire ! Grâce à ses batteries au phosphate de fer lithium, ce système s’adapte parfaitement à vos besoins. Avec une puissance impressionnante de 2400 watts et la possibilité d’ajouter jusqu’à cinq batteries supplémentaires, il assure un stockage optimal. Sa compatibilité avec le compteur Anker SOLIX Smart favorise une gestion intelligente de votre consommation énergétique. Ne ratez pas l’offre spéciale « early bird », disponible dès maintenant pour seulement 999 euros ! Saisissez cette chance unique !

Published

7 mois ago

20 janvier 2025

Julien Parker

Anker SOLIX dévoile la Solarbank 2 AC : la nouvelle ère du stockage d’énergie ultra-compatible !

Le Solarbank 2 AC : Une Révolution dans le Stockage Énergétique

Batteries au Lithium Fer Phosphate

Le Solarbank 2 AC se démarque par l’utilisation de batteries au lithium fer phosphate (LFP), reconnues pour leur sécurité et leur efficacité. Ce modèle est particulièrement innovant grâce à son système de couplage alternatif, qui lui permet de s’adapter facilement à divers systèmes solaires déjà en place.Que ce soit pour des installations sur toiture, des systèmes solaires compacts pour balcons ou d’autres configurations réduites, il peut fonctionner avec un micro-onduleur de 800 Watts.

Capacité et flexibilité Énergétique

Avec une capacité maximale d’injection dans le réseau domestique atteignant 1200 watts,le Solarbank 2 AC peut être associé à deux régulateurs solaires MPPT. Cela ouvre la possibilité d’ajouter jusqu’à 1200 watts supplémentaires via des panneaux solaires additionnels, portant ainsi la puissance totale à un impressionnant 2400 watts. Pour les utilisateurs nécessitant davantage de stockage énergétique, il est possible d’intégrer jusqu’à cinq batteries supplémentaires de 1,6 kilowattheure chacune, augmentant la capacité totale à 9,6 kilowattheures.

Intégration dans un Écosystème Intelligent

Le Solarbank 2 AC s’intègre parfaitement dans un écosystème énergétique intelligent grâce à sa compatibilité avec le compteur Anker SOLIX Smart et les prises intelligentes proposées par Anker. cette fonctionnalité permet une gestion optimisée de la consommation électrique tout en réduisant les pertes énergétiques inutiles. De plus, Anker SOLIX prévoit d’étendre cette compatibilité aux dispositifs Shelly.

Durabilité et Résistance aux Intempéries

Anker SOLIX met également l’accent sur la longévité du Solarbank 2 AC. Conçu pour supporter au moins 6000 cycles de charge, cet appareil a une durée de vie estimée dépassant quinze ans. Il est accompagné d’une garantie fabricant décennale et possède une certification IP65 qui assure sa résistance face aux intempéries tout en étant capable de fonctionner dans des températures variant entre -20 °C et +55 °C.

Disponibilité et Offres Promotionnelles

Le solarbank 2 AC est disponible sur le site officiel d’Anker SOLIX ainsi que sur Amazon au prix standard de 1299 euros. Cependant, une offre promotionnelle « early bird » sera active du 20 janvier au 23 février 2025, permettant aux acheteurs intéressés d’acquérir cet appareil dès 999 euros ! Cette promotion inclut également un compteur Anker SOLIX Smart offert pour chaque commande passée durant cette période spéciale.

le Solarbank 2 AC représente une avancée significative dans le domaine du stockage énergétique domestique grâce à ses caractéristiques techniques avancées et son engagement envers la durabilité environnementale.

Technologie

Ne manquez pas cette offre incroyable : le Air Fryer Moulinex Easy Fry Max à -42% sur Amazon !

Les soldes d’hiver sont là ! Ne ratez pas l’incroyable offre d’Amazon sur le Moulinex Easy Fry Max, à seulement 69 euros au lieu de 119 euros, soit une réduction sensationnelle de -42% ! Avec sa capacité généreuse de 5 L, cette friteuse sans huile est idéale pour régaler jusqu’à 6 convives. Grâce à ses 10 programmes de cuisson et son interface tactile intuitive, préparez des plats sains et savoureux en un clin d’œil. Dépêchez-vous, les stocks s’épuisent vite et cette offre est limitée dans le temps !

Published

7 mois ago

20 janvier 2025

Julien Parker

Ne manquez pas cette offre incroyable : le Air Fryer Moulinex Easy Fry Max à -42% sur Amazon !

Technologie

Les soldes d’hiver sont en cours, et Amazon en profite pour offrir des promotions intéressantes, notamment sur les friteuses à air. Actuellement, le Moulinex Easy Fry Max est proposé à un prix attractif de 69 euros au lieu de 119 euros, ce qui représente une réduction immédiate de 42 %. C’est une occasion parfaite pour acquérir une friteuse sans huile XL d’une capacité généreuse de 5 L, idéale pour préparer des repas pour jusqu’à six personnes à un tarif très compétitif.

Étant donné que cette offre est limitée dans le temps,il est conseillé d’agir rapidement si vous souhaitez en bénéficier. De plus, avec un tel prix, les stocks pourraient s’épuiser rapidement. Ce modèle se classe parmi les meilleures ventes sur Amazon avec plus de 1000 unités écoulées le mois dernier.

Profitez des offres sur Amazon

Amazon propose également la livraison gratuite et rapide pour cet article qui bénéficie d’une garantie de deux ans. En outre, il existe une option de paiement échelonné en quatre fois sans frais sur ce modèle. Enfin, sachez que vous avez la possibilité de changer d’avis et retourner le produit gratuitement dans un délai de 30 jours afin d’obtenir un remboursement intégral.

Moulinex Easy Fry Max : cuisinez sainement pour toute la famille

Le moulinex Easy Fry Max fonctionne comme un four à air chaud permettant la préparation de plats savoureux tout en utilisant peu ou pas du tout d’huile. En plus des frites croustillantes qu’il réalise parfaitement, cet appareil se révèle très polyvalent et peut cuisiner une multitude d’autres recettes.

avec ses dix programmes prédéfinis adaptés à divers ingrédients tels que poulet,steak,poisson ou légumes ainsi que des options pour bacon et desserts comme les pizzas ,cet appareil répond aux besoins variés des familles modernes. De plus, Moulinex met à disposition un livre numérique rempli de recettes accessible via QR Code afin que vous puissiez facilement trouver l’inspiration culinaire lorsque nécessaire.

Sa capacité généreuse permet non seulement la préparation rapide mais aussi économique : jusqu’à 70 % moins énergivore et presque deux fois plus rapide qu’un four traditionnel ! Son interface intuitive avec écran tactile facilite son utilisation quotidienne.

en outre, le panier antiadhésif compatible lave-vaisselle simplifie grandement l’entretien après chaque utilisation. N’oubliez pas qu’il s’agit là encore d’une offre temporaire ; ne tardez donc pas si vous souhaitez profiter du meilleur prix possible sur cette friteuse innovante !

Pour accéder à cette remise exceptionnelle :

Technologie

TikTok revient en force aux États-Unis, mais pas sur l’App Store !

Le suspense autour de TikTok est à son comble ! En avril 2024, le Congrès américain a voté une loi obligeant l’application à changer de propriétaire avant le 19 janvier. Les utilisateurs ont anxieusement attendu la décision finale. Bien que TikTok ait brièvement cessé ses activités, elle est revenue en ligne, mais absente de l’App Store. Apple justifie cette décision par des obligations légales. Cependant, les utilisateurs peuvent toujours accéder à leur compte… sans mises à jour. L’avenir de TikTok pourrait prendre un tournant décisif avec les promesses du nouveau président.

Published

7 mois ago

20 janvier 2025

Julien Parker

TikTok revient en force aux États-Unis, mais pas sur l’App Store !

Technologie

En avril 2024, le Congrès américain a adopté une législation obligeant TikTok à trouver un nouvel acquéreur, ByteDance étant accusé d’activités d’espionnage. Les utilisateurs de l’submission aux États-Unis ont donc attendu avec impatience le week-end précédent la date limite du 19 janvier pour savoir si TikTok serait interdit dans le pays.

Bien que TikTok n’ait pas réussi à dénicher un repreneur avant cette échéance, l’application a temporairement suspendu ses activités… mais seulement pour quelques heures. le réseau social est désormais de retour en ligne, mais il n’est plus accessible sur l’App Store.

Retour de TikTok : Une Absence Persistante sur l’App Store

Apple a expliqué sa décision de retirer TikTok de son App store par un communiqué officiel. « Apple doit respecter les lois en vigueur dans les régions où elle opère. Selon la loi Protecting Americans from Foreign Adversary Controlled Applications act, les applications développées par ByteDance ltd., y compris TikTok et ses filiales comme CapCut et Lemon8, ne pourront plus être téléchargées ou mises à jour sur l’App Store pour les utilisateurs américains après le 19 janvier 2025 », précise la société.

Il est crucial de souligner que les utilisateurs américains ayant déjà installé TikTok peuvent toujours accéder au service. Cependant, ils ne recevront plus aucune mise à jour future de l’application. L’avenir du réseau social pourrait dépendre des décisions du nouveau président des États-Unis.

DÉCLARATION DE TIKTOK :

En collaboration avec nos partenaires techniques, nous travaillons activement à rétablir notre service. Nous remercions le président Trump pour avoir clarifié la situation et rassuré nos partenaires qu’ils ne subiront aucune sanction en continuant d’offrir TikTok aux plus de 170 millions d’utilisateurs…

Le successeur de Joe Biden sera investi comme président ce lundi 20 janvier et prévoit d’émettre un décret afin d’accorder un délai supplémentaire à TikTok pour trouver un acquéreur potentiel.Donald Trump propose même que les États-Unis détiennent une participation significative dans cette application.

« Je souhaite que les États-Unis possèdent une part importante dans une coentreprise avec cet outil numérique afin que nous puissions préserver son intégrité tout en lui permettant d’évoluer […]. Ainsi,notre pays détiendrait la moitié des parts dans une coentreprise établie entre nous et tout acheteur sélectionné »,a déclaré Donald Trump.

L’avenir immédiat de TikTok pourrait donc connaître des évolutions majeures très prochainement. Il convient également de noter qu’une rumeur circulait selon laquelle Elon Musk envisagerait d’acquérir des parts dans la plateforme,mais celle-ci a été rapidement démentie par un porte-parole officiel.