Google intègre son modèle d'IA Gemini Nano dans Chrome sur le bureau

Lors de la conférence des développeurs Google I/O 2024 mardi, Google a annoncé qu'il intègre Gemini Nano, le plus petit de ses modèles d'IA, directement dans le client de bureau Chrome, à partir de Chrome 126.

Cela, affirme l'entreprise, permettra aux développeurs d'utiliser le modèle sur l'appareil pour alimenter leurs propres fonctionnalités d'IA. Google prévoit lui-même d'utiliser cette nouvelle capacité pour alimenter des fonctionnalités comme l'outil existant "aidez-moi à écrire" du Workspace Lab dans Gmail, par exemple.

L'entreprise affirme que c'est le récent travail sur le support WebGPU et WASM dans Chrome qui permet à ces modèles de s'exécuter à une vitesse raisonnable sur une large gamme de matériels.

Lors d'un briefing avant l'annonce de mardi, Jon Dahlke, directeur de la gestion de produits de Chrome chez Google, a noté que Google était en discussion avec d'autres navigateurs pour permettre cela - ou une fonctionnalité similaire - dans leurs navigateurs également.

\"Nous avons commencé à collaborer avec d'autres navigateurs et allons ouvrir un programme de prévisualisation anticipée pour les développeurs\", a écrit Dahlke dans l'annonce de mardi. \"Avec webGPU, WASM et Gemini intégrés dans Chrome, nous croyons que le web est prêt pour l'IA.\"

Je doute que la plupart des concurrents de Chrome voudraient parier uniquement sur les modèles d'IA de Google. Ce qui a plus de sens, c'est de permettre aux navigateurs - et aux développeurs - d'exécuter le modèle de leur choix. Google opterait clairement pour Gemini pour ses applications, mais ces modèles sont suffisamment petits pour permettre aux développeurs de choisir celui qu'ils veulent pour leurs applications.

Cependant, le pari de Google est d'activer un certain nombre d'API de haut niveau dans Chrome pour traduire, sous-titrer et transcrire du texte dans le navigateur en utilisant ses modèles Gemini.

\"Pour offrir cette fonctionnalité, nous avons peaufiné notre version la plus efficace de Gemini et optimisé Chrome\", a déclaré Dahlke lors du discours d'ouverture des développeurs aujourd'hui à l'I/O. \"Maintenant, nous voulons vous donner accès aux modèles Gemini dans Chrome. Notre vision est de vous fournir les modèles d'IA les plus puissants dans Chrome pour atteindre des milliards d'utilisateurs sans avoir à vous soucier de l'ingénierie prompte, du peaufinage, de la capacité et du coût. Il vous suffit d'appeler quelques API de haut niveau - traduire, sous-titrer, transcrire. C'est un grand changement pour le web et nous voulons le faire correctement.\"

Pour les développeurs, Google utilise désormais le modèle Gemini Nano intégré pour alimenter de nouvelles fonctionnalités dans la console des outils de développement Chrome. Grâce à cela, les outils de développement Chrome peuvent désormais expliquer les erreurs et fournir des solutions de débogage directement dans la console.

Nous lançons une newsletter sur l'IA! Inscrivez-vous ici pour commencer à la recevoir dans vos boîtes de réception le 5 juin.