Google I/O était une évolution de l'IA, pas une révolution

Lors de la conférence des développeurs Google I/O, la société a présenté aux développeurs - et dans une certaine mesure aux consommateurs - pourquoi ses investissements dans l'IA sont en avance sur ses concurrents. Lors de l'événement, la société a dévoilé un moteur de recherche propulsé par l'IA repensé, un modèle d'IA avec une fenêtre contextuelle étendue de 2 millions de tokens, des assistants d'IA dans sa suite d'applications Workspace, comme Gmail, Drive et Docs, des outils pour intégrer son IA dans les applications des développeurs et même une vision future de l'IA, codée Project Astra, qui peut répondre à la vue, aux sons, à la voix et au texte combinés. 

Alors que chaque avancée prise individuellement était prometteuse, le déluge de nouvelles concernant l'IA était écrasant. Bien que clairement destinés aux développeurs, ces grands événements sont également l'occasion d'émerveiller les utilisateurs finaux sur la technologie. Mais après le flot de nouvelles, même des consommateurs relativement familiers avec la technologie peuvent se demander, attendez, c'est quoi Astra déjà? Est-ce la chose qui alimente Gemini Live? Gemini Live est-il un peu comme Google Lens? Comment est-il différent de Gemini Flash? Google va-t-il réellement fabriquer des lunettes d'IA ou est-ce du vent? Qu'est-ce que Gemma, qu'est-ce que LearnLM... quels sont les Gems? Quand Gemini arrivera-t-il dans votre boîte de réception, dans vos documents? Comment utiliser ces choses?

Si vous connaissez les réponses à ces questions, félicitations, vous êtes un lecteur de TechCrunch. (Si ce n'est pas le cas, cliquez sur les liens pour vous mettre à jour.)

Crédits image: Google

Ce qui manquait à la présentation générale, malgré l'enthousiasme des présentateurs individuels ou les acclamations enthousiastes des employés de Google dans la foule, c'était un sentiment de révolution imminente de l'IA. Si l'IA doit finalement conduire à un produit qui aura un impact profond sur la direction de la technologie de la même manière que l'iPhone a impacté l'informatique personnelle, ce n'était pas l'événement où il a été lancé.

En revanche, on retient que nous sommes encore au tout début du développement de l'IA.

En marge de l'événement, on sentait même que les employés de Google savaient que le travail n'était pas encore terminé. Lors de la démonstration de comment l'IA pouvait compiler le guide d'étude et le quiz d'un étudiant en quelques instants après le téléchargement d'un document de plusieurs centaines de pages - un exploit impressionnant - nous avons remarqué que les réponses du quiz n'étaient pas annotées avec les sources citées. Interrogé sur la précision, un employé a admis que l'IA avait les bonnes réponses dans la plupart des cas et qu'une version future indiquerait les sources pour que les gens puissent vérifier les réponses. Mais si vous devez vérifier les faits, dans quelle mesure un guide d'étude d'IA est-il fiable pour vous préparer à l'examen en premier lieu? 

Lors de la démo d'Astra, une caméra montée au-dessus d'une table et connectée à un grand écran tactile vous permettait de jouer au Pictionary avec l'IA, de lui montrer des objets, de poser des questions sur ces objets, de lui demander de raconter une histoire et plus encore. Mais les cas d'utilisation pour lesquels ces capacités s'appliqueront à la vie quotidienne n'étaient pas immédiatement apparents, malgré les avancées techniques qui, prises individuellement, sont impressionnantes.

Par exemple, vous pourriez demander à l'IA de décrire des objets en utilisant l'allitération. Lors du discours d'ouverture diffusé en direct, Astra a vu un ensemble de crayons et a répondu "crayons créatifs colorés joyeusement." Belle astuce de soirée.

Lorsque nous avons défié Astra lors d'une démo privée pour deviner l'objet dans un dessin griffonné, il a identifié correctement la fleur et la maison que j'ai dessinées sur l'écran tactile tout de suite. Lorsque j'ai dessiné un insecte - un plus gros cercle pour le corps, un plus petit cercle pour la tête, de petites pattes sur les côtés du grand cercle - l'IA a trébuché. Est-ce une fleur? Non. Est-ce le soleil? Non. L'employé a guidé l'IA pour deviner quelque chose qui était vivant. J'ai ajouté deux pattes supplémentaires pour un total de huit. Est-ce une araignée? Oui. Un humain aurait immédiatement vu l'insecte, malgré mon manque de talent artistique.

Lors du #GoogleIO, nous avons fait un test privé de Project Astra (pas sûr que j'étais autorisé à filmer cela?). @skirano parlant à Astra pendant qu'il identifiait ce qu'il regardait. Multimodal complet, pas de décalage, super fluide. Fou. pic.twitter.com/ayWPZRiEYq

— Conor Grennan (@conorgrennan) 15 mai 2024
Non, vous n'étiez pas censé enregistrer. Mais voici une démo similaire postée sur X.

Pour vous donner une idée de l'état actuel de la technologie, le personnel de Google n'a pas permis d'enregistrer ou de prendre des photos dans la salle de démonstration d'Astra. Ils avaient également Astra en cours d'exécution sur un smartphone Android, mais vous ne pouviez pas voir l'application ou tenir le téléphone. Les démonstrations étaient amusantes, et certainement la technologie qui les rendait possibles vaut la peine d'être explorée, mais Google a manqué une occasion de montrer comment sa technologie d'IA impactera votre vie quotidienne.

Quand aurez-vous besoin de demander à une IA de trouver un nom de groupe basé sur une image de votre chien et d'un tigre en peluche, par exemple? Avez-vous vraiment besoin d'une IA pour vous aider à trouver vos lunettes? (C'étaient d'autres démonstrations d'Astra de la keynote.)

Crédits image: vidéo de démonstration de Google (s'ouvre dans une nouvelle fenêtre)

Ce n'est pas la première fois que nous assistons à un événement technologique rempli de démos d'un futur avancé sans applications réelles ou qui pitchent des avantages comme des améliorations plus importantes. Google, par exemple, a déjà teasé ses lunettes de RA les années précédentes. (Il a même fait descendre des parachutistes en Google Glass à l'I/O, un projet construit il y a plus d'une décennie, qui a depuis été abandonné.)

Après avoir regardé l'I/O, on a l'impression que Google considère l'IA simplement comme un autre moyen de générer des revenus supplémentaires : Payez pour Google One AI Premium si vous voulez ses mises à jour de produits. Peut-être alors que Google ne fera pas la première avancée majeure de l'IA pour les consommateurs. Comme l'a récemment souligné le CEO de OpenAI Sam Altman, l'idée initiale d'OpenAI était de développer la technologie et "créer toutes sortes de bénéfices pour le monde."

"Au lieu de cela," a-t-il dit, "il semble maintenant que nous allons créer de l'IA et que d'autres personnes l'utiliseront pour créer toutes sortes de choses incroyables dont nous bénéficierons tous." 

Google semble être dans le même bateau.

Cependant, il y a eu des moments où l'IA Astra de Google semblait plus prometteuse. Si elle pouvait correctement identifier du code ou faire des suggestions sur la façon d'améliorer un système en fonction d'un diagramme, il est plus facile de voir comment elle pourrait être un compagnon de travail utile. (Clippy, évolué!)

Gemini dans Gmail.
Crédits image: Google

Il y a eu d'autres moments où la praticité réelle de l'IA a brillé également. Un meilleur outil de recherche pour Google Photos, par exemple. De plus, avoir l'IA de Gemini dans votre boîte de réception pour résumer les e-mails, rédiger des réponses ou lister des éléments d'action pourrait vous aider à enfin arriver à une boîte de réception vide, ou quelque chose d'approchant, plus rapidement. Mais peut-elle nettoyer vos e-mails indésirables mais non-spam, organiser intelligemment les e-mails en étiquettes, s'assurer que vous ne manquez jamais un message important et offrir un aperçu de tout dans votre boîte de réception sur lequel vous devez agir dès que vous vous connectez? Peut-elle résumer les nouvelles les plus importantes de vos bulletins d'information par e-mail? Pas tout à fait. Pas encore. 

De plus, certaines fonctionnalités plus complexes, comme les workflows alimentés par l'IA ou l'organisation des reçus qui ont été démontrés, ne seront pas déployées en Labs avant septembre.

Lorsqu'on pense à la façon dont l'IA impactera l'écosystème Android - argument de Google pour les développeurs présents - on a le sentiment que même Google ne peut pas encore convaincre que l'IA aidera Android à attirer les utilisateurs loin de l'écosystème d'Apple. "Quand est le meilleur moment pour passer de l'iPhone à Android?", avons-nous posé à des Googlers de divers rangs. "Cet automne" était la réponse générale. En d'autres termes, l'événement matériel d'automne de Google, qui devrait coïncider avec l'adoption par Apple du RCS, une mise à niveau des SMS qui rendra la messagerie Android plus compétitive avec iMessage.

En résumé, l'adoption par les consommateurs de l'IA dans les appareils informatiques personnels peut nécessiter de nouveaux développements matériels - peut-être des lunettes de RA ? une smartwatch plus intelligente? des Pixel Buds alimentés par Gemini ? - mais Google n'est pas encore prêt à révéler ses mises à jour matérielles ou même à les teaser. Et, comme nous l'avons déjà vu, avec les lancements décevants de Ai Pin et Rabbit, le matériel reste difficile. 

Crédits image: Google

Même si beaucoup peut être fait aujourd'hui avec la technologie d'IA de Google sur les appareils Android, les accessoires de Google comme la Pixel Watch et le système qui l'alimente, WearOS, ont été largement négligés lors de l'I/O, au-delà de quelques améliorations mineures de performances. Ses écouteurs Pixel Buds n'ont même pas reçu de mention. Dans le monde d'Apple, ces accessoires aident à verrouiller les utilisateurs dans son écosystème, et pourraient un jour les connecter avec un Siri alimenté par l'IA. Ce sont des pièces critiques de sa stratégie globale, pas des ajouts optionnels. 

Pendant ce temps, on a l'impression d'attendre que se passe quelque chose : c'est-à-dire, la WWDC d'Apple. La conférence mondiale des développeurs de la firme de Cupertino promet de dévoiler l'agenda d'IA d'Apple, peut-être par le biais d'un partenariat avec OpenAI... ou même Google. Sera-t-il compétitif? Comment pourrait-il l'être si l'IA ne peut pas s'intégrer profondément dans le système d'exploitation, à la manière dont Gemini peut sur Android? Le monde attend la réponse d'Apple.

Avec un événement matériel d'automne, Google a le temps d'examiner les lancements d'Apple puis d'essayer de créer son propre moment d'IA aussi puissant, et aussi immédiatement compréhensible, que l'introduction de l'iPhone par Steve Jobs : "Un iPod, un téléphone et un communicateur Internet. Un iPod, un téléphone... vous y arrivez?" 

Les gens ont compris. Mais quand comprendront-ils l'IA de Google de la même manière? Pas à partir de cet I/O, du moins.

Nous lançons une newsletter sur l'IA! Inscrivez-vous ici pour commencer à la recevoir dans vos boîtes de réception le 5 juin.