Betaworks mise sur les agents d'IA dans la dernière cohorte de 'Camp'

Betaworks embrasse la tendance de l'IA non pas avec un autre LLM, mais plutôt avec un groupe de modèles d'agents automatisant des tâches quotidiennes qui ne sont pourtant pas si simples à définir. Le dernier incubateur "Camp" de l'investisseur a formé et financé neuf start-ups d'agents d'IA qu'ils espèrent prendront en charge les tâches les plus fastidieuses d'aujourd'hui.

Les cas d'utilisation de nombreuses de ces entreprises semblent prometteurs, mais l'IA a tendance à avoir du mal à tenir ses promesses. Feriez-vous confiance à une nouvelle IA reluisante pour trier vos e-mails? Et que dire de l'extraction et de la structuration des informations d'une page web? Est-ce que cela dérangerait quelqu'un si une IA programmare des réunions là où cela fonctionne?

Il y a un élément de confiance qui reste à établir avec ces services, quelque chose qui se produit avec la plupart des technologies qui changent notre manière d'agir. Demander des directions à MapQuest semblait étrange jusqu'à ce que ce ne soit plus le cas - et maintenant la navigation GPS est un outil de tous les jours. Mais les agents d'IA en sont-ils à ce stade? Le PDG et fondateur de Betaworks, John Borthwick, le pense. (Divulgation: L'ancienne rédactrice en chef de TechCrunch et animatrice de Disrupt, Jordan Crook, a quitté TC pour travailler chez la firme.)

“Vous touchez à quelque chose sur lequel nous avons beaucoup réfléchi,” a-t-il déclaré à TechCrunch. “Alors que l'IA d'agent est à ses débuts - et qu'il y a des problèmes à résoudre autour des taux de réussite des agents, etc. - nous constatons des progrès énormes même depuis le début de Camp.”

Alors que la technologie continuera à s'améliorer, Borthwick a expliqué que certains clients sont prêts à l'adopter dans son état actuel.

“Historiquement, nous avons vu des clients faire un saut dans l'inconnu, même avec des tâches à enjeux élevés, si un produit était 'suffisamment bon.' Le Bill.com original, malgré ses innovations en matière de ROC et de scraping d'e-mails, ne se trompait pas toujours, et les utilisateurs lui faisaient confiance pour des milliers de dollars de transactions parce qu'il rendait une tâche terrible moins terrible. Et au fil du temps, à travers une conception d'interface hautement communicative, les retours des clients ont créé un produit encore meilleur, plus fiable,” a-t-il déclaré.

“Pour l'instant, la plupart des premiers utilisateurs des produits de Camp sont des développeurs, des fondateurs et des adopteurs précoces de la technologie, et ce groupe a toujours été disposé à tester patiemment et à fournir des retours sur ces produits, qui finissent par passer au grand public.”

Betaworks mise tout sur l'IA augmentée dans la dernière cohorte de Camp: 'Nous sommes passionnément intéressés'

Betaworks Camp est un accélérateur de trois mois au cours duquel les entreprises sélectionnées sur le thème choisi reçoivent de l'aide pratique pour leur produit, leur stratégie et leurs connexions avant d'être renvoyées avec un chèque de 500 000 $ - offert par Betaworks lui-même, Mozilla Ventures, Differential Ventures et Stem AI. Mais cela se fait avant que les start-ups ne montrent leur savoir-faire le jour du démo, le 7 mai.

Nous avons eu un aperçu de la programmation à l'avance. Voici les trois qui ont le plus attiré mon attention.

Twin automatise les tâches en utilisant un “modèle d'action” dont Rabbit parle depuis quelques mois maintenant (mais n'a pas encore lancé). En entraînant un modèle sur beaucoup de données représentant des interfaces logicielles, il peut (selon ces entreprises) apprendre comment accomplir des tâches courantes, des choses qui sont plus complexes qu'une API ne peut gérer, mais pas tellement qu'elles ne puissent être déléguées à un “stagiaire intelligent.” Nous les avons d'ailleurs écrits en janvier.

Crédits image : Twin

Ainsi, au lieu de faire construire un script personnalisé par un ingénieur en informatique pour effectuer une certaine tâche, vous pouvez la démontrer ou la décrire en langage courant. Des choses comme “mettre tous les CV que nous avons reçus aujourd'hui dans un dossier sur Dropbox et les renommer d'après le candidat, puis m'envoyer le lien de partage dans Slack.” Et une fois que vous avez ajusté ce flux de travail (“Oops, cette fois ajoutez la date de candidature aux noms des fichiers”), cela peut être simplement la nouvelle manière dont ce processus fonctionne. L'objectif de l'entreprise est d'automatiser les 20% des tâches qui prennent 80% de notre temps - la question réelle est probablement de savoir si elle peut le faire de manière abordable. (Twin a refusé de donner plus de détails sur la nature de leur modèle et de leur processus de formation.)

Skej vise à améliorer le processus parfois douloureux de trouver un horaire de réunion qui convient à deux (ou trois, ou quatre...) personnes. Vous envoyez simplement le bot en copie conforme d'un e-mail ou d'un fil Slack et il commencera le processus de conciliation des disponibilités et des préférences de chacun. S'il a accès aux emploi du temps, il les vérifiera ; si quelqu'un dit qu'il préfère l'après-midi si c'est le jeudi, il travaillera avec cela ; vous pouvez dire que certaines personnes ont la priorité ; et ainsi de suite. Toute personne qui travaille avec un assistant exécutif compétent sait qu'ils sont irremplaçables, mais il est fort probable que chaque assistant exécutif préférerait passer moins de temps sur des tâches qui ne sont qu'une série de “Comment cela ? Non ? Et cela ?”

Crédits image : Skej

En tant que misanthrope, je n'ai pas ce problème de planification, mais j'apprécie que d'autres en aient un, et préféreraient également une solution du type “configurer et oublier” où ils n'ont qu'à accepter les résultats. Et cela est totalement dans les capacités des agents d'IA d'aujourd'hui, qui seraient principalement chargés de comprendre le langage naturel plutôt que des formulaires.

Jsonify est une évolution des outils de raclage de sites web qui peuvent extraire des données de contextes relativement non structurés. Cela se fait depuis des années, mais le moteur qui extrait les informations n'a jamais été très intelligent. S'il s'agit d'un gros document plat, ils fonctionnent bien - s'il est dans des onglets sur le site ou dans une liste visuelle mal codée destinée aux humains qui cliquent partout, ils peuvent échouer. Jsonify utilise la compréhension améliorée des modèles d'IA visuelle d'aujourd'hui pour mieux analyser et trier les données qui pourraient être inaccessibles aux simples robots d'indexation.

Crédits image : Jsonify

Vous pourriez par exemple rechercher des options Airbnb dans une région donnée, puis avoir Jsonify qui les répertorie toutes dans un tableau structuré avec des colonnes pour le prix, la distance de l'aéroport, la notation, les frais cachés, etc. Ensuite, vous pourriez faire la même chose chez Vacasa et extraire les mêmes données - peut-être pour les mêmes endroits (j'ai fait cela et j'ai économisé environ 150 $ l'autre jour, mais j'aurais aimé automatiser le processus). Ou, vous savez, des trucs professionnels.

Mais l'imprécision inhérente aux LLM en fait-elle un outil douteux pour le travail ? 'Nous avons réussi à mettre en place un système de garde-fou plutôt robuste,” a déclaré le fondateur Paul Hunkin. “Nous utilisons quelques modèles différents au moment de l'exécution pour comprendre la page, qui fournissent une certaine validation - et les LLM que nous utilisons sont ajustés à notre cas d'utilisation, donc ils sont généralement assez fiables même sans la couche de garde-fou. Habituellement, nous obtenons une précision d'extraction de plus de 95 %, en fonction du cas d'utilisation.”

Je pourrais voir que chacun de ces outils serait utile probablement dans n'importe quelle entreprise à la pointe de la technologie. Les autres entreprises de la cohorte sont un peu plus techniques ou situationnelles - voici les six restantes :

  • Resolvd AI - automatisation agentic des flux de travail cloud. Semble utile jusqu'à ce que les intégrations sur mesure rattrapent leur retard.
  • Floode - un agent IA pour la gestion de la boîte de réception qui lit vos e-mails et trouve l'essentiel tout en préparant des réponses et des actions appropriées.
  • Extensible AI - votre IA régresse-t-elle ? Demandez à votre médecin si Extensible est l'infrastructure de test et de journalisation adaptée à votre déploiement.
  • Opponent - un personnage virtuel destiné aux enfants pour des interactions et des jeux étendus. Semble être un champ miné éthiquement et légalement, mais quelqu'un doit passer par là.
  • High Dimensional Research - la pièce maîtresse de l'infrastructure. Un cadre pour les agents d'IA basés sur le web avec un modèle de paiement à l'usage, donc si l'expérience de votre entreprise échoue, vous ne devez que quelques dollars.
  • Mbodi - IA générative pour la robotique, un domaine où les données d'entraînement sont relativement rares. Je pensais que c'était un mot africain mais c'est juste “incarner.”

Il ne fait aucun doute que les agents d'IA joueront un rôle dans les flux de travail logiciel de plus en plus automatisés du futur proche, mais la nature et l'étendue de ce rôle ne sont pas encore écrites. Il est clair que Betaworks vise à entrer tôt dans la danse même si certains des produits ne sont pas encore tout à fait prêts pour leur lancement sur le marché de masse.

Vous pourrez voir les entreprises présenter leurs produits d'IA agentic le 7 mai.

Correction : Cette histoire a été mise à jour pour refléter que le fondateur de Jsonify est Paul Hunkin, et non Ananth Manivannan.