Ampere s'associe à Qualcomm pour lancer un serveur AI basé sur ARM

Ampere et Qualcomm ne sont pas les partenaires les plus évidents. En effet, les deux offrent des puces basées sur ARM pour exécuter des serveurs de centres de données (bien que le plus grand marché de Qualcomm reste mobile). Mais comme l'ont annoncé aujourd'hui les deux entreprises, elles unissent désormais leurs forces pour offrir un serveur axé sur l'IA utilisant les CPU d'Ampere et les puces d'inférence AI Cloud 100 Ultra de Qualcomm pour exécuter - non pas pour entraîner - des modèles.

Comme tous les autres fabricants de puces, Ampere cherche à tirer profit du boom de l'IA. Cependant, la société s'est toujours concentrée sur des puces de serveur rapides et économes en énergie, donc bien qu'elle puisse utiliser la technologie ARM pour ajouter certaines de ces fonctionnalités à ses puces, ce n'est pas nécessairement une compétence centrale. C'est pourquoi Ampere a décidé de travailler avec Qualcomm (et SuperMicro pour intégrer les deux solutions), a déclaré le directeur technique d'ARM Jeff Wittich.

\"L'idée ici est que si je vous montre de très bonnes performances pour les CPU Ampere exécutant l'inférence AI uniquement sur les CPU, si vous souhaitez passer à des modèles encore plus importants - des modèles à plusieurs dizaines de milliards de paramètres, par exemple - tout comme pour tous les autres charges de travail, l'IA n'est pas une taille unique. Nous travaillons avec Qualcomm sur cette solution, en combinant nos CPU Ampere super efficaces pour effectuer bon nombre des tâches à usage général que vous exécutez en conjonction avec l'inférence, puis en utilisant leurs cartes vraiment efficaces, nous avons une solution au niveau du serveur.\"

Crédits d'image : Ampere

Quant à son partenariat avec Qualcomm, Wittich a déclaré qu'Ampere voulait mettre en place des solutions meilleures.

\"C'est une très bonne collaboration que nous avons eue avec Qualcomm ici,\ a-t-il déclaré. \"C'est l'une des choses sur lesquelles nous avons travaillé, je pense que nous partageons beaucoup d'intérêts similaires, c'est pourquoi je pense que c'est vraiment convaincant. Ils construisent des solutions vraiment, vraiment efficaces et dans de nombreux domaines différents du marché. Nous construisons des solutions vraiment, vraiment efficaces du côté des CPU de serveur.\"

Le partenariat avec Qualcomm fait partie de la mise à jour annuelle de la feuille de route d'Ampère. Une partie de cette feuille de route est la nouvelle puce AmpereOne de 256 cœurs, construite avec un processus moderne de 3 nm. Ces nouvelles puces ne sont pas encore tout à fait disponibles, mais Wittich dit qu'elles sont prêtes à l'usine et devraient être déployées plus tard cette année.

En plus des cœurs supplémentaires, la caractéristique déterminante de cette nouvelle génération de puces AmpereOne est la RAM DDR5 à 12 canaux, qui permet aux clients des centres de données d'Ampere de mieux ajuster l'accès à la mémoire de leurs utilisateurs selon leurs besoins.

La vente ici ne concerne pas seulement les performances, mais aussi la consommation d'énergie et le coût d'exécution de ces puces dans le centre de données. C'est particulièrement vrai en ce qui concerne l'inférence IA, où Ampere aime comparer ses performances à celles des GPU Nvidia A10.

Crédit d'image : Ampere

Il convient de noter qu'Ampere ne met pas fin à l'un de ses puces existantes en faveur de ces nouvelles. Wittich a souligné que même ces anciennes puces avaient encore de nombreux cas d'utilisation.

Ampere a également annoncé un autre partenariat aujourd'hui. La société travaille avec NETINT pour construire une solution commune qui associe les CPU d'Ampere aux puces de traitement vidéo de NETINT. Ce nouveau serveur pourra transcoder 360 canaux vidéo en direct en parallèle, tout en utilisant également le modèle de transcription en temps réel Whisper de OpenAI pour sous-titrer 40 flux.

\"Nous avons commencé ce chemin il y a six ans parce qu'il est clair que c'est le bon chemin\", a déclaré le PDG d'Ampère, Renée James, dans l'annonce d'aujourd'hui. \"La faible consommation d'énergie était autrefois synonyme de faible performance. Ampere a prouvé que ce n'est pas vrai. Nous avons été des pionniers dans la frontière de l'efficacité de l'informatique et avons offert des performances supérieures aux CPU hérités dans une enveloppe informatique efficace.\"