La division Google d'Alphabet a présenté mercredi deux processeurs d'intelligence artificielle spécialisés, marquant la première fois que son architecture d'unités de traitement tensoriel est séparée en puces distinctes pour les opérations d'entraînement et d'inférence.
Le TPU 8t est spécifiquement conçu pour l'entraînement de modèles d'IA, tandis que son homologue, le TPU 8i, se concentre exclusivement sur l'inférence — le processus de déploiement de modèles entraînés dans des applications réelles. Broadcom a servi de partenaire de co-développement, prolongeant une collaboration qui s'étend sur plus de dix ans.
Alphabet Inc., GOOGL
Cela représente un changement stratégique par rapport aux approches précédentes. Les itérations antérieures du TPU combinaient les capacités d'entraînement et d'inférence au sein d'un seul processeur. Google attribue ce changement à l'émergence des systèmes d'IA agentiques — des modèles autonomes qui fonctionnent en boucles de rétroaction continues avec une supervision humaine minimale — qui nécessitent un silicium plus dédié.
Le TPU 8i orienté inférence intègre 384 mégaoctets de SRAM par processeur — trois fois la capacité d'Ironwood. Selon Google, cette amélioration architecturale élimine le goulot d'étranglement de la « salle d'attente », réduisant les pics de latence qui surviennent lorsque plusieurs utilisateurs interrogent simultanément un modèle.
Comparé à Ironwood, le TPU 8i atteint une efficacité économique supérieure de 80 %. En termes opérationnels, les organisations peuvent accueillir près du double de la demande des utilisateurs sans augmenter leur budget.
La puce démontre également jusqu'à 2x une meilleure efficacité énergétique par watt, rendue possible par une technologie de gestion dynamique de l'énergie qui module la consommation d'énergie en fonction des besoins de charge de travail en temps réel.
Pour la première fois, les deux processeurs utilisent le CPU Axion de Google comme processeur hôte, permettant une optimisation au niveau de l'architecture système plutôt que de limiter les améliorations aux performances individuelles des puces.
En ce qui concerne les capacités d'entraînement, la configuration superpod du TPU 8t prend en charge des clusters allant jusqu'à 9 600 processeurs avec 2 pétaoctets de mémoire à haute bande passante. Cela représente le double de la bande passante de communication inter-puces d'Ironwood, et Google affirme qu'il peut compresser les délais de développement de modèles de pointe de plusieurs mois à quelques semaines seulement.
Le processeur d'entraînement offre 2,8 fois les performances de calcul de l'architecture Ironwood de septième génération à un prix équivalent.
L'adoption précoce prend de l'élan. Citadel Securities a développé des plateformes de recherche quantitative en utilisant l'infrastructure TPU de Google. Les dix-sept laboratoires nationaux du Département de l'Énergie des États-Unis exploitent des applications d'IA co-scientifique sur les processeurs. Anthropic s'est engagé à utiliser plusieurs gigawatts de capacité de calcul TPU de Google.
Les analystes de DA Davidson ont projeté en septembre que la division TPU de Google, combinée à Google DeepMind, pourrait atteindre une valorisation approchant les 900 milliards de dollars.
Google maintient un modèle de distribution exclusif pour les TPU — ils ne sont pas disponibles à l'achat direct et ne peuvent être accessibles que via les services Google Cloud. Nvidia continue de fournir du matériel GPU à Google, et la société a confirmé qu'elle sera parmi les premiers fournisseurs de services cloud à proposer la prochaine plateforme Vera Rubin de Nvidia lors de son lancement plus tard cette année.
Les processeurs ont été conçus en étroite collaboration avec Google DeepMind, qui les a déployés pour entraîner les modèles de langage Gemini et optimiser les algorithmes alimentant les plateformes Search et YouTube.
Google a annoncé que le TPU 8t et le TPU 8i seront disponibles en disponibilité générale pour les clients de la plateforme cloud plus tard en 2025.
The post Alphabet (GOOGL) Unveils Dual-Purpose 8th-Gen TPU Chips Developed With Broadcom appeared first on Blockonomi.


