Depuis une dizaine d'années, la puce Tomahawk de Broadcom fait partie des composants courants des centres de données, et il est intégré dans les commutateurs réseaux de nombreux fournisseurs. Chaque nouvelle génération de Tomahawk a cherché à offrir une plus grande largeur de bande et une plus grande évolutivité. Le Tomahawk 6, en cours de livraison, marque la première mise à jour majeure de cette puce réseau pour datacenters de Broadcom depuis la v5, lancé en 2022. L'objectif déclaré de la dernière génération de la puce est sensiblement le même qu'il y a trois ans : accélérer les charges de travail liées à l’IA. Avec un changement, cependant : l’exigence spectaculaire et l'échelle écrasante des charges de travail d'IA. C'est cette échelle que Broadcom poursuit désormais.

Comme l'indique le fournisseur, le Tomahawk 6 double la bande passante de son prédécesseur, passant de 51,2 térabits par seconde (Tbps) à un débit stupéfiant de 102,4 Tbps. Cette annonce intervient alors que les opérateurs hyperscale prévoient des déploiements dépassant les 100 000 XPU (unités de traitement comprenant les GPU, TPU et autres accélérateurs d'IA) et se préparent à des clusters pouvant atteindre un million de XPU. « En termes de bande passante brute, c’est le plus grand bond en avant à ce jour. Tomahawk 5 a fourni 51,2 Tbps, Tomahawk 6 double ce chiffre pour atteindre 102,4 Tbps », a déclaré Pete Del Vecchio, chef de produit pour la famille de commutateurs Tomahawk chez Broadcom.

Une complexité architecturale, au-delà de la mise à l'échelle linéaire

Si le doublement de la bande passante par rapport aux 51,2 Tbps de Tomahawk 5 représente une augmentation significative des performances, la complexité de l'ingénierie va bien au-delà d'une simple mise à l'échelle linéaire. M. Del Vecchio a fait remarquer que de nombreuses structures sur la puce, comme l'unité de gestion de la mémoire (Memory Management Unit, MMU), voient leur complexité multipliée par quatre environ lorsque la bande passante double. « Jamais la famille Tomahawk n’a vu sa complexité augmenter à ce point », a-t-il ajouté. Ce surcroît de complexité de la MMU reflète les défis posés par la gestion de la mise en mémoire tampon des paquets, l'ordonnancement des files d'attente et le contrôle de la congestion à ces largeurs de bande extrêmes.

Les approches traditionnelles de la commutation de paquets deviennent de plus en plus difficiles à mesure que le nombre de ports, de files d'attente et de flux simultanés augmente de manière exponentielle. Le Tomahawk 6 relève ces défis grâce à plusieurs innovations architecturales majeures. La puce prend en charge des configurations avec jusqu'à 1 024 voies SerDes 100G ou des options SerDes 200G à plus haut débit, offrant ainsi une flexibilité pour différents scénarios de déploiement. Pour les clusters d'IA nécessitant une portée étendue, la configuration 100G SerDes permet des interconnexions passives en cuivre plus longues, réduisant à la fois la consommation d'énergie et le coût total de possession par rapport aux solutions optiques.

Une architecture scale-up et scale-out unifiée

L'une des réalisations techniques les plus importantes de Tomahawk 6 est sa capacité à gérer les exigences de mise en réseau de type « scale-up » et « scale-out » dans un cadre Ethernet unifié. Le réseau scale-up fait référence aux connexions à large bande passante et à faible latence au sein des pods individuels de formation à l'IA, qui prennent généralement en charge jusqu'à 512 XPU dans le cas de Tomahawk 6. La mise en réseau « scale-out » relie ces modules en grappes plus importantes, Tomahawk 6 prenant en charge des déploiements de plus de 100 000 XPU. Cette approche unifiée évite de recourir à des technologies et des protocoles de réseau distincts entre les niveaux scale-up et scale-out, ce qui simplifie les opérations de réseau.

Le Tomahawk 6 intègre Cognitive Routing 2.0, une version améliorée de la technologie de routage adaptatif de Broadcom spécialement conçue pour les charges de travail de l'IA. Ce système fournit une télémétrie avancée, un contrôle dynamique de la congestion, une détection rapide des défaillances et des capacités de réduction des paquets qui permettent un équilibrage global de la charge sur l'ensemble du réseau. Ces fonctionnalités répondent aux défis spécifiques des charges de travail d'apprentissage de l'IA, où les modèles de communication collective tels que les opérations de réduction peuvent créer des points chauds de congestion temporaires, mais graves. La capacité du système à réacheminer dynamiquement le trafic et à fournir un contrôle fin des flux permet de maintenir des performances constantes pour les tâches de formation distribuées à grande échelle. La puce prend également en charge les protocoles de transport modernes de l'IA et les mécanismes de signalisation de la congestion définis par l'Ultra Ethernet Consortium, ce qui garantit la compatibilité avec les normes industrielles émergentes pour la mise en réseau de l'IA.

Positionnement concurrentiel et calendrier de développement

L'effort de développement de Tomahawk 6 représente un investissement technique très élevé. « Le développement a duré plus de trois ans, avec des investissements considérables dans l'architecture, la conception du silicium, le logiciel et la validation du système », a fait valoir M. Del Vecchio. D'un point de vue concurrentiel, Broadcom revendique également une avance substantielle en matière de largeur de bande de commutation. « Aucune autre puce de commutation Ethernet n'est proche de la bande passante du TH6 », a affirmé M. Del Vecchio. « Les concurrents les plus proches de Nvidia, Marvell et Cisco atteignent la moitié de la bande passante ». Le fournisseur met aussi l'accent sur son avantage en termes de délai de mise sur le marché : « Notez qu'avec Tomahawk 5, Broadcom a livré en volume avant même qu'un concurrent n'en ait fait l'échantillonnage », a rappelé M. Del Vecchio. « Nous prévoyons un avantage similaire en termes de délai de mise sur le marché avec Tomahawk 6 ».