Application la plus connue, la console de jeux vidéo PlayStation 3 de Sony est conçue autour du processeur CELL.
Pour des raisons de coûts de production, un des huit SPEs est inutilisé afin d'obtenir un rendement de production plus élevé (Sony peut utiliser les processeurs avec 1 ou 0 SPE défectueux). Le processeur CELL de la PS3 aura ainsi 7 SPE contrairement à la version standard d'IBM à 8 SPE.
Mercury et IBM ont collaboré pour développer des solutions basées sur le processeur CELL.
Mercury propose au 1er juillet 2006 quatre solutions à base de processeurs CELL, plus une solution d'évaluation (performance peak simple précision) :
IBM annonce une nouvelle génération de serveurs lame et la formation officielle de la communauté Blade qui regroupent des acteurs collaborent au développement de solutions BladeCenter.
Ce serveur lame (utilisé pour le nouveau BladeCenter H) regroupe 9 processeurs CELL, constituant la première offre de ce type chez IBM. Conçu pour les traitements de calcul intensif et les applications multimédia à forte demande en bande passante, il permet d’augmenter de manière significative la bande-passante des petits serveurs lames, et offre ainsi aux entreprises la possibilité de faire circuler 10 fois plus de données sur leur réseau. Cette percée technologique repousse les limites des performances internes des nouveaux systèmes en leur fournissant plus de 40 Gbits/s (Gb) de bande-passante I/O par lame.
Annoncé en septembre 2006, Roadrunner est le premier supercalculateur à utiliser ce processeur (16 000 processeurs de ce type). Il est construit par IBM.
Machine / processeur(s) | #proc | #core par proc | Rmax (GFlop/s) | Rpeak (GFlop/s) | Rmax (GFlop/s) par proc | Rpeak (GFlop/s) par proc |
---|---|---|---|---|---|---|
IBM Cell BE (3,2 GHz)¹¹¹ en 2006 | 1 | 9 | 98.05 | 14.6 (64 bit) 204.8 (32 bit) | 98.05 | 14.6 (64 bit) 204.8 (32 bit) |
Itanium 2 Montecito (2× Itanium 2 @ 1,6 GHz) | 1 | 2 | (~12)¹ | 12.8 | (~12)¹ | 12.8 |
IBM Cell BE (3,2 GHz) en 2005 | 1 | 9 | (10~13)¹ | 14.6 | (10~13)¹ | 14.6 |
Pentium 4 + SSE3 (3,6 GHz) | 1 | 1 | 14.4 | 14.4 | ||
IBM IntelliStation POWER 285 (2× POWER5+ @ 1,9 GHz) | 2 | 1 | 14.35 | 15.2 | 7.18 | 7.6 |
HP Integrity rx1620-2 (2× Itanium 2 @ 1,6 GHz) | 2 | 1 | 12.05 | 12.8 | 6.03 | 6.4 |
Pentium 4 (3,2 GHz) | 1 | 1 | 6.4 | 6.4 | ||
HP ProLiant BL25p (2× AMD 254 Opteron @ 2,8 GHz) | 2 | 1 | 11.2 | 5.6 |
¹¹¹ L'algorithme utilisé pour obtenir cette performance est basé sur une approche de raffinement itérative où un couple de 32 et 64 bits en virgule flottante sont utilisés. Cette méthode calcule une factorisation LU en 32 bits et utilise une approche de raffinement itérative où est sélectionnée la solution avec une précision de 64 bits. La précision obtenue est équivalente à une implémentation 64 bits. Dans notre cas, le Rpeak est noté par un couple de 32 et 64 bits en virgule flottante.
À noter que, certains des processeurs utilisés pour les Calculs Haute Performance démontrent aujourd'hui la supériorité des performances lors de calculs 32 bits par rapport à des calculs directement réalisés en 64 bits, comme les processeurs AMD Opteron, Intel Pentium, IBM PowerPC, et Cray X1.