Durant l'été a été officialisée une puce géante de 1200 milliards de transistors, le Wafer Scale Engine (WSE) armé de 18 Go de mémoire SRAM (mémoire vive statique) et d'une bande passante de 9 petaoctets/s.
Le monstre de 46 225 mm2 représente l'équivalent de 400 000 coeurs gravés en 16 nm chez TSMC et avec des cadences autour de 3 GHz, regroupés en un seul système et nécessite une puissance de 15 kW pour fonctionner. Si l'on pouvait avoir des doutes sur sa capacité à trouver place dans un équipement informatique, son créateur Cerebras Systems annonce le système CS-1 qui lui donnera vie et permettra d'exploiter son potentiel.
Le dispositif représente l'équivalent de 15 RU (Rack Units) et pourra être intégré dans un datacenter. Ses 12 lignes Ethernet 100 Gigabit lui permettront d'absorber 1,2 Tbps de données.
Pour le faire fonctionner, il faudra lui fournir 20 kW, dont 15 kW pour la puce géante WSE et 4 kW pour l'ensemble de son système de refroidissement. C'est pourtant bien moins que ce qu'il faudrait en clusters GPU pour fournir des performances de calcul similaires, assure Cerebras, tandis que la configuration du système ne prendrait que quelques minutes, contre plusieurs semaines pour un cluster GPU.
Cette débauche de capacité de traitement servira à entraîner des intelligences artificielles sur des périodes se comptant en minutes et en heures plutôt qu'en jours et en semaines, réduisant drastiquement les temps nécessaires d'apprentissage.
A noter que le système peut être programmé en passant par des frameworks comme TensorFlow ou PyTorch grâce à une solide couche logicielle développée conjointement au hardware.
Cerebras ne dévoile pas le prix de son système CS-1, sans doute très onéreux, mais annonce que celui-ci est déjà à l'oeuvre au sein de l'Argonne National Lab, grand centre de recherche US, mettant l'intelligence artificielle au service de la recherche contre le cancer.