Nvidia Svela la Nuova GPU AI Blackwell Ultra B300 e il Futuro Roadmap Vera Rubin

Blackwell Ultra nel 2025, Vera Rubin nel 2026, Rubin Ultra nel 2027, Feynman nel 2028

Prospettive future: Durante la conferenza sulla tecnologia GPU del 2025, il CEO di Nvidia, Jensen Huang, ha presentato una nuova serie di GPU acceleratrici per l’intelligenza artificiale, tra cui il Blackwell Ultra B300, il Vera Rubin e il Rubin Ultra. Queste GPU sono progettate per potenziare le prestazioni dell’IA, soprattutto nei compiti di inferenza e addestramento.

Il Blackwell Ultra B300, previsto per il lancio nella seconda metà del 2025, espande la capacità di memoria da 192GB a 288GB di HBM3e e offre un incremento del 50% nella computazione tensoriale densa FP4 rispetto al Blackwell GB200.

Questi miglioramenti supportano modelli di IA più grandi e ottimizzano le prestazioni di inferenza per framework come DeepSeek R1. In una configurazione completa di rack NVL72, il Blackwell Ultra sarà capace di erogare 1.1 exaflops di computazione di inferenza FP4 densa, segnando un progresso significativo rispetto all’attuale configurazione Blackwell B200.

Il Blackwell Ultra B300 non è solamente una GPU indipendente. Insieme all’unità principale B300, Nvidia sta introducendo nuove soluzioni di server rack B300 NVL16, la stazione DGX GB300 e il sistema completo di rack NV72L GB300.

Unendo otto rack NV72L si forma il completo Blackwell Ultra DGX SuperPOD (nella foto sopra), che include 288 CPU Grace, 576 GPU Blackwell Ultra, 300TB di memoria HBM3e e una potenza di calcolo di 11.5 ExaFLOPS in FP4. Questi sistemi possono essere interconnessi per creare supercomputer su larga scala, che Nvidia denomina “fabbriche di IA”.

Inizialmente annunciato a Computex 2024, i GPU di prossima generazione Vera Rubin sono attesi per il lancio nella seconda metà del 2026, offrendo miglioramenti sostanziali di prestazioni, particolarmente nell’addestramento e nell’inferenza di IA.

LEGGI Sony in trattative per acquisire Kadokawa: FromSoftware e Elden Ring presto sotto la sua ala!

Vera Rubin dispone di decine di terabyte di memoria ed è abbinata a una CPU progettata su misura da Nvidia, Vera, che include 88 core Arm personalizzati con 176 thread.

Il GPU integra due chip su un singolo die, raggiungendo 50 petaflops di prestazioni di inferenza FP4 per chip. In una configurazione completa di rack NVL144, Vera Rubin può erogare 3.6 exaflops di computazione di inferenza FP4.

Basandosi sull’architettura di Vera Rubin, il Rubin Ultra è previsto per il lancio nella seconda metà del 2027. Utilizzerà la configurazione di rack NVL576, con ogni GPU dotata di quattro die di dimensione reticolo, fornendo 100 petaflops di precisione FP4 per chip.

Rubin Ultra promette 15 exaflops di computazione di inferenza FP4 e 5 exaflops di prestazioni di addestramento FP8, superando significativamente le capacità di Vera Rubin. Ogni GPU Rubin Ultra includerà 1TB di memoria HBM4e, contribuendo a 365TB di memoria veloce in tutto il rack.

Nvidia ha inoltre introdotto una nuova architettura di GPU di prossima generazione chiamata “Feynman”, prevista per il debutto nel 2028 insieme alla CPU Vera. Sebbene i dettagli rimangano scarsi, si prevede che Feynman avanzarà ulteriormente le capacità di calcolo AI di Nvidia.

Durante il suo discorso, Huang ha delineato la visione ambiziosa di Nvidia per l’IA, descrivendo i data center come “fabbriche di IA” che producono token elaborati dai modelli di IA. Ha anche evidenziato il potenziale dell’IA “fisica” per alimentare robot umanoidi, sfruttando le piattaforme software di Nvidia per addestrare modelli di IA in ambienti virtuali per applicazioni nel mondo reale.

La roadmap di Nvidia è felice di posizionare queste GPU come pivotali nel futuro del computing, sottolineando la necessità di una potenza computazionale aumentata per stare al passo con i progressi dell’IA. Questa strategia arriva mentre Nvidia mira a rassicurare gli investitori a seguito delle recenti fluttuazioni di mercato, costruendo sul successo dei suoi chip Blackwell.

Messaggi simili:

LEGGI CTO di AMD: I Limiti di Potenza Modelleranno i Supercomputer del Futuro, Non il Calcolo

Nicola Costanzo

Nicola Costanzo esplora il mondo della tecnologia e dell’innovazione. I suoi articoli illuminano le sfide digitali che plasmano il nostro futuro.