NVIDIA Vera Rubin vào sản xuất: nền tảng AI mới với GPU 336 tỷ transistor
NVIDIA giới thiệu nền tảng AI thế hệ mới Vera Rubin tại CES 2026 và đưa vào sản xuất hàng loạt, kết hợp CPU Vera và GPU Rubin. GPU Rubin sản xuất trên tiến trình 3nm với 336 tỷ transistor, hứa hẹn giảm mạnh chi phí suy luận AI và số GPU cần để huấn luyện mô hình, củng cố vị thế dẫn đầu của NVIDIA trong làn sóng AI.
NVIDIA ra mắt nền tảng AI Vera Rubin tại CES 2026. Nguồn: YouTube
NVIDIA giới thiệu nền tảng AI thế hệ mới Vera Rubin tại CES 2026 và đưa vào sản xuất hàng loạt, kết hợp CPU Vera và GPU Rubin. GPU Rubin sản xuất trên tiến trình TSMC 3nm với thiết kế hai die chứa tổng cộng 336 tỷ transistor, tăng 1,6 lần so với Blackwell. Nền tảng hứa hẹn giảm tới 10 lần chi phí cho mỗi token suy luận và giảm 4 lần số GPU cần để huấn luyện mô hình MoE so với Blackwell. Sản phẩm dựa trên Rubin dự kiến tới tay đối tác trong nửa cuối 2026, với Rubin Ultra theo sau vào 2027.
NVIDIA tiếp tục dẫn dắt cuộc đua hạ tầng AI khi giới thiệu nền tảng thế hệ mới Vera Rubin tại CES 2026 và đưa vào sản xuất hàng loạt. Kết hợp CPU Vera và GPU Rubin, đây là nền tảng kế nhiệm Blackwell với bước nhảy lớn về năng lực tính toán. GPU Rubin trên tiến trình 3nm với 336 tỷ transistor hứa hẹn giảm mạnh chi phí suy luận và huấn luyện AI, củng cố vị thế thống trị của NVIDIA trong bối cảnh nhu cầu tính toán AI bùng nổ trên toàn cầu.
| Nền tảng | Vera Rubin, ra mắt CES 2026 |
| Thành phần | CPU Vera và GPU Rubin |
| Tiến trình | TSMC 3nm |
| Transistor | 336 tỷ, tăng 1,6 lần so với Blackwell |
| Chi phí suy luận | Giảm tới 10 lần |
| Sản phẩm | Tới đối tác nửa cuối 2026 |
Vera Rubin: nền tảng AI thế hệ mới
Tâm điểm của CES 2026 với NVIDIA là nền tảng Vera Rubin, được CEO Jensen Huang giới thiệu như một siêu máy tính AI mạnh mẽ thế hệ mới. Vera Rubin kết hợp CPU Vera và GPU Rubin, cùng các thành phần kết nối và mạng, tạo thành một nền tảng hoàn chỉnh cho các tác vụ AI quy mô lớn. Đây là nền tảng kế nhiệm Blackwell, được thiết kế đặc biệt cho AI agentic và các ứng dụng AI hành động trong thế giới thực.
Việc NVIDIA công bố Vera Rubin đã vào sản xuất hàng loạt cho thấy nhịp độ phát triển rất nhanh của hãng. Trong bối cảnh nhu cầu tính toán AI tăng vọt, các nền tảng mạnh hơn và hiệu quả hơn là yếu tố quyết định. Một thành phần quan trọng của nền tảng là bộ nhớ tốc độ cao, lĩnh vực mà NVIDIA hợp tác với các đối tác lớn, được phân tích trong bài NVIDIA và SK Hynix hợp tác bộ nhớ AI HBM4.
Vera Rubin là tâm điểm của NVIDIA tại CES 2026. Nguồn: YouTube
GPU Rubin: 336 tỷ transistor trên tiến trình 3nm
Trái tim của nền tảng là GPU Rubin, một bước nhảy lớn về quy mô và năng lực. Rubin được sản xuất trên tiến trình 3nm của TSMC, một bước thu nhỏ node so với Blackwell. GPU sử dụng thiết kế hai die với hai chiplet tính toán cỡ lớn, chứa tổng cộng 336 tỷ transistor, tăng 1,6 lần so với 208 tỷ của Blackwell. Số transistor nhiều hơn đồng nghĩa với năng lực tính toán cao hơn đáng kể.
Quy mô khổng lồ này giúp Rubin xử lý các mô hình AI ngày càng lớn và phức tạp. Đây là yếu tố then chốt trong cuộc đua AI, khi các mô hình tiên tiến đòi hỏi sức mạnh tính toán vượt trội. Việc liên tục đẩy giới hạn về tiến trình và số transistor cho thấy NVIDIA đầu tư mạnh để duy trì lợi thế. Cạnh tranh trong mảng chip AI cũng ngày càng gay gắt, với nhiều đối thủ tham gia, chẳng hạn được nêu trong bài Qualcomm AI200, AI250 đấu NVIDIA.
Giảm mạnh chi phí suy luận và huấn luyện
Một trong những điểm nhấn quan trọng nhất của Vera Rubin là hiệu quả chi phí. NVIDIA cho biết nền tảng giúp giảm tới 10 lần chi phí cho mỗi token suy luận và giảm 4 lần số GPU cần để huấn luyện các mô hình MoE so với Blackwell. Đây là những con số ấn tượng, nhờ thiết kế đồng bộ giữa phần cứng và phần mềm để tối ưu toàn hệ thống. Chi phí thấp hơn là yếu tố sống còn khi quy mô triển khai AI ngày càng lớn.
Việc giảm chi phí vận hành AI có ý nghĩa lớn với cả ngành. Chạy các mô hình AI hiện rất tốn kém về phần cứng và điện năng, nên giảm chi phí giúp AI dễ tiếp cận hơn cho nhiều doanh nghiệp và ứng dụng. Điều này có thể thúc đẩy làn sóng ứng dụng AI rộng hơn, khi rào cản chi phí được hạ thấp. Hiệu quả năng lượng cao hơn cũng góp phần giảm áp lực lên hạ tầng điện của các trung tâm dữ liệu, một thách thức lớn của ngành.
Lộ trình và vị thế của NVIDIA
NVIDIA cho biết Rubin đã vào sản xuất hàng loạt, với các sản phẩm dựa trên nền tảng này dự kiến tới tay đối tác trong nửa cuối năm 2026. Các nhà cung cấp dịch vụ đám mây lớn nằm trong nhóm triển khai sớm, cho thấy nhu cầu mạnh mẽ với nền tảng. NVIDIA cũng công bố lộ trình dài hạn với Rubin Ultra dự kiến năm 2027 và kiến trúc Feynman tiếp theo, thể hiện nhịp độ ra mắt nhanh để duy trì lợi thế.
Vị thế dẫn đầu của NVIDIA trong mảng chip AI hiện rất vững chắc, nhưng cạnh tranh đang gia tăng từ nhiều phía. Việc hãng liên tục tung ra các nền tảng mạnh hơn và hiệu quả hơn là cách giữ khoảng cách với đối thủ. Sự thống trị này cũng đặt ra câu hỏi về sự phụ thuộc của ngành vào một nhà cung cấp, thúc đẩy nhiều công ty tìm kiếm giải pháp thay thế. Dù vậy, với Vera Rubin, NVIDIA tiếp tục đặt ra chuẩn mực mới cho hạ tầng AI toàn cầu.
Ý nghĩa với người dùng và doanh nghiệp Việt
Dù Vera Rubin là nền tảng cho trung tâm dữ liệu mà người dùng phổ thông khó tiếp cận trực tiếp, ảnh hưởng gián tiếp tới người Việt là rất lớn. Chi phí AI thấp hơn nhờ các nền tảng hiệu quả như Vera Rubin giúp các dịch vụ AI trở nên rẻ và phổ biến hơn, bao gồm cả những ứng dụng mà người Việt dùng hằng ngày như trợ lý ảo, dịch thuật và công cụ sáng tạo. Khi chi phí giảm, AI có thể đến với nhiều người hơn.
Với doanh nghiệp Việt, hạ tầng AI mạnh và rẻ hơn mở ra cơ hội ứng dụng AI vào sản phẩm và quy trình với chi phí hợp lý hơn. Làn sóng đầu tư hạ tầng AI toàn cầu cũng thúc đẩy các dự án trung tâm dữ liệu tại Việt Nam, tạo nền tảng cho kinh tế số, như phân tích trong bài trung tâm dữ liệu AI Việt Nam hút hơn 7 tỷ USD. LongTechVision sẽ tiếp tục theo dõi sự phát triển của hạ tầng AI và tác động tới thị trường Việt Nam.