Qualcomm tung chip AI200, AI250 đấu Nvidia ở data center
Qualcomm chính thức bước vào sân chơi chip AI cho trung tâm dữ liệu với hai dòng AI200 và AI250, nhắm thẳng vào mảng suy luận (inference) vốn do Nvidia thống trị. Thay vì đua hiệu năng đỉnh, hãng chọn vũ khí khác: dung lượng nhớ khổng lồ 768GB mỗi card, kiến trúc near-memory và chi phí vận hành thấp. AI200 thương mại hóa trong 2026, AI250 nối tiếp năm 2027.
Qualcomm trình làng hai dòng chip suy luận AI200 và AI250 cho data center. Nguồn: YouTube
Qualcomm đưa hai dòng chip suy luận AI AI200 (thương mại hóa 2026) và AI250 (2027) vào trung tâm dữ liệu, dựa trên nền NPU Hexagon. Mỗi card AI200 mang tới 768GB LPDDR, ưu tiên dung lượng nhớ thay vì hiệu năng đỉnh. AI250 dùng kiến trúc near-memory computing, băng thông nhớ hiệu dụng cao gấp hơn 10 lần mà điện năng thấp hơn. Cả hai đóng gói dạng rack làm mát chất lỏng, công suất 160kW, dùng PCIe để scale-up và Ethernet để scale-out. Qualcomm đấu Nvidia bằng chi phí sở hữu (TCO) chứ không phải tốc độ thô. Cổ phiếu hãng từng tăng hơn 20% sau công bố.
Qualcomm, cái tên gắn liền với chip Snapdragon trên điện thoại, vừa có bước nhảy lớn nhất nhiều năm qua: chính thức bước vào thị trường chip AI cho trung tâm dữ liệu với hai dòng AI200 và AI250. Đáng chú ý là cách tiếp cận của hãng, không lao vào cuộc đua hiệu năng đỉnh với Nvidia mà chọn một mặt trận khác, nơi hãng tin mình có lợi thế: dung lượng nhớ, hiệu suất điện năng và chi phí vận hành.
| Nền tảng | NPU Hexagon, tùy biến cho suy luận AI ở data center |
| AI200 | Tối đa 768GB LPDDR mỗi card, ưu tiên dung lượng nhớ |
| AI250 | Kiến trúc near-memory, băng thông hiệu dụng cao hơn 10x |
| Đóng gói | Rack hoàn chỉnh, làm mát chất lỏng trực tiếp, 160kW |
| Kết nối | PCIe để scale-up, Ethernet để scale-out |
| Thời điểm bán | AI200 trong 2026, AI250 trong 2027 |
Qualcomm AI200 và AI250 là chip gì?
Cả AI200 và AI250 đều dựa trên Hexagon, dòng NPU mà Qualcomm đã mài giũa nhiều năm trên chip Snapdragon cho smartphone. Lần này hãng phóng to kiến trúc đó lên quy mô trung tâm dữ liệu, tối ưu riêng cho suy luận AI, tức giai đoạn mô hình đã huấn luyện xong và đi vào vận hành để trả lời người dùng.
Đây là lựa chọn có chủ đích. Thị trường chip AI lâu nay chia làm hai phần: huấn luyện (training) và suy luận (inference). Nvidia thống trị mảng huấn luyện với GPU mạnh và đắt. Nhưng khi các mô hình lớn đã được huấn luyện và bắt đầu phục vụ hàng tỷ lượt truy vấn mỗi ngày, chi phí suy luận mới là khoản lớn dần và kéo dài. Qualcomm đặt cược vào chính phần này.
AI200 và AI250 khác nhau ở đâu?
Hai con chip nhắm hai bài toán khác nhau. AI200 đặt cược vào dung lượng nhớ: mỗi card hỗ trợ tới 768GB LPDDR, con số rất lớn so với mặt bằng card tăng tốc hiện nay. Dung lượng nhớ dồi dào cho phép nạp trọn các mô hình ngôn ngữ lớn vào một card mà không phải chia nhỏ, giúp giảm độ trễ và chi phí khi chạy ở quy mô lớn.
AI250 đi theo hướng táo bạo hơn với kiến trúc near-memory computing, tức đưa khối tính toán lại gần bộ nhớ để cắt giảm quãng đường di chuyển dữ liệu. Qualcomm công bố băng thông nhớ hiệu dụng của AI250 cao hơn 10 lần trong khi điện năng tiêu thụ thấp hơn đáng kể. Với suy luận AI, nơi nghẽn cổ chai thường nằm ở băng thông nhớ chứ không phải sức mạnh tính toán thuần, đây là điểm có thể tạo khác biệt thực sự.
Cơn khát bộ nhớ của hạ tầng AI cũng chính là thứ đang đẩy giá linh kiện lên cao trên toàn cầu, như đã thấy trong khủng hoảng bộ nhớ RAM tăng giá vì trung tâm dữ liệu AI.
Qualcomm đấu Nvidia bằng chiến lược nào?
Qualcomm không cố thắng Nvidia ở tốc độ thô, một cuộc chiến gần như bất khả thi vào lúc này. Thay vào đó, hãng cạnh tranh ở chi phí sở hữu tổng thể: nhiều bộ nhớ hơn trên mỗi card, điện năng thấp hơn và chi phí vận hành rẻ hơn cho cùng một khối lượng suy luận.
Logic đằng sau khá thuyết phục. Khi AI chuyển từ giai đoạn xây dựng mô hình sang giai đoạn phục vụ hàng loạt, các trung tâm dữ liệu quan tâm tới số truy vấn xử lý được trên mỗi đồng điện và mỗi đồng vốn, nhiều hơn là kỷ lục hiệu năng. Nvidia hiểu rõ điều này và cũng đang củng cố mảng suy luận của mình, như phân tích trong kiến trúc Vera Rubin tại Nvidia GTC 2026. Nói cách khác, mặt trận suy luận đang trở thành chiến trường nóng nhất của ngành chip AI.
Vì sao cổ phiếu Qualcomm tăng hơn 20%?
Phản ứng của thị trường nói lên nhiều điều. Ngay sau công bố, cổ phiếu Qualcomm có thời điểm tăng hơn 20%, mức nhảy hiếm thấy với một hãng vốn hóa lớn. Nhà đầu tư nhìn thấy hai tín hiệu: Qualcomm tìm được động lực tăng trưởng mới ngoài thị trường smartphone đã bão hòa, và hãng có cơ sở thực để giành một phần chiếc bánh data center khổng lồ.
Lãnh đạo Qualcomm mô tả đây là bước chuẩn bị cho giai đoạn tiếp theo của hạ tầng AI, khi nhu cầu vận hành mô hình bùng nổ và thị trường cần thêm nhà cung cấp ngoài Nvidia. Việc có thêm một đối thủ nghiêm túc cũng là tin tốt cho cả ngành, vì cạnh tranh kéo theo giá thấp hơn và lựa chọn rộng hơn.
CEO Qualcomm chia sẻ về định hướng chuẩn bị cho giai đoạn tăng trưởng tiếp theo của data center AI. Nguồn: YouTube
Điều này có ý nghĩa gì với người dùng và doanh nghiệp Việt Nam?
Trước mắt, AI200 và AI250 không phải sản phẩm người dùng cuối có thể mua, mà là phần cứng dành cho các nhà vận hành đám mây và trung tâm dữ liệu. Nhưng tác động sẽ chảy xuống theo thời gian. Mỗi dịch vụ AI mà người Việt đang dùng hằng ngày, từ chatbot, công cụ dịch, trợ lý ảo tới các tính năng AI trong ứng dụng, đều chạy trên hạ tầng suy luận như thế này.
Khi Qualcomm, Nvidia và AMD cạnh tranh quyết liệt hơn ở tầng chip, chi phí vận hành mô hình có xu hướng giảm, và phần tiết kiệm đó dần phản ánh vào giá dịch vụ. Với doanh nghiệp Việt Nam đang cân nhắc triển khai AI, đây là tín hiệu tích cực: hạ tầng rẻ và đa dạng hơn đồng nghĩa rào cản chi phí thấp dần. Xu hướng này gắn chặt với làn sóng AI agents triển khai trong doanh nghiệp năm 2026, nơi chi phí suy luận là yếu tố quyết định bài toán có khả thi hay không.