Microsoft tự làm 7 model MAI: thoát phụ thuộc OpenAI, đối đầu ChatGPT
Tại hội nghị Build 2026, Microsoft công bố 7 model AI tự huấn luyện mang thương hiệu MAI, dẫn đầu là model suy luận MAI-Thinking-1. Đây là bước chuyển lớn từ chỗ thuê model của OpenAI sang tự sở hữu model, đưa AI riêng vào Copilot, VS Code, PowerPoint và Azure.
CEO Microsoft AI Mustafa Suleyman giới thiệu dàn model MAI tại Build 2026. Nguồn: YouTube
Ngày 2/6/2026 tại Build 2026, Microsoft công bố 7 model AI tự huấn luyện họ MAI, do CEO Microsoft AI Mustafa Suleyman dẫn dắt. Đầu tàu là MAI-Thinking-1, model suy luận kiến trúc Mixture-of-Experts với khoảng 35 tỷ tham số kích hoạt trên tổng 1 nghìn tỷ, ngữ cảnh 256K token, huấn luyện từ đầu, không chưng cất từ model bên thứ ba. Kèm theo là MAI-Code-1-Flash (lập trình, rẻ), MAI-Voice-2 (giọng nói 15+ ngôn ngữ), MAI-Image-2.5 và MAI-Transcribe-1.5 (phiên âm 43 ngôn ngữ). Tất cả lên Microsoft Foundry và tích hợp Copilot, VS Code, PowerPoint. Đây là nước cờ giảm phụ thuộc OpenAI.
Microsoft công bố 7 model MAI tự làm
Tại hội nghị Build 2026 ngày 2/6, Microsoft trình làng 7 model trí tuệ nhân tạo do chính bộ phận Microsoft AI tự huấn luyện, mang thương hiệu MAI. Dàn model trải dài các mảng văn bản, lập trình, hình ảnh, giọng nói và phiên âm, được đưa lên nền tảng Microsoft Foundry cho nhà phát triển và tích hợp thẳng vào các sản phẩm chủ lực như Copilot, VS Code và PowerPoint.
Người dẫn dắt là Mustafa Suleyman, CEO Microsoft AI và đồng sáng lập DeepMind trước đây. Thông điệp xuyên suốt buổi công bố là Microsoft muốn tự chủ về model thay vì chỉ dựa vào đối tác, với mục tiêu dài hạn được hãng gọi là trí tuệ siêu việt phục vụ con người.
Microsoft công bố dàn model MAI tại Build 2026. Nguồn: YouTube
MAI-Thinking-1: model suy luận chủ lực
Ngôi sao của đợt công bố là MAI-Thinking-1, model suy luận đầu bảng của Microsoft. Model dùng kiến trúc Mixture-of-Experts thưa, với khoảng 35 tỷ tham số kích hoạt trên tổng khoảng 1 nghìn tỷ tham số, và cửa sổ ngữ cảnh lên tới 256.000 token. Kiến trúc này cho phép model lớn nhưng chỉ kích hoạt một phần chuyên gia phù hợp cho mỗi truy vấn, giúp cân bằng giữa năng lực và chi phí vận hành.
Điểm Microsoft nhấn mạnh nhất là cách huấn luyện. MAI-Thinking-1 được huấn luyện từ đầu trên dữ liệu doanh nghiệp có bản quyền thương mại, và quan trọng là không chưng cất từ model của bên thứ ba. Trong bối cảnh nhiều model bị nghi học lại từ đối thủ, tuyên bố này nhằm khẳng định model thực sự là tài sản trí tuệ riêng của Microsoft. Hiện MAI-Thinking-1 đang ở giai đoạn xem trước riêng tư.
| Công bố | Build 2026, ngày 2/6/2026 |
| MAI-Thinking-1 | Suy luận, MoE ~35 tỷ kích hoạt / ~1 nghìn tỷ tổng, 256K context |
| MAI-Code-1-Flash | Lập trình, 5 tỷ tham số kích hoạt, đang lên GitHub Copilot và VS Code |
| MAI-Voice-2 | Chuyển văn bản thành giọng nói, nhân bản giọng, 15+ ngôn ngữ |
| MAI-Image-2.5 | Tạo và chỉnh sửa ảnh, kèm chỉnh ảnh sang ảnh |
| MAI-Transcribe-1.5 | Phiên âm, mở rộng lên 43 ngôn ngữ |
| Nơi dùng | Microsoft Foundry, Copilot, VS Code, PowerPoint, Azure |
Microsoft cũng đang đẩy mạnh bộ công cụ lập trình của mình, được nói tới trong bài Microsoft Build 2026: Copilot+ Phase 2, Windows AI Studio 2.0 và GitHub Copilot Workspace.
Dàn model chuyên biệt: Code, Voice, Image, Transcribe
Bên cạnh MAI-Thinking-1, Microsoft tung loạt model chuyên biệt nhắm vào từng tác vụ. MAI-Code-1-Flash là model lập trình gọn với 5 tỷ tham số kích hoạt, được mô tả là ngang tầm các model nhỏ phổ biến nhưng rẻ hơn, và đang được triển khai trong GitHub Copilot cùng VS Code để gợi ý và sinh mã.
MAI-Voice-2 nâng cấp khả năng chuyển văn bản thành giọng nói, bổ sung nhân bản giọng và mở rộng lên hơn 15 ngôn ngữ. MAI-Image-2.5 cải thiện tạo ảnh và thêm tính năng chỉnh ảnh sang ảnh. MAI-Transcribe-1.5 mở rộng phiên âm lên 43 ngôn ngữ. Phần lớn các model này đã âm thầm chạy trong Copilot, Bing, PowerPoint và dịch vụ giọng nói của Azure trước khi được công bố chính thức và mở cho nhà phát triển trên Foundry.
Phân tích chiến lược model riêng của Microsoft. Nguồn: YouTube
Vì sao Microsoft tự làm: thoát phụ thuộc OpenAI
Suốt nhiều năm, Microsoft và OpenAI là cặp đôi gắn bó: Microsoft rót hàng chục tỷ USD, đổi lại độc quyền tích hợp model GPT vào sản phẩm. Nhưng phụ thuộc vào một nhà cung cấp duy nhất cũng đi kèm rủi ro về chi phí, lộ trình và quyền kiểm soát. Tự làm dàn model MAI giúp Microsoft chủ động hơn, tối ưu model cho chính nhu cầu của Copilot và Office, và giảm hóa đơn vận hành model khổng lồ.
Đây không chỉ là chuyện kỹ thuật mà là chuyện chiến lược. Khi các hãng lớn như Microsoft, Google và Amazon đều muốn tự chủ model lõi, cuộc đua AI dịch chuyển từ ai có model tốt nhất sang ai kiểm soát được cả chuỗi từ model tới sản phẩm tới hạ tầng. OpenAI vẫn là đối tác quan trọng của Microsoft, nhưng cán cân đang dần thay đổi.
Cùng lúc, sức ép cạnh tranh và chi phí cũng đến từ phía các model giá rẻ. Bức tranh các phòng lab AI đua nhau về giá và năng lực được phản ánh trong bài OpenAI bắt tay Dell đưa Codex vào doanh nghiệp.
Tổng quan phản ứng quanh dàn model MAI. Nguồn: YouTube
Ý nghĩa với người dùng và Việt Nam
Với người dùng phổ thông, thay đổi diễn ra phần lớn ở hậu trường. Khi gõ lệnh trong Word, tạo ảnh trong PowerPoint hay nhờ Copilot viết mã, nhiều khả năng tác vụ đó đang chạy trên một model MAI thay vì GPT, mà người dùng không cần để ý. Lợi ích kỳ vọng là tốc độ và chi phí tốt hơn, kéo theo giá dịch vụ AI dễ chịu hơn theo thời gian.
Với người dùng Việt Nam, đáng chú ý nhất là MAI-Transcribe-1.5 hỗ trợ 43 ngôn ngữ và MAI-Voice-2 hơn 15 ngôn ngữ. Nếu tiếng Việt nằm trong danh sách hỗ trợ tốt, các tính năng phiên âm cuộc họp, lồng tiếng và trợ lý giọng nói trong bộ Office sẽ hữu ích cho công việc hằng ngày. Microsoft chưa công bố chi tiết mức hỗ trợ tiếng Việt, đây là điểm cần theo dõi.
LongTechVision sẽ cập nhật khi MAI-Thinking-1 ra khỏi giai đoạn xem trước và khi Microsoft công bố thêm về hiệu năng, giá cùng mức hỗ trợ tiếng Việt của dàn model MAI.