Google Gemini 3.5 Pro: cửa sổ 2 triệu token và chế độ Deep Think
Google giới thiệu Gemini 3.5 Pro tại sự kiện I/O, mô hình AI đầu bảng mới với cửa sổ ngữ cảnh lên tới 2 triệu token, chế độ suy luận Deep Think và khả năng đa phương thức xử lý văn bản, hình ảnh, âm thanh và video. Mô hình dự kiến mở rộng trong tháng 6/2026, hứa hẹn nâng tầm cuộc đua AI với các đối thủ.
Gemini 3.5 Pro hướng tới ngữ cảnh siêu lớn và suy luận sâu. Nguồn: YouTube
Google công bố Gemini 3.5 Pro tại sự kiện I/O ngày 19/5/2026, dự kiến mở rộng trong tháng 6. Điểm nhấn gồm cửa sổ ngữ cảnh 2 triệu token, đủ để xử lý tài liệu rất dài và mã nguồn lớn; chế độ suy luận Deep Think dành cho các bài toán phức tạp; và khả năng đa phương thức kết hợp văn bản, hình ảnh, âm thanh và video. Mô hình cung cấp qua gói Pro 20 USD mỗi tháng và gói Ultra 250 USD mỗi tháng, trong đó Deep Think dành cho người dùng Ultra. Đây là bước tiến đáng chú ý của Google trong cuộc đua mô hình AI đầu bảng.
Google vừa giới thiệu Gemini 3.5 Pro tại sự kiện thường niên I/O, mô hình AI đầu bảng mới với loạt nâng cấp đáng chú ý. Điểm nhấn gồm cửa sổ ngữ cảnh lên tới 2 triệu token, chế độ suy luận Deep Think và khả năng đa phương thức xử lý văn bản, hình ảnh, âm thanh cùng video trong một lần. Mô hình dự kiến mở rộng cung cấp trong tháng 6/2026, hứa hẹn nâng tầm cuộc đua AI với các đối thủ như OpenAI và Anthropic.
| Công bố | Google I/O ngày 19/5/2026 |
| Cửa sổ ngữ cảnh | Lên tới 2 triệu token |
| Suy luận | Chế độ Deep Think cho bài toán phức tạp |
| Đa phương thức | Văn bản, ảnh, âm thanh, video |
| Gói tiếp cận | Pro 20 USD, Ultra 250 USD mỗi tháng |
| Trạng thái | Mở rộng dự kiến trong tháng 6/2026 |
Gemini 3.5 Pro có gì mới?
Theo công bố tại Google I/O ngày 19/5/2026, Gemini 3.5 Pro là mô hình đầu bảng mới nhất trong dòng Gemini của Google. Điểm gây chú ý nhất là cửa sổ ngữ cảnh lên tới 2 triệu token, một trong những mức lớn nhất trên thị trường. Khả năng này cho phép mô hình giữ và xử lý lượng thông tin khổng lồ cùng lúc, từ những tài liệu rất dài, mã nguồn lớn tới các cuộc hội thoại kéo dài mà không bị quên phần đầu.
Bên cạnh ngữ cảnh lớn, Gemini 3.5 Pro được trang bị chế độ suy luận Deep Think. Đây là hướng đi mà nhiều hãng đang theo đuổi, nơi mô hình dành nhiều công sức tính toán hơn để giải các bài toán phức tạp thay vì trả lời nhanh. Chế độ này hữu ích cho toán học, lập trình và các vấn đề cần lập luận nhiều bước, dù theo công bố nó được dành cho người dùng gói cao cấp.
Tổng quan về Gemini 3.5 Pro và các nâng cấp chính. Nguồn: YouTube
Cửa sổ ngữ cảnh siêu lớn dùng để làm gì?
Cửa sổ ngữ cảnh 2 triệu token mở ra nhiều ứng dụng thực tế. Với lượng thông tin lớn như vậy trong bộ nhớ làm việc, mô hình có thể đọc và phân tích cả một cuốn sách, một bộ tài liệu pháp lý dày hay toàn bộ một dự án phần mềm trong một lần, rồi trả lời câu hỏi xuyên suốt mà vẫn giữ được mạch logic. Đây là lợi thế rõ rệt so với các mô hình có ngữ cảnh nhỏ hơn, vốn phải chia nhỏ tài liệu và dễ mất liên kết.
Với lập trình viên, ngữ cảnh lớn giúp mô hình hiểu toàn bộ kiến trúc của một dự án thay vì chỉ vài tệp rời rạc, từ đó đưa ra gợi ý sát hơn và ít nhầm lẫn hơn. Với người làm nghiên cứu, phân tích hay nội dung, khả năng nạp cùng lúc nhiều nguồn dữ liệu giúp tổng hợp và đối chiếu thông tin nhanh hơn. Đây là lý do cửa sổ ngữ cảnh trở thành một trong những thông số được quan tâm nhất ở các mô hình AI hiện nay.
Giá, các gói đăng ký và bản Flash
Về cách tiếp cận, Google cung cấp Gemini 3.5 Pro qua các gói đăng ký người dùng, gồm gói Pro khoảng 20 USD mỗi tháng và gói Ultra khoảng 250 USD mỗi tháng. Đáng chú ý, chế độ Deep Think được dành cho người dùng gói Ultra cao cấp, trong khi gói Pro tiêu chuẩn vẫn được dùng mô hình nhưng không có tính năng suy luận sâu này. Với lập trình viên dùng qua API, giá dự kiến theo tỉ lệ quen thuộc, cao hơn nhiều lần so với bản Flash.
Trước Pro, Google đã ra mắt Gemini 3.5 Flash vào tháng 5/2026, phiên bản nhẹ, nhanh và rẻ hơn, phù hợp các tác vụ cần phản hồi nhanh ở quy mô lớn. Sự phân tầng giữa Flash và Pro cho phép người dùng chọn đúng công cụ theo nhu cầu và ngân sách, thay vì luôn dùng mô hình mạnh nhất và đắt nhất. Đây là chiến lược phổ biến giúp đưa AI vào nhiều ứng dụng với chi phí hợp lý hơn.
Ý nghĩa với cuộc đua AI
Gemini 3.5 Pro ra mắt giữa lúc cuộc đua mô hình AI đầu bảng nóng hơn bao giờ hết. Google cạnh tranh trực tiếp với các mô hình của OpenAI và Anthropic, trong khi các hãng khác như Microsoft cũng đẩy mạnh mô hình tự phát triển. Việc đua nhau nâng cấp ngữ cảnh, khả năng suy luận và đa phương thức cho thấy các hãng đang hướng tới những mô hình không chỉ trả lời tốt mà còn xử lý được tác vụ phức tạp và đa dạng dữ liệu.
Với sức mạnh tích hợp sâu vào hệ sinh thái Google, từ tìm kiếm, Workspace tới Android, Gemini 3.5 Pro có lợi thế tiếp cận hàng tỷ người dùng. Tuy nhiên, sức mạnh thực tế còn phụ thuộc vào trải nghiệm khi triển khai rộng và mức độ ổn định. Cuộc cạnh tranh giữa các mô hình hàng đầu cuối cùng có lợi cho người dùng, khi chất lượng tăng và giá có xu hướng hợp lý hơn theo thời gian. Để dùng các mô hình này hiệu quả, có thể tham khảo bài cách viết prompt AI hiệu quả.
Người dùng Việt Nam nên lưu ý gì?
Với người dùng Việt, Gemini 3.5 Pro hứa hẹn nâng cao trải nghiệm các tác vụ như soạn thảo, tóm tắt tài liệu dài, dịch thuật và hỗ trợ lập trình bằng tiếng Việt. Khi mô hình mở rộng chính thức, người dùng nên kiểm tra khả năng tiếp cận tại Việt Nam, chất lượng tiếng Việt và mức giá các gói để chọn phương án phù hợp. Với nhu cầu cơ bản, các bản nhẹ và miễn phí thường đã đủ dùng.
Quan trọng như mọi công cụ AI, người dùng nên kiểm chứng thông tin do mô hình tạo ra, đặc biệt với số liệu và nội dung quan trọng, và tránh nhập dữ liệu nhạy cảm. Việc làm quen với cách viết yêu cầu rõ ràng sẽ giúp khai thác tốt sức mạnh của các mô hình ngữ cảnh lớn như Gemini 3.5 Pro. LongTechVision sẽ cập nhật khi mô hình được mở rộng và có thêm thông tin chi tiết về khả năng thực tế.