AI · Dịch từ TechCrunch · 15/05/2026 · 📖 ...

Osaurus — server AI local cho Mac M-series: chạy LLM hoàn toàn offline, mã nguồn mở

Trong lúc Big Tech đua cloud AI hàng trăm tỷ USD, một startup nhỏ ra mắt Osaurus — server AI 10MB chạy native trên Apple Silicon, dùng MLX của Apple. Tất cả LLM chạy ngay trên Mac của bạn, không một byte dữ liệu nào rời máy. Đối thủ nặng ký nhất của Ollama 2026.

Osaurus local AI server Mac Apple Silicon MLX LLM offline

Ảnh: TechCrunch — Giao diện SwiftUI của Osaurus

Tóm tắt nhanh

Osaurus (osaurus-ai/osaurus) là app native macOS viết bằng Swift, chỉ 10MB, chạy LLM local hoàn toàn offline trên Apple Silicon M1+. Dùng MLX framework của Apple — nhanh hơn llama.cpp trên Mac. Mã nguồn mở MIT, 3.8k GitHub stars, 112,000+ downloads. OpenAI-compatible API endpoint — dễ thay thế ChatGPT trong code có sẵn. Hỗ trợ vừa local vừa cloud (OpenAI, Anthropic) qua một interface. Cần tối thiểu 64GB RAM để chạy mượt. Đối thủ trực tiếp của Ollama, LM Studio.

Theo TechCrunch (15/5/2026), Osaurus đang nhanh chóng trở thành "Ollama của Mac" — nhưng tốt hơn ở nhiều khía cạnh. Founder Terence Pae (cựu kỹ sư Tesla, Netflix) đã âm thầm phát triển Osaurus suốt năm qua sau khi nhận ra Mac M-series có tiềm năng chạy LLM mạnh hơn người ta nghĩ.

1. Osaurus là gì?

Osaurus là một server AI native cho macOS với những điểm khác biệt:

2. Tại sao đáng quan tâm?

1. Bảo mật tuyệt đối. Không một byte dữ liệu nào rời khỏi Mac của bạn. Phù hợp:

2. Không phải trả tiền theo token. Một lần mua Mac (đã có), không phí API mỗi tháng. Người dùng nặng ChatGPT Plus ($20/tháng) hoàn toàn có thể chuyển sang Osaurus + Llama 3 70B.

3. Hoạt động khi mất mạng. Đi tàu, máy bay, vùng sâu vùng xa — vẫn dùng AI bình thường.

3. Tính năng "Bridge" — vừa local vừa cloud

Đây là điểm khác biệt lớn nhất so với Ollama. Osaurus có chế độ "Bridge":

Đặc biệt hữu ích cho dev: build app AI mà không cần lo về fallback logic.

4. MLX — vũ khí bí mật của Apple

Osaurus chạy trên MLX — framework AI mà Apple công bố cuối 2023. Khác với llama.cpp (đa nền tảng), MLX:

Trong benchmark độc lập, Osaurus + MLX nhanh hơn 30% so với Ollama (dùng llama.cpp) trên cùng phần cứng M-series.

5. Yêu cầu phần cứng

Để chạy mượt model 70B (như Llama 3 70B), bạn cần:

Cho model nhỏ hơn (Llama 3 8B, Qwen 7B):

6. Mã nguồn mở và community

Osaurus open source MIT license:

Khi Apple công bố MLX, ai cũng nghĩ Apple sẽ làm Ollama riêng. Hoá ra, một developer độc lập đã làm trước — và còn tốt hơn.

Góc nhìn TechVision: ai nên dùng Osaurus?

1. Nếu bạn có Mac M-series: Nên thử ngay. Miễn phí, 10MB, không ảnh hưởng gì hệ thống. Cài xong vài phút là chạy được.

2. Nếu bạn là developer: Cực thích hợp để test app AI mà không tốn tiền API. Build prototype với Osaurus, sản xuất chuyển sang cloud.

3. Nếu bạn quan tâm bảo mật: Lựa chọn an toàn nhất. Ngay cả công ty bạn cấm dùng ChatGPT, Osaurus chạy local không bị phát hiện.

4. Nếu bạn dùng Windows/Linux: Osaurus không hỗ trợ. Hãy dùng Ollama hoặc LM Studio.

Cách cài đặt nhanh

Cách 1 — tải app:

  1. Vào github.com/osaurus-ai/osaurus/releases
  2. Tải file .dmg mới nhất
  3. Cài như app Mac thường
  4. Mở app, chọn model trong list (Llama 3, Qwen, Mistral...) — tự download
  5. Bắt đầu chat ngay trong app, hoặc gọi qua API localhost:11434

Cách 2 — qua Homebrew:

brew install --cask osaurus

Người Việt nên thử để hiểu AI local — cuộc đua 2026 không chỉ là cloud, mà cả on-device.

Bài gốc tiếng Anh
Osaurus brings both local and cloud AI models to your Mac
techcrunch.com
Nguyễn Tấn Thiên Long
Nguyễn Tấn Thiên Long
Biên tập viên · Tech Reviewer

Theo dõi công nghệ quốc tế từ năm 2018. Chuyên tổng hợp và dịch tin AI, smartphone, phần cứng từ các nguồn uy tín như TechCrunch, MacRumors, The Verge, CNBC.

← Quay lại Tech News techvision.click