Bạn đang tìm cách gọi API của các model AI lớn mà không tốn một đồng nào? Tin vui là điều đó hoàn toàn khả thi và OpenRouter chính là “cầu nối” đang được hàng trăm nghìn lập trình viên, nhà nghiên cứu và người dùng cá nhân trên toàn thế giới tin dùng. Vậy cụ thể cách dùng miễn phí API LLM trên OpenRouter như thế nào? Cùng Tino tìm hiểu qua bài viết dưới đây nhé!
Tại sao OpenRouter lại có gói miễn phí?
Trước khi vào hướng dẫn, hiểu rõ “tại sao lại miễn phí” sẽ giúp bạn dùng đúng cách và không bị bất ngờ về giới hạn.
OpenRouter không tự nhiên “cho không” mà nền tảng này đang tài trợ chi phí vận hành cho một số model với mục tiêu rõ ràng: mở rộng cộng đồng người dùng, thu thập dữ liệu sử dụng để cải thiện hệ thống định tuyến và xây dựng hệ sinh thái lâu dài. Một số model miễn phí chạy trên hạ tầng của các nhà nghiên cứu hoặc đối tác, trong khi số khác được OpenRouter trực tiếp bù chi phí.

Điều quan trọng cần nhớ: miễn phí không có nghĩa là kém chất lượng. Nhiều model trong danh sách free tier của OpenRouter là các model mã nguồn mở hàng đầu thế giới như DeepSeek, Llama , Qwen — hoàn toàn đủ sức phục vụ các tác vụ thực tế.
Khi nào nên dùng API LLM miễn phí trên OpenRouter?
API LLM miễn phí phù hợp nhất trong các trường hợp sau:
- Học cách gọi API AI.
- Test chatbot hoặc AI Agent ở giai đoạn đầu.
- Xây dựng prototype cho workflow tự động hóa.
- Kiểm tra prompt trước khi chuyển sang model trả phí.
- Tạo công cụ nội bộ với tần suất sử dụng thấp.
- Thử nghiệm nhiều model khác nhau để so sánh chất lượng phản hồi.
Các model miễn phí nổi bật trên OpenRouter
Tính đến tháng 5/2026, OpenRouter cung cấp hơn 30 model miễn phí và danh sách này đang liên tục được mở rộng. Nhận diện model miễn phí rất đơn giản: Bạn chỉ cần nhập từ khóa “free” vào ô. Danh sách các model miễn phí với đuôi (free) sẽ hiện ra.
ID của các model này sẽ kết thúc bằng :free, ví dụ deepseek/deepseek-v4-flash:free.
Dưới đây là những cái tên đáng chú ý nhất (cập nhật trực tiếp từ openrouter.ai/collections/free-models):
| Mô hình | ID trên OpenRouter | Context | Điểm mạnh |
|---|---|---|---|
| OpenRouter Owl Alpha | openrouter/owl-alpha | 1.05M | Agent, tool use, marketing, SEO, lập trình — đứng #1 marketing |
| NVIDIA Nemotron 3 Super 120B | nvidia/nemotron-3-super-120b-a12b:free | 1M | Đa tác nhân, lập trình, suy luận phức tạp |
| Poolside Laguna M.1 | poolside/laguna-m.1:free | 131K | Lập trình chuyên sâu, agentic coding |
| OpenAI gpt-oss-120b | openai/gpt-oss-120b:free | 131K | Suy luận cao, đa năng, tool use |
| DeepSeek V4 Flash | deepseek/deepseek-v4-flash:free | 1.05M | Chat nhanh, lập trình, context siêu dài |
| MiniMax M2.5 | minimax/minimax-m2.5:free | 205K | Năng suất văn phòng, Word/Excel/PPT, duyệt web |
| Z.ai GLM 4.5 Air | z-ai/glm-4.5-air:free | 131K | Roleplay, lập trình, tiếng Trung, có chế độ “thinking” |
| Poolside Laguna XS.2 | poolside/laguna-xs.2:free | 131K | Agentic coding nhỏ gọn, nhanh |
| NVIDIA Nemotron 3 Nano 30B | nvidia/nemotron-3-nano-30b-a3b:free | 256K | Agent chuyên biệt, nhẹ, hiệu quả cao |
| Arcee AI Trinity Large Thinking | arcee-ai/trinity-large-thinking:free | 262K | Suy luận, agentic, lập trình |
| OpenAI gpt-oss-20b | openai/gpt-oss-20b:free | 131K | Nhẹ, tool use, lập trình, triển khai GPU đơn |
| Baidu CoBuddy | baidu/cobuddy:free | 131K | Sinh code, AI agent, thông lượng cao |
| NVIDIA Nemotron 3 Nano Omni | nvidia/nemotron-3-nano-omni-30b-a3b-reasoning:free | 300K | Đa phương thức (text + ảnh + video + audio) |
Lưu ý quan trọng: Danh sách model miễn phí thay đổi thường xuyên. Một số model quen thuộc từ trước như Llama 4 Scout, Qwen3, DeepSeek R1 vẫn có thể xuất hiện lại.
Giới hạn của gói miễn phí cần biết
Sử dụng miễn phí đồng nghĩa với việc bạn cần hiểu rõ giới hạn để tránh bị gián đoạn bất ngờ.
Giới hạn mặc định cho tài khoản chưa nạp tiền:
- 50 requests/ngày đối với toàn bộ các model miễn phí cộng lại
- 20 requests/phút tối đa
Nếu bạn đã từng nạp ít nhất 10 USD credit (dù chỉ một lần):
- Giới hạn tăng lên 1.000 requests/ngày
- Tốc độ vẫn giữ nguyên 20 requests/phút

Điểm cần lưu ý thực tế:
- Model miễn phí không có cam kết SLA (Service Level Agreement) — tức là không đảm bảo thời gian phản hồi hay độ ổn định
- Trong giờ cao điểm, một số model có thể chậm hoặc tạm thời không khả dụng
- Danh sách model miễn phí có thể thay đổi bất kỳ lúc nào
Mẹo xử lý giới hạn: Khi một model trả về lỗi 429 (quá nhiều yêu cầu), hãy chuyển sang model miễn phí khác trong danh sách. Vì giới hạn được tính theo từng model, luân chuyển giữa các model giúp bạn có thêm nhiều lượt dùng trong ngày.
Cách lấy API Key miễn phí của OpenRouter
Để các ứng dụng bên thứ ba giao tiếp được với hệ thống máy chủ của OpenRouter, bạn cần một “chìa khóa” gọi là API Key. Quy trình tạo API Key diễn ra rất nhanh chóng, bạn có thể tham khảo bài viết: OpenRouter là gì? Hướng dẫn cách lấy API Key của OpenRouter A-Z
Tóm tắt 4 bước:
Bước 1: Truy cập openrouter.ai và nhấn Sign Up. Bạn có thể đăng ký bằng tài khoản Google hoặc email.
Bước 2: Sau khi đăng nhập, vào mục Dashboard → API Keys.
Bước 3: Nhấn Create Key, đặt tên dễ nhớ (ví dụ: “my-free-key”), sau đó sao chép key vừa tạo.
Bước 4: Lưu key này ở nơi an toàn vì key chỉ hiển thị một lần duy nhất. Đừng chia sẻ key với bất kỳ ai và không đưa thẳng vào code public trên GitHub.
Cách dùng miễn phí API LLM trên OpenRouter
Lấy ID model miễn phí
Bước 1: Truy cập https://openrouter.ai/models và nhập từ khóa “free” vào ô tìm kiếm.
Bước 2: Danh sách các model đang miễn phí sẽ xuất hiện, bạn nhấn nút copy kế bên để sao chép ID:

Nhấn vào model đó để xem thông số chi tiết.

Ngoài ra, OpenRouter hỗ trợ endpoint chat completions tại:
https://openrouter.ai/api/v1/chat/completions
Hướng dẫn kết nối model miễn phí của OpenRouter với các công cụ AI
Sử dụng trên OpenClaw của Tino (ví dụ minh họa)
Bước 1: Truy cập trang quản trị VPS OpenClaw tại Tino.vn
Bước 2: Chọn mục Cấu hình AI. Sau đó, nhấn nút Thêm tại phần Custom Providers.

Bước 3: Nhập các thông tin sau:
- Model: Nhập ID model miễn phí trên OpenClaw mà bạn đã lấy ở phần trên.
- Tên hiển thị (tùy chọn): Đặt tên cho Custom Providers này để dễ quản lý.
- Endpoint URL: https://openrouter.ai/api/v1/chat/completions
- API Key: Nhập API Key bạn đã tạo trên OpenRouter.

Bước 4: Nhấn Tạo Custom Providers.
Sử dụng trên Hermes Agent (ví dụ minh họa)
Bước 1: Truy cập Hermes Agent qua SSH VPS rồi nhập lệnh sau:
hermes model
Bước 2: Chọn Provider là OpenRouter.

Bước 3: Nhập API Key của bạn.

Bước 4: Chọn model miễn phí được đề xuất hoặc di chuyển xuống mục Enter custom model name để nhập model cụ thể.

Ví dụ:

Bước 5: Gõ hermes status để kiểm tra.

Mẹo tối ưu khi dùng API miễn phí trên OpenRouter
- Luôn kiểm tra danh sách mô hình miễn phí mới nhất: Danh sách free model thay đổi thường xuyên. Truy cập openrouter.ai/collections/free-models để xem danh sách cập nhật.
- Viết prompt ngắn gọn và rõ ràng: Model miễn phí có rate limit theo số lượng request, không phải theo token. Vì vậy, thay vì gửi nhiều câu hỏi nhỏ, hãy gộp thành một prompt đầy đủ để tiết kiệm lượt gọi.
- Đặt mô hình dự phòng trong code: Khi một model trả lỗi 429, code của bạn nên tự động thử sang mô hình miễn phí khác thay vì dừng lại hoàn toàn.
- Dùng openrouter/free khi không cần kiểm soát model: ID này tự động chọn mô hình phù hợp từ danh sách free — rất tiện khi bạn không quan tâm đến loại model cụ thể.
- Tránh dùng free tier cho môi trường production: Free model không có SLA và danh sách có thể thay đổi. Nếu ứng dụng của bạn cần ổn định, hãy nạp credit và dùng phiên bản trả phí.
- Theo dõi usage trong Dashboard Vào openrouter.ai/activity: để xem lịch sử gọi API, biết mình đã dùng bao nhiêu request trong ngày và điều chỉnh kịp thời.
Kết luận
OpenRouter đã biến điều tưởng như khó tiếp cận – gọi API của các mô hình AI hàng đầu thế giới — thành điều ai cũng có thể thực hiện chỉ với một tài khoản email. Hãy lấy API key ngay hôm nay, thử gọi một mô hình miễn phí đầu tiên, và tự mình cảm nhận sức mạnh của AI không còn nằm sau bức tường phí. Khi dự án của bạn lớn dần và cần độ ổn định cao hơn, việc chuyển sang gói trả phí của OpenRouter cũng rất linh hoạt.
OpenRouter có gói miễn phí vĩnh viễn — không phải thử nghiệm có thời hạn. Bạn không cần nhập thẻ tín dụng để đăng ký và sử dụng các mô hình miễn phí. Giới hạn 50 request/ngày áp dụng cho tài khoản chưa nạp tiền; nếu đã từng nạp ít nhất 10 USD, giới hạn tăng lên 1.000 request/ngày.
OpenRouter mã hóa toàn bộ giao tiếp API qua HTTPS. Về chính sách dữ liệu, bạn nên đọc kỹ trang Privacy Policy của OpenRouter tại openrouter.ai/privacy để hiểu rõ cách dữ liệu được xử lý, đặc biệt trước khi gửi thông tin nhạy cảm qua API.
Về mặt kỹ thuật là có thể, nhưng không khuyến khích. Free tier không có cam kết uptime, danh sách mô hình có thể thay đổi bất ngờ, và rate limit khá thấp (50 request/ngày mặc định). Với sản phẩm cần phục vụ người dùng thực tế, hãy dùng phiên bản trả phí để đảm bảo độ ổn định.
Không hẳn. Các mô hình như DeepSeek R1, Llama 4, Qwen3 trong danh sách miễn phí đều là mô hình mã nguồn mở chất lượng cao — bạn đang dùng đúng bộ trọng số đó, chỉ có điều bị giới hạn về số lượng request. Sự khác biệt chủ yếu là tốc độ phản hồi và độ ổn định, không phải chất lượng đầu ra của mô hình.
OpenRouter có thực sự miễn phí không, hay chỉ là dùng thử?
Dùng API OpenRouter miễn phí có an toàn không? Dữ liệu của tôi có bị lưu lại không?
Tôi có thể dùng API OpenRouter miễn phí để xây dựng sản phẩm thương mại không?
Mô hình miễn phí trên OpenRouter có kém hơn mô hình trả phí không?
