Một trong những rào cản lớn nhất khi sử dụng OpenClaw chính là chi phí API Key. Với mỗi yêu cầu gửi đi, tiền lại bị tính — và nếu bạn làm việc nhiều, con số đó tích lũy nhanh hơn bạn nghĩ. Nhưng thực tế là bạn hoàn toàn có thể vận hành OpenClaw gần như miễn phí nếu biết cách kết hợp đúng công cụ. Trong bài viết này, Tino sẽ hướng dẫn bạn sử dụng nhiều model AI miễn phí trên OpenClaw bằng cách kết hợp Kyma API và 9Router.
Tổng quan về Kyma API và 9Router
Kyma API là gì?
Kyma API (kymaapi.com) là một API gateway AI mã nguồn mở, cho phép bạn truy cập hơn 20 mô hình ngôn ngữ lớn (LLM) mã nguồn mở miễn phí chỉ thông qua một endpoint duy nhất và một API Key duy nhất.
Thay vì phải đăng ký riêng lẻ từng nhà cung cấp như Google, Meta, Alibaba… và quản lý hàng loạt API Key khác nhau, Kyma API gom tất cả lại, cho phép bạn gọi bất kỳ model nào chỉ bằng cách thay đổi tên model trong câu lệnh.

Một số tính năng nổi bật của Kyma API:
- Hơn 20 model mã nguồn mở hàng đầu: Llama 4, Qwen 3, Gemma 4, Kimi K2, Gemini Flash, GPT-OSS và nhiều hơn nữa.
- Tương thích OpenAI SDK: Hoạt động với bất kỳ công cụ nào hỗ trợ OpenAI-compatible API — bao gồm OpenClaw, Cursor, Claude Code, LangChain.
- Auto-failover tích hợp sẵn: Nếu một nhà cung cấp bị lỗi hoặc quá tải, Kyma tự động thử lại trên nhà cung cấp khác trong vòng dưới 200ms — hoàn toàn trong suốt với người dùng.
- Miễn phí để bắt đầu: Kyma cấp sẵn $0.50 credit miễn phí khi đăng ký, không cần thẻ tín dụng. Với các model nhỏ như Gemma 4 26B MoE hay Llama 3.1 8B, bạn có thể xử lý hàng triệu token với chi phí gần như bằng 0.
- Endpoint đơn giản: https://kymaapi.com/v1 — không cần cấu hình phức tạp.
9Router là gì?
9Router (https://9router.com/) là một proxy AI mã nguồn mở, đứng giữa các công cụ AI như OpenClaw và các nhà cung cấp API. Thay vì OpenClaw chỉ kết nối với một nguồn API duy nhất, 9Router đóng vai trò điều phối: nhận yêu cầu từ OpenClaw, rồi tự động quyết định chuyển đến nhà cung cấp nào phù hợp nhất tại thời điểm đó.
Tính năng nổi bật của 9Router:
- Kết nối hơn 40 nhà cung cấp AI trong một điểm quản lý duy nhất.
- Tự động chuyển dự phòng (Auto-failover): Khi một nguồn hết quota hoặc gặp lỗi, 9Router chuyển sang nguồn khác ngay lập tức, không gián đoạn công việc.
- Combo model & Round Robin: Gom nhiều model lại, phân bổ request luân phiên để tận dụng tối đa hạn mức miễn phí.
- Dashboard thống kê chi tiết: Xem trạng thái từng request, quota còn lại, nhà cung cấp nào được gọi.
- Tương thích rộng: Hoạt động tốt trên Windows, macOS, Linux với hầu hết công cụ AI hiện nay.

Hướng dẫn sử dụng nhiều model AI miễn phí trên OpenClaw với Kyma API và 9Router
Bước 1: Cài đặt 9Router trên VPS
Truy cập VPS của bạn qua SSH. Tại cửa sổ dòng lệnh, chạy lần lượt hai lệnh sau để cài đặt và khởi chạy 9Router:
npm install -g 9router
9router

Khi menu cấu hình hiện ra, dùng phím điều hướng chọn mục Hide to Tray Background để 9Router hoạt động ngầm trong suốt quá trình thao tác với máy chủ sau này.

Bước 2: Mở SSH Tunnel để truy cập Web UI của 9Router
Để truy cập giao diện quản trị của 9Router một cách an toàn từ máy tính cá nhân, bạn cần thiết lập một luồng chuyển tiếp cổng.
Mở terminal trên máy tính của bạn (ví dụ: Windows PowerShell) — không phải trên VPS — và chạy lệnh:
ssh -L 20128:localhost:20128 root@ip-vps -N
Thay ip-vps bằng địa chỉ IP thực của VPS. Nhập mật khẩu VPS khi được yêu cầu.

Sau khi tunnel được mở, truy cập giao diện Web UI của 9Router tại địa chỉ: http://localhost:20128
Lưu ý quan trọng: Bạn có thể đóng cửa sổ 9Router, thoát SSH VPS nhưng tuyệt đối không đóng cửa sổ terminal này trong suốt quá trình làm việc. Nếu đóng, kết nối giữa máy tính và VPS sẽ bị ngắt, OpenClaw sẽ mất kết nối với 9Router.
Bước 3: Lấy API Key từ Kyma API
Truy cập kymaapi.com, đăng ký tài khoản bằng email và mật khẩu.

- Hệ thống sẽ cấp ngay một API Key có dạng kyma-xxxxxxxxxx.
- Base URL của Kyma API sẽ là: https://kymaapi.com/v1

Hãy lưu lại 2 thông tin này.
Bước 4: Thêm Kyma API làm Provider trên 9Router
Trên giao diện Web UI của 9Router tại http://localhost:20128, vào mục Providers trên thanh điều hướng bên trái -> Chọn mục + Add OpenAI Compatible

Điền các thông tin cần thiết như sau:
- Name: kyma-api (hoặc tên bạn muốn đặt)
- Prefix: kyma (hoặc tên bạn muốn đặt)
- Base URL: https://kymaapi.com/v1
- API Key: Dán chuỗi key ky-xxxxxxxxxx đã lấy ở Bước 3
Nhấn nút Check, nếu thấy hiển thị thông báo Valid màu xanh nghĩa là API khả dụng. Sau đó, nhấn Create để tạo.

Tuy nhiên, lúc này vẫn chưa thật sự kết nối Kyma API với 9Router. Sau khi được đưa về giao diện Provider, bạn lại nhấp vào Provider Kyma vừa tạo.

Tiếp theo, nhấn + Add và nhập các thông tin sau:
- Name: kyma-api (hoặc tên bạn muốn đặt)
- API Key: Nhập lại key đã lấy trước đó.
Nhấn Save để lưu.

Bước 5: Thêm các model từ Kyma vào 9Router
Vẫn tại phần cấu hình Kyma trên giao diện 9Router, cuộn xuống khu vực Available Models và nhập định danh model bạn muốn dùng -> nhấn Add.

Bạn có thể chuyển qua trang Models của Kyma để copy chính xác định danh.

Bước 6: Tạo Combos trên 9Router
Tính năng Combo trên 9Router cho phép bạn gom nhiều model lại thành một nhóm. Khi OpenClaw gửi request đến tên Combo, 9Router tự động phân bổ luân phiên sang các model trong nhóm — giúp tận dụng tối đa hạn mức miễn phí của từng nguồn.
Tạo nhóm Combo mới
Trên thanh điều hướng bên trái của 9Router, chuyển sang thẻ Combos. Nhấn nút + Create Combo.

Điền tên cho Combo tại trường Combo Name, ví dụ: kyma-free-combo.
Nhấn + Add Model để lần lượt thêm các model bạn đã khai báo ở Phần 1 vào nhóm, ví dụ:
- llama-3.3-70b
- qwen-3-32b
- gemma-4-26b-moe
- kimi-k2
Sau khi thêm đủ model, nhấn Create để khởi tạo Combo.

Kích hoạt cơ chế luân phiên Round Robin
Trong danh sách Combos vừa tạo, tìm công tắc Round Robin và chuyển sang trạng thái bật. Khi Round Robin được kích hoạt, 9Router sẽ tự động chia đều các yêu cầu từ OpenClaw sang lần lượt từng model trong nhóm, đảm bảo không model nào bị quá tải và tận dụng tối đa quota miễn phí từ mỗi nguồn.

Tạo API Key cho OpenClaw trên 9Router
Trên giao diện 9Router, vào mục Endpoint, tìm khu vực API Keys và nhấn + Create Key. Khi hệ thống sinh ra chuỗi key mới, nhấn Copy và lưu lại.
Đây là API Key nội bộ của 9Router — bạn sẽ dùng chuỗi này khi khai báo vào OpenClaw ở Phần 3.


Ghi lại hai thông tin quan trọng:
- API Key: Chuỗi key vừa tạo từ 9Router
- Base URL: http://localhost:20128/v1 (sau này localhost sẽ được thay bằng địa chỉ IP VPS của bạn)

Bước 7: Kết nối 9Router với OpenClaw trên VPS
Trên cửa sổ dòng lệnh đang điều khiển OpenClaw ở VPS, nhập lệnh tương ứng với cách bạn cài OpenClaw:
- Cài đặt trực tiếp:
openclaw config
- Cài đặt qua Docker:
./scripts/docker/setup.sh
Tại danh sách nhà cung cấp hiện ra, chọn Custom Provider.

Hệ thống sẽ lần lượt hỏi bạn các thông tin sau:
- API Base URL: Nhập địa chỉ trỏ về VPS kèm cổng của 9Router (http://ip-vps:20128/v1)
- API Key: Chọn Paste API key now, sau đó dán chuỗi API Key nội bộ đã tạo từ 9Router ở bước trên.

Chọn chuẩn tương thích là OpenAI-compatible.

Nhập Model ID là tên Combo đã tạo ở Bước 6

Đặt tên nhận diện cho kết nối này tại phần Endpoint ID, ví dụ: 9router-kyma
Nhấn Enter để xác nhận. Bạn có thể bỏ qua phần Model Alias và nhấn Enter lần nữa, OpenClaw đã được liên kết thành công với 9Router và Kyma API.

Các cấu hình như Kênh nhắn tin, Skills,…bạn có thể chọn Skip for now để sử dụng lại cấu hình cũ.
Bước 8: Tùy chỉnh tham số trong Web Control của OpenClaw
Truy cập giao diện quản trị Web của OpenClaw. Vào mục AI & Agents ở menu bên trái, chuyển sang thẻ Models. Tại đây bạn sẽ thấy provider 9router-kyma vừa tạo.

Kéo xuống khu vực Context Window tăng thông số lên 200000 để khai thác tối đa khả năng đọc hiểu ngữ cảnh dài của các model, đồng thời tránh lỗi “100% context used” giữa chừng.

Nhấn Save ở góc trên để lưu lại toàn bộ thay đổi. Nếu sau khi Save vẫn gặp lỗi, hãy restart OpenClaw bằng lệnh:
docker compose restart
Bước 9: Chọn model Combo để bắt đầu chat
Chuyển sang giao diện Chat chính của OpenClaw. Tại thanh menu chọn model, tìm và chọn kyma-free-combo – 9router-kyma.

Từ đây, mỗi khi bạn gửi tin nhắn, 9Router sẽ tự động luân phiên request sang các model Llama, Qwen, Gemma, Kimi… trong nhóm Combo — tận dụng hết hạn mức miễn phí từ Kyma API một cách thông minh và liền mạch.

Kiểm tra bên kênh nhắn tin:

Bạn có thể quản lý mức sử dụng token trong phần Usage trên 9Router:

Kết bài
Chỉ với vài bước thiết lập ban đầu, bạn đã sở hữu một hệ thống AI agent hoàn chỉnh trên VPS mà không bị ràng buộc bởi một model hay một nhà cung cấp duy nhất. Sự kết hợp giữa Kyma API, 9Router và OpenClaw tạo nên một kiến trúc linh hoạt: Kyma cung cấp quyền truy cập vào hơn 20 model hàng đầu qua một endpoint đơn giản, 9Router điều phối và phân tải thông minh giữa các nguồn, còn OpenClaw là nơi bạn trực tiếp làm việc và ra lệnh cho AI.
Quan trọng hơn, toàn bộ quy trình này có thể vận hành gần như miễn phí — phù hợp cho cả cá nhân, nhóm nhỏ, lẫn doanh nghiệp đang muốn khai thác sức mạnh của AI agent mà không bị áp lực chi phí API mỗi tháng. Chúc bạn thiết lập thành công và tận hưởng trải nghiệm AI không giới hạn!
Những câu hỏi thường gặp
Kyma API có hoàn toàn miễn phí không?
Kyma API cung cấp hạn mức miễn phí cho rất nhiều mô hình AI khác nhau. Tuy nhiên, người dùng cần kiểm tra kỹ quy định và giới hạn tốc độ của từng mô hình trên hệ thống Kyma để tránh tình trạng vượt quá định mức và bị từ chối yêu cầu.
Tại sao nên dùng 9Router thay vì kết nối Kyma trực tiếp vào OpenClaw?
Việc kết nối trực tiếp rất dễ bị gián đoạn khi một mô hình đạt đến giới hạn số lượng yêu cầu miễn phí. 9Router giúp tự động chuyển đổi sang các mô hình dự phòng khác, đảm bảo quá trình phát triển mã nguồn diễn ra liên tục mà không cần can thiệp thay đổi cấu hình thủ công.
Tính năng Round Robin trên 9Router hoạt động ra sao?
Round Robin thực hiện phân bổ luân phiên các yêu cầu từ OpenClaw đến danh sách các API Key hoặc danh sách mô hình đã thiết lập trong phần Combos. Cách thức này giúp dàn đều tải lượng, tối ưu hóa triệt để việc khai thác các giới hạn miễn phí từ Kyma.
Cần cấu hình máy chủ ảo VPS như thế nào để chạy 9Router?
9Router là một ứng dụng rất nhẹ và không tiêu tốn nhiều tài nguyên hệ thống. Một VPS cơ bản với 4GB RAM và 2 CPU là hoàn toàn đủ khả năng để duy trì tiến trình hoạt động ổn định và xử lý hàng nghìn yêu cầu mỗi ngày.
