Trong thế giới AI đang thay đổi từng ngày, Nous Research nổi lên như một cái tên đáng chú ý không chỉ vì những mô hình ngôn ngữ mạnh mẽ và framework Hermes Agent, mà còn vì cách tiếp cận thân thiện với cả lập trình viên lẫn người dùng phổ thông. Nếu bạn đang tìm cách kết nối ứng dụng của mình với hàng trăm mô hình AI hàng đầu thế giới mà không muốn phải quản lý nhiều khoản khác nhau thì Nous Portal API chính là thứ bạn cần. Hãy cùng Tino tìm hiểu tài liệu Nous Research API và cách lấy API Key trên Nous Portal qua bài viết dưới đây nhé!
Tổng quan về Nous Research API và Nous Portal
Nous Research API là gì?
Nous Research API là giao diện lập trình cho phép ứng dụng bên ngoài gửi yêu cầu đến các model AI do Nous Research cung cấp qua hạ tầng hosted inference. Thay vì tải model về máy, cấu hình GPU, tối ưu inference và tự vận hành máy chủ, người dùng có thể gọi model qua API để tạo nội dung, trả lời câu hỏi, xử lý hội thoại, hỗ trợ lập trình hoặc tích hợp vào AI Agent.

Điểm đáng chú ý là Nous Research API hiện hỗ trợ cách dùng quen thuộc với nhiều lập trình viên: endpoint tương thích với hệ sinh thái OpenAI-compatible. Điều này giúp quá trình chuyển đổi từ một provider khác sang Nous Research thuận tiện hơn, đặc biệt khi dự án đã dùng thư viện OpenAI SDK hoặc các công cụ hỗ trợ endpoint dạng /v1/chat/completions.
Nous Portal là gì?
Nous Portal là trang quản lý tài khoản của Nous Research. Đây là nơi người dùng có thể đăng nhập, quản lý API Keys, theo dõi usage, xem thông tin model, thêm credits hoặc chọn subscription phù hợp.
Với người mới, có thể hiểu Nous Portal gồm các khu vực quan trọng:
- Hermes Agent — truy cập Hermes Agent trực tiếp
- API keys — quản lý API key
- Usage — theo dõi mức sử dụng
- Account Settings — cài đặt tài khoản
- API Docs — tài liệu API
- Help — trợ giúp
Nếu bạn muốn tích hợp model AI vào website, chatbot, AI Agent hoặc workflow tự động, API Key trong Nous Portal là phần cần lấy đầu tiên.
Cần chuẩn bị gì trước khi lấy API Key Nous Portal?
Trước khi tạo API Key, bạn nên chuẩn bị các thông tin sau:
- Tài khoản Nous Portal: Bạn cần truy cập Nous Portal và đăng ký tài khoản bằng email phù hợp.
- Credits hoặc subscription: Một số model hoặc mức sử dụng yêu cầu credits hay gói trả phí. Vì vậy, hãy kiểm tra mục subscription, credits và pricing trước khi chạy tác vụ lớn.
- Mục đích sử dụng rõ ràng: Hãy xác định API Key dùng cho dự án nào: chatbot, backend website, AI Agent, workflow test hay môi trường production. Cách đặt tên key rõ ràng sẽ giúp quản lý dễ hơn.
- Môi trường lưu key an toàn: Không nên dán API Key trực tiếp vào mã nguồn. Cách tốt hơn là lưu trong biến môi trường, file .env nội bộ hoặc secret manager của nền tảng triển khai.

Hướng dẫn lấy API Key trên Nous Portal
Các bước lấy API Key Nous Portal
Bước 1: Truy cập: https://portal.nousresearch.com/. Tại màn hình đăng nhập, chọn phương thức phù hợp như Google, Email, GitHub, Discord hoặc More options (đăng nhập bằng các ví điện tử).

Bước 2: Sau khi đăng nhập thành công, bạn sẽ được chuyển vào giao diện quản trị Nous Portal. Ở thanh menu bên trái, có các mục quan trọng như Billing, API keys, Usage, Local Dashboards, Account Settings và Info.
Bước 3: Chọn Billing ở menu bên trái để kiểm tra số dư tài khoản.

Nếu tài khoản mới hiển thị $0.00 hoặc thông báo No funds, bạn cần kích hoạt credits trước khi tạo và sử dụng API Key ổn định.
Bước 4: Trong mục Billing, bạn có hai lựa chọn:
Subscription: chọn gói Free, Plus, Super hoặc Ultra. Với gói Free, giao diện có thể hiển thị mức $0/mo và credits miễn phí theo chu kỳ. Nhấn Subscribe via Stripe để kích hoạt.

Tại đây, bạn có thể chọn tiền tệ, kiểm tra tổng tiền và xác minh số điện thoại nếu được yêu cầu. Với gói Free, tổng tiền có thể hiển thị 0đ, nhưng vẫn cần hoàn tất bước xác nhận để kích hoạt subscription.

Top-up Credits: dùng để nạp credits không hết hạn. Nhấn Top up now nếu muốn nạp thêm số dư thủ công.


Bước 5: Sau khi thanh toán thành công, quay lại mục Billing. Nếu tài khoản đã có credits, phần Balance sẽ hiển thị số dư, ví dụ $0.10.

Bạn cũng có thể xem chi tiết credits trong phần Balance Breakdown, gồm:
- Top-up Credits: credits nạp thêm, không hết hạn.
- Subscription Credits: credits đi kèm gói subscription.
- Spent This Period: số credits đã sử dụng trong chu kỳ hiện tại.
Bước 6: Ở thanh menu bên trái, chọn API keys.
Nếu chưa có khóa API nào, màn hình sẽ hiển thị thông báo tạo key mới. Nhấn nút Create key ở góc phải màn hình.

Sau khi nhấn Create key, hệ thống sẽ tạo một API Key cho tài khoản. Key thường có dạng bắt đầu bằng:
sk-nous-…
Trong bảng API, bạn sẽ thấy các thông tin như:
- Name: tên key.
- Key: chuỗi API Key dạng rút gọn.
- Created: ngày tạo.
- Last Used: lần sử dụng gần nhất.
- Total Spend: tổng chi phí đã dùng qua key.
- Revoke: thu hồi key khi không còn sử dụng.

Nhấn biểu tượng sao chép bên cạnh chuỗi key để copy API Key. Sau đó, hãy lưu key vào nơi an toàn.
Dùng API Key để gọi Nous Research API
Sau khi có API Key, bạn có thể gọi API bằng endpoint chính:
https://inference-api.nousresearch.com/v1
Với chat completion, endpoint thường dùng là:
https://inference-api.nousresearch.com/v1/chat/completions
Khi gửi request, API Key cần được đặt trong header:
Authorization: Bearer YOUR_NOUS_API_KEY
Trong thực tế, hãy thay YOUR_NOUS_API_KEY bằng key đã tạo trong Nous Portal.
Rate Limits của API Nous Research
Khi sử dụng Nous Research API, chi phí được tính dựa trên lượng token tiêu thụ. Token có thể hiểu đơn giản là đơn vị nhỏ dùng để đo phần nội dung đầu vào và đầu ra khi model xử lý yêu cầu.
Thông tin giá chi tiết được cập nhật trong mục Info trên Nous Portal.
Trong phần này, người dùng có thể kiểm tra giá theo từng model, khả năng xử lý, context window và các thông tin liên quan trước khi tích hợp API vào dự án thực tế.
API Key Rate Limits là gì?
Rate limit là giới hạn tốc độ sử dụng API trong một khoảng thời gian nhất định. Nous Portal hiển thị hai chỉ số quan trọng:
- RPM: số request tối đa mỗi phút.
- TPM: số token tối đa mỗi phút.
Theo thông tin trong tài liệu, giới hạn API Key hiện được chia theo từng nhóm tài khoản như sau:
| Gói / nhóm tài khoản | RPM | TPM |
|---|---|---|
| Free | 50 RPM | 500.000 TPM |
| Default paid users | 180 RPM | 720.000 TPM |
| Plus | 400 RPM | 4.000.000 TPM |
| Super | 800 RPM | 8.000.000 TPM |
| Ultra | 1.600 RPM | 16.000.000 TPM |
Với người mới thử nghiệm, gói Free đã đủ để kiểm tra API, chạy demo nhỏ hoặc test chatbot cơ bản. Nếu triển khai AI Agent, chatbot nhiều người dùng hoặc hệ thống xử lý nội dung tự động, nên cân nhắc các gói cao hơn để tránh bị giới hạn request trong giờ cao điểm.
Các lỗi thường gặp khi dùng API Key Nous Portal
1. Lỗi 401 Unauthorized
Nguyên nhân phổ biến là API Key sai, thiếu header Authorization, sai định dạng Bearer token hoặc key đã bị thu hồi.
Cách xử lý:
- Kiểm tra lại biến môi trường.
- Đảm bảo header có dạng Authorization: Bearer sk-….
- Tạo API Key mới nếu key cũ không còn hoạt động.
- Không thêm dấu nháy thừa hoặc khoảng trắng vào key.
2. Lỗi 402 hoặc thông báo liên quan đến credits
Lỗi này thường liên quan đến credits, subscription hoặc giới hạn thanh toán. Hãy vào Nous Portal kiểm tra số dư, gói đang dùng và model đang gọi.

3. Sai model name
Nếu model name không đúng, API có thể trả về lỗi không tìm thấy model hoặc model không được hỗ trợ. Hãy mở trang model trong Nous Portal và sao chép đúng tên model đang hiển thị.
4. Gọi sai endpoint
Endpoint gốc là:
https://inference-api.nousresearch.com/v1
Endpoint chat completion là:
https://inference-api.nousresearch.com/v1/chat/completions
Nếu dùng SDK OpenAI-compatible, hãy đặt base_url là endpoint gốc, không đặt toàn bộ đường dẫn /chat/completions vào base_url.
5. Key hoạt động local nhưng lỗi trên server
Trường hợp này thường do server chưa khai báo biến môi trường, service chưa restart sau khi cập nhật .env, hoặc nền tảng deploy chưa nhận secret mới.
Cách xử lý:
- Kiểm tra biến môi trường trên server.
- Restart service sau khi chỉnh .env.
- Kiểm tra log để xem request đang gửi key rỗng hay key sai.
- Đảm bảo backend mới là nơi gọi API, không gọi từ frontend.
Bảo mật API Key — Những quy tắc không thể bỏ qua
Bảo mật API key là điều tối quan trọng, đặc biệt khi key này mở quyền truy cập vào nhiều dịch vụ cùng lúc:
Những điều nên làm:
- Lưu key trong biến môi trường hoặc secret manager (như AWS Secrets Manager, Vault)
- Đặt tên mô tả cho từng key để dễ quản lý
- Xoay vòng (rotate) key định kỳ
- Kiểm tra mức sử dụng thường xuyên để phát hiện bất thường

Những điều tuyệt đối không làm:
- Không commit key lên GitHub hoặc bất kỳ repository công khai nào
- Không chia sẻ key trong Slack, email hay chat nhóm
- Không để key trong file .env được tracking bởi Git
- Không hardcode key trực tiếp vào source code
Nếu nghi ngờ key đã bị lộ: xóa ngay trên Portal và tạo key mới. Đây là thao tác chỉ mất vài giây nhưng có thể tránh được thiệt hại lớn.
Lưu ý khi chọn model trên Nous Portal
Nous Portal có nhiều model khác nhau, trong đó có nhóm Hermes 4 và các model từ nhiều hệ sinh thái AI khác. Khi chọn model, đừng chỉ nhìn tên model. Hãy kiểm tra thêm các yếu tố sau:
- Context window: Context window càng lớn, model càng xử lý được nhiều nội dung trong cùng một request. Đây là yếu tố quan trọng nếu bạn muốn tóm tắt tài liệu dài hoặc xây dựng AI Agent có nhiều ngữ cảnh.
- Chi phí prompt token và completion token: Một số model có chi phí đầu vào thấp nhưng chi phí đầu ra cao hơn. Nếu ứng dụng tạo nội dung dài, phần completion token cần được tính kỹ.
- Khả năng reasoning: Các model hybrid reasoning phù hợp cho tác vụ cần phân tích sâu, lập luận hoặc viết nội dung dài. Tuy nhiên, thời gian phản hồi và chi phí có thể cao hơn model nhỏ.
- Khả năng tool calling: Nếu dùng cho AI Agent, hãy ưu tiên model được tối ưu cho gọi công cụ, xử lý nhiều bước và tương tác với hệ thống bên ngoài. Tài liệu Nous cũng lưu ý nhóm Hermes 4 mạnh cho chat và reasoning nhưng không phải lựa chọn khuyến nghị cho Hermes Agent.
- Trạng thái hỗ trợ API: Một số model có thể chỉ dùng local, tạm ngừng API hoặc thay đổi tên hiển thị. Trước khi đưa vào production, hãy kiểm tra lại trang model trên Nous Portal.
Các bài viết liên quan:
- Hướng dẫn cài đặt và sử dụng Hermes Agent Desktop
- Hướng dẫn kết nối Google Workspace với Hermes Agent
- Hướng dẫn kết nối Google Chat với Hermes Agent A-Z
- Hướng dẫn kết nối Slack với Hermes Agent trên VPS Hermes
- Hướng dẫn kết nối Kilo Code với Hermes Agent
- Hướng dẫn kết nối Telegram với Hermes Agent trên VPS Hermes
- Hướng dẫn kết nối tài khoản Zalo cá nhân với Hermes Agent trên VPS Hermes
- Hướng dẫn kết nối Discord với Hermes Agent trên VPS Hermes
- Hướng dẫn cách thêm skill cho Hermes Agent
Kết luận
Nous Portal đang dần trở thành một trong những lựa chọn được yêu thích nhất trong cộng đồng AI developer không chỉ vì danh mục mô hình phong phú với hơn 300 lựa chọn, mà còn vì triết lý tập trung vào sự đơn giản: một tài khoản, một hóa đơn, đầy đủ công cụ.
Dù bạn là lập trình viên đang xây dựng ứng dụng AI, người dùng cá nhân muốn trải nghiệm các mô hình frontier, hay nhà nghiên cứu cần nền tảng thử nghiệm linh hoạt, Nous Portal cung cấp điểm khởi đầu thực sự đơn giản và dễ tiếp cận.
Những câu hỏi thường gặp
Nous Portal có miễn phí không?
Có, nhưng bạn cần sử dụng thẻ mới có thể đăng ký. Ngoài ra, Nous Portal có gói trả phí với mức giá cạnh tranh so với việc đăng ký từng dịch vụ riêng lẻ. Bạn có thể xem chi tiết tại https://portal.nousresearch.com/manage-subscription. Mức phí cụ thể và các gói tùy chọn được cập nhật trực tiếp trên trang này.
API của Nous Portal có tương thích với SDK của OpenAI không?
Có. Nous Portal sử dụng chuẩn OpenAI-compatible API, vì vậy bạn chỉ cần thay api_key và base_url khi khởi tạo client OpenAI, phần còn lại của code giữ nguyên.
Tôi có thể dùng Nous Portal mà không cần cài Hermes Agent không?
Hoàn toàn có thể. Hermes Agent không yêu cầu phải dùng Nous Portal. Nous Portal chỉ là một trong nhiều lựa chọn nhà cung cấp và OpenRouter, Ollama, OpenAI, Anthropic, Hugging Face và các endpoint tương thích OpenAI đều là các lựa chọn thay thế. Bạn có thể dùng API trực tiếp từ bất kỳ ngôn ngữ lập trình hay công cụ nào hỗ trợ OpenAI-compatible API.
RPM và TPM trong Nous Portal nghĩa là gì?
RPM là số request tối đa mỗi phút. TPM là số token tối đa mỗi phút. Hai chỉ số này cho biết tốc độ sử dụng API của từng gói. Gói càng cao thường có RPM và TPM càng lớn, phù hợp với hệ thống nhiều người dùng hoặc AI Agent hoạt động thường xuyên.
