Trong thời đại tự động hóa và trí tuệ nhân tạo bùng nổ, AI Agent ngày càng trở thành công cụ hỗ trợ đắc lực cho doanh nghiệp và cá nhân tối ưu quy trình làm việc. Nhưng bạn đã thực sự hiểu AI Agent là gì? Cách sử dụng node AI Agent trên n8n như thế nào? Cùng Tino khám phá qua bài viết dưới đây nhé!
Định nghĩa AI Agent
AI Agent là gì?
AI Agent là một hệ thống hoặc chương trình thông minh được thiết kế để thực hiện các nhiệm vụ tự động, đưa ra quyết định hoặc xử lý thông tin dựa trên dữ liệu đầu vào bằng cách sử dụng các thuật toán trí tuệ nhân tạo (AI).
AI Agent có khả năng học hỏi, phân tích và tương tác với môi trường xung quanh (như dữ liệu, ứng dụng hoặc người dùng) để hoàn thành mục tiêu mà không cần can thiệp thủ công liên tục.

Tổng quan về node AI Agent trong n8n
Node AI Agent trong n8n cho phép bạn tích hợp các mô hình ngôn ngữ lớn (LLMs) như OpenAI, Anthropic, Google Gemini… vào workflow một cách trực quan. Node này hoạt động như một “trợ lý thông minh”, có khả năng:
- Hiểu và xử lý ngôn ngữ tự nhiên
- Sử dụng các công cụ bên ngoài (như HTTP Request, Google Sheets…)
- Ra quyết định và thực hiện hành động dựa trên dữ liệu đầu vào
Node AI Agent có khác gì so với node Open AI trên n8n?
Mục đích và chức năng chính
Open AI node:
- Được thiết kế để tích hợp trực tiếp với API của Open AI, cho phép sử dụng các mô hình AI cụ thể của Open AI.
- Tập trung vào việc thực hiện các tác vụ riêng lẻ, như tạo văn bản, sinh hình ảnh, phân tích dữ liệu, hoặc trả lời câu hỏi dựa trên prompt.
- Hoạt động như một node độc lập, gửi yêu cầu trực tiếp đến Open AI và nhận kết quả trả về.
Ví dụ: Bạn có thể dùng Open AI node để tạo một đoạn văn bản với prompt “Viết một bài tweet về AI” hoặc sinh hình ảnh từ mô tả.
AI Agent node:
- Là một node tổng quát hơn, được thiết kế để xây dựng các tác nhân AI (AI agents) có khả năng ra quyết định và tương tác với nhiều công cụ hoặc dịch vụ bên ngoài.
- Không giới hạn ở Open AI; nó có thể kết nối với nhiều mô hình ngôn ngữ lớn (LLM) khác nhau (như Open AI, Google Gemini, DeepSeek) thông qua Chat Model sub-nodes.
- Hỗ trợ tích hợp các công cụ (tools), bộ nhớ (memory), và logic phức tạp để xử lý các tác vụ theo ngữ cảnh, như chatbot hoặc quy trình tự động hóa thông minh.
Ví dụ: AI Agent node có thể được dùng để tạo một chatbot trả lời câu hỏi, sử dụng bộ nhớ để lưu ngữ cảnh cuộc trò chuyện và gọi công cụ như tìm kiếm web để trả lời chính xác hơn.
Khả năng tích hợp và tính linh hoạt
Open AI node:
- Chỉ hoạt động với API của Open AI và yêu cầu API Key từ tài khoản Open AI.
- Hỗ trợ các tính năng cụ thể của Open AI, như tạo văn bản (completions), sinh hình ảnh (DALL-E), hoặc sử dụng trợ lý (assistants).
- Ít linh hoạt hơn vì nó bị giới hạn trong các endpoint và mô hình do Open AI cung cấp.
- Nếu bạn muốn gọi một tính năng không được hỗ trợ trực tiếp, bạn phải dùng HTTP Request node để gọi API Open AI thủ công.
AI Agent node:
- Linh hoạt hơn, có thể kết nối với nhiều nhà cung cấp LLM (bao gồm Open AI) thông qua Chat Model sub-nodes (như OpenAI Chat Model, Google Gemini, …).
- Hỗ trợ Tools Agent, cho phép tích hợp các công cụ bên ngoài (như tìm kiếm web, truy vấn cơ sở dữ liệu, hoặc API tùy chỉnh) để mở rộng khả năng của AI.
- Có thể gắn memory sub-nodes (như Window Buffer Memory) để lưu trữ ngữ cảnh cuộc trò chuyện, giúp xử lý các tương tác liên tục (ví dụ: chatbot nhớ tên người dùng).
- Hỗ trợ các loại agent khác nhau (trước phiên bản 1.82.0, có nhiều loại agent; hiện tại mặc định là Tools Agent).

Hiệu suất và chi phí
Open AI node:
- Vì chỉ sử dụng API Open AI, chi phí phụ thuộc vào số lượng token được xử lý bởi mô hình Open AI (xem giá tại https://openai.com/api/pricing).
- Hiệu suất phụ thuộc vào tốc độ phản hồi của máy chủ Open AI và cấu hình node (như mô hình, số token tối đa).
AI Agent node:
- Chi phí phụ thuộc vào nhà cung cấp LLM được sử dụng (ví dụ: Open AI, Google Gemini) và các công cụ bổ sung (như API tìm kiếm web).
- Có thể tốn nhiều tài nguyên hơn do xử lý logic phức tạp, tích hợp nhiều sub-nodes và duy trì bộ nhớ.
Bảng so sánh nhanh:

Hướng dẫn cách sử dụng node AI Agent trên n8n
Giải thích các thành phần trong node AI Agent
User Message
- Mô tả: Là tin nhắn hoặc câu hỏi mà người dùng gửi đến AI Agent, đóng vai trò là đầu vào chính để AI xử lý.
- Chức năng: Cung cấp nội dung cụ thể (như câu hỏi, yêu cầu) để AI tạo ra phản hồi.
- Thường được lấy từ node trước (như Webhook, Chat Message node) hoặc nhập trực tiếp trong AI Agent node
Ví dụ:
- Người dùng hỏi: “Thời tiết hôm nay ở Hà Nội thế nào?”.
- User Message sẽ là: Thời tiết hôm nay ở Hà Nội thế nào?.
System Message
- Mô tả: Là hướng dẫn hoặc bối cảnh mà bạn cung cấp để định hình cách AI trả lời. Nó giống như “vai trò” hoặc “quy tắc” mà AI phải tuân theo.
- Chức năng: Giúp AI hiểu rõ nhiệm vụ, phong cách trả lời, hoặc thông tin nền trước khi xử lý User Message.
Ví dụ:
- System Message: Bạn là trợ lý AI của một công ty du lịch. Trả lời ngắn gọn, thân thiện và luôn đề xuất tour du lịch..
- Khi người dùng hỏi: “Có gì thú vị ở Đà Lạt?”, AI sẽ trả lời dựa trên hướng dẫn này, như: “Đà Lạt có hồ Xuân Hương và đồi chè. Bạn muốn đặt tour khám phá Đà Lạt không?”.
Require Specific Output Format
- Mô tả: Yêu cầu AI trả lời theo một định dạng cụ thể, như JSON, danh sách hoặc văn bản thuần.
- Chức năng: Đảm bảo phản hồi của AI dễ sử dụng trong các node tiếp theo (như lưu vào Google Sheets hoặc gửi qua email).
- Thường để mặc định.

Chat Model
- Mô tả: Là mô hình ngôn ngữ lớn (LLM) mà AI Agent sử dụng để xử lý và trả lời, như GPT-3.5-turbo (Open AI), Google Gemini hoặc DeepSeek.
- Chức năng: Được xem là “bộ não” của AI Agent, quyết định chất lượng và phong cách trả lời. Bạn cần API Key từ nhà cung cấp LLM.
Memory
- Mô tả: Bộ nhớ giúp AI Agent ghi nhớ ngữ cảnh của các tương tác trước, rất hữu ích cho các cuộc trò chuyện liên tục (như chatbot).
- Chức năng: Lưu trữ lịch sử tin nhắn (User Message và phản hồi) để AI trả lời nhất quán và phù hợp với bối cảnh.
Ví dụ:
- Người dùng hỏi: “AI là gì?” -> AI trả lời: “AI là trí tuệ nhân tạo.”
- Người dùng hỏi tiếp: “Nó hoạt động thế nào?” -> Với Memory, AI biết câu hỏi liên quan đến AI và trả lời: “AI hoạt động bằng cách học từ dữ liệu, sử dụng các thuật toán như mạng nơ-ron.”
- Nếu không có Memory, AI có thể không hiểu “nó” là gì.
Tool
- Mô tả: Là công cụ bổ sung mà AI Agent có thể sử dụng để lấy thông tin hoặc thực hiện hành động, như tìm kiếm web, truy vấn cơ sở dữ liệu hoặc gọi API.
- Chức năng: Mở rộng khả năng của AI, cho phép trả lời các câu hỏi cần dữ liệu bên ngoài hoặc thực hiện tác vụ đặc biệt.
Ví dụ:
- Tool: Brave Search (tìm kiếm web).
- Người dùng hỏi: “Thời tiết hôm nay ở Hà Nội?”.
- AI Agent dùng Brave Search để lấy dữ liệu thời gian thực và trả lời: “Hôm nay ở Hà Nội trời nắng, nhiệt độ 28°C.”
Cách sử dụng node AI Agent cơ bản
Trong bài viết này, Tino sẽ hướng dẫn bạn cách sử dụng AI Agent trong n8n để tạo một chatbot trả lời câu hỏi cơ bản bằng Open AI (GPT-3.5-turbo).
Mục tiêu: Tạo workflow nhận câu hỏi từ người dùng (ví dụ: “AI là gì?”) và sử dụng AI Agent node với Open AI để trả lời ngắn gọn.
Bước 1: Đăng nhập vào n8n. Bấm “Create Workflow” để tạo workflow mới.
Bước 2: Nhấn dấu + trên canvas, tìm Manual Trigger. Đây là trigger để chạy thử workflow thủ công.

Bước 3: Thêm node Set vào workflow. Đây là node giả lập dữ liệu đầu vào cho AI Agent.

Trong cấu hình node Set, đặt tên là question.
Nhấn Add Fields
- Type: String.
- Nhập vào ô Value: Trái đất có bao nhiêu lục địa?

Bước 4: Thêm và cấu hình node AI Agent.

Sau khi đã hiểu được các thành phần của node AI Agent, cấu hình node này như sau: Thành phần Cách thiết lập Source for Prompt Chọn Define below để lấy câu hỏi từ node Set User Message Kéo thả câu hỏi từ node Set: {{$json[“question”]}} System Message (Không bắt buộc) Nhấn Option -> System Message, ghi: Bạn là một giáo viên khoa học, trả lời dễ hiểu, thân thiện. Require Specific Output Format Tắt (vì chỉ cần trả lời văn bản tự nhiên).

Cấu hình Chat model:
Nhấp vào dấu + tại Chat mode -> Chọn model bạn đã kết nối API trước đó, ví dụ: OpenAI Chat Model. Tham khảo bài viết: Cách kết nối API OpenAI vào n8n để biết thêm chi tiết.

Cấu hình Memory (tùy chọn, nhưng nên thêm để lưu ngữ cảnh):
- Nhấp vào dấu + tại Memory, chọn Simple Memory.
- Memory Key: chọn Define below -> chat_history.
- Window Size: 3 (lưu 3 tương tác gần nhất).

Cấu hình Tools: Có thể bỏ qua vì ví dụ này không cần công cụ như tìm kiếm web.
Bước 5: Nhấn Test step trong AI Agent node.
Kết quả mong đợi:
AI Agent trả lời, ví dụ: “Có bảy lục địa trên Trái Đất: Châu Á, Châu Phi, Bắc Mỹ, Nam Mỹ, Châu Nam Cực, Châu Âu và Châu Úc.”
Nếu có lỗi:
- 401 Unauthorized: Kiểm tra API Key trong credential.
- 429 Too Many Requests: Kiểm tra quota Open AI tại https://platform.openai.com.
Bước 6: Nhấn Save để lưu workflow.
(Tùy chọn) Thay Manual Trigger bằng Webhook để nhận câu hỏi từ ứng dụng như Slack hoặc Telegram và thêm node như Telegram để gửi trả lời.
Kết luận
Sử dụng AI Agent node trong n8n mở ra khả năng xây dựng các quy trình tự động hóa thông minh, từ chatbot, phân tích dữ liệu, đến tích hợp công cụ bên ngoài. Với sự linh hoạt trong việc kết hợp các mô hình ngôn ngữ lớn (LLM), bộ nhớ ngữ cảnh và công cụ như tìm kiếm web, node này giúp bạn tối ưu hóa hiệu suất công việc một cách dễ dàng.
Những câu hỏi thường gặp
Tôi cần gì để sử dụng AI Agent node?
Bạn cần tài khoản n8n (Cloud hoặc tự host), API Key từ nhà cung cấp LLM (như Open AI) và kiến thức cơ bản về workflow trong n8n.
Sử dụng AI Agent node có tốn phí không?
Có, nếu dùng LLM như Open AI, bạn sẽ bị tính phí dựa trên token xử lý (xem giá tại https://openai.com/api/pricing). Công cụ như Brave Search cũng có thể yêu cầu API Key trả phí.
Tôi có thể dùng AI Agent node mà không cần Tool không?
Có, bạn có thể bỏ qua Tool nếu chỉ cần AI trả lời dựa trên thông tin trong Prompt hoặc Chat Message. Tool chỉ cần thiết khi yêu cầu dữ liệu bên ngoài (như tìm kiếm web).
AI Agent có giới hạn độ dài phản hồi không?
Có. Tùy theo model mà bạn dùng (GPT-3.5, GPT-4,…), phản hồi sẽ bị giới hạn bởi số tokens. Bạn có thể điều chỉnh độ dài mong muốn bằng cách kiểm soát prompt và cài đặt hệ thống.
Tôi có thể dùng nhiều node AI Agent trong một workflow không?
Hoàn toàn được. Bạn có thể dùng nhiều node AI Agent để thực hiện nhiều tác vụ khác nhau trong cùng một workflow như: tạo nội dung, phân tích cảm xúc, dịch thuật,…