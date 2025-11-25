Bạn đang tốn hàng giờ để copy-paste dữ liệu từ các website về Google Sheets? Hay bạn đang tìm cách để workflow trong n8n tự động kích hoạt các ‘actor’ mạnh mẽ của Apify? Việc tích hợp hai công cụ này chính là chìa khóa để bạn xây dựng hệ thống tự động hóa dữ liệu khép kín. Cùng Tino tìm hiểu cách tích hợp API của Apify vào n8n qua bài viết dưới đây nhé!

Đôi nét về Apify

Apify là gì?

Apify là một nền tảng điện toán đám mây (Cloud Platform) chuyên dụng cho web scraping (cào dữ liệu) và browser automation (tự động hóa trình duyệt). Hiểu một cách đơn giản, giải pháp công nghệ này giúp bạn biến bất kỳ trang web nào – kể cả những trang phức tạp nhất – trở thành một API để trích xuất dữ liệu có cấu trúc.

Thay vì phải tự xây dựng hạ tầng server, quản lý Proxy hay đau đầu xử lý captcha, người dùng có thể tận dụng “chợ ứng dụng” có sẵn gọi là Apify Store. Tại đây, bạn dễ dàng tìm thấy hàng ngàn Actors (các robot lập trình sẵn) để thực hiện các tác vụ cụ thể như: Cào thông tin sản phẩm từ Amazon, lấy danh sách khách hàng tiềm năng từ Google Maps hay tải video từ TikTok/Instagram. Mọi quy trình đều vận hành trên hạ tầng cloud của Apify, đảm bảo tốc độ và tính ổn định tối đa.

Apify là gì?

Tại sao nên tích hợp Apify vào n8n?

Mặc dù n8n rất mạnh mẽ trong việc điều phối luồng công việc (Workflow Automation), nhưng khả năng cào dữ liệu (Scraping) của nền tảng này lại có giới hạn nhất định, đặc biệt là với các website sử dụng nhiều JavaScript hoặc có cơ chế chống bot. Việc kết hợp Apify vào n8n chính là “mảnh ghép hoàn hảo” vì những lý do sau:

Xử lý các website động: Node “HTML Extract” mặc định của n8n thường chỉ hoạt động tốt với các trang web tĩnh. Ngược lại, Apify sử dụng các trình duyệt Headless (như Puppeteer/Playwright) nên có thể render JavaScript, cuộn trang (scroll), và click vào các nút bấm – điều mà n8n đơn thuần khó thực hiện được.

Node “HTML Extract” mặc định của n8n thường chỉ hoạt động tốt với các trang web tĩnh. Ngược lại, Apify sử dụng các trình duyệt Headless (như Puppeteer/Playwright) nên có thể render JavaScript, cuộn trang (scroll), và click vào các nút bấm – điều mà n8n đơn thuần khó thực hiện được. Vượt qua các rào cản anti crawling: Apify cung cấp hệ thống Residential Proxy (Proxy dân cư) và cơ chế tự động xoay IP, giúp bạn lấy dữ liệu mượt mà mà không bị chặn bởi tường lửa bảo mật của website đích.

Apify cung cấp hệ thống Residential Proxy (Proxy dân cư) và cơ chế tự động xoay IP, giúp bạn lấy dữ liệu mượt mà mà không bị chặn bởi tường lửa bảo mật của website đích. Tự động hóa quy trình khép kín: Hãy tưởng tượng một quy trình hoàn toàn tự động: n8n kích hoạt Apify để cào dữ liệu đối thủ cạnh tranh vào 8 giờ sáng mỗi ngày -> Apify trả dữ liệu về -> n8n lọc các mức giá thay đổi -> n8n gửi báo cáo hoặc cập nhật giá lên website của bạn. Sự kết hợp này loại bỏ hoàn toàn thao tác thủ công.

Hãy tưởng tượng một quy trình hoàn toàn tự động: n8n kích hoạt Apify để cào dữ liệu đối thủ cạnh tranh vào 8 giờ sáng mỗi ngày -> Apify trả dữ liệu về -> n8n lọc các mức giá thay đổi -> n8n gửi báo cáo hoặc cập nhật giá lên website của bạn. Sự kết hợp này loại bỏ hoàn toàn thao tác thủ công. Tiết kiệm tài nguyên hệ thống: Thay vì bắt VPS n8n phải gánh nặng việc chạy trình duyệt Chrome ngốn RAM để cào web, bạn có thể đẩy tác vụ nặng đó sang hạ tầng của Apify. n8n khi đó chỉ đóng vai trò nhận kết quả cuối cùng, giúp hệ thống vận hành nhẹ nhàng và ổn định hơn.

Tại sao nên tích hợp Apify vào n8n?

Hướng dẫn cách tích hợp API của Apify vào n8n

Cách lấy API Token từ Apify

Bước 1: Đầu tiên, hãy truy cập vào trang quản trị chính thức tại địa chỉ console.apify.com. Tại đây, người dùng cần đăng nhập vào tài khoản của mình.

Nếu chưa có tài khoản, bạn có thể đăng ký nhanh thông qua GitHub, Google hoặc Email cá nhân.

Cách lấy API Token từ Apify

Bước 2: Tại giao diện Dashboard chính, hãy nhìn sang thanh điều hướng nằm dọc bên tay trái màn hình. Tìm và nhấp chuột vào mục Settings (thường có biểu tượng hình bánh răng).

Cách lấy API Token từ Apify

Bước 3: Trong giao diện Cài đặt, hệ thống sẽ hiển thị nhiều tab chức năng khác nhau. Bạn chọn tab API & Integrations. Đây là khu vực chuyên biệt để quản lý các kết nối ngoại vi và quyền truy cập API.

Tại khu vực này, bạn sẽ thấy mục Personal API token. Đây chính là chuỗi ký tự mà n8n yêu cầu.

Cách lấy API Token từ Apify

Chuỗi token này thường được hệ thống che mờ để đảm bảo tính riêng tư. Hãy nhấn vào nút Copy to clipboard (Sao chép vào bộ nhớ tạm).

⚠️ Lưu ý bảo mật quan trọng: API Token này có toàn quyền truy cập vào tài khoản Apify của bạn (bao gồm cả việc chạy task tốn phí và truy cập dữ liệu). Tuyệt đối không chia sẻ mã token cho người lạ hoặc chụp ảnh màn hình để lộ chuỗi ký tự này lên mạng xã hội. Nếu nghi ngờ token bị lộ, hãy nhấn nút “Rotate token” ngay bên cạnh để hủy mã cũ và tạo mã mới ngay lập tức.

Cách tích hợp API của Apify vào n8n

Bước 1: Tại giao diện chính (Dashboard) của n8n, bạn nhấn vào biểu tượng dấu + và chọn mục Credentials nằm ở phía trên bên trái màn hình.

Cách tích hợp API của Apify vào n8n

Bước 2: Một thanh tìm kiếm sẽ xuất hiện giúp lọc các dịch vụ hỗ trợ. Tại đây, hãy gõ từ khóa Apify. Hệ thống sẽ hiển thị tùy chọn Apify API, bạn hãy nhấp chuột chọn dịch vụ này để tiếp tục.

Cách tích hợp API của Apify vào n8n

Lưu ý: Nếu không tìm thấy Apify API, bạn hãy tạo một workflow mới -> tìm node Apify và tiến hành cài đặt node này. Sau đó, quay lại phần cài đặt Credentials ở bước 1.

Cách tích hợp API của Apify vào n8n

Bước 3: Bảng cấu hình thông tin xác thực sẽ hiện ra trên màn hình. Tại trường dữ liệu có nhãn API Token, hãy dán chuỗi mã bảo mật mà bạn đã sao chép từ trang quản trị Apify Console (như đã hướng dẫn ở phần trên).

Cách tích hợp API của Apify vào n8n

Bước 4: Sau khi nhập xong chuỗi Token, nhấn nút Save để hoàn tất. Nếu thông tin chính xác, thông báo kết nối thành công sẽ xuất hiện ở góc dưới bên phải màn hình.

Ví dụ thực tế: Cào dữ liệu Google Maps để tìm kiếm 5 quán cà phê nổi bật tại Quận 1, TP.HCM

Bước 1: Khởi tạo và cấu hình Node Apify

Tại giao diện n8n Editor, hãy thêm node Apify vào bảng làm việc (Canvas) -> chọn Run an Actor and get dataset. Đối với 90% trường hợp sử dụng thông thường, tùy chọn “Run an Actor and get dataset” là giải pháp tối ưu nhất.

Khởi tạo và cấu hình Node Apify

Tiếp theo, hãy thực hiện thiết lập các thông số kỹ thuật như sau:

Credential: Chọn hồ sơ xác thực mà bạn đã tạo thành công ở phần trước.

Chọn hồ sơ xác thực mà bạn đã tạo thành công ở phần trước. Resource: Chọn Actor . Tùy chọn này cho phép n8n điều khiển các robot thu thập dữ liệu.

Chọn . Tùy chọn này cho phép n8n điều khiển các robot thu thập dữ liệu. Operation: Chọn Run an Actor and get dataset .

Chọn . Actor Source: Chọn Apify Store Actors .

Chọn . Actor: Tại thanh tìm kiếm, hãy nhập Google Maps Scraper. Đây là một Actor phổ biến được cộng đồng phát triển để trích xuất dữ liệu bản đồ. Nếu hệ thống không tự động gợi ý, người dùng có thể nhập ID thủ công là: compass/crawler-google-places.

Khởi tạo và cấu hình Node Apify

Bước 2: Thiết lập dữ liệu đầu vào (Input JSON)

Đây là bước quan trọng nhất để “ra lệnh” cho Actor biết cần tìm kiếm gì. Tại mục Input, hãy chuyển chế độ nhập liệu sang JSON và dán đoạn mã cấu hình dưới đây:

{ "searchStringsArray": [ "coffee shop in District 1, Ho Chi Minh City" ], "maxCrawledPlaces": 5, "language": "vi", "zoom": 15 }

Giải thích các tham số:

searchStringsArray: Từ khóa tìm kiếm. Bạn có thể thay đổi cụm từ này thành bất kỳ địa điểm hoặc dịch vụ nào mong muốn.

Từ khóa tìm kiếm. Bạn có thể thay đổi cụm từ này thành bất kỳ địa điểm hoặc dịch vụ nào mong muốn. maxCrawledPlaces: Giới hạn số lượng kết quả trả về là 5. Việc đặt giới hạn nhỏ trong lần chạy thử đầu tiên giúp tiết kiệm thời gian chờ và chi phí tài nguyên (Compute Units) trên Apify.

Giới hạn số lượng kết quả trả về là 5. Việc đặt giới hạn nhỏ trong lần chạy thử đầu tiên giúp tiết kiệm thời gian chờ và chi phí tài nguyên (Compute Units) trên Apify. language: Mã ngôn ngữ vi giúp kết quả trả về hiển thị tiếng Việt.

Thiết lập dữ liệu đầu vào (Input JSON)

Bước 3: Chạy thử nghiệm và kiểm tra kết quả

Nhấn nút Execute Test. Hệ thống sẽ mất khoảng 20-40 giây để khởi động trình duyệt ảo và quét dữ liệu. Khi hoàn tất, cửa sổ Output sẽ hiển thị một danh sách JSON chứa đầy đủ các trường thông tin giá trị như:

title: Tên quán cà phê.

address: Địa chỉ chi tiết.

totalScore: Điểm đánh giá trung bình (ví dụ: 4.5).

reviewsCount: Số lượng bài đánh giá.

Chạy thử nghiệm và kiểm tra kết quả

Kết luận

Giờ đây, rào cản về hạ tầng server hay nỗi lo về Proxy đã được gỡ bỏ hoàn toàn. Bất kỳ ai cũng có thể tự tay xây dựng những luồng công việc thông minh: Từ nghiên cứu đối thủ, theo dõi biến động thị trường cho đến tổng hợp nội dung tự động. Hy vọng qua hướng dẫn chi tiết này, bạn đã nắm vững cách thiết lập API Apify với n8n và tự tin triển khai Workflow đầu tiên của mình.

Những câu hỏi thường gặp

Apify có miễn phí để sử dụng với n8n không? Apify cung cấp gói “Free Forever” tặng người dùng 5$ tín dụng (credits) mỗi tháng. Khoản tín dụng này đủ để thực hiện hàng trăm lượt cào dữ liệu quy mô nhỏ. Tuy nhiên, nếu bạn có nhu cầu cào lượng dữ liệu lớn hoặc chạy liên tục hàng ngày, việc nâng cấp lên các gói trả phí là điều cần thiết để đảm bảo tài nguyên hệ thống.

Dữ liệu cào được từ Apify có bị chặn IP không? Một trong những ưu điểm lớn nhất của Apify là hệ thống tích hợp sẵn Residential Proxy. Các Actor trên nền tảng này tự động xoay vòng địa chỉ IP, giúp việc lấy dữ liệu diễn ra mượt mà và giảm thiểu tối đa nguy cơ bị các website đích chặn kết nối.

Tôi có thể lập lịch để n8n tự động cào dữ liệu mỗi ngày không? Chắc chắn được. Bạn chỉ cần thêm node Schedule Trigger (Kích hoạt theo lịch) vào đầu Workflow. Node này cho phép thiết lập thời gian chạy cụ thể (ví dụ: 8:00 sáng mỗi ngày) hoặc theo chu kỳ mong muốn.

Kết nối qua HTTP Request khác gì so với dùng Node Apify có sẵn? Node Apify có sẵn (Native Node) giúp việc cấu hình trở nên trực quan và đơn giản hơn nhờ giao diện đồ họa. Trong khi đó, HTTP Request là giải pháp dành cho người dùng nâng cao, cho phép tùy chỉnh sâu các tham số API mà node có sẵn chưa hỗ trợ, nhưng đổi lại đòi hỏi kiến thức kỹ thuật vững vàng hơn.