Для автоматизации реальной работы больше не нужно быть программистом. Скрейпинг сайта, обработка данных и превращение их в читаемое резюме раньше означали написание скрипта или найм человека для этого. С правильными инструментами всё это можно собрать самостоятельно на визуальном холсте.
Это руководство показывает, как создать Amazon AI-агента с n8n и Crawlbase: рабочий процесс, который принимает ключевое слово продукта, извлекает публичные результаты поиска Amazon через Crawlbase, передаёт их AI-модели для анализа и отправляет вам итоги по email. Форма собирает ключевое слово, Crawling API загружает листинги за реальным браузером и надёжным IP, AI обобщает тренды и цены, а результат попадает в почтовый ящик. Это чистый автоматизированный цикл, работающий без вашего надзора за скрейпером или прокси-пулом.
Что делает агент и для кого он предназначен
Каждый узел выполняет одну задачу. Триггер формы собирает ключевое слово и данные получателя, Crawlbase извлекает листинги Amazon в виде чистых структурированных данных, узел switch повторяет попытку при неудачном запросе, AI-модель пишет анализ, а email-узел доставляет его. Вместе рабочий процесс превращает вопрос "что продаётся по этому ключевому слову" в резюме в вашем почтовом ящике через несколько секунд.
Это полезно для исследователей продуктов, оценивающих нишу, команд ecommerce, отслеживающих конкурентов, агентств, валидирующих категорию, или всех, кто предпочтёт прочитать краткий бриф, а не листать листинги вручную. Тот же паттерн, описанный в статье автоматизация исследования продуктов ecommerce, применим здесь; это специфичная для Amazon реализация.
Ответственный скрейпинг Amazon
Прежде чем писать код, обозначим границу. Этот рабочий процесс ограничен публичными данными о продуктах Amazon: названия, цены, рейтинги, количество отзывов и статус Prime, видимые на странице результатов поиска без авторизации. Прочитайте этот раздел, прежде чем нацелить агента на рабочий объём.
Условия использования Amazon ограничивают автоматический доступ, поэтому скрейпинг может нарушать эти условия вне зависимости от того, насколько аккуратен ваш инструментарий. Ничто в этой настройке не меняет этого; она просто делает техническую часть работающей. Несколько принципов, которых стоит придерживаться: собирайте только публичные данные листингов, уважайте robots.txt Amazon и заявленные ожидания относительно частоты запросов, держите объём запросов достаточно низким, чтобы не нагружать серверы. Если вы планируете коммерческое переиспользование данных, получите разрешение или официальное соглашение о данных, а не исходите из того, что молчание, это согласие.
Что это руководство намеренно не охватывает: всё, что за стеной авторизации, данные аккаунта или заказов, персональные данные, связанные с идентифицируемыми покупателями или рецензентами, любой обход аутентификации и любые действия по покупке или в аккаунте. Если вашему проекту нужно больше, чем публичные листинги, правильное решение, официальный API Amazon или соглашение о данных, а не более умный скрейпер.
Граница, делающая эту работу защищённой, стена авторизации. Всё, что читает этот агент, видно любому анонимному посетителю на странице поиска. Как только задача требует аккаунта, истории заказов или персональных данных покупателя, она выходит за рамки этого руководства и принадлежит официальному API или соглашению о данных.
Что нужно перед началом
Подготовьте это заранее, и остальная часть сборки пойдёт быстро:
- Аккаунт и токен Crawlbase. Это загружает результаты Amazon. После регистрации скопируйте Normal-токен из дашборда. Crawlbase не взимает плату за неудачные запросы, на чём строится логика повторных попыток.
- Экземпляр n8n. Самостоятельно развёрнутый или n8n Cloud, оба работают; именно здесь вы соединяете узлы.
- Ключ провайдера AI. Шаг анализа требует модели. Работает любой провайдер с конечной точкой chat или message; в этом руководстве используется OpenAI.
- Аккаунт для отправки email. Для доставки резюме. Достаточно сервиса типа SendGrid на бесплатном тарифе.
- Базовые знания n8n. Если вы умеете перетаскивать узлы на холст и заполнять поля, вы готовы.
Как данные проходят через рабочий процесс
Вместо того чтобы вручную писать HTTP-интеграцию с заголовками, парсингом и логикой повторных попыток, вы позволяете каждому узлу делать одну часть:
- Form Trigger собирает ключевое слово продукта и имя с email получателя.
- Узел HTTP Request отправляет ключевое слово в Crawling API и получает обратно разобранные листинги Amazon.
- Узел Switch проверяет статус ответа и зацикливается для повторной попытки при неудаче.
- Узел AI-модели читает листинги и пишет анализ.
- Узел email отправляет резюме на адрес из формы.
Поскольку Crawlbase возвращает результаты поиска Amazon уже разобранными в чистый JSON, шаг AI читает структурированные поля вместо борьбы с сырым HTML. Это тот же движок, что стоит за Crawling API, доступный здесь как параметр scraper в вызове Crawling API.
Шаг 1: Начало с триггера формы
Создайте новый рабочий процесс в n8n, нажмите Add first step и выберите On form submission из списка триггеров. Это даёт вам размещённую форму, запускающую рабочий процесс при отправке. Настройте триггер со следующими значениями:
- Authentication: None
- Form Title: Amazon SERP AI Agent with n8n and Crawlbase
- Form Description: Enter a product keyword to analyze on Amazon. n8n uses Crawlbase to extract titles, prices, and ratings, then an AI agent summarizes the results.
- Respond When: Workflow Finishes
Добавьте три элемента формы, чтобы рабочий процесс имел ключевое слово для поиска и адрес для отправки результата:
Product Keyword | Text | placeholder: wireless earbuds | required Your Name | Text | placeholder: John Doe | required Email | Email | placeholder: [email protected] | required
Прокрутите вниз до Options и в разделе Form Response установите Respond With в "Form Submitted Text", а Text to Show, на что-то вроде "Please check your email." Это то, что увидит посетитель после отправки, пока рабочий процесс выполняется в фоне.
Шаг 2: Получение результатов Amazon с помощью Crawling API
Нажмите кнопку плюс (+) после триггера формы, найдите HTTP и добавьте узел HTTP Request. Он отправляет ключевое слово в Crawlbase и получает обратно результаты поиска Amazon в виде разобранного JSON. Настройте его для GET-запроса к конечной точке Crawling API с параметрами запроса из полей ниже:
Method: GET URL: https://api.crawlbase.com Send Query Parameters: Yes Specify Query Parameters: Using Fields Below
Затем перейдите на вкладку Query Parameters и добавьте три параметра. Параметр scraper указывает Crawlbase вернуть разобранные данные Amazon SERP вместо сырого HTML, поэтому шаг AI получает чистые поля:
token | YOUR_CRAWLBASE_NORMAL_TOKEN url | https://www.amazon.com/s?k={{ $json['Product Keyword'] }} scraper | amazon-serp
Для значения url введите выражение вручную или перетащите поле Product Keyword из левой панели в поле, и n8n вставит его автоматически. Это строит URL поиска Amazon из любого ключевого слова, введённого посетителем.
Amazon рендерит результаты на клиенте и агрессивно блокирует автоматический трафик, поэтому обычный запрос возвращает пустую оболочку. Crawling API рендерит страницу за реальным браузером и надёжным IP, а скрейпер amazon-serp возвращает листинги уже разобранными в массив products с названиями, ценами, рейтингами и статусом Prime. Это означает, что AI никогда не парсит HTML, а ваши селекторы никогда не устаревают.
Шаг 3: Повтор неудачных запросов с помощью узла switch
Нажмите кнопку плюс (+) после узла HTTP Request и найдите Switch. Идея проста: если Crawlbase возвращает что-либо, кроме чистого успеха, зациклитесь и попробуйте снова. Поскольку Crawlbase не выставляет счёт за неудачные запросы, продвижение вперёд происходит только при получении валидного результата.
Установите Mode узла в Rules, затем добавьте два правила маршрутизации, ветвящихся по статусу ответа:
{{ $json.original_status }} | is equal to | 200 | output: success {{ $json.original_status }} | is not equal to | 200 | output: failed
Установите тип сравнения Number. Это важно: оставьте его строкой, и проверка равенства может давать сбои, ломая логику повторных попыток. Затем подключите выход failed обратно к началу узла HTTP Request, чтобы плохой ответ автоматически запускал новую попытку. Выход success ведёт к шагу AI.
Amazon требует отрендеренной страницы за надёжным IP и в идеале уже разобранных листингов. Crawling API делает оба в одном вызове: передайте ваш токен плюс scraper=amazon-serp, и он рендерит страницу поиска в реальном браузере, ротирует резидентные IP на стороне сервера и возвращает чистый JSON, чтобы ваш n8n-агент читал структурированные продукты без headless-флота или прокси-пула. Неудачные запросы не тарифицируются, что делает цикл повторных попыток бесплатным. Начните с бесплатного тарифа и укажите на публичный поиск.
Шаг 4: Анализ данных с помощью AI-модели
После настройки цикла повторных попыток нажмите кнопку плюс (+) на выходе success узла switch. Найдите вашего провайдера AI, например OpenAI, и выберите Message a model. Этот узел принимает разобранные данные о продуктах от Crawlbase и просит модель обобщить тренды, ценовые диапазоны, популярные бренды и средние отзывы или другие нужные вам данные.
Если вы ещё не добавили учётные данные провайдера в n8n, узел предложит это сделать. Настройте его для отправки одного пользовательского сообщения текущей чат-модели:
Credential: your configured AI provider key Resource: Text Operation: Message a Model Model: a current chat model (for example gpt-4o) Role: User
В поле сообщения вставьте промпт, который преобразует массив products Crawlbase в читаемый список и запрашивает целевой анализ. Выражение извлекает ключевое слово из формы и поля продуктов из вывода HTTP Request:
You are a product research analyst. Here is the data from an Amazon search for "{{ $('On form submission').item.json['Product Keyword'] }}": {{ $('HTTP Request').item.json.body.products.map((item, index) => "\n" + (index + 1) + ". " + item.name + " | " + item.price + " | " + (item.isPrime ? "Amazon Prime" : "Not Amazon Prime") + " | " + item.customerReview + " | " + item.boughtInfo) }} Analyze this data and summarize the key insights: - Top 3 popular brands - Average price range - Notable deals or trends - Short market summary (3 to 4 sentences)
Промпт делает несколько вещей намеренно. Он задаёт роль, чтобы модель оставалась лаконичной, называет точные данные, которые вы хотите, для единообразного вывода между запусками, и подаёт модели чистый список разобранных полей вместо сырого HTML.
Шаг 5: Отправка резюме по email
Анализ завершён; последний шаг, доставка. Нажмите кнопку плюс (+) после узла AI, найдите ваш email-сервис, например SendGrid, и в разделе Mail Actions выберите Send an email. Он отправляет резюме на адрес из формы, поэтому убедитесь, что учётные данные email настроены.
Заполните узел, подтягивая значения из предыдущих шагов. Получатель и имя отправителя берутся из формы, тема повторно использует ключевое слово, а тело, вывод модели:
Credential: your configured email-service key Resource: Mail Operation: Send Sender Email: the verified sender you set up with the service Sender Name: {{ $('On form submission').item.json['Your Name'] }} Recipient Email: {{ $('On form submission').item.json.Email }} Subject: Amazon analysis for '{{ $('On form submission').item.json['Product Keyword'] }}' Mime Type: Plain Text Message Body: {{ $json.output[0].content[0].text }}
После подключения всего рабочий процесс складывается чисто: форма собирает ключевое слово, Crawlbase загружает и разбирает листинги, switch обрабатывает повторные попытки, AI обобщает, а email-узел отправляет.
Тестирование рабочего процесса от начала до конца
Активируйте рабочий процесс, откройте Production URL из узла On form submission, и вы получите размещённую форму с тремя заданными вами полями. Введите ключевое слово, например "wireless earbuds", добавьте имя и email и отправьте.
Подождите несколько секунд. Ключевое слово поступает в Crawlbase, разобранные продукты возвращаются, switch подтверждает чистый ответ, модель пишет анализ, и email-узел отправляет его. Вы должны получить краткий бриф: топовые бренды по этому ключевому слову, средний ценовой диапазон, любые заметные предложения и несколько предложений обзора рынка. Если ничего не приходит, откройте журнал выполнения, чтобы увидеть, какой узел остановился и что вернул.
Куда двигаться дальше
Вы создали ассистента для исследования продуктов, работающего в автономном режиме. Дальше решаете вы. Запускайте его по расписанию для отслеживания цен конкурентов со временем. Отправляйте вывод в Slack-канал или базу данных вместо email. Замените триггер формы на список ключевых слов и проанализируйте целую категорию за один проход.
И Crawlbase, не только для Amazon. Тот же параметр scraper работает с другими крупными сайтами, а для всего, у чего нет специального парсера, Crawling API возвращает отрендеренный HTML или LLM-готовый markdown, который может читать шаг AI. Если вы предпочитаете, чтобы агент самостоятельно обращался к инструментам краулинга, статья подключение n8n к Crawlbase Web MCP показывает версию, управляемую агентом, с использованием сервера Web MCP, а статья построение рабочих процессов AI-агентов с Crawlbase Web MCP углубляется в многошаговые агенты. Для кастомных сборок вне n8n Crawling API и Smart AI Proxy дают тот же движок для прямого вызова.
Привлекательность в том, что это работает без кода: n8n управляет автоматизацией, Crawlbase выполняет краулинг и парсинг, а AI выполняет чтение. Crawlbase доверяют более 70 000 разработчиков, поэтому уровень краулинга под вашим рабочим процессом, тот же, что работает в продакшн-скрейперах в масштабе.
Ключевые выводы
- Пять узлов, один цикл. Триггер формы, HTTP Request к Crawlbase, switch для повторных попыток, AI-модель, email. Каждый делает одну задачу, и данные текут насквозь.
-
Пусть Crawlbase парсит Amazon. Передайте
scraper=amazon-serp, чтобы листинги возвращались в виде чистого JSON; AI читает структурированные поля вместо сырого HTML, и селекторы никогда не устаревают. - Повторные попытки бесплатны. Crawlbase не выставляет счёт за неудачные запросы, поэтому узел switch может возвращаться при статусе, отличном от 200, до получения валидного результата.
- AI выполняет анализ. Целевой промпт, называющий точные нужные данные, обеспечивает единообразный бриф в каждом запуске.
- Оставайтесь на публичных данных. Уважайте условия использования Amazon и robots.txt; никаких аккаунтов, заказов или персональных данных, никакого обхода аутентификации, никаких действий по покупке.
Часто задаваемые вопросы
Нужно ли писать код для создания этого Amazon AI-агента?
Нет. Весь рабочий процесс строится визуально в n8n путём перетаскивания узлов на холст и заполнения полей. Единственный "код", короткое выражение в промпте AI, преобразующее массив продуктов Crawlbase в читаемый список, и вы можете вставить его как есть. Crawlbase обрабатывает скрейпинг и парсинг, AI-модель обрабатывает анализ, а n8n соединяет два.
Почему Crawlbase, а не обычный HTTP-запрос к Amazon?
Amazon рендерит результаты на клиенте и агрессивно блокирует автоматический трафик, поэтому обычный запрос обычно возвращает 200 без данных о продуктах. Crawling API рендерит страницу в реальном браузере за надёжным резидентным IP, а скрейпер amazon-serp возвращает листинги уже разобранными в JSON. Вы получаете чистые поля без запуска headless-браузера или прокси-пула самостоятельно.
Какие данные Amazon может собирать агент?
Только публичные данные результатов поиска: названия продуктов, цены, рейтинги, количество отзывов, статус Prime и аналогичные поля, видимые без авторизации. Не собирает данные аккаунта, историю заказов, персональные данные, связанные с покупателями или рецензентами, или что-либо за стеной авторизации. Держите агент в рамках публичных листингов и уважайте условия использования Amazon и robots.txt.
Почему узел switch повторяет неудачные запросы?
Иногда запрос возвращает статус, отличный от 200. Узел switch проверяет original_status и направляет всё, кроме 200, обратно к узлу HTTP Request для повторной попытки, так что рабочий процесс продвигается вперёд только при получении валидного результата. Поскольку Crawlbase не взимает плату за неудачные запросы, этот цикл повторных попыток ничего не стоит. Убедитесь, что тип сравнения установлен в Number, иначе проверка равенства может давать сбои.
Можно ли использовать провайдера AI, отличного от OpenAI?
Да. Шаг анализа работает с любой моделью, поддерживаемой n8n через узел chat или message. Замените узел OpenAI на узел вашего провайдера, добавьте его учётные данные и сохраните тот же промпт. Остальная часть рабочего процесса, включая загрузку Crawlbase и доставку email, остаётся точно такой же.
Как отправить результаты куда-то, кроме email?
Замените email-узел на любое нужное вам место назначения. В n8n есть узлы для Slack, Google Sheets, баз данных, вебхуков и многого другого. Направьте вывод AI-модели на этот узел, и вы сможете публиковать резюме в канал, добавлять его в таблицу или сохранять на потом. Форма, загрузка Crawlbase, switch и шаги AI не изменятся.
Обходите любой сайт в масштабе, без борьбы с инфраструктурой.
Crawlbase берёт на себя прокси, отпечатки и CAPTCHA, чтобы ваша команда выпускала конвейеры данных вместо поддержки обвязки краулинга. 1 000 запросов бесплатно, без карты.

