Раньше обновление страниц товаров и копирование данных в электронные таблицы были нормой. Это работало, но было медленно, неудобно и легко упустить из виду самое важное. Теперь у нас есть варианты получше. Crawlbase Благодаря извлечению чистых данных о товарах прямо с веб-сайтов и отсеиванию ненужных данных с помощью ИИ, мониторинг становится более точным. Он превращается в систему, которая может отмечать внезапные изменения цен, предупреждать о сокращении запасов и даже выявлять тенденции до того, как они станут очевидными. Короче говоря, теперь вы можете выявлять товарные тренды с помощью веб-скрапинга, а не догадываться.
Поэтому в этом руководстве мы создаем инструмент, который по ощущениям ближе к цифровому аналитику, работающему вместе с вами.
Содержание
- Рабочий процесс инструмента мониторинга продуктов на основе ИИ
- Предпосылки
- Настройка инструментов
- Получить данные о продукте
- Анализ данных с помощью Perplexity AI
- Как создать отчет по анализу ИИ
- Автоматизируйте и планируйте отчеты ИИ
- Визуализация результатов ИИ
- Подводя итог
- Часто задаваемые вопросы (FAQ)
Рабочий процесс инструмента мониторинга продуктов на основе ИИ
Подумайте о системе, которую мы построим, как о реле. Crawlbase Он собирает страницы товаров с таких сайтов, как Amazon, eBay или любого другого магазина, на который вы укажете. Затем эта информация сокращается, оставляя только полезную информацию, например, цену, название товара и наличие на складе. После очистки данные передаются в Perplexity AI, который анализирует их и замечает то, что пользователи могли пропустить: резкий скачок цен, медленное опустошение запасов или начало формирования тренда.
Наконец, эти сведения обобщаются и предоставляются в виде отчета или оповещения, что позволяет кому-то предпринять какие-либо действия.

Предпосылки
Прежде чем приступить к сборке, полезно подготовить несколько вещей. Вам не нужно быть экспертом, но небольшая подготовка будет очень полезна.
Навыки, которые нужно взять с собой
- Базовый Питон навыки: умение читать скрипты, настраивать функции и запускать их, не теряясь.
- Некоторый опыт работы с REST API: вы должны уметь отправлять запросы и проверять ответы.
- Примерное представление о том, как модели ИИ реагируют, когда вы даете им структурированные подсказки.
Инструменты для создания решения для мониторинга продуктов на основе ИИ
- A Crawlbase аккаунт с вашим Crawling API маркер.
- API-ключ от Perplexity AI.
- Локальная машина с установленным Python.
Как только все это будет готово, мы сможем начать создавать скрипты для извлечения данных о продуктах, пропускать их через ИИ и позволять системе выявлять изменения и закономерности для вас.
Настройка инструментов
Теперь давайте подготовим среду. Мы настроим Crawlbase для сбора данных и Perplexity AI для анализа.
Crawlbase Установка
- Создать аккаунт на Crawlbase и войти.
- Скопируйте свой Crawling API обычный токен запроса. Именно его мы будем использовать в скрипте.
- Новые аккаунты включают 1,000 бесплатных запросов. Если вы добавить платежные данные Прежде чем использовать их, вы разблокируете дополнительно 9,000 бесплатных кредитов.
Настройка ИИ Perplexity
растерянность предоставляет API, совместимый с OpenAI, что упрощает интеграцию.
- Получите свой ключ API из Панель управления учетной записью Perplexity.
- В коде Python настройте клиент следующим образом:
1 | Импортировать openai |
Сохраняйте свой ключ в тайне. Не публикуйте его на GitHub и не делитесь им в публичных репозиториях.
Шаг 1: получение данных о продукте
Прежде чем мы начнём отслеживать что-либо, нам нужно найти способ извлечь информацию о товаре с сайта магазина. Это, по сути, первый фрагмент пазла. Итак, для начала скопируйте скрипт ниже. Сохраните его как crawling.py и мы продолжим развивать его позже.
1 | от запросы.исключения Импортировать ЗапросИсключения |
Обязательно замените заполнитель <Crawlbase Normal requests token> с твоим настоящим Crawlbase маркер.
Шаг 2: Анализ данных с помощью Perplexity AI
Сами по себе цифры ничего не значат, если мы их не осмысливаем. Вот тут-то и появляется Perplexity. Мы добавим функцию, которая извлекает записи о товарах, выполняет быструю проверку, чтобы убедиться, что всё в порядке, а затем отображает полезную статистику, такую как общее количество записей, самая ранняя и самая поздняя даты, диапазоны цен и даже отклонения.
Создайте новый файл с именем perplexity_ai.py и поместите туда скрипт.
1 | Импортировать JSON |
Этот скрипт преобразует необработанные данные о ценах на продукты в структурированный набор данных, просит модель ИИ проанализировать их на предмет аномалий, тенденций и закономерностей, а затем возвращает эти данные в формате JSON, при этом безопасно обрабатывая ошибки.
Имейте в виду, что запрос не фиксирован. Вы можете экспериментировать с его формулировкой, сокращать его или даже запрашивать разные ракурсы в зависимости от того, чего вы хотите добиться. Всё, что вам нужно сделать, — это подправить текст в коде, и ИИ скорректирует свой ответ соответствующим образом.
Шаг 3: Как создать отчет по анализу ИИ
Прежде чем мы сможем выполнить код, нам понадобятся тестовые данные для целей этого блога. Вы можете выполнить следующие шаги:
- Получите пример сценария из Репозиторий GitHub и сохраните как
dummy_data.pyдля заполнения базы данных. - Выполните скрипт, выполнив:
1 | python dummy_data.py |
Это должно добавить записи в вашу базу данных следующим образом:

- После того, как фиктивные данные будут вставлены, скопируйте скрипт ниже и сохраните его как
price_monitoring.py
1 | от база данных Импортировать query_products; |
Когда все готово, запустите код:
1 | питон price_monitoring.py |
Вот пример вывода Perplexity AI:

Шаг 4: Автоматизация и планирование отчетов ИИ
Для демонстрации мы решили упростить задачу, используя небольшой скрипт под названием schedule.py (его можно найти в Репо GitHub). Он настроен на запуск один раз в день в 10:00. Чтобы запустить его вручную, просто выполните:
1 | python schedule.py |
Если вам нужно что-то, что не будет давать сбоев в реальном использовании, вам следует использовать встроенный планировщик вашей системы. В Linux это обычно означает настройку хрон. В Windows вы, вероятно, выбрали бы Планировщик заданий.
Шаг 5: Визуализация результатов ИИ
Установить цены — это только половина дела. Сложнее всего понять, что они на самом деле означают, если посмотреть на весь набор целиком. Вот тут-то несколько визуальных материалов могут значительно облегчить жизнь.
Если вам нужно что-то стильное и интерактивное, вам подойдёт лёгкая панель инструментов с Plotly или Bokeh. Вы получите графики, на которые можно навести курсор, увеличить их и перенести прямо на веб-страницу.
В качестве альтернативы, если вы хотите что-то более быстрое, используйте Матплотлиб or рожденное море. Они существуют уже много лет, они невероятно универсальны, и вы можете подобрать их так, чтобы они соответствовали вашему образу.
Если вам не хочется долго смотреть на цифры или столбцы, вы можете положиться на искусственный интеллект. Такие сервисы, как Perplexity, выдадут краткие, понятные краткие описания вашего набора данных. Таким образом, вместо того, чтобы перебирать множество значений, вы получите несколько чётких и общих выводов прямо рядом с визуальными данными.
Подводя итог
Скрапинг страницы — это только начало. Как только вы принесёте Crawlbase Вместе с Python и небольшим количеством искусственного интеллекта весь процесс превращается в нечто гораздо большее: вы не просто собираете данные, вы преобразуете их в идеи, на основе которых можно действовать.
Если вам интересно, как это выглядит в реальном мире, стоит протестировать это на своих конкурентах. Crawlbase Справившись со сложностью, вы сможете извлечь необходимые данные и позволить ИИ указать на изменения на рынке прежде, чем их заметит кто-либо еще. Дайте Crawlbase попробуй сегодня и будьте на шаг впереди.
Часто задаваемые вопросы (FAQ)
В. Что делать, если мои запросы продолжают блокироваться?
A. Блокировка — одно из самых серьёзных препятствий в веб-скрапинге. CrawlbaseЭто происходит автоматически благодаря ротации IP-адресов и обновлению пользовательских агентов. Каждый запрос выглядит уникальным, как и запрос от реального посетителя, что обеспечивает бесперебойность сканирования и высокий процент успеха.
В. Что произойдет, если веб-сайт изменит свой макет или структуру данных?
A. Веб-сайты развиваются, часто обновляя макеты и HTML-структуры. Когда это происходит, ваши существующие селекторы могут перестать работать. Решение обычно быстрое: скорректируйте селекторы под новую структуру. Потому что Crawlbase всегда возвращает полный HTML, вам не нужно переписывать свой сканер с нуля; просто настройте логику анализа.
В. Могут ли модели ИИ «галлюцинировать» при анализе извлеченных данных?
A. Иногда ИИ генерирует ответы, которые хорошо читаются, но не соответствуют исходным данным. Лучший способ избежать этого — дать модели чёткие, структурированные инструкции и ограничить свободу творчества. Запросы, запрашивающие конкретные результаты, такие как сводка или таблица, обычно позволяют ИИ соответствовать вашему фактическому набору данных.











