Farfetch — одна из крупнейших платформ моды класса люкс с тысячами предметов одежды, обуви и аксессуаров класса люкс от ведущих мировых брендов. Независимо от того, проводите ли вы маркетинговые исследования, анализируете тенденции моды класса люкс или создаете свою базу данных электронной коммерции, сбор данных с Farfetch может быть очень полезен.
Однако, как и многие другие веб-сайты, Farfetch использует JavaScript для загрузки своего контента, поэтому традиционные скраперы не могут скраперить нужные вам розничные данные. Вот где Crawlbase Crawling API Он упрощает сбор данных, обрабатывая контент JavaScript, управляя прокси-серверами и обходя механизмы защиты от ботов — и все это с помощью всего нескольких строк кода на Python.
В этом блоге мы будем сканировать SERP Farfetch и страницы продуктов с помощью Crawlbase Crawling API в Python.
Содержание
- Преимущества сбора данных Farfetch
- Ключевые данные для извлечения из Farfetch
- Crawlbase Crawling API для Farfetch Scraping
- Crawlbase Библиотека Python
- Установка Python и необходимых библиотек
- Выбор IDE
- Проверка HTML на наличие селекторов CSS
- Написание скребка списков поиска
- Обработка пагинации в Farfetch
- Хранение данных в CSV-файле
- Полный пример кода
- Проверка HTML на наличие селекторов CSS
- Написание скрапера страницы продукта
- Хранение данных в CSV-файле
- Полный пример кода
Преимущества сбора данных Farfetch
Один из крупнейших игроков на рынке моды класса люкс, Farfetch связывает потребителей с магазинами и брендами класса люкс. Farfetch — это сокровищница для компаний, ученых и разработчиков, предлагающая тысячи товаров: от одежды класса люкс до аксессуаров.

Анализ Farfetch даст вам представление о:
- Ценовые тенденции: Как формируются цены на предметы роскоши в зависимости от брендов, категорий и регионов.
- Доступность продукта: Отслеживайте уровень запасов и доступность, чтобы узнать, что продается быстрее всего и какие бренды пользуются популярностью.
- Рыночные тренды: найдите модные тенденции, сезонные скидки и новые бренды.
- Анализ конкурентов: Сравните цены, описания продуктов и скидки с конкурентами.
- Создание баз данных: Создайте чистую базу данных продуктов с названиями, описаниями, ценами, изображениями и т. д.
Ключевые данные для извлечения из Farfetch
При анализе Farfetch обратите внимание на следующие данные:
- реклама: Краткое описание, которое поможет вам идентифицировать продукт.
- Бренд: Отслеживайте и идентифицируйте люксовые бренды на платформе.
- Цена: Получите как оригинальные цены, так и скидки.
- Описание товара:: Собрать информацию о материалах и характеристиках для каталогизации.
- Размеры и наличие: Отслеживайте наличие на складе и спрос на популярные размеры.
- Категории: Анализ тенденций в определенных сегментах продукции.
- Фотографии: Извлечение URL-адресов изображений продуктов для визуальных баз данных.
- Рейтинги и обзоры: Понимание предпочтений клиентов и оценка качества продукции.
- Региональное ценообразование: Сравните цены в разных валютах и регионах.
- Варианты доставки: Оцените сроки и стоимость доставки.
Собирая эти данные, вы можете получить информацию для исследования рынка и роста бизнеса. Теперь давайте посмотрим, как скрафтить Farfetch с Crawlbase Crawling API.
Crawlbase Crawling API для Farfetch Scraping
Crawlbase Crawling API это инструмент для веб-скрейпинга, который упрощает извлечение данных из Farfetch. Он обрабатывает рендеринг JavaScript, прокси и решение CAPTCHA, так что вы можете сосредоточиться на создании своего скрапера без технических проблем.
Crawlbase Библиотека Python
Crawlbase также имеет Библиотека Python чтобы сделать интеграцию API легкой. Как только вы Регистрация, вы получите токен доступа для аутентификации. Вот краткий пример того, как его использовать:
1 | от база сканирования Импортировать CrawlingAPI |
Ключевые моменты:
- Crawlbase имеет отдельные токены для статического и динамического извлечения контента.
- Используйте токен JavaScript (JS) для извлечения динамического контента Farfetch.
- Crawlbase Crawling API берет на себя рендеринг JavaScript и прокси-серверы.
Как настроить среду Python
Прежде чем начать скрейпинг Farfetch, вам нужно настроить среду Python. Это проведет вас через процесс установки Python, настройки необходимых библиотек и выбора IDE для ваших нужд.
Установка Python и необходимых библиотек
- Установите Python:
- Перейдите на python.org и загрузите последнюю версию Python.
- Обязательно отметьте опцию «Добавить Python в PATH» во время установки.
- Установите необходимые библиотеки:
- Откройте терминал или командную строку и выполните следующую команду:
1 | pip установить crawlbase beautifulsoup4 |
- Эти библиотеки имеют решающее значение для веб-скрапинга и использования Crawlbase Crawling API.
Выбор IDE
Для написания и управления кодом вам понадобится IDE или редактор кода. Вот несколько вариантов:
- PyCharm: Полнофункциональная IDE с расширенными инструментами отладки и навигации по коду
- Visual Studio Code: Легкий и настраиваемый редактор с расширениями для Python.
- Jupyter Notebook: Для интерактивного тестирования и запуска фрагментов кода.
Выберите подходящую вам IDE, и все будет готово. В следующем разделе мы займемся скрапингом списков поиска Farfetch.
Скрапинг результатов поиска Farfetch
Теперь, когда у вас настроена среда Python, давайте приступим к извлечению результатов поиска из Farfetch. В этом разделе вы узнаете, как проверить HTML, создать скрапер, управлять пагинацией и сохранять данные в файл CSV.
Проверка структуры HTML
Прежде чем писать скрапер, нам нужно проверить HTML результатов поиска Farfetch, чтобы найти названия продуктов, цены и ссылки. Для этого примера мы будем использовать категорию, например «мужские кроссовки» из следующего URL.
1 | https://www.farfetch.com/pk/shopping/men/trainers-2/items.aspx |
- Открытые инструменты разработчика: Перейдите по URL-адресу и нажмите
Ctrl + Shift + I(илиCmd + Option + Iна Mac), чтобы открыть инструменты разработчика вашего браузера. - Осмотрите элементы продукта: Наведите указатель мыши на названия продуктов, цены и ссылки, чтобы найти соответствующие им теги и классы CSS.

Ключевые селекторы для списков поиска Farfetch:
- Бренд: Найдено в
<p>тег сdata-component="ProductCardBrandName"атрибутов. - Описание: Найдено в
<p>тег сdata-component="ProductCardDescription"атрибутов. - Цена: Найдено в
<p>тег сdata-component="Price"ordata-component="PriceFinal"атрибутов. - скидка: Найдено в
<p>тег сdata-component="PriceDiscount"атрибутов. - Ссылка на продукт: Найдено в
<a>тег внутри контейнера продукта. Атрибут href предоставляет ссылку на продукт с префиксомhttps://www.farfetch.com.
Написание скребка списков поиска
Вот скрипт Python для извлечения данных о продуктах с помощью Crawlbase и BeautifulSoup библиотеки:
1 | от база сканирования Импортировать CrawlingAPI |
Этот код определяет функцию, scrape_farfetch_listings, чтобы извлечь данные о продукте из результатов поиска Farfetch. Он отправляет запрос Crawlbase Crawling API для получения Farfetch SERP HTML. Он использует ajax_wait и page_wait параметры предоставлены Crawlbase Crawling API для обработки JS-контента. Вы можете прочитать об этих параметрах здесь.
Если запрос успешен, функция использует BeautifulSoup для разбора возвращенного HTML и извлечения сведений о продукте для каждой карточки продукта. Извлеченные данные сохраняются в виде словарей в списке, а функция возвращает список продуктов.
Обработка пагинации в Farfetch
Farfetch выводит списки продуктов на нескольких страницах. Чтобы извлечь все списки, пройдитесь по каждой странице, добавив параметр страницы к URL (например, ?page=2).
1 | защиту scrape_multiple_pages(базовый_url, общее_количество_страниц): |
Хранение данных в CSV-файле
После очистки сохраните данные в CSV-файл для дальнейшего анализа.
1 | Импортировать CSV |
Полный пример кода
Ниже представлен полный скрипт для извлечения результатов поиска Farfetch с помощью Crawlbase Crawling API, обработать пагинацию и сохранить данные в CSV-файл:
1 | от база сканирования Импортировать CrawlingAPI |
farfetch_listings.csv Снимок файла:

В следующем разделе мы рассмотрим сбор более подробных данных со страниц отдельных продуктов.
Очистка страниц продуктов Farfetch
Теперь, когда у вас есть парсинг листингов продуктов, следующим шагом будет парсинг отдельных страниц продуктов, чтобы получить описания продуктов, размеры, материалы и т. д. Здесь мы покажем вам, как проверить HTML, написать парсер для страниц продуктов и сохранить данные в файле CSV.
Проверка HTML на наличие селекторов CSS
Посетите страницу продукта Farfetch, например:
1 | https://www.farfetch.com/pk/shopping/men/gucci-screener-sneakers-item-27582236.aspx |
Откройте инструменты разработчика в браузере (Ctrl + Shift + I or Cmd + Option + I на Mac) и проверьте ключевые элементы, которые вы хотите извлечь.

Ключевые селекторы для страниц продуктов Farfetch:
- реклама: Расположен в
<p>пометить сdata-testid="product-short-description". - Бренд:: Расположен в
<a>пометить сdata-component="LinkGhostDark". - Цена: Расположен в
<div>пометить сid="price". - Описание: Расположен во вложенном
<div>сdata-component="AccordionPanel"с находится внутриdivсdata-testid="product-information-accordion".
Написание скрапера страницы продукта
Вот скрипт Python для извлечения информации о продукте с помощью Crawlbase и BeautifulSoap:
1 | от база сканирования Импортировать CrawlingAPI |
scrape_product_page Функция делает HTTP-запрос к указанному URL с опциями для отображения JavaScript. Затем она использует BeautifulSoup для анализа HTML и извлечения аннотации, бренда, цены, описания и размеров. Данные возвращаются в виде словаря. Если запрос не удается, она выводит ошибку.
Хранение данных в CSV-файле
После сбора сведений о продукте вы можете сохранить их в CSV-файл для более удобного доступа.
1 | Импортировать CSV |
Полный пример кода
Вот полный скрипт для извлечения данных со страницы продукта Farfetch с помощью Crawlbase Crawling API и сохранение данных в CSV-файл:
1 | от база сканирования Импортировать CrawlingAPI |
farfetch_product_details.csv Снимок файла:

Заключение
Скрапинг Farfetch может дать вам ценные данные для исследования рынка, анализа цен и поможет оставаться впереди в мире моды. Использование Crawlbase Crawling API и библиотеки, такие как BeautifulSoup, позволяют извлекать сведения о продуктах, автоматизировать сбор данных и оптимизировать рабочий процесс.
Но не забывайте соблюдать TOS сайта и этичное парсинг. С кодом и руководством, представленными в этом блоге, вы можете легко парсить страницы поиска и продуктов Farfetch. Хотите парсить больше сайтов? Ознакомьтесь с нашими другими руководствами.
📜 Как скопировать Monster.com
📜 Как скрейпить Groupon
📜 Как парсить TechCrunch
📜 Как скопировать страницы твитов X.com
📜 Как очистить Clutch.co
Если у вас есть вопросы или вы хотите оставить отзыв, наш команда поддержки может помочь с веб-скрапингом. Счастливого скрапинга!
Часто задаваемые вопросы (FAQ)
В. Как обрабатывать контент JavaScript при парсинге Farfetch?
При парсинге динамических сайтов, таких как Farfetch, содержимое JavaScript может загружаться не сразу. Используйте Crawlbase Crawling API, который поддерживает рендеринг JavaScript. Это гарантирует полную загрузку страницы, включая динамический контент, перед извлечением данных. Вы можете установить параметр ajax_wait в значение true в запросе API, чтобы дать JavaScript достаточно времени для рендеринга страницы.
В. Могу ли я извлечь информацию о товарах с нескольких страниц Farfetch?
Да, вы можете извлекать данные о продуктах с нескольких страниц на Farfetch. Для этого вам нужно обработать пагинацию. Вы можете настроить URL-адрес, включив параметр номера страницы, и извлекать списки с каждой страницы в цикле. Если использовать вместе с Crawlbase Crawling API, вы сможете сканировать несколько страниц, не опасаясь быть забаненным.
В. Как хранить извлеченные данные?
После извлечения данных из Farfetch важно сохранить их в организованном формате. Вы можете сохранить данные в файлах CSV или JSON для легкого доступа и использования в будущем. Например, код может записать извлеченные данные о продукте в файл CSV, гарантируя, что информация будет сохранена в структурированном виде, что идеально подходит для анализа или распространения.










