Scraper API
Забудьте о парсинге. Выберите скрейпер, укажите URL и получите чистый структурированный JSON. Скрейперы охватывают Amazon, Google, LinkedIn, Instagram, eBay и многие другие сайты.
&scraper=nameТе же скрейперы, более простой endpoint, больше параметров. Отдельный Scraper API закрыт для новых регистраций с 1 октября 2024 года - существующие интеграции продолжают работать, отключение не запланировано, а миграция сводится к изменению одной строки URL.
Endpoint
# Identical to the Crawling API, plus a required `scraper` parameter.
# Returns parsed JSON instead of raw HTML.Быстрый старт - товар Amazon
curl 'https://api.crawlbase.com/scraper?token=YOUR_TOKEN' \
--data-urlencode 'url=https://www.amazon.com/dp/B08N5WRWNW' \
--data-urlencode 'scraper=amazon-product-details' -Gfrom crawlbase import ScraperAPI
api = ScraperAPI({'token': 'YOUR_TOKEN'})
res = api.get(
'https://www.amazon.com/dp/B08N5WRWNW',
{'scraper': 'amazon-product-details'}
)
import json
data = json.loads(res['body'])
print(data['name'], data['price'])const { ScraperAPI } = require('crawlbase');
const api = new ScraperAPI({ token: 'YOUR_TOKEN' });
const res = await api.get(
'https://www.amazon.com/dp/B08N5WRWNW',
{ scraper: 'amazon-product-details' }
);
const data = JSON.parse(res.body);
console.log(data.name, data.price);Пример ответа:
{
"name": "Echo Dot (4th Gen) | Smart speaker with Alexa",
"asin": "B08N5WRWNW",
"brand": "Amazon",
"price": "$49.99",
"availability": "In Stock",
"rating": 4.7,
"reviews_count": 412903,
"main_image": "https://m.media-amazon.com/images/I/61MZi+B-OBL.jpg",
"images": ["…"],
"features": ["Meet the all-new Echo Dot…"],
"description": "Our most popular smart speaker…"
}Каталог скрейперов
Репрезентативная выборка доступных скрейперов. Передавайте имя скрейпера в параметре scraper.
Amazon
| Скрейпер | Возвращает |
|---|---|
amazon-product-details | Страница товара: название, цена, рейтинги, изображения, характеристики |
amazon-search-results | Страница результатов поиска: товары, пагинация, фильтры |
amazon-reviews | Страница отзывов с рейтингом, автором, датой, текстом и количеством оценок «полезно» |
amazon-bestsellers | Списки бестселлеров по категориям |
amazon-questions | Раздел вопросов и ответов покупателей |
| Скрейпер | Возвращает |
|---|---|
google-serp | Результаты поиска: органика, реклама, knowledge panel, похожие запросы |
google-shopping | Результаты вкладки Shopping с продавцом, ценой, рейтингом |
google-news | Результаты вкладки News с источником, сниппетом и временем публикации |
google-maps | Страница места: название, адрес, часы работы, рейтинги, отзывы |
google-scholar | Результаты академического поиска с цитированиями |
Социальные сети
| Скрейпер | Возвращает |
|---|---|
linkedin-profile | Данные публичного профиля: опыт работы, образование, навыки |
linkedin-company | Страница компании: размер, отрасль, штаб-квартира |
instagram-profile | Метаданные профиля, недавние посты, количество подписчиков |
tiktok-profile | Профиль пользователя TikTok и недавние видео |
youtube-channel | Метаданные канала, число подписчиков, недавние загрузки |
Другие маркетплейсы
| Скрейпер | Возвращает |
|---|---|
ebay-product-details | Данные объявления на eBay |
walmart-product | Страница товара Walmart |
yelp-business | Карточка бизнеса Yelp со сводкой отзывов |
booking-hotel | Страница отеля Booking.com с тарифами и удобствами |
tripadvisor-attraction | Страница достопримечательности TripAdvisor |
Полный каталог доступен в вашей панели. Новые скрейперы добавляются ежемесячно. Напишите нам, если вам нужен кастомный скрейпер для сайта, который мы пока не поддерживаем.
Автоопределение с autoparse
Если вы знаете URL, но не хотите искать нужное имя скрейпера, используйте autoparse=true на стандартном endpoint Crawling API. Мы определим тип страницы и автоматически применим подходящий скрейпер.
curl 'https://api.crawlbase.com/?token=YOUR_TOKEN' \
--data-urlencode 'url=https://www.amazon.com/dp/B08N5WRWNW' \
--data-urlencode 'autoparse=true' -G
# Crawlbase recognizes the Amazon URL and auto-applies amazon-product-detailsПараметры
Endpoint Scraper API принимает ту же структуру, что и Crawling API, сокращённую до пяти параметров ниже плюс имя scraper. Подробные примечания по каждому общему параметру см. в справочнике Crawling API - он является каноническим, а этот список представляет собой самодостаточный справочник для устаревшего endpoint /scraper.
javascript=true.http или https и быть полностью URL-кодированным.US, GB, DE). Доступность стран зависит от тарифного плана; полный список стран приведён в справочнике параметров Crawling API.javascript=true для SPA и страниц с JS-рендерингом. Стоит 2 кредита за запрос; требует JavaScript token, а не Normal token.javascript=true. Зависит от тарифного плана.Ошибки, специфичные для скрейпера
| Код | Значение |
|---|---|
422 | Неизвестное имя скрейпера. Проверьте написание по каталогу. |
423 | URL не соответствует ожидаемому шаблону скрейпера (например, amazon-product-details на URL, не относящемся к товару). |
425 | Структура страницы изменилась, и скрейпер не смог извлечь данные. Сообщается автоматически; обычно исправляется в течение нескольких часов. |

