# Ответ

Если вы это сделаете, Crawlbase Вы оставили ответ.

Этот ответ — это объект JSON или HTML-код на сайте, который может быть изменен с помощью Option, но не с ним. Формат Параметр (стандартный HTML).

# HTML-ответ

Если формат HTML-Antwortformat ausgewählt haben (был стандартным), вы можете использовать HTML der Seite als Antwort.

Умереть Ответпараметр wird den Antwortheadern hinzugefügt.

GET 'https://api.crawlbase.com/?token=_USER_TOKEN_&url=https%3A%2F%2Fgithub.com%2Fcrawlbase%3Ftab%3Drepositories&format=html'
Response:
  Headers:
    url: https://github.com/crawlbase?tab=repositories
    original_status: 200
    pc_status: 200
    'X-Domain-Complexity': standard

  Body:
    <!doctype html><html class="a-no-js" data-19ax5a9jf="dingo"><!-- sp:feature:head-start -->
    <head><script>var aPageStart = (new Date()).getTime();</script><meta charset="utf-8">
    ... (all the html of the page)

# Ответ JSON

Когда вы используете формат JSON-Antwortformat, вы можете использовать JSON-объект, чтобы он был проанализирован.

Dieses Objekt enthält alle Informationen, die Sie benötigen. Лесен Си Ответпараметр для всей информации.

GET 'https://api.crawlbase.com/?token=_USER_TOKEN_&url=https%3A%2F%2Fgithub.com%2Fcrawlbase%3Ftab%3Drepositories&format=json'
Response:
{
  "original_status": "200",
  "pc_status": 200,
  "url": "https://github.com/crawlbase?tab=repositories",
  "domain_complexity": "standard",
  "body": "\u003C!doctype html\u003E\u003Chtml class=\"a-no-js\" data-19ax5a9jf\n... (all the html of the page)"
}

# Заголовки

Wie Sie in den obigen Beispielen gesehen haben, wird die Antwort, JSON или HTML zurückgegeben Параметр для JSON или Заголовок для HTML, damit Sie erfahren, был mit der Anfrage passiert ist.

# URL

URL-адрес URL, умереть в Anfrage gesendet, или URL-адрес Weiterleitung, умереть Crawlbase гефолгт.

# оригинальный_статус

Die Statusantwort, die wir (Crawlbase) для сканирования URL-адреса.

Это может быть хороший HTTP-код состояния.

Обратите внимание, что Crawlbase Es werden nur Anfragen berechnet, die original_status Erfolg (200, 201, 204), постоянный Weiterleitung (301), временный Weiterleitung (302), wenn die folgende Weiterleitung Inhalt zurückgegeben Hat, nicht gefunden (410, 404). И когда ты pc_status ist 200. Alle anderen original_status Für die erhaltenen Codes Fall keine Gebühren an.

# pc_status

Умереть Crawlbase (ПК) Код статуса может быть верным Код статуса, который является кодом, дер letztendlich gültig ist.
Веб-сайт Beispielsweise könnte eine original_status 200 с капчей, осенью, pc_status вирд 503 сейн.

Кодекс Джедера, der nicht dem Standard entspricht, wie etwa 601, 999 usw., является стажером в инженерной команде и может помочь вам, когда вы находитесь в службе поддержки.

Обратите внимание dass Anfragen an Crawlbase das endet mit einem erfolglosen pc_status Код (также anders als 200) wird nicht berechnet.

# X-Домен-Сложность

Der Komplexitätsgrad gibt an, wie schwierig das Crawlen или Scrapen einer bestimmten Domäne ist, und spiegelt auch den damit verbunden Ressourcenbedarf und die Preise более широкий:

  • standard – Домены, которые нужно сканировать или чистить, и нур минимальные шуцмаснамены erfordern. Эти домены доступны в der Regel die niedrigste Preisstufe.
  • moderate – Domänen mit modem Anti-Bot-Schutz, die eine spezielle Behandlung erfordern. Diese Domänen haben typischerweise eine mittlere Preisstufe und sind ressourcenintensir zu verarbeiten.
  • complex – Domänen mit erweiterten Schutzsystemen, die schwer zu crown или zu Scrapen Sind. Diese erfordern fortgeschrittene Techniken und spezialisierte Ressourcen, был sich in der höchsten Preisstufewidespiegelt.

Дополнительные возможности комплексного обучения можно получить, используя мощность и технические аспекты для быстрого ползания. Специализированную предварительную информацию можно найти в разделе «План подписки» или связаться с нами, чтобы узнать больше о дополнительных услугах. контакт.

# тело

Параметр Dieser находится в строке JSON verfügbar Формат, в html format Wird der Hauptteil der Antwort сам по себе.

Der Inhalt der Seite, die Crawlbase gefunden als Ergebnis des Proxy-Crawlings der in der Anfrage gesendeten URL.