了解如何使用 Scrapers 触发数据采集,支持 discovery 和 PDP 两种采集方式。可自定义请求、设置交付选项,并高效获取数据。
Documentation Index
Fetch the complete documentation index at: https://docs.brightdata.com/llms.txt
Use this file to discover all available pages before exploring further.
Example: [{"url":"https://www.airbnb.com/rooms/50122531"}]
data 传入
Example (curl): data=@path/to/your/file.csv

PDP URL 输入示例PDP 的输入格式始终是指向待抓取页面的 URL。
discovery 方法的 Discovery 输入示例discovery 的输入格式可能因具体 scraper 而异。示例如下:
在 Authorization 头中使用您的 Bright Data API Key 作为 Bearer token。
认证方法:
Authorization: Bearer YOUR_API_KEY示例:
Authorization: Bearer b5648e1096c6442f60a6c4bbbe73f8d2234d3d8324554bd6a7ec8f3f251f07df了解如何获取 Bright Data API Key: https://docs.brightdata.com/cn/api-reference/authentication#如何生成新的-api-key?
触发数据采集的数据集 ID。
"gd_l1vikfnt1wgvvqz95w"
输出列列表,用 | 分隔 (例如 url|about.updated_on)。过滤响应,仅包含指定字段。
"url|about.updated_on"
设置为 "discover_new" 以触发包含发现阶段的数据采集。
discover_new 指定使用哪种发现方法。可选项包括: "keyword"、"best_sellers_url"、"category_url"、"location" 等(根据具体 API)。仅对包含发现阶段的采集相关。
在结果中包含错误报告。
每个输入的结果数量限制。仅对包含发现阶段的采集相关。
x >= 1限制总结果数量。
x >= 1当采集完成时,通知将发送到此 URL,包含 snapshot_id 和状态。
数据将被传送到的 webhook URL。
指定传送到 webhook 的数据格式。
json, ndjson, jsonl, csv 发送通知到 notify URL 或通过 webhook 传输数据时使用的授权头。
默认情况下,数据会被压缩发送到 webhook。传 true 可不压缩发送。
采集任务成功启动
可在后续 API 中使用的请求 ID
"s_m4x7enmven8djfqak"