跳转到主要内容

Documentation Index

Fetch the complete documentation index at: https://docs.brightdata.com/llms.txt

Use this file to discover all available pages before exploring further.

使用这些可直接复制的提示词,完全通过 Claude Code、Cursor 或 Codex 驱动 Bright Data Scraper Studio 的构建、运行、修复、批准、再运行流程。这种模式是有意为之:先构建一个最小爬虫,再通过修复扩展数据结构,这样修复信封中的 preview_result 就更容易对照一个已知良好的基线进行验证。

前提条件

  • 一个 Bright Data 账户(免费注册,无需信用卡)。
  • Node.js 18 或更高版本。如果尚未安装 Bright Data CLI,第一个提示词会让编码助手为您安装。
  • 一个具备终端访问能力的编码助手:Claude Code、Cursor 或 Codex。

用一个提示词运行完整流程

如果您只想直接看到构建、运行、修复、批准、再运行流程的实际效果,粘贴下面这一个提示词,让编码助手逐步完成每个步骤。如果 Bright Data CLI 尚未安装,编码助手会先安装它。
Prompt
端到端地构建、运行、修复并验证一个 Bright Data 爬虫。请按顺序执行每个步骤,如果某个步骤失败则停止:

1. 运行 `bdata --version` 检查是否已安装 Bright Data CLI。如果找不到该命令,使用 `npm install -g @brightdata/cli` 安装它,然后运行 `bdata login` 进行身份验证。
2. 为 https://shopalto.xyz/product/aurora-wireless-headphones 创建一个 Bright Data 爬虫,仅提取两个字段:产品名称和价格。返回 Collector ID。
3. 在同一个 URL 上运行该爬虫并美化输出结果。预期返回一行包含 name 和 price 的数据。
4. 原地修复该爬虫,在现有的 name 和 price 之外,再捕获 description、image url 和 rating。保持相同的 Collector ID,将修复锚定在同一个 URL 上,并显示批准信封。
5. 当预览显示全部五个字段时,在同一个 URL 上批准该修复。
6. 再次在同一个 URL 上运行该爬虫,确认全部五个字段都已返回:name、price、description、image_url 和 rating。
预期结果: 编码助手最终返回一行 JSON,包含 namepricedescriptionimage_urlrating,且 Collector ID 与第 2 步相同。

逐步运行流程

当您希望在继续之前检查每个 Collector ID、运行结果和修复信封时,请逐条执行下面的提示词。
1

提示编码助手检查 CLI 是否已安装

Prompt
运行 `bdata --version` 检查是否已安装 Bright Data CLI。如果找不到该命令,使用 `npm install -g @brightdata/cli` 安装它,然后运行 `bdata login` 进行身份验证。在继续之前确认版本号。
预期结果: 编码助手打印出 bdata 的版本号并确认已完成身份验证。如果 CLI 此前缺失,编码助手会先安装它。
2

提示编码助手构建一个最小爬虫

Prompt
为 https://shopalto.xyz/product/aurora-wireless-headphones 创建一个 Bright Data 爬虫,仅提取两个字段:产品名称和价格。完成后向我显示 Collector ID。
预期结果: 编码助手返回一个类似 c_mpohus372o5tmid1jk 的 Collector ID。请保存它;后续提示词都会复用同一个 ID。
3

提示编码助手运行爬虫

Prompt
在 https://shopalto.xyz/product/aurora-wireless-headphones 上运行该爬虫并美化输出结果。
预期结果: 一个 JSON 数组,包含一行数据,仅填充 nameprice
4

提示编码助手修复并添加更多字段

Prompt
原地扩展该爬虫。修复它,在现有的 name 和 price 之外,再捕获 description、image url 和 rating。保持相同的 Collector ID。将修复锚定在 https://shopalto.xyz/product/aurora-wireless-headphones 上,并在准备就绪时向我显示批准信封。
预期结果: 编码助手返回 status: "awaiting_approval",其 preview_result 行现在显示五个字段。
5

提示编码助手批准修复

Prompt
预览看起来没问题。批准该修复,锚定在 https://shopalto.xyz/product/aurora-wireless-headphones 上。
预期结果: status 推进到 done。Collector ID 保持不变。
6

提示编码助手验证扩展后的数据结构

Prompt
再次在 https://shopalto.xyz/product/aurora-wireless-headphones 上运行该爬虫,确认全部五个字段现在都已返回:name、price、description、image_url 和 rating。
预期结果: 与之前运行相同的 JSON 结构,每行现在多出三个字段。
如需无人值守的变体,让编码助手在修复调用中添加 --auto-approve。编码助手会跳过批准环节,一步轮询直至 done。仅在您信任无需人工审核的修复时使用它。

相关内容

使用 Bright Data CLI 构建爬虫

权威的 CLI 教程:安装、登录、创建、运行、修复

自我修复工具

从 Bright Data 控制面板修复爬虫

Scraper Studio API 快速开始

通过 cURL、Python 或 Node.js 触发现有爬虫

Bright Data CLI 命令

scraper create、heal 和 approve 的参数参考