跳转到主要内容

Documentation Index

Fetch the complete documentation index at: https://docs.brightdata.com/llms.txt

Use this file to discover all available pages before exploring further.

本指南展示如何使用自我修复工具自动更新您的爬虫代码 - 添加或删除输出字段以及解决破损代码 - 无需手动编辑底层脚本。

什么是自我修复工具?

自我修复工具是一个内置于爬虫工作室的AI驱动代码重构助手。当您的爬虫因网站结构更改而破损,或当您需要添加或删除输出字段时,该工具基于纯文本提示重写爬虫代码的相关部分 - 因此您无需手动挖掘代码。

何时使用:

当爬虫停止返回预期数据,或当您需要快速添加/删除字段(如 priceimagerating)而不需要深入编码知识时,使用自我修复工具。
  • 一个有效的 Bright Data 账户
  • 爬虫工作室中的现有爬虫(开发模式保存版本)
  • 访问爬虫工作室 IDE
1

打开自我修复工具

在您的爬虫工作室 IDE 中,找到自我修复工具
self-healing-tool-location.png
预期结果:您应该看到一个文本输入字段,准备好接受您的指令。
refactor-collector.png
2

描述您需要的修复或更改

使用纯文本在提示字段中输入您的请求。请具体说明什么被破坏或您想添加什么。
示例提示:
向输出添加"price"和"image"字段

"price"值返回"undefined",请修复  
"price"字段从HTML返回错误的数据,改为使用tag_response()来捕获"/api/price"  
预期结果:AI 处理您的提示并生成建议的代码更改,在编辑器中以差异形式突出显示。
您无需停留在页面上即可让自我修复工具处理您的请求,处理可能需要长达 15 分钟。AI 重构完成后,您将收到电子邮件通知,以便您可以返回并在方便时审查建议的更改。
email.png
3

审查建议���更改

在代码模板中检查 AI 生成的差异。在接受前验证更改是否与您的意图匹配。
  • ✅ 接受 - 将更改保存到草稿
  • ❌ 拒绝 - 丢弃建议;您的原始代码保持不变
预期结果:如果接受,编辑器将反映更新的代码并将其保存到草稿
4

运行预览

接受更改后,运行预览以验证爬虫是否正确返回预期的数据。
run-a-preview.png
预期结果:您的输出文件包含新添加/修复的字段,具有有效的、非未定义的值。
view-download.png
5

保存到生产环境

预览确认数据正确后,将爬虫保存到生产环境。
save-to-production.png
如果您添加/重命名了字段,系统将提示您更新架构。点击 更新架构,然后点击 保存到生产环境
update-schema.png
预期结果:重构/修复的爬虫已上线,准备好以新配置收集数据。

故障排除

问题可能的原因解决方案
AI生成的代码无法解决问题提示太模糊使用更具体的字段名称或错误描述重新提示
预览仍然返回未定义的值目标网站结构已更改检查实时页面并在提示中包含预期的HTML元素提示
接受后更改未反映浏览器缓存问题刷新IDE并重新检查开发模式