> ## Documentation Index > Fetch the complete documentation index at: https://docs.brightdata.com/llms.txt > Use this file to discover all available pages before exploring further. # Scraper Studio 常见问题 > Bright Data Scraper Studio 常见问题解答：爬虫类型、输入与输出、计费、限制、快照与问题反馈。本页回答 Bright Data 支持团队最常被问到的 Scraper Studio 问题。如果您想看演练而不是快速答案，请先阅读[了解 Scraper Studio](/cn/datasets/scraper-studio/introduction)。 ## 通用问题 Bright Data 网页爬虫是一段自动化脚本，通过 Bright Data 的代理与解封基础设施大规模采集公开网页数据。它以结构化格式（JSON、NDJSON、CSV、XLSX）返回采集到的数据，并可交付到 API 端点、webhook、云存储或 SFTP。Bright Data 在 [Scrapers Library](https://www.bright.cn/products/web-scraper) 中维护数百个面向主流站点的预构建爬虫。 Bright Data Scraper Studio 是用于构建自定义爬虫的云端环境。它提供两种模式：从自然语言描述生成爬虫的 AI Agent，以及可直接编写 JavaScript 的 IDE。两种模式都运行在同一套 Bright Data 代理与解封基础设施之上。详见[了解 Scraper Studio](/cn/datasets/scraper-studio/introduction)。 [Scrapers Library](https://www.bright.cn/products/web-scraper) 提供 Bright Data 为 Amazon、LinkedIn、Instagram 等主流站点维护的预构建爬虫。Bright Data Scraper Studio 则是您在所需站点不在库内时用来构建自定义爬虫的环境。可以。单个爬虫可以导航到您作为输入传入的任意 URL。如果不同站点需要不同的提取逻辑，可以使用多阶段（`next_stage()`），或为每个站点构建独立的爬虫。 ## 输入、输出与 schema 输入是 Bright Data Scraper Studio 在单次运行时传给爬虫的参数集合。典型输入包括 URL、搜索关键词、产品 ID 或 ASIN、用户名或日期范围。可以通过 CSV 上传或 API 在一次任务中传入多条输入。输出是爬虫针对一条输入返回的结构化数据。Bright Data Scraper Studio 会根据爬虫的交付偏好以 JSON、NDJSON、CSV、XLSX 或 Parquet 格式交付输出。一条输入可能产生多条记录。例如，您提交 5 个产品列表页 URL，每个列表页包含 20 个产品，那么 5 条输入会得到 100 条记录。统计页面统计的是记录数，而不是输入数。搜索爬虫接收关键词作为输入，而不是 URL。Bright Data Scraper Studio 会在目标站点上执行搜索，并从结果页中提取数据。当您没有具体 URL 时可使用搜索爬虫。 Discovery 爬虫从列表页（如搜索结果、分类页或目录页）采集数据。它会提取列表上直接可见的字段（标题、价格、评分），也可以收集产品 URL 或 ID 以供后续的产品页爬取。当输入或输出 schema 发生变化时，爬虫必须更新以匹配新 schema。如果在 Bright Data 完成更新之前触发爬虫，您会看到 `input(output)_schema_incompatible` 错误。若想忽略 schema 不匹配并继续触发，可在 UI 中点击 **Trigger anyway**（仍然触发），或在 API 请求中添加参数： * 输出 schema 不兼容：`override_incompatible_schema=1` * 输入 schema 不兼容：`override_incompatible_input_schema=1` ```bash theme={null} curl "https://api.brightdata.com/dca/trigger?scraper=ID_COLLECTOR&queue_next=1&override_incompatible_schema=1" \ -H "Content-Type: application/json" \ -H "Authorization: Bearer API_KEY" \ -d '[{"url":"https://targetwebsite.com/product_id/"}]' ``` ## 构建与编辑爬虫 Bright Data Scraper Studio 中有三种方式： * **使用 AI Agent 构建**：用自然语言描述您想要的数据。详见 [Scraper Studio AI Agent](/cn/datasets/scraper-studio/ai-agent)。 * **在 IDE 中构建**：直接编写 JavaScript。详见[使用 IDE 开发爬虫](/cn/datasets/scraper-studio/develop-a-scraper)。 * **申请托管爬虫**：由 Bright Data 数据团队为您构建并维护爬虫。可以。每个爬虫 —— 包括 AI Agent 生成的 —— 都可以在 Bright Data Scraper Studio IDE 中打开并编辑。您可以修改提取逻辑、调整选择器、增删输出字段，以及优化性能。如果不想写代码，可以使用[自我修复工具](/cn/datasets/scraper-studio/self-healing-tool)用自然语言提交修改请求。向 AI Agent 传入一个目标 URL 和（可选的）想要数据的描述。AI Agent 会提出澄清问题、生成输出 schema 供您审查，并在您批准 schema 后写出完整的爬虫代码。之后您可以立刻运行爬虫，或安排周期性运行。完整演练参见 [Scraper Studio AI Agent](/cn/datasets/scraper-studio/ai-agent)。 ## 运行与触发爬虫 Bright Data Scraper Studio 支持三种触发方式： * **通过 API**：普通请求、排队请求或替换请求 * **手动**：从控制面板触发 * **按计划**：每小时、每日、每周或自定义详见[启动数据收集与交付](/cn/datasets/scraper-studio/initiate-collection-and-delivery-options)。排队请求告诉 Bright Data Scraper Studio 在同一爬虫的上一个请求完成后再启动下一个。当您希望串行执行而非并行运行多个任务时使用它。 Bright Data Scraper Studio 每个爬虫最多并行运行 **1,000 个批量任务**。超出部分会自动排队，等容量释放后启动。完整限制参见 [Scraper Studio 规格说明](/cn/datasets/scraper-studio/specifications)。在 Bright Data Scraper Studio 仪表盘上点击 **Failed crawls**（失败抓取）下的 **Bug** 图标可在 IDE 中打开该爬虫。失败的输入会显示在 **Last errors**（最近错误）选项卡，附带精确的错误信息和错误码。Bright Data 会为每个虚拟任务保留最近 1,000 次错误，方便您重新运行失败的输入并诊断问题。 ## 计费与限制 CPM 是 "cost per mille"（每千次成本）的缩写，即 1,000 次页面加载。Bright Data Scraper Studio 按 CPM 单位对页面加载计费。当前费率请参见[定价页面](https://www.bright.cn/pricing/web-scraper/custom)。计费事件指任何让 Bright Data Scraper Studio 加载页面或发起网络请求的函数： * `navigate()` * `request()` * `load_more()` * 媒体文件下载（按 GB 计费，与 CPM 分开） Scraper Studio 没有单独的页面加载或记录额度，但它包含在账户级免费套餐内。每个新账户每月可获得 5,000 个免费信用额度，这是一个可用于 Unlocker API、SERP API、Web Scraper API 和 Scraper Studio 的单一共享池。在免费套餐中，Scraper Studio 每次页面加载消耗一个信用额度，从该池中扣除；记录默认不计费。新账户还会获得一笔可用于任意 Bright Data 产品的一次性新手赠送额度。参见[免费套餐](/cn/general/account/billing-and-pricing/free-tier)和[计费](/cn/general/account/billing-and-pricing/billing)页面。 ## 快照与数据保留快照保留期取决于采集类型： * **批量采集**：16 天 * **实时采集**：7 天超期后快照会被永久删除。Bright Data 不会恢复已过期的数据。请在保留窗口关闭前下载或导出数据，或配置爬虫通过 webhook、API 下载或云存储自动交付结果。 ## 反馈问题在 Bright Data Scraper Studio 控制面板中打开爬虫，从三点菜单选择 **Report an issue**（反馈问题）。Bright Data 会根据问题类型将工单路由到不同团队： * **Data**（缺失字段、缺失记录、解析错误）：路由给爬虫工程师。仅适用于托管爬虫。 * **Collection and delivery**（交付不完整、爬虫运行慢）：路由给支持团队。 * **Other**（UI 问题、产品咨询）：路由给客户经理。请附上受影响的 job ID、问题描述，以及能说明问题的截图或文件。包含以下内容： * 问题分类（数据错误、缺失记录、交付问题、IDE 问题、其他） * 问题的精确描述 * 受影响的 job ID * 能展示问题的截图或文件（如有） Bright Data 会自动创建工单，由研发团队处理。当 Bright Data 工程师开始构建爬虫时您会收到一封邮件，爬虫准备就绪时会再收到一封邮件。您也可以在 Scrapers 仪表盘上跟踪状态。 ## 相关内容 Bright Data Scraper Studio 如何工作以及何时使用基础设施限制、计费与数据保留