跳转到主要内容

数据抓取器仪表板

您使用模板或自定义抓取器创建的任何抓取器都会显示在您的数据抓取器仪表板上。

概览

  • 免费试用:作为7天免费试用的一部分,您可使用 1,000 页加载
  • 有可用更新:有抓取器的新版本可用。如果没有更新按钮,则表示您已使用最新版本。
  • 属性:这里显示抓取器的所有属性。了解更多
  • 交付偏好:选择所需的文件格式、交付方式和通知设置。了解更多
  • 输出配置/架构:在此处,您可以返回编辑输出定义。了解更多
  • 限制 - 我们的采集器有 100 个并行运行任务 的限制。当触发超过 100 个任务时,额外任务将排队等待前面的任务完成。

抓取器操作菜单

抓取器操作菜单允许对抓取器执行不同操作。
  • 通过 API 启动 - 无需进入控制面板即可开始数据收集
  • 手动启动 - Bright Data 控制面板让数据收集轻松上手
  • 按计划运行 - 精确选择何时收集所需数据
  • 版本 - 查看抓取器的修改版本
  • 报告问题 - 您可以使用此表单反馈平台、抓取器或数据集结果的问题
  • 复制链接 - 复制抓取器链接以与同事共享
  • 工单 - 查看工单状态
  • 高级选项:
    • 编辑代码 - 在 IDE 中编辑抓取器代码
    • 禁用抓取器 - 暂时禁用抓取器,但可根据需要重新启用
    • 删除抓取器 - 永久删除抓取器

属性:

  • 抓取器维护者:
    • 自助服务:抓取器由您维护
    • 全方位服务:抓取器由 Bright Data 开发者维护
  • 抓取器类型:
    • 搜索:抓取器输入为关键字(例如 iPhone)
    • PDP:抓取器输入为产品页面 URL
    • 发现:抓取器输入为类别 URL
    • 其他
  • 抓取器使用案例(社交媒体、电商、旅游等)
  • 上次修改:显示抓取器最后更新时间
  • CPM 价格:1 CPM = 1,000 页加载
  • 每输入平均页面加载量:处理 1 个输入集所需的平均页面加载数

启动抓取器并获取收集结果

启动抓取器 开始收集数据,您有三种选择: A. 通过 API 启动
B. 手动启动
C. 计划抓取器
获取收集结果 数据收集完成后,点击“三点”图标并选择“统计信息”以访问结果并下载数据。
实时作业输入和输出无法下载,因为它未存储在我们端

统计信息

统计页面展示了数据收集成功的重要信息。以下是统计表中包含的所有术语: 统计操作菜单
  • 三点 您可以在此对数据收集任务执行不同功能: 统计页面展示了数据收集成功的重要信息。以下是统计表中包含的所有术语:
  • 作业 ID - 收集的唯一 ID
  • 触发者 - 启动数据收集的人及方式(API、手动或计划)
  • 输入 - 插入到收集中的输入数量
  • 记录 - 收集的结果数量
  • 失败 - 抓取失败的页面数量
  • 成功率 - 成功收集结果的百分比
  • 排队时间 - 排队时间戳
  • 开始时间 - 抓取器开始收集的日期和时间
  • 完成时间 - 抓取器完成收集的日期和时间
  • 作业时间 - 完成所用的时间长度
  • 预计剩余时间 - 收集完成前剩余的时间
  • 队列 - 触发行为中作业的名称(队列名称)
  • 使用量 - 已使用的页面加载总量