跳转到主要内容
有问题吗?点击这里 联系我们 >>>
2025 年 7 月

截至 2025 年 7 月 29 日当周的发布说明

🆕 新功能

已验证账户的 IP 订单

可订购大量专用 IP,并支持处理时间与交付跟踪。阅读更多

Deep Lookup 预览模式

在拉取数据之前可免费预览表结构,并附带内置 co-pilot 优化提示以提升准确性。阅读更多

Google 轻量解析器

可将前 10 条搜索结果解析速度提升至 2.5×。阅读更多

Bing → Bright Data SERP API 迁移

提供 1 对 1 的迁移路径,便于将 Bing API 解析迁移到 Bright Data 的 SERP API。阅读更多

截至 2025 年 7 月 22 日当周的发布说明

🆕 新功能

Web Scraper API – Gemini/Grok/Google AIO

新增多模型 AI Scraper 支持,使使用任意一个模型的用户都能轻松使用其他模型。阅读更多

BrightAI 起始页

推出 BrightAI —— 基于 RAG 的助手,利用账户日志与设置引导用户进行配置、优化与浏览 Bright Data 工具。

数据与数据速率概览

Zone Dashboard 新增筛选器,可按 zone、类型、目标域名查看流量与连接速度,以帮助优化与检测异常。阅读更多

Residential Mega Pool

提供更大的 IPv4/IPv6 住宅代理轮换池访问。

IPv6 → IPv4 回退

当目标网站不支持 IPv6 时自动回退至 IPv4,以提升成功率。

数据中心与 ISP 批量订单

特定客户可提前下单未来的专用数据中心与静态住宅代理,并在控制面板中查看交付进度。

MCP 云存储

可选择云托管或本地部署 MCP,以获得更广泛的兼容性。阅读更多

Web Archive 前缀自定义

可自定义导出文件夹路径的前缀。阅读更多
2025 年 6 月

🆕 新功能

Scraper IDE(Functions)WARC 支持

支持以 WARC 格式捕获网页内容全上下文,更适合存档、合规与可复现研究。阅读更多
2025年5月

🆕 新功能

居民网络:IPv6 支持

现在您可以在 Bright Data 的居民网络上使用 IPv6。拥有超过 150,000 个支持 IPv6 的节点,并且还在增长,此升级提供更高的可扩展性和更大的 IP 池访问。 阅读更多

自定义抓取器

轻松从任何网站提取数据——无需编码或基础设施。只需提供目标 URL 并定义所需数据。可以选择自行管理项目,或让我们提供端到端服务。阅读更多

抓取器:自定义字段选择

通过使用简单的管道分隔列表,仅选择所需字段,从而节省存储并简化输出。阅读更多

🚀 新集成

LangChain

使用实时匿名网页数据为 LLM 代理提供动力。阅读更多

Lindy.ai

使 AI “员工”能够利用实时网页数据自动执行任务。阅读更多

LlamaIndex

无缝将网页数据导入和索引到知识库,以实现强大的检索增强生成(RAG)工作流。阅读更多

Make

自动化抓取、数据集检索和 API 调用——无需代码。阅读更多

n8n

构建自动化工作流,将 Bright Data 的功能与数百个其他应用和服务连接——全部通过可视化编辑器。阅读更多
2025 年 4 月

截至 2025 年 3 月 20 日当周的发布说明

数据集

🆕 新功能

大型数据集分片与 UI 下载:可直接在 UI 下载大型数据集。大文件会自动拆分成多个小文件,并通过邮件提供下载链接。

🚀 改进

  • 改进的交付系统:优化后端以实现更快、更稳定的数据集交付。
  • Filter API 微调:改进性能与过滤准确性。
  • 支持免费数据集:新增对免费数据集的账单端支持,便于获取免费提供的数据。

错误状态文档更新

文档新增 Dataset API 错误状态码,帮助开发者更快排查问题。

👉 查看文档

通过邮件下载大型快照

快照大于 5GB 时,可通过邮件接收下载链接。

Snapshot Metadata API 更新

现在会返回错误详情、错误代码与启动类型,以提升可见性。

🐞 修复

  • 修复“自定义数据集”按钮。
  • 修复大型 Parquet 文件交付时的内存错误。
  • 修复过滤器缺失“list exact match”和“include”选项。
  • 修复 Enriched Employee Business 数据集过滤问题。
  • 修复不清晰的 UI 错误提示。
  • 修复快照表某些空列显示问题。
2025 年 3 月

截至 2025 年 3 月 20 日当周的发布说明

通用

🆕 新功能

  • AI 驱动的支持
    • BrightAI 现在为中小型和新客户提供支持工单的首轮响应,在确保服务质量的同时提供即时协助。您将获得更快的初始回应,但如果需要,您可以在任何时候请求人工支持专家加入对话。

数据集

🆕 新功能

  • 自动完成带来的更轻松过滤体验
    • 使用自动完成建议后,过滤数据集变得更快速、更直观。例如,在选择 Amazon 类别时,您现在可以从预定义列表中选择,而无需在 Amazon 上手动搜索。 mar20_1
  • 新的数据集元数据 API
    • 开发者现在可以通过 API 访问数据集的元数据,更轻松地与 Zapier、Make.com 和 n8n.io 等自动化工具集成。这允许您获取数据集详情和 schema,以设置自动化工作流并获取所需的精确数据。👉 查看 API 文档(link

🚀 改进

  • 更好的市场搜索
    • 市场中的数据集搜索现在更灵活,允许轻微的拼写错误或变体,使您在搜索不够精准时仍能找到所需内容。 mar20_2
  • 更清晰的过滤限制提示
    • 当达到每日过滤限制时,现在会显示清晰的信息说明限制及下一步操作。您还可以提交请求,让我们的数据专家协助优化过滤条件。 mar20_3
  • 日期列的实用提示
    • 日期列现在包含解释日期格式的提示,确保您理解所选日期范围内的记录是“包含”的。 mar20_4

🐞 Bug 修复

  • 更好的可用性与 UI
    • 我们通过修正文案错误等方式进行了一系列设计和可用性改进,让体验更加顺畅。

Scrapers(网页采集器)

🆕 新功能

  • 新的端点支持同步请求获取采集数据
    • 我们推出了一个新的端点,允许同步调用直接从请求来源获取采集数据,提高效率、简化流程。这一增强与未来即将发布的设计更新结合,将使用户更快访问和测试他们的采集数据,并更好地呈现其潜在价值(link
  • 新的“Wikipedia 文章”采集器
    • 用户现在可以根据关键词发现和采集 Wikipedia 文章信息。

🚀 改进

  • 搜索与导航
    • 我们对搜索结果和导航进行了多项改进,使用户更容易找到相关数据并探索相关产品。搜索结果现在将优先显示仅域名结果以提高准确性。此外,数据集(DS)结果将显示在 Scraper 结果下方,反之亦然,使结构更清晰。 mar20_5
  • SERP 中的新横幅,用于重定向对 ChatGPT 和 Perplexity 结果感兴趣的用户
    • 此横幅让用户更轻松访问 AI 驱动的搜索结果数据。 mar20_6

🐞 Bug 修复

  • API Key 刷新修复
    • 我们解决了影响 API Key 刷新的问题,确保身份验证与会话持续不受影响。
  • Scraper 请求调度通知修复
    • 解决了新自定义 Scraper 请求的调度通知未正确触发的问题,确保相关人员能及时收到提醒。

截至 2025 年 3 月 13 日当周的发布说明

Web Archive API:

🚀 改进

  • 热存储时长更新 Web Archive API 现在提供 72 小时的热存储数据(之前为 96 小时)。更多详情请查看此处

Scrapers:

🆕 新功能

  • 输出 Schema 更改监控 我们发布了“输出 schema 变化监控系统”,以提高检测准确性与透明度。Schema 更改通知现在整合为一封邮件推送给用户。 mar13_img1
  • 新的 Walmart 产品发现方式 用户现在可以根据 SKU 发现并采集产品信息。

🚀 改进

  • 大型文件的外部存储选项 如果压缩文件仍超过 5GB,系统会提示将文件发送到外部存储,便于访问与管理。
  • 自定义采集器——请求流程改进 根据客户类型(Community、Named、Key、Strategic)对请求进行分流,并仅邀请相关人员参与,提高效率。
  • 自定义采集器 schema 更新更灵活 如果客户在通话中修改 schema,团队现在可在发送给合作伙伴前进行更新。

Proxy 产品:

🚀 改进

  • 允许将数据中心和 ISP 代理从旧的“按 GB 计费”方案迁移到新的“无限流量”方案。

🐞 Bug 修复

  • 修复住宅代理网络中默认国家的错误国家分配问题。

数据集:

🆕 新功能

  • 电商数据集支持每日 & 每周订阅 您现在可以为 73 个电商数据集中的 41 个设置每日或每周更新,更轻松监控新品或价格变化。 🚀 改进
  • 更好的过滤功能
    • 应用过滤器前查看匹配记录数——您现在可以在应用过滤器前看到有多少记录匹配条件。
    • 按日期过滤——现在可使用相对日期进行更精准的数据选择。
  • 数据集页面新增预计费用标签
    • 在购买按钮下方新增预计费用标签,让您在购买前了解价格。
    • “过滤数据集”按钮可快速调整数据集筛选条件。
  • 更顺畅的结账体验
    • 更清晰的导航——新增面包屑导航。
    • 更智能的更新说明——更好地解释 delta(增量)订阅。
    • 支持优惠码——现在可在结账时直接输入折扣码。
  • 更好的市场体验
    • 市场中新增面包屑导航。
    • 更新了头部、分类列表和数据集卡片网格,使浏览更轻松。

🐞 Bug 修复

  • 更快的报价计算 通过移除不必要的计算提高了结账性能。
  • 订阅更新修复 更新订阅时不再跳转到其他页面。
  • 预览速度改进 数据集预览加载速度更快。

Scrapers:

🆕 新功能

  • 从 No-Code Scraper 取消快照——用户现在可以直接取消正在运行的快照。
  • 新的日志功能——日志区域新增按钮以提供更好的交互和调试体验。
  • 新的 Airbnb 房源发现方式——根据过滤后的 URL 获取房源信息。
  • 新的 Glassdoor 公司发现方式——根据过滤后的 URL 获取公司信息。

🚀 改进

Scrapers 首页 UI 增强
我们改进了 Scrapers 首页的可用性,包括更快的搜索、更紧凑的卡片显示、更多推荐内容、更智能的自定义 Scraper 建议,以及分类页面内的搜索功能。
  • 统一 API 与 No-Code 的数据交付选项 修复了 API 与 No-Code Scraper 在数据交付设置上的不一致,使配置逻辑统一。

🐞 Bug 修复

  • 修复损坏的数据交付设置
  • 过滤功能修复——“我的采集器”表格过滤现在可按产品正确工作
  • URL 结构统一——所有 Scraper URL 现在遵循统一格式,包含 scrapers
  • Scraper 首页搜索结果修复
2025年2月

代理产品

🚀 改进

  • 在区域概览页面中新增按域名分解区域统计数据的选项: feb27_image1

Unlocker API

🆕 新功能

数据集

🆕 新功能

  • 支持数据集过滤器中的日期表达式:现在您可以在数据集过滤器中使用日期表达式(相对日期),便于根据时间条件精细选择数据。此功能同时支持 Filter API 和数据集订阅,允许更灵活的动态过滤。示例用例:假设您希望过滤记录,仅包含过去 7 天的数据。可以使用“最近”表达式检索过去一周的所有记录,同时排除更早的数据。 feb27_image2

🚀 改进

  • 我们增强了个人可识别信息(PII)的屏蔽方式,以提高数据安全性和合规性。
  • 改进结账页面报价生成时间——加载报价数据和最终价格的时间更快。
  • 发布了新的结账页面,用户现在可以直接在结账页面查看已添加和更新的记录。

🐞 错误修复

  • 修复预览表错误:解决了导致数据集预览表加载缓慢的问题,确保数据预览更快速顺畅。

抓取器

🆕 新功能

  • Perplexity 抓取器 - 推出全新 Perplexity 抓取器,类似于我们的 ChatGPT 抓取器!此抓取器允许客户以编程方式与 Perplexity 交互,将响应作为结构化数据检索。现在,您可以轻松自动化查询并从 Perplexity 提取洞见。在此尝试 feb27_image3
  • 模式变更监控系统 – 实施了首个模式变更监控与告警系统,以提高数据准确性和稳定性。它能够检测更改并发送自动通知,确保数据操作无缝进行。预计未来几周系统将进一步改进。
  • 无代码抓取器新交付功能 – 我们新增了交付方式,为无代码用户提供更多导出和访问抓取数据的灵活性。 feb27_image4

🚀 改进

  • 增强搜索选项以包含新结果类型 – 搜索功能现在显示数据点及其对应的抓取器,使用户更容易根据输出识别相关抓取器。 feb27_image5
  • “交付到外部存储”默认启用 – 为简化工作流程,Web 抓取器 API 现在默认启用外部存储交付,减少手动设置步骤。
  • 自定义抓取器请求 - 简化了请求流程。现在只需两个 URL,其余部分将自动处理,从而优化请求过程。

🐞 错误修复

  • 解决影响自定义抓取器的问题,并实施告警系统,当需要操作时通知合作伙伴。
  • 修复未定义 URL 结构——改进 URL 处理以确保不同页面结构一致且清晰。

代理产品

🆕 新功能

🚀 改进

  • 使用预制连接字符串(host、port、user 和 password)更快速地集成代理访问详情,并配有新配置指南 集成指南
  • 我们在错误目录中新增错误代码。通过 代理错误目录 更快地查找并自行解决问题。
  • 我们在亚洲增加了服务器部署,并提升了一些性能。

SERP API

🆕 新功能

数据集

🆕 新功能

  • 数据集订阅增量数据 - 客户现在可以启用增量逻辑,只接收新增或更新的记录,而非每个收集周期的完整数据集。此功能提高数据相关性,并允许灵活的快照比较。无需手动识别更改,我们的系统会自动处理。 feb20_1

🚀 改进

  • 新定价表 - 重新设计的定价表提供更清晰信息,便于客户理解定价等级并做出明智决策。
  • 增强数据集结账确认页面 - 修复确认页面以确保结账体验更加顺畅可靠。
  • 改进缺少支付信息的错误提示 - 尝试购买但未添加支付和账单信息的客户将收到更清晰、信息更丰富的错误提示。
  • 优化交付方式 - 调整交付选项顺序,并对界面进行改进以提高可用性。
  • “更新数据集”键盘快捷键 - 新增键盘快捷键以简化数据集更新及界面操作,提升用户体验。
  • 改进数据样本预览表 - 用户现在可以直观展开表行,并在弹出窗口中查看对象数据类型,以获得更清晰的可视化效果。

🐞 错误修复

  • 修复路由错误 - 导航数据集页面时不再保留不必要的查询参数。
  • 修复促销卡 UI 问题 - 促销卡现已按预期布局正确显示。

抓取器

🆕 新功能

  • AI 抓取器代理 – 首个 AI 抓取器代理允许用户仅提供域名即可提取任何网站的数据。它会自动检索该域名下的所有 URL,并以 HTML、Markdown 或纯文本格式提取内容。适用于 AI 公司、研究人员和开发人员,需要高质量文本数据进行模型训练、分析或内容生成。在此尝试 feb20_2 feb20_3 feb20_4
  • ChatGPT 抓取器 - 推出全新 ChatGPT 抓取器,类似于我们的 SERP 抓取器!此抓取器允许客户以编程方式与 ChatGPT 交互,将响应作为结构化数据检索。现在,您可以轻松自动化查询并从 ChatGPT 提取洞见。在此尝试 feb20_5
  • 日志页面“再次运行”按钮 - 在日志页面添加“再次运行”按钮,允许用户单击即可重新运行相同请求,简化重试失败或历史任务的操作。 feb20_6

🚀 改进

  • 我的抓取器表 - 当前运行的抓取器或最近使用的抓取器将显示在“我的抓取器”表顶部,更易于跟踪活跃任务,无需滚动查看已完成任务。
  • WSA API - 为改善导航和组织,我们将“交付选项”部分移动到“管理 API”选项卡,使基于 API 的数据管理更加直观。

🐞 错误修复

  • 无代码抓取器的收集任务失败时,用户现在可以下载错误详情,更好地理解问题原因。以前下载按钮被禁用,调试困难。此改进提高了透明度和排错效率。
  • 修复“报告问题”功能未正确关联快照与工单的问题。现在,当客户报告问题时,正确的快照会自动关联,便于排查和解决问题。

代理产品

🆕 新功能

  • HTTP3 测试版已上线 - 代理网络升级以支持 HTTP3/QUIC 请求。如需体验,请联系 Bright Data 销售团队 - [email protected]

🚀 改进

  • 在“概览”选项卡中更方便地 复制您的代理凭证,提供不同格式。

🐞 错误修复

  • 修复账户管理 API 文档示例代码问题
  • 补充缺失文档及部分旧文档链接无法正确跳转的问题

数据集

🆕 新功能

  • “AI 筛选助手” 允许用户使用 自然语言 筛选数据集——只需用英文描述所需过滤条件,即可获取相关记录。 feb13_img1 feb13_img2
  • 支付链接分享 – 仪表盘用户现在可以生成并分享支付链接,使其他人(如 CFO)无需登录控制面板即可完成购买。 feb13_img3
  • 额外的数据集统计信息 – 每个数据集现在包括其内容的额外统计信息,例如:记录的地理分布。此信息每月更新。 feb13_img4

🚀 改进

  • 增强筛选体验 – 查看和优化过滤器及数据集时,可以移动过滤窗口,不再遮挡表格。
  • 更好的数据样本预览 – 限制了单元格大小以提高可读性。用户现在可以点击字段展开并查看样本数据的完整数据点。

🐞 错误修复

  • 修复上传 CSV 文件到过滤组件时解析错误的问题。
  • 确保记录计数始终更新,以显示过滤效果。

抓取器

🆕 新功能

  • 自定义抓取器 - 允许用户在我们的市场中未提供域名时请求自定义抓取器。只需提供 2 个 URL 即可启动流程 - 观看视频

🚀 改进

  • 自动邮件通知 - 客户首次触发抓取器后发送,以改善入门体验。
  • 添加多语言代码示例 - 用户可以在所有 API 请求中以首选语言复制代码。
  • “概览”标签页示例数量从 10 个减少到 5 个,为用户提供“清晰”视图。
  • Sophie: 用户现在可以针对特定用例提问,并获得相关建议及直接的数据集链接。

🐞 错误修复

  • 修复抓取器页面的损坏链接。