跳转到主要内容
Bright Data 市场数据集 API(Marketplace Dataset API)提供两个端点,用于从 250+ 个市场数据集中提取记录:Search 用于实时查询,Filter 用于批量异步任务。两个端点共享同一套筛选 schema、同一种身份验证方式以及相同的 $2.5 CPM 定价。
将您的 API Key 粘贴到授权字段。要获取 API Key,请创建账户并了解如何生成 API Key

Dataset API 有哪两个端点?

市场数据集 API 提供两种提取记录的方式,可根据任务选择:
  • Search(同步) 基于 Elasticsearch,以亚秒级响应内联返回记录。适用于实时查询、线索增强和抽样。
  • Filter(异步) 基于快照,支持 CSV/JSON 文件上传和大体量负载。适用于批量导出和值列表筛选。

Search 数据集(同步)

Elasticsearch 查询,内联返回结果,亚秒级延迟。每次调用最多 1,000 条记录。

Filter 数据集(异步)

基于快照的任务,支持 CSV/JSON 上传,负载最大 200 MiB。覆盖全部 250+ 个数据集。

我该使用哪个端点?

低延迟、单次调用的查询使用 Search;批量或基于文件的任务使用 Filter。
需求使用
实时查询,最多 1,000 条记录,亚秒级延迟Search
对单条记录进行线索增强Search
购买前快速抽样数据集Search,搭配 "sort": "random"
批量导出或大规模提取Filter
按 CSV/JSON 中 10 万以上的值列表筛选Filter
Search 尚不支持的数据集Filter

两个端点有何区别?

Search 和 Filter 端点接受相同的 filter 对象,但在引擎、延迟和数据集覆盖范围上有所不同。
SearchFilter
路径POST /datasets/search/:dataset_idPOST /datasets/filter
引擎Elasticsearch基于快照
模式同步(内联返回结果)异步(返回 snapshot_id
延迟亚秒级每个任务最长 5 分钟
数据集3 个 LinkedIn 数据集(alpha)全部 250+ 个市场数据集
最大负载单个请求体最大 200 MiB(multipart)
文件上传(CSV/JSON)不支持支持
分页search_after 游标快照上的 records_limit
返回hitstotal_hitstooksnapshot_id(需单独下载)
定价$2.5 CPM$2.5 CPM
两个引擎之间的结果可能存在差异。Elasticsearch 对文本的分词方式与快照引擎不同。

如何进行身份验证?

两个端点都使用 Bearer token 身份验证。在 Authorization 请求头中传入您的 API Key:
Authorization: Bearer YOUR_API_KEY
账户设置获取您的 Key。

Dataset API 的费用是多少?

两个端点的费用均为 $2.5 CPM(每返回 1,000 条记录),与市场价格相同。实时 Search 不收取额外费用,筛选返回 0 条记录时也不收费。
项目价格
Search 与 Filter$2.5 CPM(每返回 1,000 条记录)
零匹配查询免费(筛选返回 0 条记录时不收费)
订阅按月承诺用量,超额部分享受更低的有效 CPM
企业版定制 SLA,专属容量

筛选语法在哪里查看?

两个端点都接受相同的 filter 对象,运算符和嵌套规则一致。筛选语法参考记录了运算符列表、筛选组、最多 3 层嵌套以及 CSV/JSON 文件引用。

相关文档