Dataset API 有哪两个端点?
市场数据集 API 提供两种提取记录的方式,可根据任务选择:- Search(同步) 基于 Elasticsearch,以亚秒级响应内联返回记录。适用于实时查询、线索增强和抽样。
- Filter(异步) 基于快照,支持 CSV/JSON 文件上传和大体量负载。适用于批量导出和值列表筛选。
Search 数据集(同步)
Elasticsearch 查询,内联返回结果,亚秒级延迟。每次调用最多 1,000 条记录。
Filter 数据集(异步)
基于快照的任务,支持 CSV/JSON 上传,负载最大 200 MiB。覆盖全部 250+ 个数据集。
我该使用哪个端点?
低延迟、单次调用的查询使用 Search;批量或基于文件的任务使用 Filter。| 需求 | 使用 |
|---|---|
| 实时查询,最多 1,000 条记录,亚秒级延迟 | Search |
| 对单条记录进行线索增强 | Search |
| 购买前快速抽样数据集 | Search,搭配 "sort": "random" |
| 批量导出或大规模提取 | Filter |
| 按 CSV/JSON 中 10 万以上的值列表筛选 | Filter |
| Search 尚不支持的数据集 | Filter |
两个端点有何区别?
Search 和 Filter 端点接受相同的 filter 对象,但在引擎、延迟和数据集覆盖范围上有所不同。| Search | Filter | |
|---|---|---|
| 路径 | POST /datasets/search/:dataset_id | POST /datasets/filter |
| 引擎 | Elasticsearch | 基于快照 |
| 模式 | 同步(内联返回结果) | 异步(返回 snapshot_id) |
| 延迟 | 亚秒级 | 每个任务最长 5 分钟 |
| 数据集 | 3 个 LinkedIn 数据集(alpha) | 全部 250+ 个市场数据集 |
| 最大负载 | 单个请求体 | 最大 200 MiB(multipart) |
| 文件上传(CSV/JSON) | 不支持 | 支持 |
| 分页 | search_after 游标 | 快照上的 records_limit |
| 返回 | hits、total_hits、took | snapshot_id(需单独下载) |
| 定价 | $2.5 CPM | $2.5 CPM |
如何进行身份验证?
两个端点都使用 Bearer token 身份验证。在Authorization 请求头中传入您的 API Key:
Dataset API 的费用是多少?
两个端点的费用均为 $2.5 CPM(每返回 1,000 条记录),与市场价格相同。实时 Search 不收取额外费用,筛选返回 0 条记录时也不收费。| 项目 | 价格 |
|---|---|
| Search 与 Filter | $2.5 CPM(每返回 1,000 条记录) |
| 零匹配查询 | 免费(筛选返回 0 条记录时不收费) |
| 订阅 | 按月承诺用量,超额部分享受更低的有效 CPM |
| 企业版 | 定制 SLA,专属容量 |
筛选语法在哪里查看?
两个端点都接受相同的filter 对象,运算符和嵌套规则一致。筛选语法参考记录了运算符列表、筛选组、最多 3 层嵌套以及 CSV/JSON 文件引用。
相关文档
- Search 数据集(同步)
- Filter 数据集(异步,文件上传)
- 筛选语法参考
- 获取数据集元数据
- 获取数据集列表
- 在查询前构建或刷新数据集,请参阅创建数据收集请求。