跳转到主要内容
通过 UI 或 API,将 Bright Data Marketplace 数据集(250+ 个域名)缩小到您所需的确切记录和字段,方法是创建筛选子集并选择要包含的字段。 您可以执行的操作:
  • 自定义字段: 选择要包含在数据集视图或导出中的列(字段)。
  • 筛选数据集: 使用筛选规则创建已保存的子集。
权限: 您需要拥有该数据集的访问权限以及创建子集的权限。
突出显示筛选图标和字段控件的数据集预览表

自定义字段

选择要在 Bright Data Marketplace 数据集视图和导出中显示的字段(列)。
  1. 导航到您要处理的数据集。
  2. 打开字段选择器(Fields selector)。
  3. 选择要包含在视图中的字段。
  4. 点击 Apply(应用),如果系统提示,请保存该视图。
预期结果: 该视图的数据集预览以及任何导出都将仅包含所选字段。
字段选择器已打开,显示可用字段,已选字段被勾选

筛选数据集

通过在 UI 或 API 中应用筛选规则,创建 Bright Data Marketplace 数据集的已保存子集。
筛选面板已打开,显示包含筛选条件和创建子集

使用 UI 筛选数据集

  1. 导航到您要筛选的数据集。
  2. 点击筛选图标(右上角)。
  3. 输入名称,以便日后找到此子集。
  4. 在 Include filters(包含筛选条件)下,添加一个或多个筛选条件(例如:国家、职位、日期)。
  5. 点击 Create subset(创建子集)。
预期结果: 将出现一个仅包含符合筛选条件记录的新子集。

筛选运算符参考

Select(选择)

从预定义列表中匹配一个或多个精确值(例如:国家或地区)。

Boolean(布尔值,true/false)

筛选只能为 true 或 false 的字段(例如:类似 verified 的字段)。

Date(日期)

筛选特定日期范围内的记录(起始日期和结束日期)。

Number(数值,运算符)

  • Is(等于): 匹配精确数值。
  • Not(不等于): 排除某个数值。
  • Exists(存在): 仅包含该字段非空的记录。
  • List (exact match)(列表,精确匹配): 匹配所提供列表中的任意值。
  • Lower than / Lower or equal to(小于 / 小于等于): 匹配低于(或不超过)阈值的值。
  • Greater than / Greater or equal to(大于 / 大于等于): 匹配高于(或达到)阈值的值。

String(字符串)

使用 UI 中提供的匹配类型筛选文本字段(例如:精确匹配或包含)。

Array(数组)

使用 Array includes(数组包含)匹配多值(数组)字段中包含特定值的记录(例如:类别、属性或标签)。

分组筛选器(基于规则的筛选)

  1. 点击 + Add filter(添加筛选条件)。
  2. 选择 Add group(添加分组)。
  3. 定义您的分组规则(例如:类别为”电子产品”,且品牌为”Dell”或”Apple”)。
预期结果: 该子集仅包含符合您分组逻辑的记录。

局限

  • 分组不能嵌套。
  • 每个筛选器最多允许 2 个分组。
  • 每个筛选分组最多允许 4 个输入。
  • 要按更多值筛选,请使用 CSV 列表上传选项(如果可用),或联系您的账户经理。
  • 如需更复杂的查询,请联系您的账户经理。

故障排除

  • 我看不到筛选图标。 请确保您正在查看数据集表格,并且您的账户拥有创建子集的权限。
  • 我的子集没有返回任何结果。 逐个移除筛选条件以找出限制性条件,然后重新应用正确的值和运算符。

后续步骤