跳转到主要内容

概述

我们正在推出新的数据暂存流程,使开发人员和所有者都能在交付数据集之前验证和批准数据集。 这一系统将便于错误处理、验证检查和客户定制,确保准确性和可靠性。 它将协助每个人节省时间,减少开启工单的次数,并保持所需质量水平,以保持我们想要的品质水平。 flowchart.png

运行机制:

数据集快照准备就绪后,我们将运行其验证测试。
  • ✅ 如果所有验证测试都没问题
  • ❌ 如果所有/部分验证测试失败
客户将获得数据集快照,并在 CP 上显示所有测试均已通过。
客户批准后,快照将进入交付阶段。

验证测试

确保数据集中唯一值的最小百分比。
确保填写值的最低百分比。
填写后将字段设为必填字段;如果之后留空,则会触发错误。
与先前的值相比,数值编号的变化幅度不得超过 X。
根据其字段类型(例如字符串、数字、日期)检查每个条目的数据类型,以确保完整性并在处理之前标记为不匹配以进行更正。
建立自定义规则以验证特定字段是否存在以及字段值是否有效,例如要求大小字符串为 “S”、“M” 或 “L”;任何其他值均视为错误。
初始数据集需要至少 X 条记录(在特定 URL 中,应符合总网址输入中最少 X 条记录)
验证 +/-X% 范围内的波动。

主要组件和功能

snapshots.png

点击特定快照进行查看时

数据集测试视图有三个筛选选项(“所有结果”、“通过”、“失败”)dataset-view.png
此操作让您可以重新解析缓存的数据reparse-button.png
由于数据看起来很正常/或者特定数据集未达到阈值是合理的,则可以选择覆盖测试,(注意! 如果需要进行覆盖,则需要向客户写一份解释)
ignore-button.pngundo-ignore.png
confirm-undo.png
如果测试失败,请点击“显示相关记录”以查看记录示例,然后点击“查看并编辑代码”进入 IDE 并开始修复问题view-edit-code.png
完成所需修复工作后,即可根据需要重新解析或重新爬取reparse-recrawl.png
此操作可以让您在需要时再次运行验证测试rerun-tests.png
此操作让您在需要编辑收集器并重新爬取(例如,如果根本没有记录)时,可以在上下文中重定向到 IDEide-button.png
查看所需数据并修复/忽略问题后,您应该点击此按钮并将快照发送给所有者进行审查。 对于被忽略的测试,应提供理由来解释您为什么选择忽略测试deliver-dataset.png
如果所有者未接受所有已拒绝的测试,则问题将发回给您,并将标有“已拒绝”标签以进行更多修复,然后重新发送给所有者审批failed.png

通信和通知

状态更改和其他通知将在 CP 上通过扩音器显示给您。

工单和错误

现在,我们引入暂存流程后,修复收集器并不是错误/问题的终点 该过程包括两个步骤:
  1. 修复收集器
  2. 修复快照
因此,将对错误处理工作流程进行修改,以便与新的两步流程保持一致。
在快照交付给数据集所有者之前,不应允许将与验证问题相关的工单标记为“已解决”!

对流程的更改:

我们正在从工单上的选项中移除“解决”按钮
I