IDE 交互代码
以下是您可以在 IDE 中使用的所有交互代码:input - 全局对象,可在交互代码中使用,由触发器 input 或 next_stage() 提供
navigate - 导航浏览器会话到指定 URL
url:要导航到的 URL
navigate 选项
parse - 解析页面数据
collect - 向爬虫创建的数据集添加一条数据
data_line:要收集的字段对象validate_fn:可选函数,用于验证数据行有效性
next_stage - 使用指定输入运行爬虫下一阶段
input:传递给下一浏览器会话的输入对象

rerun_stage - 使用新的 input 重新运行本阶段爬虫
input:传递给下一浏览器会话的输入对象
run_stage - 使用新浏览器会话运行特定阶段
input:传递给下一浏览器会话的输入对象stage:要运行的阶段(1 为第一阶段)
country - 配置爬虫从特定国家运行
code:ISO 两位国家代码
wait - 等待元素出现在页面上
selector:元素选择器opt:等待选项(参见示例)
wait_for_text - 等待页面上的元素包含指定文本
selector:元素选择器text:要等待的文本
click - 点击元素(点击前会等待元素出现)
selector:元素选择器
type - 在输入框中输入文本(出现后输入)
selector:元素选择器text:要输入的文本
select - 从下拉框中选择值
selector:元素选择器
URL - NodeJS 标准模块 “url” 的 URL 类
url:URL 字符串
location - 当前位置信息对象,可用字段:href
tag_response - 保存浏览器请求的响应数据
name:标记字段名称pattern:匹配 URL 的模式
response_header - 返回最后页面加载的响应头
console - 输出交互代码日志
load_more - 滚动到底部触发加载更多项目,适用于懒加载或无限滚动页面
selector:元素选择器
scroll_to - 滚动页面使元素可见
$ - jQuery 风格的辅助函数
selector:元素选择器
IDE 解析器代码
以下是解析器可用的所有代码:input - 全局变量,可在解析器代码中使用
$ - cheerio 实例
location - 全局变量,可在解析器代码中使用,包含当前位置信息