如何在 Octoparse 中设置 Bright Data
通过将 Bright Data 集成到 Octoparse,提高您的网页抓取效率,确保数据提取的安全性和匿名性,同时降低 IP 封锁风险。
什么是 Octoparse?
Octoparse 是一款用户友好的网页抓取工具,无需任何编程知识即可从网站收集数据。它提供简单的点选界面,使您能够从复杂的网站提取信息。Octoparse 允许自定义、自动化和定时执行抓取任务,并支持将提取的数据保存为 CSV 或 Excel 等格式。无论是市场调研、价格监测,还是潜在客户获取,Octoparse 都能让数据收集变得快速、简单、高效!
Octoparse 代理集成
按照以下步骤,将 Bright Data 代理集成到 Octoparse:
安装 Octoparse
访问 Octoparse 官网 下载并安装该工具。
创建新任务
点击左上角的 +New 按钮,然后选择 Custom Task(自定义任务)。
输入目标 URL
在 URL Input(URL 输入)字段中输入要抓取的网站地址,然后点击 Save(保存)。
进入代理设置
网页加载完成后,进入 Task Settings > Anti-blocking(任务设置 > 反封锁)。
启用代理
勾选 Access websites via proxies(通过代理访问网站),然后选择 Use my own proxies(使用自定义代理)。点击 Configure(配置)。
配置 Bright Data 代理
在弹出的窗口中,按以下格式输入您的 Bright Data 代理信息:
- IP/host: 输入
http://brd.superproxy.io/
。 - Port: 使用您在 Bright Data 控制面板 中提供的端口号。
- Username: 输入您的 Bright Data 代理
username
。 - Password: 输入您的 Bright Data 代理
password
。
如果需要使用特定国家的代理,可以使用格式 your-username-country-US
以获取美国出口节点。
如果您使用的是轮换代理,可以在 Switch interval(切换间隔)中设置 IP 轮换的频率。对于保持会话的代理,请根据需要调整会话时长。
保存设置
点击 Confirm(确认)以应用更改,然后点击 Save(保存)。
就这样!您已成功将 Bright Data 代理集成到 Octoparse。