什么是 Octoparse?

Octoparse 是一款用户友好的网页抓取工具,无需任何编程知识即可从网站收集数据。它提供简单的点选界面,使您能够从复杂的网站提取信息。Octoparse 允许自定义、自动化和定时执行抓取任务,并支持将提取的数据保存为 CSV 或 Excel 等格式。无论是市场调研、价格监测,还是潜在客户获取,Octoparse 都能让数据收集变得快速、简单、高效!

Octoparse 代理集成

按照以下步骤,将 Bright Data 代理集成到 Octoparse:

1

安装 Octoparse

访问 Octoparse 官网 下载并安装该工具。

2

创建新任务

点击左上角的 +New 按钮,然后选择 Custom Task(自定义任务)。

3

输入目标 URL

URL Input(URL 输入)字段中输入要抓取的网站地址,然后点击 Save(保存)。

4

进入代理设置

网页加载完成后,进入 Task Settings > Anti-blocking(任务设置 > 反封锁)。

5

启用代理

勾选 Access websites via proxies(通过代理访问网站),然后选择 Use my own proxies(使用自定义代理)。点击 Configure(配置)。

6

配置 Bright Data 代理

在弹出的窗口中,按以下格式输入您的 Bright Data 代理信息:

IP/host:port:username:password
  • IP/host: 输入 http://brd.superproxy.io/
  • Port: 使用您在 Bright Data 控制面板 中提供的端口号。
  • Username: 输入您的 Bright Data 代理 username
  • Password: 输入您的 Bright Data 代理 password

如果需要使用特定国家的代理,可以使用格式 your-username-country-US 以获取美国出口节点。

如果您使用的是轮换代理,可以在 Switch interval(切换间隔)中设置 IP 轮换的频率。对于保持会话的代理,请根据需要调整会话时长。

7

保存设置

点击 Confirm(确认)以应用更改,然后点击 Save(保存)。

就这样!您已成功将 Bright Data 代理集成到 Octoparse。