将 Bright Data 代理与 ParseHub 集成,可增强您的网页抓取能力,提供安全匿名访问,并降低被检测和 IP 封禁的风险。
展开以获取您的 Bright Data 代理访问信息
Bright Data 代理按“代理区域”(Proxy zones)进行分组。每个区域包含其对应的代理配置。
要获取代理区域的访问权限:
要使用 Bright Data 的 住宅代理(Residential Proxies),您需要通过合规团队的验证或安装证书。了解更多…
如果您的目标是 Google、Bing 或 Yandex 等搜索引擎,则需要使用专门的搜索引擎结果页(SERP)代理 API。请使用 Bright Data SERP API 来访问搜索引擎。
点击此处了解 Bright Data SERP 代理 API。
PROXY ERROR
一些工具会使用搜索引擎作为代理测试目标:如果您的代理测试失败,这可能就是原因。请确保您的测试目标域名不是搜索引擎(此设置在工具配置中,而非 Bright Data 代理的控制范围内)。
ParseHub 是一款用户友好且功能强大的网页抓取工具,彻底改变了从网络中提取数据的方式。其直观的设计使用户能够轻松与复杂网站交互,处理 AJAX 和 JavaScript 元素,并浏览表单和无限滚动页面,而无需编写任何代码。
通过将 Bright Data 代理与 ParseHub 集成,用户可获得无与伦比的优势,轻松应对最具挑战性的数据抓取任务。这一组合不仅能确保高效的数据抓取,还能提供高度的隐私和安全性,是专业人士寻求全面数据收集能力的理想解决方案。
将 Bright Data 代理 与 ParseHub 集成,可彻底改变您的网页抓取能力,为数据提取任务带来更高的效率和可靠性。以下是 Bright Data 代理解决方案为何是 ParseHub 强大抓取功能的理想搭配:
广泛的代理网络
增强的匿名性与安全性
高性能与高可靠性
多功能且可扩展的解决方案
用户友好的集成方式
注册 Bright Data
代理管理界面,显示活动代理和添加按钮
选择代理类型
在本示例中,我们将演示如何设置 ISP 代理。
代理和抓取基础设施仪表板,显示各种选项
命名代理解决方案
选择 IP 类型的表单,显示已选择专用选项
选择 IP 数量
填写所需的 IP 数量。
国家和城市选择
选择所需的 IP 位置的国家和城市。
针对美国和纽约市的地理定位选项
选择域名
使用特定域名,或选择“所有域名”以便一个 IP 可用于访问多个网站。
添加 Zone
点击“添加”按钮以创建 Zone。
访问参数
点击您的 Zone 名称,导航到“访问参数”选项卡,并记录代理凭据:
代理服务访问参数界面,显示主机和用户名
your-zone-username
your-zone-password
下载并安装 ParseHub
ParseHub 下载选项:Mac、Windows、Linux
创建新项目
点击 ParseHub 主页上的“+ 新项目”按钮。
仪表板,显示项目创建和教程界面
使用 URL 启动新项目
输入您想要抓取数据的网址(例如 instagram.com),然后点击“在此 URL 上启动项目”。
网页抓取工具界面,显示教程和说明
导航到 ParseHub 代理配置
切换到浏览器模式,滑块变绿表示已启用浏览模式。
Instagram 登录页面,显示图片预览
设置
打开浏览器界面右上角的设置,然后点击“选项”。
Instagram 网页,显示手机屏幕模拟工具
访问高级网络设置
选择“高级”选项卡。
点击“网络”选项卡
在“连接”部分选择“设置”。
浏览器设置和错误消息界面
配置手动代理设置
在网络设置中,选择“手动代理配置”。
在浏览器选项中配置手动代理设置
代理设置
在 HTTP 代理字段中输入 Bright Data 代理 URL brd.superproxy.io,端口设为 33335。
浏览器窗口中的代理配置设置截图
切换到 SOCKS v4 并点击 OK
切换到 SOCKS v4 后,点击“OK”按钮。
浏览器选项窗口中配置代理设置
代理 Zone 凭据
输入您的代理 Zone 凭据,这些信息可以在您的代理 Zone 访问参数中找到。
计算机屏幕上的密码身份验证弹出窗口
格式化代理配置
brd.superproxy.io:33335:brd-customer-hl_******-zone-isp_proxy6:b1s*****:Luminati
应用已配置的代理到 ParseHub 项目:
Instagram 网页,显示设置菜单
启用自定义代理
勾选“轮换 IP 地址”以启用“自定义代理”文本框。
Instagram 抓取工具界面,显示数据提取
自定义代理字段
将格式化后的代理粘贴到“自定义代理”字段中。对于多个代理,每行输入一个。
Instagram 界面,显示用户对话和登录页面
保存您的项目设置
保存后,使用 Bright Data 代理运行项目。
Instagram 登录页面,显示手机消息界面
重要提示:
如果您使用 Bright Data 的住宅代理、Web Unlocker 或 SERP API,则需要安装 SSL 证书,以启用与目标网站的端到端安全连接。
这个过程很简单,请参阅本指南了解安装说明。