抓取浏览器
如何配置抓取浏览器
了解如何使用您的凭据设置和配置 Bright Data 的抓取浏览器、运行示例脚本以及浏览实时浏览器会话。使用我们的详细说明确保高效的网页抓取。
首先,获取您的凭据——您的用户名和密码。您可以在你刚刚创建的抓取浏览器区域中找到它们。我们假设您已经安装了首选的网络自动化工具。 如果尚未安装,请安装它。
示例代码
运行以下基本示例,检查您的抓取浏览器是否正常运行(记得换入您的凭据和目标 URL):
运行脚本
将以上代码另存为 script.js(别忘了输入您的凭据!),然后使用此命令运行它:
查看实时浏览器会话
抓取浏览器 Debugger 使开发人员能够与 Chrome 开发者工具一起检查、分析和微调代码,从而实现更好的控制、可见性和效率。 您可以集成以下代码片段,为每个会话自动启动开发者工具:
每个会话单次导航
抓取浏览器会话被构建为允许每个会话进行一次初始导航。 此初始导航指的是加载要从中提取数据的目标站点的第一个实例。 之后,用户可以在同一会话中使用点击、滚动和其他交互式操作自由浏览网站。 然而,要从初始导航阶段开始新的抓取作业(无论是在同一个站点还是不同的站点),都必须开始一个新的会话。
会话时间限制
抓取浏览器有两种超时设置,旨在使我们的客户不会进行不受控制的使用。
- 空闲会话超时:如果浏览器会话在空闲模式下保持打开状态5分钟及以上,这意味着没有使用该会话,抓取浏览器将自动使会话超时。
- 最大会话长度超时:抓取浏览器会话最多可持续30分钟。 一旦达到最长会话时间,会话将自动超时。