什么是 Playwright?

Playwright 是一个强大的 Node.js 工具包,可用于一次性自动化多个主流浏览器。无论您是在抓取数据、测试应用程序,还是构建无缝的自动化流程,Playwright 的统一接口和强大功能都能帮助您在不影响质量的情况下更快完成任务。

通过在用户名中使用 -session 参数,确保整个浏览器会话保持相同的 IP 地址。这一点很重要,因为 Bright Data 代理默认会在每个请求之间更换 IP。了解更多

新用户应从 ISP 或数据中心代理入手,因为住宅代理在 即时访问模式 下不兼容浏览器集成。

对于 账户管理 相关的用例,应为每个账户使用一致的专用静态 IP。建议使用 ISP 专用代理

如何集成 Bright Data 与 Playwright

前提条件

  1. Node.js:从 nodejs.org 下载并安装最新版本。

  2. Playwright 包:在您的项目中添加 Playwright:

npm install playwright

获取您的 Bright Data 凭据

登录您的 Bright Data 控制面板,并获取以下信息:

  • 主机 (Host)http://brd.superproxy.io/
  • 端口 (Port)33335
  • 用户名 (Username):输入您的 Bright Data username
  • 密码 (Password):输入您的 Bright Data password

您需要这些信息进行代理身份验证。

配置 Playwright 以使用 Bright Data

  1. 设置代理服务器:在浏览器启动选项中包含您的 Bright Data 主机和端口。格式为 host:port

  2. 添加身份验证:提供您的 Bright Data usernamepassword 以确保安全访问。

示例代码

使用以下示例代码开始:

const { chromium } = require('playwright');

(async () => {
  // 使用代理设置启动浏览器
  const browser = await chromium.launch({
    headless: false,  // 设置为 true 以启用无头模式
    proxy: {
      server: 'http://[HOST]:[PORT]',  // 替换为您的代理主机和端口
      username: '[USERNAME]',        // 替换为您的代理 `username`
      password: '[PASSWORD]'         // 替换为您的代理 `password`
    }
  });

  const context = await browser.newContext();
  const page = await context.newPage();

  // 访问 IP 验证网站以测试代理
  await page.goto('http://httpbin.org/ip');
  // 截取屏幕截图以验证设置
  await page.screenshot({ path: 'example.png' });

  await browser.close();
})();

通过将 Bright Data 集成到 Playwright,您的自动化流程将更加安全且隐蔽。享受更快的工作流、降低检测风险,并在抓取、测试和自动化任务时更加安心。