如何将 Bright Data 与 Mastra 集成
1
前置条件
- Node.js
- 最新版本的 npm
- Bright Data API 密钥
- OpenAI API 密钥(用于 GPT-4o-mini)
- Bright Data 区域会在需要时自动创建
2
获取 Bright Data API 密钥
- 登录你的 Bright Data 控制台
- 前往 账户设置
- 如果你还没有 API 密钥,请生成一个
- 为你的 API 密钥启用 SDK 访问权限
3
获取 OpenAI API 密钥
- 访问 OpenAI 平台
- 前往 API Keys 页面
- 创建新的 API 密钥
- 确保你拥有 GPT-4o-mini 的访问权限
4
使用模板创建 Mastra 项目
使用 Bright Data Mastra 模板创建新项目:
或者,你也可以直接克隆仓库:
5
配置环境变量
编辑
.env 文件,填入你的 API 密钥:6
启动开发服务器
运行带热重载的 Mastra 开发服务器:你的 Bright Data 加持的 Web Agent 已准备就绪!
7
示例用法
该 Web Agent 自带四个强大的工具。下面是 Agent 的工作方式:示例查询:
- “搜索量子计算的最新进展”
- “抓取 example.com 的价格信息”
- “获取此 Amazon 产品的详情和评论:[URL]”
- “收集某公司高管的 LinkedIn 资料”
8
可用工具
集成提供以下四类强大工具:1. 搜索工具
- 支持 Google、Bing、Yandex
- 返回 Markdown 或 HTML
- 自动防封与反机器人
- 支持国家代码以获取本地化结果
- 获取网页内容并转换成干净的 Markdown
- 自动绕过 CAPTCHA 和机器人检测
- 支持国家级代理
- 价格、评分、评论、规格
- 支持 ZIP 码本地化
- 全量产品信息
- 获取职业背景、经验、教育
- 支持批量
- 详细技能与工作记录
9
自定义工具
你可以选择性地启用或禁用工具:
项目结构
关键特性
- AI 智能推理:使用 OpenAI GPT-4o-mini
- Bright Data SDK 深度集成
- 多数据源支持:搜索引擎、网页抓取、Amazon、LinkedIn
- 自动防封机制
- 持久化记忆(LibSQL)
- TypeScript 强类型支持
生产部署
故障排查
“初始化工具需要 Bright Data API 密钥”- 检查
.env中的BRIGHTDATA_API_KEY - 确认 API 密钥具有 SDK 权限
- 检查密钥是否已过期
- 检查
.env中的OPENAI_API_KEY - 确保你有 GPT-4o-mini 的权限
- 检查账户是否有余量
- 集成默认启用
autoCreateZones: true - 检查 Bright Data 控制台中的区域是否已创建