跳转到主要内容

Documentation Index

Fetch the complete documentation index at: https://docs.brightdata.com/llms.txt

Use this file to discover all available pages before exploring further.

正在构建 AI 初创公司?

您可能符合我们的初创计划资格。获得本文所介绍基础设施的全额资助访问权限(最高价值 $20,000)。

深度研究代理

构建AI代理,在规模上进行全面的多源研究操作。 超越简单的数据提取,创建结合实时搜索、历史分析和复杂网站导航的研究工作流。这些能力为竞争情报、市场研究和调查分析系统奠定了基础。

学习研究模式

了解多源研究工作流

快速开始

探索研究示例

处理的研究挑战

处理通常会阻止基本抓取的研究挑战:
  • 多步工作流 - 需要在多个请求中保持会话持久性
  • 复杂网站交互 - 需要浏览器自动化来处理JavaScript繁重网站
  • 历史背景 - 需要存档访问以进行全面研究
  • 研究深度 - 需要跨源验证以确保准确性
该基础设施为全面的研究操作提供了完整的工具包。

会话管理

在多步工作流中维持会话持久性

浏览器自动化

使用浏览器自动化处理复杂网站交互

历史数据

通过网络存档访问历史背景

跨源验证

验证多个来源的研究

应用和目的

从初创企业竞争分析到企业市场情报,研究代理需要能够:
  • 导航复杂工作流
  • 在多个来源中保持背景
  • 提供当前和历史视角
为需要广度和深度的研究模式而构建。

多源研究模式

结合多个数据源进行全面研究:

实时搜索

使用SERP API获取多个搜索引擎的实时搜索结果

历史分析

通过网络存档访问历史数据以进行趋势分析

网站特定数据

使用浏览器自动化从特定网站提取数据

交叉参考验证

在多个来源中验证发现以确保准确性

网络存档的历史背景

访问历史数据进行全面研究:
// 搜索历史数据
const response = await fetch('https://api.brightdata.com/datasets/v3/trigger?dataset_id=YOUR_ARCHIVE_DATASET_ID', {
  method: 'POST',
  headers: {
    'Authorization': `Bearer ${apiKey}`,
    'Content-Type': 'application/json'
  },
  body: JSON.stringify([{
    url: 'https://example.com',
    date: '2023-01-01',
    archive_type: 'web_archive'
  }])
});

复杂网站导航

使用浏览器自动化导航复杂网站:
// 多步研究工作流
const response = await fetch('https://api.brightdata.com/browser_api/v1/run', {
  method: 'POST',
  headers: {
    'Authorization': `Bearer ${apiKey}`,
    'Content-Type': 'application/json'
  },
  body: JSON.stringify({
    url: 'https://example.com/research',
    browser: {
      headless: true,
      viewport: { width: 1920, height: 1080 }
    },
    actions: [
      { type: 'navigate', url: 'https://example.com/search' },
      { type: 'fill', selector: '#search', value: 'research topic' },
      { type: 'click', selector: '#submit' },
      { type: 'wait', timeout: 3000 },
      { type: 'extract', selector: '.results' },
      { type: 'navigate', url: 'https://example.com/details' },
      { type: 'extract', selector: '.content' }
    ]
  })
});

研究工作流编排

编排复杂的研究工作流:
1

定义研究查询

定义您的研究查询和目标。识别您需要回答的问题。
{
  "query": "AI工具市场分析",
  "objectives": [
    "识别关键竞争对手",
    "分析定价策略",
    "审查客户反馈"
  ]
}
2

搜索多个来源

同时在多个来源中搜索:
  • 实时搜索结果(SERP API)
  • 历史数据(网络存档)
  • 网站特定数据(浏览器API)
const searchPromises = [
  searchSERP(query),
  searchArchive(query),
  searchSite(query)
];
const results = await Promise.all(searchPromises);
3

提取和结构化

从每个来源提取相关数据并将其结构化以供分析。
使用数据验证以确保跨来源的数据质量和一致性。
4

交叉参考和验证

在多个来源间交叉参考发现并验证准确性。
经验证的研究发现已准备好进行分析和报告。
5

生成研究报告

将发现编汇成全面的研究报告。
包含来源归属和验证状态以确保透明度。

跨源数据验证

在多个来源中验证研究发现:
async function validateResearch(findings, sources) {
  const validationResults = await Promise.all(
    findings.map(finding => 
      validateAgainstSources(finding, sources)
    )
  );
  
  return validationResults.filter(result => result.confidence > 0.8);
}

async function validateAgainstSources(finding, sources) {
  // 在来源间交叉参考发现
  const matches = await Promise.all(
    sources.map(source => checkMatch(finding, source))
  );
  
  const confidence = matches.filter(m => m).length / sources.length;
  return { finding, confidence, sources: matches };
}

企业研究模板

使用预构建的模板用于常见研究工作流:

竞争情报

用于竞争分析和市场研究的模板

市场分析

用于全面市场研究的模板

调查研究

用于调查研究工作流的模板

趋势分析

用于历史趋势分析的模板

示例

竞争情报研究

在多个来源中研究竞争对手:
async function researchCompetitor(competitorName) {
  // 搜索实时数据
  const serpResults = await searchSERP(`${competitorName} pricing features`);
  
  // 搜索历史数据
  const archiveResults = await searchArchive(competitorName, '2023-01-01');
  
  // 提取网站特定数据
  const siteData = await extractFromSite(`https://${competitorName}.com`);
  
  // 交叉参考发现
  const validated = await validateResearch([
    ...serpResults,
    ...archiveResults,
    siteData
  ]);
  
  return {
    competitor: competitorName,
    findings: validated,
    sources: ['serp', 'archive', 'site']
  };
}

市场研究工作流

进行全面的市场研究:
async function conductMarketResearch(topic) {
  // 第1步:搜索当前趋势
  const currentTrends = await searchSERP(`${topic} trends 2024`);
  
  // 第2步:分析历史趋势
  const historicalTrends = await searchArchive(topic, '2020-01-01');
  
  // 第3步:提取竞争对手数据
  const competitors = await findCompetitors(topic);
  const competitorData = await Promise.all(
    competitors.map(c => researchCompetitor(c))
  );
  
  // 第4步:验证和编汇
  const researchReport = {
    topic,
    currentTrends,
    historicalTrends,
    competitors: competitorData,
    validated: true
  };
  
  return researchReport;
}

后续步骤

SERP API 快速开始

开始收集用于研究的搜索结果

浏览器 API 快速开始

自动化复杂网站导航以进行研究

网络存档

访问历史数据以进行趋势分析

深度查询

使用深度查询进行全面研究
需要帮助? 查看我们的研究示例联系支持