Skip to main content

Documentation Index

Fetch the complete documentation index at: https://docs.brightdata.com/llms.txt

Use this file to discover all available pages before exploring further.

AI 爬虫中的”源”是什么?

某些 AI 爬虫可以在生成的答案旁边返回引用/超链接(“源”)。当您需要以下内容时,源很有用:
  • 可验证的声明引用
  • 原始页面的链接,用于审计/合规
  • 研究风格的输出(例如,带引用的摘要)
源的可用性取决于底层 AI 产品是否决定对该特定请求使用网络搜索/浏览。
我们所有的 LLM 都会尝试在其响应中包含源。某些模型提供了一个选项,以便在无法检索源时返回错误。对于某些爬虫,只有当您明确启用”源”选项时,才会返回源。

源如何生成

当您使用提示运行 AI 爬虫时:
  1. 我们将您的提示发送到选定的 AI 引擎(例如 ChatGPT)。
  2. AI 引擎根据其内部策略和运行时条件决定是否:
    • 从其现有知识中回答,或
    • 执行网络搜索并附加引用/源。
  3. 如果使用网络搜索,源/引用将在响应中返回(如果可用)。
  4. 如果不使用网络搜索,答案可能在没有源的情况下返回。

什么是”源错误”?

源错误通常意味着运行完成,但引擎未按预期提供源(例如,引擎选择不浏览、浏览不可用,或该请求/国家/版本没有返回引用)。

提示最佳实践以增加获取源的机会

由于网络搜索和引用受到引擎内部决策的影响,提示措辞可能会实质性地影响是否出现源。 推荐的策略:
  • 明确请求源/引用
    示例:“为每个关键声明包含带链接的源。”
  • 询问网络验证/最新信息
    示例:“使用网络搜索并引用过去 12 个月的源。”
  • 请求引用部分
    示例:“最后,添加带有 URL 的”源”部分。”
  • 如果您获得缺失的源,请尝试修订后的提示,而不是重新运行完全相同的提示。
    • 在我们的测试中,改变提示可以增加网络搜索和返回源的可能性。