在 AI 爬虫中使用源 - Bright Data Docs

AI 爬虫中的”源”是什么？

某些 AI 爬虫可以在生成的答案旁边返回引用/超链接（“源”）。当您需要以下内容时，源很有用：

可验证的声明引用

原始页面的链接，用于审计/合规

研究风格的输出（例如，带引用的摘要）

源的可用性取决于底层 AI 产品是否决定对该特定请求使用网络搜索/浏览。

我们所有的 LLM 都会尝试在其响应中包含源。某些模型提供了一个选项，以便在无法检索源时返回错误。对于某些爬虫，只有当您明确启用”源”选项时，才会返回源。

源如何生成

当您使用提示运行 AI 爬虫时：

我们将您的提示发送到选定的 AI 引擎（例如 ChatGPT）。

AI 引擎根据其内部策略和运行时条件决定是否：

如果使用网络搜索，源/引用将在响应中返回（如果可用）。

如果不使用网络搜索，答案可能在没有源的情况下返回。

提示最佳实践以增加获取源的机会

由于网络搜索和引用受到引擎内部决策的影响，提示措辞可能会实质性地影响是否出现源。

推荐的策略：

明确请求源/引用

示例：“为每个关键声明包含带链接的源。”

询问网络验证/最新信息

示例：“使用网络搜索并引用过去 12 个月的源。”

请求引用部分

示例：“最后，添加带有 URL 的”源”部分。”

如果您获得缺失的源，请尝试修订后的提示，而不是重新运行完全相同的提示。

​AI 爬虫中的”源”是什么？