LinkedIn 爬虫 API - Bright Data Docs

发送 LinkedIn URL，获得结构化 JSON 返回。Bright Data LinkedIn 爬虫 API 处理代理、验证码和解析，让你专注于数据管道。

初次使用 Bright Data？创建免费账户并获得 $2 额度开始爬取。

工作原理

你向 Bright Data LinkedIn 爬虫 API 发送一个或多个 LinkedIn URL。Bright Data 处理爬虫基础设施并返回清晰的结构化 JSON。

你的应用  -->  Bright Data API  -->  结构化 JSON
           POST /datasets/v3/scrape
           Authorization: Bearer YOUR_API_KEY

所有请求都使用 dataset_id 来指定数据类型（个人资料、公司、职位或帖子），并以 JSON、NDJSON 或 CSV 格式返回结果。

响应示例

curl -X POST "https://api.brightdata.com/datasets/v3/scrape?dataset_id=gd_l1viktl72bvl7bjuj0&format=json" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '[{"url": "https://www.linkedin.com/in/satyanadella"}]'

{
  "name": "Satya Nadella",
  "city": "Redmond",
  "country_code": "US",
  "current_company": { "name": "Microsoft" },
  "followers": 10842560,
  "about": "Chairman and CEO at Microsoft..."
}

支持的数据类型

个人资料

工作经历、教育背景、技能、联系人。按名字或关键词发现个人资料。

公司

员工数量、融资数据、专业领域、关联组织。

职位

薪资数据、要求、申请链接。按关键词或搜索 URL 发现职位。

帖子

帖子内容、互动指标、主题标签、评论。按公司或个人资料发现帖子。

请求方法

Bright Data LinkedIn 爬虫 API 支持两种请求方法。根据你的吞吐量和延迟需求选择。

方法	端点	最适用于
同步	`/scrape`	实时查询，最多 20 个 URL
异步	`/trigger`	批量任务、20+ URL、生产管道

了解更多信息请参考理解同步与异步请求。

能力和限制

能力	详情
输出格式	JSON、NDJSON、CSV
同步请求最多 URL 数	20
异步请求最多 URL 数	5,000
数据新鲜度	实时（按需爬取）
交付选项	API 下载、Webhook、Amazon S3、Snowflake、Azure、GCS（所有选项）
定价	按成功记录付费（查看定价）

常见问题

数据是实时爬取的吗？

是的。每个请求都会触发实时爬取。没有缓存或过期数据。响应时间因端点而异：个人资料通常在 10-30 秒内返回（同步），而发现请求可能需要更长时间，取决于结果数量。

URL 收集和发现之间有什么区别？

URL 收集爬取你提供的特定 LinkedIn 页面（例如个人资料 URL）。发现找到与搜索条件匹配的 LinkedIn 页面（例如”旧金山的软件工程师”）并爬取结果。发现仅通过异步请求提供。

这与使用代理或 Web Unlocker 爬取有什么区别？

使用代理或 Web Unlocker 爬取时，你仍需要编写和维护自己的解析逻辑，并在 LinkedIn 更改页面结构时更新它。LinkedIn 爬虫 API 处理整个堆栈：代理轮换、反机器人绕过和解析。你只需发送 LinkedIn URL，就能获得清晰的结构化 JSON，不需要在你这一端进行爬虫基础设施或解析器维护。

后续步骤

快速开始

在 5 分钟内爬取你的第一个 LinkedIn 个人资料。

发送你的第一个请求

cURL、Python 和 Node.js 的完整代码示例。

API 参考

端点规范、参数和响应架构。

Documentation Index

​工作原理

​响应示例

​支持的数据类型

个人资料

公司

职位

帖子

​请求方法

​能力和限制

​常见问题

​后续步骤

快速开始

发送你的第一个请求

API 参考

工作原理

响应示例

支持的数据类型

请求方法

能力和限制

常见问题

后续步骤