工作原理
你向 Bright Data LinkedIn 爬虫 API 发送一个或多个 LinkedIn URL。Bright Data 处理爬虫基础设施并返回清晰的结构化 JSON。dataset_id 来指定数据类型(个人资料、公司、职位或帖子),并以 JSON、NDJSON 或 CSV 格式返回结果。
响应示例
支持的数据类型
个人资料
工作经历、教育背景、技能、联系人。按名字或关键词发现个人资料。
公司
员工数量、融资数据、专业领域、关联组织。
职位
薪资数据、要求、申请链接。按关键词或搜索 URL 发现职位。
帖子
帖子内容、互动指标、主题标签、评论。按公司或个人资料发现帖子。
请求方法
Bright Data LinkedIn 爬虫 API 支持两种请求方法。根据你的吞吐量和延迟需求选择。 了解更多信息请参考 理解同步与异步请求。能力和限制
常见问题
数据是实时爬取的吗?
数据是实时爬取的吗?
是的。每个请求都会触发实时爬取。没有缓存或过期数据。响应时间因端点而异:个人资料通常在 10-30 秒内返回(同步),而发现请求可能需要更长时间,取决于结果数量。
URL 收集和发现之间有什么区别?
URL 收集和发现之间有什么区别?
URL 收集爬取你提供的特定 LinkedIn 页面(例如个人资料 URL)。发现找到与搜索条件匹配的 LinkedIn 页面(例如”旧金山的软件工程师”)并爬取结果。发现仅通过异步请求提供。
这与使用代理或 Web Unlocker 爬取有什么区别?
这与使用代理或 Web Unlocker 爬取有什么区别?
使用代理或 Web Unlocker 爬取时,你仍需要编写和维护自己的解析逻辑,并在 LinkedIn 更改页面结构时更新它。LinkedIn 爬虫 API 处理整个堆栈:代理轮换、反机器人绕过和解析。你只需发送 LinkedIn URL,就能获得清晰的结构化 JSON,不需要在你这一端进行爬虫基础设施或解析器维护。
后续步骤
快速开始
在 5 分钟内爬取你的第一个 LinkedIn 个人资料。
发送你的第一个请求
cURL、Python 和 Node.js 的完整代码示例。
API 参考
端点规范、参数和响应架构。