NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

LinkedIn 被裁定应开放对其公开资料数据的爬取

  • 2017-08-29
  • 本文字数:1371 字

    阅读完需:约 4 分钟

一位美国联邦法官裁定,Microsoft 旗下的 LinkedIn 公司不能阻止第三方 Web 爬虫爬取其公开资料数据。这一裁定是根据初创企业 hiQ Labs 针对 LinkedIn 的诉讼而于 8 月 14 日做出的,这次诉讼是在 LinkedIn 向该初创企业发出一份要求其停止并中断爬取数据的信函后发起的。

hiQ Labs 爬取 LinkedIn 用户资料中的公开可见信息,为企业了解是否雇员有意向离职提供帮助。这类爬取行为违反了 LinkedIn 的反爬取软件禁令,因此在2017 年5 月23 日,LinkedIn 向HiQ Labs 发出了信函,要求该公司停止这类爬取行为,并威胁要依据《电脑欺诈和滥用法》(CFAA,Computer Fraud and Abuse Act)而采取法律行为。就此,hiQ Labs 发起了对LinkedIn 的诉讼,指责LinkedIn 具有反竞争行为,侵犯了企业访问公开可用信息的言论自由权利。该初创企业的代理律师指出, hiQ Labs 应该并未访问 LinkedIn 的主要数据源。法官 Edward Chen 在裁定中,特意呼吁 LinkedIn 对 CFAA 做“广泛的诠释”:“如果采纳 LinkedIn 的行为,那么将对互联网的开放访问产生深远的影响,这是议会在三十年前颁布 CFAA 时所不愿意看到的结果”。据报道,LinkedIn 将对这一裁决提出上诉

对于数据所有者及隐私,以及社会媒体公司对用户公开发表信息的控制程度,该联邦政令的影响重大。HiQ Labs 认为,LinkedIn 对公共资料获取的限制违反了建立在最高法院最近的一项裁决上的“第一修正案”(the First Amendment),即将社交媒体网站等同于一种“现代公众广场”。 Hacker News 的一个热议话题显示,社交媒体用户是否将他们公开发布数据等同视作将信息张贴在公开广场上,这依然有待观察。

在本次法庭案例中,涉及了数据隐私问题的另一个意外维度,那就是LinkedIn 宣称它想要保护的并非仅是数据本身,而是包括对被更改数据的访问。LinkedIn 允许用户公开发表个人资料,默认情况下并不会共享对简历的某些更改。但是hiQ Labs 通过大规模抓取可以检测到资料中的更改情况,并使用这些发现情况去告警企业雇主存在潜在的雇员流失问题。虽然有部分用户明白公开发表资料的深层影响,但是大多数用户不可能时刻惦记从数据中可以产生何种洞察,以及这些数据会被如何使用,而有一些他们所不了解的企业却在持续地监测个人资料的更新情况。

Programmable Web 网站的主编 David Berlind 最近评论了该裁定对API 经济的影响。他指出,LinkedIn 数据的价值并非在于数据本身,而是其后的数据模型。该裁定将允许机器人毫无顾忌地利用这些数据企业,这降低了LinkedIn 等产品的整体价值。他进一步提出,该裁定强制企业允许爬虫规避企业发布的API,妨碍了企业去“扩展并理解数据和数据所驱动价值之间的关联性”。

虽然LinkedIn 确实提供了一些 API ,但是看上去很多开发人员并不认为这些 API 适合自身的需要,因为编程界业已形成了广泛爬取 LinkedIn 数据的事实。已有提供在 Github 上的开源爬取库,开发人员可在 Stack Exchange Quora 上就相关话题开展交流,商业数据爬取公司也提供了采集 LinkedIn 数据的教程。在2016 年,该Microsoft 旗下的公司发起了一次针对一百个匿名爬取数据机器人用户的诉讼,所涉及的机器人意图通过伪造的用户账号访问非公开的简历数据。值得注意的是,LinkedIn 非常支持白名单服务提供商(如搜索引擎)的爬取行为。

查看英文原文: LinkedIn Ordered to Allow Scraping of Public Profile Data

2017-08-29 19:002623
用户头像

发布了 391 篇内容, 共 127.1 次阅读, 收获喜欢 256 次。

关注

评论

发布
暂无评论
发现更多内容

研发效能是不是一个伪命题:关于研发效能的思考

思码逸研发效能

Base 链官方点名 $AYB,继续飙涨指日可待?

股市老人

Adjustable Precision Shunt Regulator

智趣匠

AI板块的火热,现在参与Gensyn来得及吗?

币离海

AI Gensyn

Affinity Designer for Mac(强大的矢量图设计软件)v2.4.0中文免激活版

影影绰绰一往直前

听到心声,看见变化——WeLink助力上海理工大学打造“校园12345服务平台”

平平无奇爱好科技

通过 Kong Gateway 性能基准和开源测试套件实现透明度和信任

Gingxing

kong API网关 Kong 网关 消息网关 Kong Gateway

SecureCRT for mac(好用的终端SSH仿真工具)v9.5.1注册激活版

影影绰绰一往直前

Topaz Video AI for mac(地表最强视频无损放大修复工具)v4.2.0激活版

影影绰绰一往直前

Affinity Photo for Mac(好用的图片编辑软件)v2.3.2免激活版

影影绰绰一往直前

开启软件架构设计之门:初识软件架构设计的奥秘

灸哥漫谈

架构师 软件架构设计 系统架构师 系统架构设计

释放心中的野兽

一跃皑皑

Metes and Bounds Pro for Mac(房地产契约绘图软件)v6.1.0激活版

影影绰绰一往直前

巧用飞羽审批,实现业务起飞

平平无奇爱好科技

云服务器搭建网站全过程

百度搜索:蓝易云

云计算 Linux 运维 云服务器 ECS

MySql中BufferPool的基本概念介绍

百度搜索:蓝易云

MySQL Linux 运维 innodb 云服务器

Linux学习之Ubuntu 20使用systemd管理OpenResty服务

百度搜索:蓝易云

Linux ubuntu 运维 openresty systemd

OpenAI 视频生成模型发布,创作者如何利用 AI 工具最大化提升创作效率?

算法的秘密

预算有限,资源冗余?DWS集群缩容如何帮你解决烦劳

华为云开发者联盟

数据库 华为云 华为云开发者联盟 华为云GaussDB(DWS)

CQ 社区版 2.9.0 | 新增告警配置、GaussDB-DWS、脱敏数据可明文查询等

BinTools图尔兹

告警 数据脱敏 数据库管控 SQLite编辑器

我翻遍整个牛客网,整理出了2024最全的Java面试八股文大合集

采菊东篱下

程序员 java面试

密码学在 Web3 钱包中的应用:私钥是什么?bitget钱包为例

股市老人

Java 包和 API 深度解析:组织代码,避免命名冲突

小万哥

Java 程序人生 编程语言 软件工程 后端开发

质量保障体系的生命周期

老张

软件测试 质量保障

基于 Amazon S3 Express One Zone 和 Amazon SageMaker 的图像分类模型实战—深析新旧产品突显 Express One Zone 在性能上的优势

亚马逊云科技 (Amazon Web Services)

WingPro for Mac(强大的Python开发工具)v9.1.2.0注册激活版

影影绰绰一往直前

用WeLink连接每一位员工,加速打造“数字易立德”

平平无奇爱好科技

SecureFX for Mac(ftp文件传输工具)v9.5.1 注册激活版

影影绰绰一往直前

对话行业智能化先锋|宁夏大学:从300间未来教室迈向教育智能化

平平无奇爱好科技

PDF怎么转换成PPT文件?用这个AI在线转换工具,轻松搞定!

彭宏豪95

效率 职场 在线白板 办公软件 AIGC

ProPresenter for Mac(现场分屏演示工具) v7.16汉化版

影影绰绰一往直前

LinkedIn被裁定应开放对其公开资料数据的爬取_语言 & 开发_Shelby Switzer_InfoQ精选文章