时隔16年Jeff Barr重返10.23-25 QCon上海站,带你看透AI如何重塑软件开发! 了解详情
写点什么

LinkedIn 被裁定应开放对其公开资料数据的爬取

  • 2017-08-29
  • 本文字数:1371 字

    阅读完需:约 4 分钟

一位美国联邦法官裁定,Microsoft 旗下的 LinkedIn 公司不能阻止第三方 Web 爬虫爬取其公开资料数据。这一裁定是根据初创企业 hiQ Labs 针对 LinkedIn 的诉讼而于 8 月 14 日做出的,这次诉讼是在 LinkedIn 向该初创企业发出一份要求其停止并中断爬取数据的信函后发起的。

hiQ Labs 爬取 LinkedIn 用户资料中的公开可见信息,为企业了解是否雇员有意向离职提供帮助。这类爬取行为违反了 LinkedIn 的反爬取软件禁令,因此在2017 年5 月23 日,LinkedIn 向HiQ Labs 发出了信函,要求该公司停止这类爬取行为,并威胁要依据《电脑欺诈和滥用法》(CFAA,Computer Fraud and Abuse Act)而采取法律行为。就此,hiQ Labs 发起了对LinkedIn 的诉讼,指责LinkedIn 具有反竞争行为,侵犯了企业访问公开可用信息的言论自由权利。该初创企业的代理律师指出, hiQ Labs 应该并未访问 LinkedIn 的主要数据源。法官 Edward Chen 在裁定中,特意呼吁 LinkedIn 对 CFAA 做“广泛的诠释”:“如果采纳 LinkedIn 的行为,那么将对互联网的开放访问产生深远的影响,这是议会在三十年前颁布 CFAA 时所不愿意看到的结果”。据报道,LinkedIn 将对这一裁决提出上诉

对于数据所有者及隐私,以及社会媒体公司对用户公开发表信息的控制程度,该联邦政令的影响重大。HiQ Labs 认为,LinkedIn 对公共资料获取的限制违反了建立在最高法院最近的一项裁决上的“第一修正案”(the First Amendment),即将社交媒体网站等同于一种“现代公众广场”。 Hacker News 的一个热议话题显示,社交媒体用户是否将他们公开发布数据等同视作将信息张贴在公开广场上,这依然有待观察。

在本次法庭案例中,涉及了数据隐私问题的另一个意外维度,那就是LinkedIn 宣称它想要保护的并非仅是数据本身,而是包括对被更改数据的访问。LinkedIn 允许用户公开发表个人资料,默认情况下并不会共享对简历的某些更改。但是hiQ Labs 通过大规模抓取可以检测到资料中的更改情况,并使用这些发现情况去告警企业雇主存在潜在的雇员流失问题。虽然有部分用户明白公开发表资料的深层影响,但是大多数用户不可能时刻惦记从数据中可以产生何种洞察,以及这些数据会被如何使用,而有一些他们所不了解的企业却在持续地监测个人资料的更新情况。

Programmable Web 网站的主编 David Berlind 最近评论了该裁定对API 经济的影响。他指出,LinkedIn 数据的价值并非在于数据本身,而是其后的数据模型。该裁定将允许机器人毫无顾忌地利用这些数据企业,这降低了LinkedIn 等产品的整体价值。他进一步提出,该裁定强制企业允许爬虫规避企业发布的API,妨碍了企业去“扩展并理解数据和数据所驱动价值之间的关联性”。

虽然LinkedIn 确实提供了一些 API ,但是看上去很多开发人员并不认为这些 API 适合自身的需要,因为编程界业已形成了广泛爬取 LinkedIn 数据的事实。已有提供在 Github 上的开源爬取库,开发人员可在 Stack Exchange Quora 上就相关话题开展交流,商业数据爬取公司也提供了采集 LinkedIn 数据的教程。在2016 年,该Microsoft 旗下的公司发起了一次针对一百个匿名爬取数据机器人用户的诉讼,所涉及的机器人意图通过伪造的用户账号访问非公开的简历数据。值得注意的是,LinkedIn 非常支持白名单服务提供商(如搜索引擎)的爬取行为。

查看英文原文: LinkedIn Ordered to Allow Scraping of Public Profile Data

2017-08-29 19:003246
用户头像

发布了 391 篇内容, 共 154.2 次阅读, 收获喜欢 257 次。

关注

评论

发布
暂无评论
发现更多内容

从采集到存储:时序数据库到底怎么处理时间?

Apache IoTDB

IoTDB Apache IoTDB

吃透JAVA的Stream流操作,多年实践总结

Java快了!

stream java;

Sovit3D数字孪生智慧港口三维可视化解决方案

数据可视化平台

物联网 智慧港口 5G智慧港口 港口三维可视化 智慧港口解决方案

Servent

喜羊羊

9月月更

不容错过的技术盛宴,4场全是 eBPF 技术干货,今天见 | 第 44-47 期

OpenAnolis小助手

Linux 开源 ebpf sig 龙蜥大讲堂

MySQL 数据库 - 函数 约束 多表查询 事务

喜羊羊

MySQL 9月月更

合阔智云核心生产系统切换到服务网格 ASM 的落地实践

阿里巴巴中间件

阿里云 Kubernetes 云原生 服务网格 合作

5年专业研究,这份云原生安全指南请查收!

博文视点Broadview

得物云原生全链路追踪Trace2.0架构实践

得物技术

云原生 监控 链路追踪 OpenTelemetry 企业号九月金秋榜

对话杨传辉:国产数据库新战绩背后,OceanBase坚持自研的初心与决心

OceanBase 数据库

库调多了,都忘了最基础的概念-《线程池篇》

知识浅谈

线程池 9月月更

数据库系统助力企业降本增效的技术要点|Meetup 回顾与预告

OceanBase 数据库

高端扫地机销量占比全球第一 石头科技创新驱动增长

科技热闻

LeetCode-13. 罗马数字转整数(java)

bug菌

9月日更 Leet Code 9月月更

C++ STL【常用算法】详解

Fire_Shield

算法 stl 9月月更

FlyFish开发者说|开源低代码平台的体验与思考

云智慧AIOps社区

前端 低代码 开源项目 数据可视化 可视化大屏

数字人技术在直播场景下的应用

百度Geek说

人工智能 直播 企业号九月金秋榜

LeetCode-9. 回文数(java)

bug菌

9月日更 9月月更

MySQL 数据库 - 通用语法 DDL DML DQL DCL

喜羊羊

MySQL 9月月更

华为云WeLink直播助力高校毕业典礼:这届毕业生,我们云上嗨

科技怪咖

开发者必读:2022年移动应用技术趋势白皮书

HarmonyOS SDK

XDR的技术栈参考

极盾科技

网络安全 数据安全 xdr

云对象 - 重新定义前后端交互

崔红保

uni-app Serverless unicloud

我们的月饼不一样!来线上 DIY 微软限定款

Azure云科技

技术 活动报名

如何理解「数字化是 IT 公司在给传统企业贩卖焦虑」?

BizFree

数字化转型 企业 焦虑 智能制造

上海华为云SaaS应用创新创业大赛暨828 B2B企业节发布仪式

科技怪咖

ShareSDK Android端微信回调冲突解决方案

MobTech袤博科技

android sdk

如何理解「数字化转型的本质是人的转型」?

BizFree

数字化转型 工业4.0 智能制造 机器换人 数字化工具

力扣20 - 有效的括号【暴力、分支判断、哈希表】

Fire_Shield

算法 哈希表 9月月更

OpenSSF发布npm 最佳实践指南,应对开源依赖风险

SEAL安全

npm DevSecOps 开源安全 软件供应链安全 开源安全与治理

CLIP-as-service 升级啦!

Jina AI

开源 算法 神经搜索

LinkedIn被裁定应开放对其公开资料数据的爬取_语言 & 开发_Shelby Switzer_InfoQ精选文章