写点什么

又被大量收集数据,Kindle“监控”你读书

  • 2020-09-08
  • 本文字数:1725 字

    阅读完需:约 6 分钟

又被大量收集数据,Kindle“监控”你读书

作为书迷,我购买过很多版本的 Kindle 设备,从最初版本到 Paperwhite 都有,并对每一版都很喜欢。但我对这个全新文本格式的潜在滥用情况心怀警惕。


从技术上来讲,亚马逊持有读者们阅读内容的所有权,他们随时可以删除这些内容。之前就曾经出现过亚马逊从客户账户及他们的Kindle删除特定书目的情况。这还不是最糟的,亚马逊甚至可以删除用户账户并撤销用户对已购买书籍的访问权限


Kindle 利用用户阅读数据来提供一些传统书籍无法提供的功能:管理设备间书签和笔记,同步所有设备中最后阅读位置等等,Kindle 同样可以显示广告或相关阅读推荐。


我想知道 Kindle 是否只会上传这些服务需要的数据,还是会将用户相关数据一同上传给亚马逊。

事实证明,Kindle 收集了海量的数据

Kindle 不仅会发送设备信息,使用大量元数据,甚至是用户在使用设备或 app 进行的所有操作都会被发送,这些数据都与用户账户直接连接。


打开 app、读书、翻页、关闭书籍,这些简单的操作会向亚马逊服务器上传上百条请求数据。



Kindle 数据请求

侵犯隐私的行为信息

总的来说,用户在读书时手指的每一次点击或互动都会被 Kindle 追踪。


读者阅读的每一页书籍都会发送下列信息:


  • 每页打开时间:每当读者翻页,都会生成一个时间戳

  • 每页的首个单词/文字:会以诸如“书中第 7705 个字”的形式记录其具体位置

  • 每页最后一个单词/文字

  • 该页是文字还是图片


以下是读者在阅读每页时会被发送的简单记录:


{    "created_timestamp": 1597743233808,    "payload": {        "context": "Reading",        "continuous_scroll_state": "disabled",        "end_position": 4708,        "is_scrolled_over_span": false,        "span_type": "Text",        "start_position": 4193    },    "schema_name": "kindle_positions_consumed_v2",    "schema_version": 0,    "sent_timestamp": 1597743233855,    "sequence_number": 26}
复制代码


每个阅读区间都会生成一个阅读页数与浏览模式的总结。


{    "created_timestamp": 1597743255324,    "payload": {        "action_type": "PageTurn",        "book_length": 2003478,        "context": "Reading",        "count": 10,        "navigation_end_location": 7884,        "navigation_mode": "Horizontal",        "navigation_start_location": 3599    },    "schema_name": "reader_in_book_navigation_v2",    "schema_version": 0,    "sent_timestamp": 1597743265854,    "sequence_number": 36}
复制代码


打开 app 时同样会上传类似数据,包括应用是否在后台开启、书籍是打开或关闭、诸如字号等设置是否有变动等。高亮或双击单词/词语,会在将其发送到 bing 翻译或维基百科的同时发送回亚马逊。


这些请求都不是像上次阅读位置这类的数据一样用于客户功能的。高亮、上次阅读位置,以及其他一些信息都会在一定周期内被再次发送向不同目的地,区别在于第二次发送所包含的信息量会大幅减少。


每条请求都不会在生成的同时上传。很多记录生成后会先保存在本地,然后才会被上传(注意前面的 sequence_number 字段)。即使用户在离线情况下阅读,一旦联网,这些存储在本地的数据都会被上传。

设备信息

Kindle 同样会上传一些私人信息,诸如:


  • 用户所在国家

  • 试图获取本地网络 IP 地址(Kindle 获取到作者的地址为 10.,并不准确)

  • 设备和版本信息(屏幕大小、品牌、设备型号),iPhone/安卓/Kindle 软件版本

  • Good Reads 账户信息

  • 设备方向(横屏/竖屏)


部分数据可能会帮助亚马逊了解用户对 app 的使用情况,方便他们后续调整。但本地 IP 是唯一一个困扰作者的数据,虽然除了 IP 作者并没有发现什么其他被上传的本地网络信息有问题。

结论

Kindle 可以说是我见过对用户隐私最不手下留情的 app 了,它记录了很多令我感到不适的阅读行为数据。在过去的几年中,我一直在尝试避免使用 Kindle 生态系统,目前在用Marvin在 iPhone 上阅读。虽然已经不再用 Kindle 设备了,但还是难免会怀念 e-Ink。


不幸的是,如果使用非 Kindle 应用,就需要买 DRM-Free 的书。这类书并不是很好找,但 Kobo 书店以及一小部分利基供应商经常会提供这类书,有些甚至还能在亚马逊上找到。


相关阅读:


Kindle Collects a Surprisingly Large Amount of Data


2020-09-08 07:002402

评论 3 条评论

发布
用户头像
图里的数据用的是什么抓包工具?
2020-09-08 10:21
回复
应该是 mitmproxy
2020-09-08 10:48
回复
多谢, 确实是这个工具
2020-09-15 10:29
回复
没有更多了
发现更多内容

利用SEO服务器优化你的网站,获得更多曝光机会

一只扑棱蛾子

服务器

SSD 价格已经翻番,还要不要继续选择全闪?

XSKY星辰天合

EC 分布式全闪 三副本

SD-WAN解决电商企业海外业务网络难题

Ogcloud

SD-WAN 企业网络 SD-WAN组网 SD-WAN服务商 SDWAN

中科院院士:借鉴美国超级计算机安腾 探索我国技术新路径

极客天地

库存领域核心能力--库存预占 建设实践

京东科技开发者

智能制造领域智能问答系统

悦数图数据库

用户行为分析模型实践(四)—— 留存分析模型

vivo互联网技术

hive 数据分析 Clickhouse 留存分析模型

做AI产品经理的三年,聊聊我的心得

京东零售技术

人工智能 产品经理 企业号 4 月 PK 榜

基于ChatGPT打造安全脚本工具流程

不在线第一只蜗牛

安全 ChatGPT

软件测试学习笔记丨显式等待的高级使用

测试人

软件测试 自动化测试 测试开发

微服务架构下如何通过弱依赖原则保障系统高可用

京东科技开发者

去中心化交易所开发 AI策略交易

区块链软件开发推广运营

dapp开发 区块链开发 链游开发 NFT开发 公链开发

从源码到实战:探寻App中的等待神秘力量,强制等待vs隐式等待

测试人

软件测试 自动化测试 测试开发

小小开发板承载万千创新可能,小熊派的云上奇遇记

华为云开发者联盟

物联网 华为云 华为云开发者联盟 先锋开发者云上说 企业号2024年4月PK榜

「布道师系列文章」解析 AutoMQ 对象存储中的文件存储格式

AutoMQ

大数据 kafka 云原生 知乎 AutoMQ

NL2SQL进阶系列(5):论文解读业界前沿方案(DIN-SQL、C3-SQL、DAIL-SQL)、新一代数据集BIRD-SQL解读

汀丶人工智能

自然语言处理 大模型 NL2SQL

NL2SQL实践系列(1):深入解析Prompt工程在text2sql中的应用技巧

汀丶人工智能

大模型 text2sql NL2SQL

国际标准图查询语言 GQL 正式发布,悦数图数据库业界首家原生支持

最新动态

搞定了 6 种分布式ID,分库分表哪个适合做主键?

程序员小富

Java 分库分表 spring-boot

市场份额第一!博睿数据持续领跑中国APM市场

博睿数据

可观测性 IT IT 运维 市场份额

系统logo及版权信息是否支持自定义配置 ?

开放签开源电子签章

版权保护 产品管理

官宣|Apache Paimon 毕业成为顶级项目,数据湖步入实时新篇章!

Apache Flink

Apache 大数据 flink paimon

利用SD-WAN技术优化企业网络

Ogcloud

网络 SD-WAN sdn 企业组网 SD-WAN组网

App测试中,强制等待和隐式等待谁更强?

霍格沃兹测试开发学社

生态短讯 | Tapdata 与 TDengine 完成产品兼容性互认证,打造物联网实时数据生态

tapdata

垃圾车的新用途:车外装摄像头,结合AI检查市容

算AI

人工智能 创业 AI 创新

又被大量收集数据,Kindle“监控”你读书_安全_Charlie Belmer_InfoQ精选文章