写点什么

又被大量收集数据,Kindle“监控”你读书

  • 2020-09-08
  • 本文字数:1725 字

    阅读完需:约 6 分钟

又被大量收集数据,Kindle“监控”你读书

作为书迷,我购买过很多版本的 Kindle 设备,从最初版本到 Paperwhite 都有,并对每一版都很喜欢。但我对这个全新文本格式的潜在滥用情况心怀警惕。


从技术上来讲,亚马逊持有读者们阅读内容的所有权,他们随时可以删除这些内容。之前就曾经出现过亚马逊从客户账户及他们的Kindle删除特定书目的情况。这还不是最糟的,亚马逊甚至可以删除用户账户并撤销用户对已购买书籍的访问权限


Kindle 利用用户阅读数据来提供一些传统书籍无法提供的功能:管理设备间书签和笔记,同步所有设备中最后阅读位置等等,Kindle 同样可以显示广告或相关阅读推荐。


我想知道 Kindle 是否只会上传这些服务需要的数据,还是会将用户相关数据一同上传给亚马逊。

事实证明,Kindle 收集了海量的数据

Kindle 不仅会发送设备信息,使用大量元数据,甚至是用户在使用设备或 app 进行的所有操作都会被发送,这些数据都与用户账户直接连接。


打开 app、读书、翻页、关闭书籍,这些简单的操作会向亚马逊服务器上传上百条请求数据。



Kindle 数据请求

侵犯隐私的行为信息

总的来说,用户在读书时手指的每一次点击或互动都会被 Kindle 追踪。


读者阅读的每一页书籍都会发送下列信息:


  • 每页打开时间:每当读者翻页,都会生成一个时间戳

  • 每页的首个单词/文字:会以诸如“书中第 7705 个字”的形式记录其具体位置

  • 每页最后一个单词/文字

  • 该页是文字还是图片


以下是读者在阅读每页时会被发送的简单记录:


{    "created_timestamp": 1597743233808,    "payload": {        "context": "Reading",        "continuous_scroll_state": "disabled",        "end_position": 4708,        "is_scrolled_over_span": false,        "span_type": "Text",        "start_position": 4193    },    "schema_name": "kindle_positions_consumed_v2",    "schema_version": 0,    "sent_timestamp": 1597743233855,    "sequence_number": 26}
复制代码


每个阅读区间都会生成一个阅读页数与浏览模式的总结。


{    "created_timestamp": 1597743255324,    "payload": {        "action_type": "PageTurn",        "book_length": 2003478,        "context": "Reading",        "count": 10,        "navigation_end_location": 7884,        "navigation_mode": "Horizontal",        "navigation_start_location": 3599    },    "schema_name": "reader_in_book_navigation_v2",    "schema_version": 0,    "sent_timestamp": 1597743265854,    "sequence_number": 36}
复制代码


打开 app 时同样会上传类似数据,包括应用是否在后台开启、书籍是打开或关闭、诸如字号等设置是否有变动等。高亮或双击单词/词语,会在将其发送到 bing 翻译或维基百科的同时发送回亚马逊。


这些请求都不是像上次阅读位置这类的数据一样用于客户功能的。高亮、上次阅读位置,以及其他一些信息都会在一定周期内被再次发送向不同目的地,区别在于第二次发送所包含的信息量会大幅减少。


每条请求都不会在生成的同时上传。很多记录生成后会先保存在本地,然后才会被上传(注意前面的 sequence_number 字段)。即使用户在离线情况下阅读,一旦联网,这些存储在本地的数据都会被上传。

设备信息

Kindle 同样会上传一些私人信息,诸如:


  • 用户所在国家

  • 试图获取本地网络 IP 地址(Kindle 获取到作者的地址为 10.,并不准确)

  • 设备和版本信息(屏幕大小、品牌、设备型号),iPhone/安卓/Kindle 软件版本

  • Good Reads 账户信息

  • 设备方向(横屏/竖屏)


部分数据可能会帮助亚马逊了解用户对 app 的使用情况,方便他们后续调整。但本地 IP 是唯一一个困扰作者的数据,虽然除了 IP 作者并没有发现什么其他被上传的本地网络信息有问题。

结论

Kindle 可以说是我见过对用户隐私最不手下留情的 app 了,它记录了很多令我感到不适的阅读行为数据。在过去的几年中,我一直在尝试避免使用 Kindle 生态系统,目前在用Marvin在 iPhone 上阅读。虽然已经不再用 Kindle 设备了,但还是难免会怀念 e-Ink。


不幸的是,如果使用非 Kindle 应用,就需要买 DRM-Free 的书。这类书并不是很好找,但 Kobo 书店以及一小部分利基供应商经常会提供这类书,有些甚至还能在亚马逊上找到。


相关阅读:


Kindle Collects a Surprisingly Large Amount of Data


2020-09-08 07:002300

评论 3 条评论

发布
用户头像
图里的数据用的是什么抓包工具?
2020-09-08 10:21
回复
应该是 mitmproxy
2020-09-08 10:48
回复
多谢, 确实是这个工具
2020-09-15 10:29
回复
没有更多了
发现更多内容

MT马特量化交易系统开发|MT马特量化交易软件APP开发

系统开发

10 个解放双手超实用在线工具,有些代码真的不用手写

程序员小富

Java

工作日志3-2-3

技术骨干

知识+AI融合创新探索,华为云论文被AI顶级学术期刊IEEE TPAMI接受

华为云开发者联盟

AI 模型 华为云 卷积神经网络 IEEE TPAMI论文

面试现场:小伙伴的美团一面分享和分析[含答案]

小傅哥

Java 面试 小傅哥

2021网络系统流行架构

杨东冬

架构 网关 ebpf cilium envoy

BI掌柜量化交易系统开发|BI掌柜炒币机器人软件APP开发

系统开发

女神节·走近又美又飒的程序媛

华为云开发者联盟

华为 程序媛 IT 工程师 汉服

阿里P8大佬亲自讲解!万字Android技术类校招面试题汇总,已拿offer

欢喜学安卓

android 程序员 面试 移动开发

Python 语言基础变量的类型转换

HoneyMoose

《精通比特币》学习笔记(第四章)

棉花糖

区块链 读书笔记 3月日更

实现一个全链路监控平台很难吗?Pinpoint、SkyWalking、Zipkin,哪个实现比较好?

xcbeyond

架构 技术方案 链路监控 3月日更

亿级用户中心的设计与实践

vivo互联网技术

大数据 架构设计 数据安全

突破关系型数据库桎梏:云原生数据库中间件核心剖析

京东科技开发者

数据库 nosql 分布式系统

LoadRunner测试中遇见的不可思议的问题及其解决方法

陈磊@Criss

七日更 28天写作 3月日更

大括号之谜:C++的列表初始化语法解析

华为云开发者联盟

c++ 函数 语法 元素 std::array

了解MySQL6种约束的不同和特点

华为云开发者联盟

MySQL 数据 约束 主键约束 自增长约束

Python 语言基础变量定义和使用

HoneyMoose

36 Kr | 打造企业统一数据安全入口,「图尔兹」想用新思路解决数据安全问题

BinTools图尔兹

数据库 sql 数据安全 权限 数据库管理工具

上线 Python 应用仅需一条命令的开源框架:Zappa(详细教程)

HelloGitHub

Python Serverless 无服务器云函数

阿里P8大牛亲自讲解!难道Android真的凉了?3面直接拿到offer

欢喜学安卓

android 程序员 面试 移动开发

Python 语言基础变量获得变量类型

HoneyMoose

实习记录-埋点测试

YUKI0506

二维码高端路线养成计

happlyfox

学习 技能 28天写作 3月日更

小喜量化交易系统开发|小喜APP软件开发

系统开发

《我想进大厂》之分布式锁夺命连环9问 | 大理版人在囧途

艾小仙

Java redis zookeeper 分布式锁

关于MPI-IO,你该知道的

焱融科技

存储 HPC 焱融科技 文件存储 分布式存储

纯干货 | 详解 HDFS 3.x 新特性-纠删码

五分钟学大数据

大数据 hdfs 28天写作 3月日更

正则表达式.03 - 分组

insight

正则表达式 3月日更

Python基础之:函数

程序那些事

Python 数据分析 Python3 程序那些事

列表推导式与字典推导式,滚雪球学 Python

梦想橡皮擦

28天写作 3月日更

又被大量收集数据,Kindle“监控”你读书_安全_Charlie Belmer_InfoQ精选文章