最新发布《数智时代的AI人才粮仓模型解读白皮书(2024版)》,立即领取! 了解详情
写点什么

会议内容被拿去训练大模型!Zoom:我的 AI 功能可不“白给”

  • 2023-08-08
    北京
  • 本文字数:3281 字

    阅读完需:约 11 分钟

会议内容被拿去训练大模型!Zoom:我的AI功能可不“白给”

最近,流行的视频会议平台 Zoom 对其服务条款进行了重大更改,这在其庞大的用户群中引发了强烈担忧。

 

通过此次更改,Zoom 获得了使用用户数据来训练人工智能 (AI) 的许可。更新后的条款授予Zoom针对客户内容的“永久性、全球性、非排他性、免版税、可再许可和可转让的许可”,并延伸到“机器学习”和“人工智能”等目的。也就是说,Zoom 可以使用特定的用户数据来增强机器学习或人工智能,包括算法训练和调整。

 

这些变化最初是由以开发者为中心的网站 Stack Diary 发现的,不久之后,该消息就在网上引发了激烈的争论。许多用户对 Zoom 将客户数据用于人工智能的决定表示愤怒,而 Zoom 将数据用于人工智能和机器学习细节的不透明进一步加剧了人们的恐慌。

 

“Zoom 还能相信吗?”

 

该公司的法律文件将用户的视频、音频和聊天记录统称为“客户内容”。该公司对“服务生成数据”也保留类似的权利,其中包括遥测数据、产品使用数据、诊断数据以及通过分析用户内容/行为获取的其他信息。

 

“许多与医院/治疗师/等进行的远程医疗操作都使用 Zoom——我怀疑是因为他们的客户可以通过浏览器在没有应用程序或账户的情况下进行连接。当您通过浏览器加入到 Zoom 会话时,您无需签署 TOS(Terms of Service,服务条款)。我认为,获得许可的医疗机构都有自己的 TOS 条款,这些条款与 HIPPA 要求兼容。语音到文本转录等方面的培训……将是相当严重的隐私侵犯,特别是在医疗等服务范围内。一方面,存在对人工智能的明显攻击,以从中获取训练数据;另一方面,这些数据可能提供给正在验证其是否适合训练的员工/承包商访问。”网友“danShumway ”提出了自己的担忧。

 

注: TOS(Terms of Service,服务条款);HIPAA(Health Insurance Portability and Accountability Act《健康保险可携性和责任法案》)由美国第 104 届国会制定,并由比尔·克林顿总统于 1996 年 8 月 21 日签署通过。

 

虽然有网友指出,Zoom 有针对 HIPPA 法规的特定版本。但仍有网友指出,医疗保健专业人员仍然使用传真。“模拟线路传真符合 HIPAA 标准,因为它不会‘存储’。”

 

“我认为问题不在于 Zoom 的安全措施是否经过审计,”网友 haldujai 说道,“而在于他们是否可以在法律不明确的情况下使用存储的 PHI 进行产品开发。”

 

Zoom 的服务条款更改也引发了大家对其他会议软件的担忧。“Google Meet 的 TOS 没有具体提到人工智能,但确实提到了使用客户数据来更广泛地“开发新技术和服务”。”有网友指出。

 

当有网友表示“值得庆幸的是,Jitsi Meet 的 TOS 中没有类似的内容”时,有人在帖子下指出,Jitsi Meet ToS 第 4 节授予了他们类似的权利,只是用了更模糊的语言。

 

“您授予 8×8 Inc(以及我们的合作伙伴)全球范围内的许可,允许其使用、托管、存储、复制、修改、创建衍生作品……传播、发布、公开表演、公开展示和分发此类内容,但仅限于以下目的:运营和使服务能够按您的预期运行的有限目的,不用于其他目的。”

 

该网友指出,每个运营视频会议服务的人都会在其服务条款中包含类似这样的条款。Zoom 变得更加明确,这通常是一件好事。如果 Jitsi 想要同样明确,他们可以添加一些内容来澄清这不包括训练人工智能模型。

 

引发大家强烈担忧的另外一个原因是,Zoom 在遵守消费者隐私承诺方面一直表现不佳。2020 年,Zoom 表示将只向付费用户提供端到端加密,但这种将隐私保护作为付费功能的行为受到强烈抗议而被迫作罢。一项诉讼称,该公司口头上表示向所有人提供端到端加密,但实际使用的却是另一种安全性更弱的加密形式(Zoom 随后解决了此问题)。

 

该公司还在客户不知情的情况下,向谷歌和 Facebook 共享用户数据。2021 年,Zoom 同意以 8500 万美元就这些问题及其他争议达成和解。上周,Zoom 又撕毁了居家办公政策,要求住在公司附近的员工每周至少要有两天到单位工作,作为一个生产在线办公产品的企业,此举让广大网友直呼“在线办公的时代已经结束”。

 

Zoom 回应了个寂寞

 

Zoom 的 AI 政策之前并不受关注,直到上周末相关帖子在高影响力的黑客新闻论坛上爆火,用户群体才普遍惊觉并表示愤怒。周一上午,Zoom 公司首席产品官 Smita Hashim 发表博文,称原则上该公司并没做过服务条款中描述的行为。

 

Hasim 澄清道,虽然该公司确实将数据用于某些机器学习目的,但“在 AI 方面,若未经客户同意,我们不会使用音频、视频或聊天内容来训练我们的模型。”然而值得注意的是,Zoom 也表示,如果用户选择使用 Zoom 的人工智能功能(例如会议摘要工具),他们将被要求允许共享该内容以进行人工智能培训。

 

也就是说,作为通话对象,我们如果想要使用 Zoom 的人工智能功能,那么就别无选择,只能同意 Zoom 的政策,允许 Zoom 利用我们的数据构建和训练模型。

 

当前,各行各业都在寻找 AI 的合适落地,Zoom 也不例外。Zoom 今年 3 月推出了“Zoom IQ”,一组能总结聊天线索并帮助用户根据书面聊天内容自动生成回复的功能。

 

Zoom IQ 包含多项功能,重点的是会议主持人能使用其生成会议纪要,并通过 Zoom 内置聊天功能 Zoom Team Chat 或电邮发送给与会者,不用对会议进行录影以便回顾。此外,用户还能使用 AI 协助其在聊天室里撰写讯息。该功能由 Open AI 驱动,会根据聊天内容创建讯息,并允许用户修改讯息语气或长度。

 

Zoom IQ 属于可选功能,在启用之后,Zoom 会默认开启一个小的复选框。而如果懒得点击取消,用户就相当于允许该公司收集数据并利用自己的数据构建/改进其 AI 模型。在启用 Zoom IQ 开始通话后,通话对话也会收到标题为“会议纪要已启用”的通知。弹出窗口显示“帐户所有者可能允许 Zoom 访问和使用您的输入与 AI 生成内容,以支持功能交付和 Zoom IQ 产品改进,包括用于模型训练。”

 

据悉,Zoom 利用了自己专有的大型语言 AI 模型,以及来自领先 AI 公司(如 OpenAI 和 Anthropic)和特定客户自己的模型。此前 Zoom 称,该公司“从用户与 Zoom IQ 功能的交互中收集数据,包括输入、消息和人工智能生成的内容”,并可以使用这些信息来训练 Zoom IQ 人工智能模型(但不能是第三方模型),除非用户选择不与 Zoom 共享数据。

 

近期,Zoom 针对大中型董事会、高层面试等场景,发布了新的智能导演功能。Zoom 的软件将聚焦于每个参与者的面部,并将他们的面部显示在屏幕上的一个框中,然后跟踪他们的移动。对此,Zoom 首席产品官 Smita Hashim 声称,其系统不会收集任何类型的生物识别数据,而只是检测镜头前的人是否具有必要比例。

 

未来,Zoom 还计划通过与 OpenAI 和 Anthropic 的合作推出其他几项人工智能驱动的功能,包括将以过往的会议、电话和电邮内容生成电邮草稿,以及一键整合聊天室的对话。据悉,Zoom 正在开发会议查询功能,用户可以在聊天室内向 AI 发问,AI 便会在不打断会议的情况下生成其错过的会议内容。

 

结束语

 

不可忽视的是,对于普通用户来说,Zoom 的进入门槛比同类中的任何其他应用程序都要低。许多人会认为,相对隐私,可用性可能更为重要。但这并不意味着我们要在数据隐私上做出妥协。

 

最近,国家网信办联合国家发展改革委、教育部、科技部、工业和信息化部、公安部、广电总局公布《生成式人工智能服务管理暂行办法》,并规定生成式人工智能服务提供者在进行预训练、优化训练等训练数据处理活动时,要使用具有合法来源的数据和基础模型;涉及个人信息的,应当取得个人同意或者符合法律、行政法规规定的其他情形;涉及知识产权的,不得侵害他人依法享有的知识产权等。

 

欧洲议会在 6 月份通过了《人工智能法案》(AI Act),成为全球首个监管 AI 的法律草案。该法案规定,AI 基础模型供应商如谷歌、微软等有义务公开披露所用材料是否受版权保护,从而提高版权及核心数字资产的价值。

 

随着人工智能在我们生活中应用地不断增多,怎么安全、放心地使用这些功能不仅是对厂商们的考验,更是我们对自己负责的表现。


参考链接:

https://gizmodo.com/zoom-ai-privacy-policy-train-on-your-data-1850712655

https://www.theverge.com/2023/6/5/23749338/zoom-ai-summaries-missed-meetings

https://news.ycombinator.com/item?id=37021160

https://shimo.im/outlink/gray?url=https%3A%2F%2Fblog.zoom.us%2Fzooms-term-service-ai%2F

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2023-08-08 14:522642

评论 1 条评论

发布
用户头像
对线上会议泄密的担心,会让部分公司优先选择线下会议
2023-08-14 08:58 · 山东
回复
没有更多了
发现更多内容

金融网络安全体系建设

阿泽🧸

9月月更 安全体系建设

Introduction to ByteDance Pitaya

字节跳动终端技术

Python Machine Learning Pitaya ByteDance End Intelligence

海泰方圆成功举办“引领数据安全创新,加速数字经济发展”技术研讨会

电子信息发烧客

设计模式的艺术 第十八章解释器设计模式练习(为数据库备份和同步开发一套简单的数据库同步指令,指令可对数据库中的数据和结构进行备份。例如,输入指令“COPY VIEW FROM srcDB TO desDB”表示将srcDB中所有视图对象复制至desDB)

代廉洁

设计模式的艺术

C++学习------cctype头文件的作用与源码学习

桑榆

c++ 9月月更

【大话C语言】分支与循环语句

Albert Edison

C语言 开发语言 for循环 if语句 9月月更

如何正确理解Java领域中的锁机制,我们一般需要掌握哪些理论知识?

PivotalCloud

计网复习一,计算机网络原理概述

前端小刘不怕牛牛

计算机网络 计算机基础 HTTP 9月月更

Alluxio入选英特尔AI百佳创新激励计划

Alluxio

人工智能 创新 英特尔 Alluxio 9月月更

09_Linux基础-SHELL-标准输入与标准输出-重定向-管道

mycpen

Linux

08_Linux基础-vim-tmux-字符编码

mycpen

Linux

高端手机市场的诸神之战,vivo举起一把“雷神之锤”

脑极体

高颜值!程序员专属浏览器

Jackpop

AOP

平凡人生

MobPush 指定页面跳转最佳实现

MobTech袤博科技

ios android intent 页面跳转

07_Linux基础-计划任务-备份脚本-变量定义和使用

mycpen

Linux

学 Go,最常用的技能是什么?打日志

梦想橡皮擦

Python 9月月更

2022-09-02:以下go语言代码输出什么?A:9;B:11;C:编译错误;D:不确定

福大大架构师每日一题

golang 福大大 选择题

二维容器进行图的DFS搜索和BFS搜索-C++STL模板

清风莫追

c++ 算法 9月日更 9月月更

中国智能网联汽车信息安全分析2022案例征集

易观分析

汽车 案例征集 智联网

03_Linux基础-文件类型-主辅提示符-第1提示符-Linux命令-内外部命令-快捷键-改为英文编码-3个时间-stat-其他基础命令

mycpen

Linux

k8s自定义controller三部曲之二:自动生成代码

程序员欣宸

Kubernetes k8s 9月月更

Ribbon源码分析之@LoadBalanced与LoadBalancerClient

急需上岸的小谢

9月月更

【Web前端】怎样用记事本写一个简单的网页-html

清风莫追

9月月更

「技术人生」第9篇:如何设定业务目标

阿里巴巴中间件

阿里云 业务 技术文章

《数据结构》线性表之顺序表的实现(C语言)

孤衫

数据结构 C语言 9月月更

为什么这么多品牌迫切想要改变Logo?

Jackpop

【数独 2】候选数法解数独谜题-挖掘更深的信息-C++实现

清风莫追

9月月更

06_Linux基础-NGINX和浏览器、网页的关系-云服务器ssh登陆-安装NGINX-上传网页-压缩命令-xz-gzip-bzip2-zip-tar-配置NGINX服务器支持下载功能-备份脚本

mycpen

Linux

开源IM项目OpenIM单聊及万人群压测报告

Geek_1ef48b

微服务为什么需要混沌工程

穿过生命散发芬芳

混沌工程 9月月更

会议内容被拿去训练大模型!Zoom:我的AI功能可不“白给”_AI&大模型_褚杏娟_InfoQ精选文章