NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

会议内容被拿去训练大模型!Zoom:我的 AI 功能可不“白给”

  • 2023-08-08
    北京
  • 本文字数:3281 字

    阅读完需:约 11 分钟

会议内容被拿去训练大模型!Zoom:我的AI功能可不“白给”

最近,流行的视频会议平台 Zoom 对其服务条款进行了重大更改,这在其庞大的用户群中引发了强烈担忧。

 

通过此次更改,Zoom 获得了使用用户数据来训练人工智能 (AI) 的许可。更新后的条款授予Zoom针对客户内容的“永久性、全球性、非排他性、免版税、可再许可和可转让的许可”,并延伸到“机器学习”和“人工智能”等目的。也就是说,Zoom 可以使用特定的用户数据来增强机器学习或人工智能,包括算法训练和调整。

 

这些变化最初是由以开发者为中心的网站 Stack Diary 发现的,不久之后,该消息就在网上引发了激烈的争论。许多用户对 Zoom 将客户数据用于人工智能的决定表示愤怒,而 Zoom 将数据用于人工智能和机器学习细节的不透明进一步加剧了人们的恐慌。

 

“Zoom 还能相信吗?”

 

该公司的法律文件将用户的视频、音频和聊天记录统称为“客户内容”。该公司对“服务生成数据”也保留类似的权利,其中包括遥测数据、产品使用数据、诊断数据以及通过分析用户内容/行为获取的其他信息。

 

“许多与医院/治疗师/等进行的远程医疗操作都使用 Zoom——我怀疑是因为他们的客户可以通过浏览器在没有应用程序或账户的情况下进行连接。当您通过浏览器加入到 Zoom 会话时,您无需签署 TOS(Terms of Service,服务条款)。我认为,获得许可的医疗机构都有自己的 TOS 条款,这些条款与 HIPPA 要求兼容。语音到文本转录等方面的培训……将是相当严重的隐私侵犯,特别是在医疗等服务范围内。一方面,存在对人工智能的明显攻击,以从中获取训练数据;另一方面,这些数据可能提供给正在验证其是否适合训练的员工/承包商访问。”网友“danShumway ”提出了自己的担忧。

 

注: TOS(Terms of Service,服务条款);HIPAA(Health Insurance Portability and Accountability Act《健康保险可携性和责任法案》)由美国第 104 届国会制定,并由比尔·克林顿总统于 1996 年 8 月 21 日签署通过。

 

虽然有网友指出,Zoom 有针对 HIPPA 法规的特定版本。但仍有网友指出,医疗保健专业人员仍然使用传真。“模拟线路传真符合 HIPAA 标准,因为它不会‘存储’。”

 

“我认为问题不在于 Zoom 的安全措施是否经过审计,”网友 haldujai 说道,“而在于他们是否可以在法律不明确的情况下使用存储的 PHI 进行产品开发。”

 

Zoom 的服务条款更改也引发了大家对其他会议软件的担忧。“Google Meet 的 TOS 没有具体提到人工智能,但确实提到了使用客户数据来更广泛地“开发新技术和服务”。”有网友指出。

 

当有网友表示“值得庆幸的是,Jitsi Meet 的 TOS 中没有类似的内容”时,有人在帖子下指出,Jitsi Meet ToS 第 4 节授予了他们类似的权利,只是用了更模糊的语言。

 

“您授予 8×8 Inc(以及我们的合作伙伴)全球范围内的许可,允许其使用、托管、存储、复制、修改、创建衍生作品……传播、发布、公开表演、公开展示和分发此类内容,但仅限于以下目的:运营和使服务能够按您的预期运行的有限目的,不用于其他目的。”

 

该网友指出,每个运营视频会议服务的人都会在其服务条款中包含类似这样的条款。Zoom 变得更加明确,这通常是一件好事。如果 Jitsi 想要同样明确,他们可以添加一些内容来澄清这不包括训练人工智能模型。

 

引发大家强烈担忧的另外一个原因是,Zoom 在遵守消费者隐私承诺方面一直表现不佳。2020 年,Zoom 表示将只向付费用户提供端到端加密,但这种将隐私保护作为付费功能的行为受到强烈抗议而被迫作罢。一项诉讼称,该公司口头上表示向所有人提供端到端加密,但实际使用的却是另一种安全性更弱的加密形式(Zoom 随后解决了此问题)。

 

该公司还在客户不知情的情况下,向谷歌和 Facebook 共享用户数据。2021 年,Zoom 同意以 8500 万美元就这些问题及其他争议达成和解。上周,Zoom 又撕毁了居家办公政策,要求住在公司附近的员工每周至少要有两天到单位工作,作为一个生产在线办公产品的企业,此举让广大网友直呼“在线办公的时代已经结束”。

 

Zoom 回应了个寂寞

 

Zoom 的 AI 政策之前并不受关注,直到上周末相关帖子在高影响力的黑客新闻论坛上爆火,用户群体才普遍惊觉并表示愤怒。周一上午,Zoom 公司首席产品官 Smita Hashim 发表博文,称原则上该公司并没做过服务条款中描述的行为。

 

Hasim 澄清道,虽然该公司确实将数据用于某些机器学习目的,但“在 AI 方面,若未经客户同意,我们不会使用音频、视频或聊天内容来训练我们的模型。”然而值得注意的是,Zoom 也表示,如果用户选择使用 Zoom 的人工智能功能(例如会议摘要工具),他们将被要求允许共享该内容以进行人工智能培训。

 

也就是说,作为通话对象,我们如果想要使用 Zoom 的人工智能功能,那么就别无选择,只能同意 Zoom 的政策,允许 Zoom 利用我们的数据构建和训练模型。

 

当前,各行各业都在寻找 AI 的合适落地,Zoom 也不例外。Zoom 今年 3 月推出了“Zoom IQ”,一组能总结聊天线索并帮助用户根据书面聊天内容自动生成回复的功能。

 

Zoom IQ 包含多项功能,重点的是会议主持人能使用其生成会议纪要,并通过 Zoom 内置聊天功能 Zoom Team Chat 或电邮发送给与会者,不用对会议进行录影以便回顾。此外,用户还能使用 AI 协助其在聊天室里撰写讯息。该功能由 Open AI 驱动,会根据聊天内容创建讯息,并允许用户修改讯息语气或长度。

 

Zoom IQ 属于可选功能,在启用之后,Zoom 会默认开启一个小的复选框。而如果懒得点击取消,用户就相当于允许该公司收集数据并利用自己的数据构建/改进其 AI 模型。在启用 Zoom IQ 开始通话后,通话对话也会收到标题为“会议纪要已启用”的通知。弹出窗口显示“帐户所有者可能允许 Zoom 访问和使用您的输入与 AI 生成内容,以支持功能交付和 Zoom IQ 产品改进,包括用于模型训练。”

 

据悉,Zoom 利用了自己专有的大型语言 AI 模型,以及来自领先 AI 公司(如 OpenAI 和 Anthropic)和特定客户自己的模型。此前 Zoom 称,该公司“从用户与 Zoom IQ 功能的交互中收集数据,包括输入、消息和人工智能生成的内容”,并可以使用这些信息来训练 Zoom IQ 人工智能模型(但不能是第三方模型),除非用户选择不与 Zoom 共享数据。

 

近期,Zoom 针对大中型董事会、高层面试等场景,发布了新的智能导演功能。Zoom 的软件将聚焦于每个参与者的面部,并将他们的面部显示在屏幕上的一个框中,然后跟踪他们的移动。对此,Zoom 首席产品官 Smita Hashim 声称,其系统不会收集任何类型的生物识别数据,而只是检测镜头前的人是否具有必要比例。

 

未来,Zoom 还计划通过与 OpenAI 和 Anthropic 的合作推出其他几项人工智能驱动的功能,包括将以过往的会议、电话和电邮内容生成电邮草稿,以及一键整合聊天室的对话。据悉,Zoom 正在开发会议查询功能,用户可以在聊天室内向 AI 发问,AI 便会在不打断会议的情况下生成其错过的会议内容。

 

结束语

 

不可忽视的是,对于普通用户来说,Zoom 的进入门槛比同类中的任何其他应用程序都要低。许多人会认为,相对隐私,可用性可能更为重要。但这并不意味着我们要在数据隐私上做出妥协。

 

最近,国家网信办联合国家发展改革委、教育部、科技部、工业和信息化部、公安部、广电总局公布《生成式人工智能服务管理暂行办法》,并规定生成式人工智能服务提供者在进行预训练、优化训练等训练数据处理活动时,要使用具有合法来源的数据和基础模型;涉及个人信息的,应当取得个人同意或者符合法律、行政法规规定的其他情形;涉及知识产权的,不得侵害他人依法享有的知识产权等。

 

欧洲议会在 6 月份通过了《人工智能法案》(AI Act),成为全球首个监管 AI 的法律草案。该法案规定,AI 基础模型供应商如谷歌、微软等有义务公开披露所用材料是否受版权保护,从而提高版权及核心数字资产的价值。

 

随着人工智能在我们生活中应用地不断增多,怎么安全、放心地使用这些功能不仅是对厂商们的考验,更是我们对自己负责的表现。


参考链接:

https://gizmodo.com/zoom-ai-privacy-policy-train-on-your-data-1850712655

https://www.theverge.com/2023/6/5/23749338/zoom-ai-summaries-missed-meetings

https://news.ycombinator.com/item?id=37021160

https://shimo.im/outlink/gray?url=https%3A%2F%2Fblog.zoom.us%2Fzooms-term-service-ai%2F

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2023-08-08 14:522646

评论 1 条评论

发布
用户头像
对线上会议泄密的担心,会让部分公司优先选择线下会议
2023-08-14 08:58 · 山东
回复
没有更多了
发现更多内容

多次拿下移动集团技术发明大奖,TA是怎么做到的?

鲸品堂

AI 资源

开源生态研究与实践| ChinaOSC

CCF开源发展委员会

系统入门-Linux系统基础命令

Albert Edison

Linux centos 指令 8月月更

Hi,我是ChunJun,一个有趣好用的开源项目

袋鼠云数栈

CSS 移动光标使文本产生多个反差色特效

南城FE

CSS css3 前端 动画

移动端四种热更新技术对比

Geek_99967b

小程序

【云原生】微服务SpringCloud-eureka(server)集群搭建

java李杨勇

Eureka spring-cloud 签约计划第三季

超云

Kent Yao

超云 Supercloud

leetcode 239. Sliding Window Maximum 滑动窗口最大值

okokabcd

LeetCode 数据结构与算法 双端队列

RocketMQ高性能设计之动态缩扩容和消息实时投递

急需上岸的小谢

8月月更

Github又爆神作!野生程序员自学SpringCloudAlibaba必备学习笔记开源(阿里2022最新版)

Java永远的神

Java 程序员 面试 微服务 SpringCloud

StoneDB 读、写操作的执行过程

StoneDB

MySQL 数据库 大数据 #开源 8月月更

什么是知识管理系统?如何改善客户体验?

Geek_da0866

基于JavaSpringMVC+vue实现协同过滤电影推荐系统详细设计

java李杨勇

Java spring Vue 3 签约计划第三季 协同过滤

【云原生】SpringCloud是什么?

java李杨勇

Java spring-boot 签约计划第三季

架构实战营毕业总结

Geek_53787a

浅谈成功的企业知识管理

Baklib

开源一夏 |ModelScope--人像卡通化、人像美肤

六月的雨在InfoQ

开源 8月月更 ModelScope

底层原理源码+面试场景还原,阿里巴巴多线程JDK源码学习笔记全网首次公开

程序员小毕

程序员 面试 多线程 高并发 jdk源码

开源中国专访 TJ:开源许可证,欢迎来到云时代

tapdata

Tapdata 开源社区

知识管理体系在企业中的作用

Baklib

因果决策从YLearn开始,数据智能基础软件迎“风口”

九章云极DataCanvas

人工智能 GitHub 数据智能 YLearn 工具包

开源知识库与SaaS解决方案的区别

Geek_da0866

首届腾讯云大数据峰会开幕在即,现场将发布全新一代产品矩阵

科技热闻

水滴低代码搭建——6倍提效,新品首发素材审核系统实践之路

京东科技开发者

CMS 低代码 表单 素材 低代码开发

开源一夏 |分布式事务

六月的雨在InfoQ

开源 分布式事务 2PC 3PC 8月月更

【云原生】SpringCloud-Spring Boot Starter使用测试

java李杨勇

Java web SpringCloud Alibaba 签约计划第三季

开源一夏 | 使用 HTML、CSS 和 JavaScript 的简单模拟时钟

海拥(haiyong.site)

开源 8月月更

中国开源先锋人物志 | ChinaOSC

CCF开源发展委员会

备受资本市场关注的Zebec,正在构建“新DeFi”生态

小哈区块

“新DeFi”生态的构建,流支付协议Zebec或厚积薄发

BlockChain先知

会议内容被拿去训练大模型!Zoom:我的AI功能可不“白给”_AI&大模型_褚杏娟_InfoQ精选文章