QCon 演讲火热征集中,快来分享技术实践与洞见! 了解详情
写点什么

会议内容被拿去训练大模型!Zoom:我的 AI 功能可不“白给”

  • 2023-08-08
    北京
  • 本文字数:3281 字

    阅读完需:约 11 分钟

会议内容被拿去训练大模型!Zoom:我的AI功能可不“白给”

最近,流行的视频会议平台 Zoom 对其服务条款进行了重大更改,这在其庞大的用户群中引发了强烈担忧。

 

通过此次更改,Zoom 获得了使用用户数据来训练人工智能 (AI) 的许可。更新后的条款授予Zoom针对客户内容的“永久性、全球性、非排他性、免版税、可再许可和可转让的许可”,并延伸到“机器学习”和“人工智能”等目的。也就是说,Zoom 可以使用特定的用户数据来增强机器学习或人工智能,包括算法训练和调整。

 

这些变化最初是由以开发者为中心的网站 Stack Diary 发现的,不久之后,该消息就在网上引发了激烈的争论。许多用户对 Zoom 将客户数据用于人工智能的决定表示愤怒,而 Zoom 将数据用于人工智能和机器学习细节的不透明进一步加剧了人们的恐慌。

 

“Zoom 还能相信吗?”

 

该公司的法律文件将用户的视频、音频和聊天记录统称为“客户内容”。该公司对“服务生成数据”也保留类似的权利,其中包括遥测数据、产品使用数据、诊断数据以及通过分析用户内容/行为获取的其他信息。

 

“许多与医院/治疗师/等进行的远程医疗操作都使用 Zoom——我怀疑是因为他们的客户可以通过浏览器在没有应用程序或账户的情况下进行连接。当您通过浏览器加入到 Zoom 会话时,您无需签署 TOS(Terms of Service,服务条款)。我认为,获得许可的医疗机构都有自己的 TOS 条款,这些条款与 HIPPA 要求兼容。语音到文本转录等方面的培训……将是相当严重的隐私侵犯,特别是在医疗等服务范围内。一方面,存在对人工智能的明显攻击,以从中获取训练数据;另一方面,这些数据可能提供给正在验证其是否适合训练的员工/承包商访问。”网友“danShumway ”提出了自己的担忧。

 

注: TOS(Terms of Service,服务条款);HIPAA(Health Insurance Portability and Accountability Act《健康保险可携性和责任法案》)由美国第 104 届国会制定,并由比尔·克林顿总统于 1996 年 8 月 21 日签署通过。

 

虽然有网友指出,Zoom 有针对 HIPPA 法规的特定版本。但仍有网友指出,医疗保健专业人员仍然使用传真。“模拟线路传真符合 HIPAA 标准,因为它不会‘存储’。”

 

“我认为问题不在于 Zoom 的安全措施是否经过审计,”网友 haldujai 说道,“而在于他们是否可以在法律不明确的情况下使用存储的 PHI 进行产品开发。”

 

Zoom 的服务条款更改也引发了大家对其他会议软件的担忧。“Google Meet 的 TOS 没有具体提到人工智能,但确实提到了使用客户数据来更广泛地“开发新技术和服务”。”有网友指出。

 

当有网友表示“值得庆幸的是,Jitsi Meet 的 TOS 中没有类似的内容”时,有人在帖子下指出,Jitsi Meet ToS 第 4 节授予了他们类似的权利,只是用了更模糊的语言。

 

“您授予 8×8 Inc(以及我们的合作伙伴)全球范围内的许可,允许其使用、托管、存储、复制、修改、创建衍生作品……传播、发布、公开表演、公开展示和分发此类内容,但仅限于以下目的:运营和使服务能够按您的预期运行的有限目的,不用于其他目的。”

 

该网友指出,每个运营视频会议服务的人都会在其服务条款中包含类似这样的条款。Zoom 变得更加明确,这通常是一件好事。如果 Jitsi 想要同样明确,他们可以添加一些内容来澄清这不包括训练人工智能模型。

 

引发大家强烈担忧的另外一个原因是,Zoom 在遵守消费者隐私承诺方面一直表现不佳。2020 年,Zoom 表示将只向付费用户提供端到端加密,但这种将隐私保护作为付费功能的行为受到强烈抗议而被迫作罢。一项诉讼称,该公司口头上表示向所有人提供端到端加密,但实际使用的却是另一种安全性更弱的加密形式(Zoom 随后解决了此问题)。

 

该公司还在客户不知情的情况下,向谷歌和 Facebook 共享用户数据。2021 年,Zoom 同意以 8500 万美元就这些问题及其他争议达成和解。上周,Zoom 又撕毁了居家办公政策,要求住在公司附近的员工每周至少要有两天到单位工作,作为一个生产在线办公产品的企业,此举让广大网友直呼“在线办公的时代已经结束”。

 

Zoom 回应了个寂寞

 

Zoom 的 AI 政策之前并不受关注,直到上周末相关帖子在高影响力的黑客新闻论坛上爆火,用户群体才普遍惊觉并表示愤怒。周一上午,Zoom 公司首席产品官 Smita Hashim 发表博文,称原则上该公司并没做过服务条款中描述的行为。

 

Hasim 澄清道,虽然该公司确实将数据用于某些机器学习目的,但“在 AI 方面,若未经客户同意,我们不会使用音频、视频或聊天内容来训练我们的模型。”然而值得注意的是,Zoom 也表示,如果用户选择使用 Zoom 的人工智能功能(例如会议摘要工具),他们将被要求允许共享该内容以进行人工智能培训。

 

也就是说,作为通话对象,我们如果想要使用 Zoom 的人工智能功能,那么就别无选择,只能同意 Zoom 的政策,允许 Zoom 利用我们的数据构建和训练模型。

 

当前,各行各业都在寻找 AI 的合适落地,Zoom 也不例外。Zoom 今年 3 月推出了“Zoom IQ”,一组能总结聊天线索并帮助用户根据书面聊天内容自动生成回复的功能。

 

Zoom IQ 包含多项功能,重点的是会议主持人能使用其生成会议纪要,并通过 Zoom 内置聊天功能 Zoom Team Chat 或电邮发送给与会者,不用对会议进行录影以便回顾。此外,用户还能使用 AI 协助其在聊天室里撰写讯息。该功能由 Open AI 驱动,会根据聊天内容创建讯息,并允许用户修改讯息语气或长度。

 

Zoom IQ 属于可选功能,在启用之后,Zoom 会默认开启一个小的复选框。而如果懒得点击取消,用户就相当于允许该公司收集数据并利用自己的数据构建/改进其 AI 模型。在启用 Zoom IQ 开始通话后,通话对话也会收到标题为“会议纪要已启用”的通知。弹出窗口显示“帐户所有者可能允许 Zoom 访问和使用您的输入与 AI 生成内容,以支持功能交付和 Zoom IQ 产品改进,包括用于模型训练。”

 

据悉,Zoom 利用了自己专有的大型语言 AI 模型,以及来自领先 AI 公司(如 OpenAI 和 Anthropic)和特定客户自己的模型。此前 Zoom 称,该公司“从用户与 Zoom IQ 功能的交互中收集数据,包括输入、消息和人工智能生成的内容”,并可以使用这些信息来训练 Zoom IQ 人工智能模型(但不能是第三方模型),除非用户选择不与 Zoom 共享数据。

 

近期,Zoom 针对大中型董事会、高层面试等场景,发布了新的智能导演功能。Zoom 的软件将聚焦于每个参与者的面部,并将他们的面部显示在屏幕上的一个框中,然后跟踪他们的移动。对此,Zoom 首席产品官 Smita Hashim 声称,其系统不会收集任何类型的生物识别数据,而只是检测镜头前的人是否具有必要比例。

 

未来,Zoom 还计划通过与 OpenAI 和 Anthropic 的合作推出其他几项人工智能驱动的功能,包括将以过往的会议、电话和电邮内容生成电邮草稿,以及一键整合聊天室的对话。据悉,Zoom 正在开发会议查询功能,用户可以在聊天室内向 AI 发问,AI 便会在不打断会议的情况下生成其错过的会议内容。

 

结束语

 

不可忽视的是,对于普通用户来说,Zoom 的进入门槛比同类中的任何其他应用程序都要低。许多人会认为,相对隐私,可用性可能更为重要。但这并不意味着我们要在数据隐私上做出妥协。

 

最近,国家网信办联合国家发展改革委、教育部、科技部、工业和信息化部、公安部、广电总局公布《生成式人工智能服务管理暂行办法》,并规定生成式人工智能服务提供者在进行预训练、优化训练等训练数据处理活动时,要使用具有合法来源的数据和基础模型;涉及个人信息的,应当取得个人同意或者符合法律、行政法规规定的其他情形;涉及知识产权的,不得侵害他人依法享有的知识产权等。

 

欧洲议会在 6 月份通过了《人工智能法案》(AI Act),成为全球首个监管 AI 的法律草案。该法案规定,AI 基础模型供应商如谷歌、微软等有义务公开披露所用材料是否受版权保护,从而提高版权及核心数字资产的价值。

 

随着人工智能在我们生活中应用地不断增多,怎么安全、放心地使用这些功能不仅是对厂商们的考验,更是我们对自己负责的表现。


参考链接:

https://gizmodo.com/zoom-ai-privacy-policy-train-on-your-data-1850712655

https://www.theverge.com/2023/6/5/23749338/zoom-ai-summaries-missed-meetings

https://news.ycombinator.com/item?id=37021160

https://shimo.im/outlink/gray?url=https%3A%2F%2Fblog.zoom.us%2Fzooms-term-service-ai%2F

2023-08-08 14:522957

评论 1 条评论

发布
用户头像
对线上会议泄密的担心,会让部分公司优先选择线下会议
2023-08-14 08:58 · 山东
回复
没有更多了
发现更多内容

如何在零停机的情况下迁移 Kubernetes 集群

阿里巴巴云原生

阿里云 Kubernetes 容器 云原生 数据迁移

盘点|2021最受开发者欢迎和最具行业影响力的文章

阿里巴巴云原生

阿里云 开发者 云原生 年终盘点

基于机器学习和深度学习,华为大佬手写AIoT系统学习小册

Java全栈架构师

Python 数据库 程序员 AI 面试

Java Jackson 中如何 Pending JSON 对象到数组中

HoneyMoose

前后端数据校验和接口测试就没我 JSON Schema 干不了的活!

CRMEB

LabVIEW目标测量方法(基础篇—12)

不脱发的程序猿

机器视觉 图像处理 LabVIEW 目标测量方法 目标尺寸测量

聚焦高质量发展,AI创业企业如何释放数智新潜力?

脑极体

【盘点 2021】义无反顾,投身福报,我的2021年度总结

Zhendong

阿里巴巴 年终总结

【网络安全】文件上传绕过思路

网络安全学海

黑客 网络安全 信息安全 渗透测试 安全漏洞

2021年12月云主机性能评测报告

博睿数据

第五周作业

lv

架构训练营 week4 课程总结

红莲疾风

「架构实战营」

全球最大规模中文跨模态生成模型文心ERNIE-ViLG来了!

科技热闻

揭秘阿里云神龙团队拿下TPCx-BB排名第一的背后技术

阿里云弹性计算

大数据 阿里云 神龙

博睿APM获《金融电子化》2021年金融业新技术应用创新突出贡献奖

博睿数据

Python原生数据结构增强模块collections

Java全栈架构师

Python 数据库 程序员 数据结构 面试

从本科退学,到再拿本科,2021我的5年技术“弯路”回轨了|1.2w字

杨成功

程序员 前端 盘点2021

阿里云 MSE 云原生网关助力斯凯奇轻松应对双 11 大促

阿里巴巴云原生

阿里云 云原生 MSE 斯凯奇

基于Paddle Serving&百度智能边缘BIE的边缘AI解决方案

百度开发者中心

飞桨

日更2.0|全新挑战,奖品升级,1月月更正式开启!

InfoQ写作社区官方

1月月更 热门活动

APICloud 入门教程窗口篇

YonBuilder低代码开发平台

前端 APP开发 APICloud 跨端开发

AWS S3 最小目录权限(qbit)

qbit

对象存储 AWS S3 权限

当云服务变成云云云云服务,谁能带领企业穿越云层?

白洞计划

以一致的体验交付和管理云原生多集群应用

阿里巴巴云原生

阿里云 云原生 KubeVela OCM 交付

央视频“数字雪花”互动项目上线,为全民打造冰雪体育盛宴

郝俸🦁好棒

06 Prometheus之exporter及查询持久性

穿过生命散发芬芳

Prometheus 1月月更

云原生实战派:2021 让改变发生,2022 让创新升级

阿里巴巴云原生

阿里云 云原生 年度盘点

一个cpp协程库的前世今生(十二)自旋锁

SkyFire

c++ cocpp

Tableau Day3:智能分析

贾献华

Tableau 1月月更

回顾 2021 | 开启全职开源的奇妙冒险

郭旭东

开源 总结

c/c++Linux开发高级架构师进阶指南-剑指腾讯T9

Yt

腾讯 C/C++ 后端开发 Linux服务器开发

会议内容被拿去训练大模型!Zoom:我的AI功能可不“白给”_AI&大模型_褚杏娟_InfoQ精选文章