【ArchSummit架构师峰会】探讨数据与人工智能相互驱动的关系>>> 了解详情
写点什么

不想被白嫖了,Reddit 将向 OpenAI 、谷歌等公司收取 API 费用,后者一直免费用其聊天内容训练大模型

  • 2023-04-19
    北京
  • 本文字数:1157 字

    阅读完需:约 4 分钟

不想被白嫖了,Reddit 将向OpenAI 、谷歌等公司收取API费用,后者一直免费用其聊天内容训练大模型

Reddit 即将推出的 API 更改将使人工智能公司付出代价。

 

众所周知,Reddit 是 AI 聊天机器人的重要数据资源,现在该公司正在添加新的开发人员 API 条款,以通过其数据获利。

 

Reddit今天宣布了新的 API 变化,将限制其内容管道用于训练人工智能工具,包括支持 OpenAI 的 ChatGPT、谷歌的 Bard 和微软的 Bing AI 的模型。

 

AI 聊天机器人提供强大答案的能力要感谢像 Reddit 这样的数据资源。但现在 Reddit 正计划将这些机器人的“食物”向付费专区转变。

 

包括 Reddit 在内的社交媒体资源提供了用于训练大型语言模型 (LLM) 的一些资源,这些模型可以对人类提示提供有说服力的响应。其中一些数据可以以非结构化方式抓取,但 Reddit 的 API 已帮助 AI 公司轻松地直接查找和打包有用的数据。

 

Reddit 的 API 自 2008 年以来一直可用,以前对开发人员开放,几乎可以做任何事情。这包括构建有助于管理 subreddits 的工具、创建 Reddit 浏览客户端以及使网站更易于搜索。

 

Reddit 计划为某些用例保持 API 免费,例如那些构建审核工具或在教育和在研究环境中使用 Reddit 的用户。

 

商业用途需要单独的协议,费用未公开

 

Reddit 的新条款适用于以需要“更广泛使用权”的方式使用其 API 的开发人员,并且不会向需要修改用户内容的任何人授予自动许可,如其新数据 API 条款中所公布的那样。

 

这意味着一些商业用途,如培训法学硕士,将不会被授予开发者许可,而是要求各方“与 Reddit 签订单独的协议”。

 

Reddit 尚未详细说明它计划向商业使用其数据的公司收取多少费用。

 

Reddit 没有更详细地说明 API 更改将如何直接影响 Apollo、Rif 和 Relay 等第三方 Reddit 客户端。它确实在数据 API 条款中提到,它可以强制限制发出的 API 请求的数量,这对于客户端来说可能相当高,因为他们需要使用 OAuth 令牌来进行 Reddit 用户身份验证。Apollo 的唯一开发者 Christian Selig在 Reddit 上询问“执行速率限制”将如何影响类似的应用程序。一位 Reddit 管理员含糊地回答说,这取决于 API 的使用量以及它是否“符合我们的条款”。

 

这些 API 更改是在 Reddit 计划在今年晚些时候进行首次公开​​募股时进行的。公司的大部分货币化以广告(有自己的 API)和数字商品的形式出现。但随着更多 AI 平台的出现,Reddit 希望建立在其用户生成内容的价值之上。

 

“Reddit 的数据语料库非常有价值,”Reddit 首席执行官 Steve Huffman 在接受纽约时报采访时表示。“我们不需要将所有这些价值免费提供给世界上一些最大的公司。” 这些变化还发生在埃隆·马斯克对 Twitter 的 API 进行更广泛的锁定之后——这可能会同时打击商业和非商业用户。

 

新的 Reddit 条款将在开发人员和第三方收到官方电子邮件通知后“在 60 天的通知期后”生效。Reddit 还将发布与其官方 iOS 和 Android 应用程序配合使用的新内部版主工具。

 

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2023-04-19 18:104296
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 493.1 次阅读, 收获喜欢 1966 次。

关注

评论 1 条评论

发布
用户头像
反击开始了
2023-04-20 09:30 · 新加坡
回复
没有更多了
发现更多内容

高性能系统开发的几个手段

漫游指南

性能优化

ClickHouse 在UBA系统中的字典编码优化实践

字节跳动数据平台

大数据 字节跳动 Clickhouse 用户行为分析

使用craco对cra项目进行构建优化

CRMEB

跨站脚本攻击xss利用-beef攻击-演示

喀拉峻

网络安全 XSS

TiDB 在国信证券海量数据高并发场景中的实践

陈培新

TiDB

react源码解析2.react的设计理念

buchila11

React React Hooks

微信朋友圈高性能复杂度分析

王大胖

Swagger通过拦截器(Interceptor)配置默认请求头

为自己带盐

swagger 2月月更

DDD[1]·区分系统与业务行为

陆乘风

领域驱动设计 领域驱动设计DDD 领域驱动

恒源云(GPUSHARE)_可构建AI的「AI」诞生?

恒源云

神经网络 深度学习

带你读AI论文:NDSS2020 UNICORN: Runtime Provenance-Based Detector

华为云开发者联盟

漏洞 apt APT攻击 UNICONRN 数据来源分析

15倍提升 & 40倍存储优化,TDengine在领益智造的实践

TDengine

数据库 大数据 tdengine 开源 物联网

C#中的数据字典Dictionary

Andy阿辉

C# 程序员 程序人生 2月日更

11亿条数据压缩到12GB,TDengine在陕煤矿山项目的落地实践

TDengine

数据库 大数据 tdengine 开源 物联网

有了堡垒机,运维工程师们不再是背锅侠啦!

行云管家

构建制品不一致,后续工作都是白费 | 研发效能提升36计

阿里云云效

阿里云 云原生 持续交付 云平台 研发

国内堡垒机品牌你给推荐哪款?我推荐行云管家!

行云管家

如何提升本地开发联调效率|阿里巴巴DevOps实践指南

阿里云云效

阿里云 DevOps 云原生 研发 本地开发

SAP 移动开发技术综述 | 社区征文

Jerry Wang

android 移动开发 cordova 新春征文 2月月更

Spring Boot Serverless 实战系列 | 性能调优

Serverless Devs

springboot Java web 2月月更

做到这4点,才是真正的持续交付| 研发效能提升36计

阿里云云效

阿里云 云原生 持续交付 云平台 研发

APICloud AVM框架列表组件list-view的使用、flex布局教程

YonBuilder低代码开发平台

前端开发 前端框架 APP开发 APICloud 跨端开发

网络安全kali渗透学习 web渗透入门 Google搜索引擎的使用技巧

学神来啦

java培训:Java堆和栈区分出来的原因

@零度

JAVA开发

Lazada 容器深度优化之旅

阿里巴巴终端技术

容器 优化业务 客户端开发 移动应用开发

字节、阿里等大厂的技术如何?看看这些Java程序员的自学笔记

进击的王小二

程序员 面试

我的云原生学习方法 | 社区征文

大菠萝

新春征文

效能时代,数栈专属DevOps跑出加速度

袋鼠云数栈

DevOps 智能运维

Hive往表写入数据的八种方法

编程江湖

阿里巴巴移动技术 2021 年终盘点

阿里巴巴终端技术

ios android 客户端 移动应用开发 年终盘点

恒业资本江一:ToB长期主义不是经营无能的遮羞布

ToB行业头条

不想被白嫖了,Reddit 将向OpenAI 、谷歌等公司收取API费用,后者一直免费用其聊天内容训练大模型_AI&大模型_刘燕_InfoQ精选文章