写点什么

用 ChatGPT 自研大模型被封号,字节最新回应:最初有用 GPT API,但没发布、已停止

  • 2023-12-18
    北京
  • 本文字数:1071 字

    阅读完需:约 4 分钟

大小:499.86K时长:02:50
用ChatGPT自研大模型被封号,字节最新回应:最初有用GPT API,但没发布、已停止

根据 The Verge 报道,字节跳动内部文件证实“其基础 LLM 的开发依赖 OpenAI API 进行”。名为为“Project Seed”的项目报告称,几乎涵盖了模型训练、评估等开发的每个阶段。为此,OpenAI 暂停了字节跳动的帐户。

 

OpenAI 发言人表示,所有 API 客户都必须遵守“我们的使用政策,以确保我们的技术是用来做好事的。”

 

“虽然字节跳动对我们 API 的使用很少,但我们在进一步调查期间已暂停了他们的帐户。如果我们发现他们的使用不遵守这些政策,我们将要求他们进行必要的更改或终止他们的帐户。”据称,字节跳动使用 GPT 违反了微软和 OpenAI 的开发者许可。

 

根据 OpenAI 条款,客户不得“开发任何与我们的产品和服务竞争的人工智能模型”。用户也不能“使用 API 允许之外的任何方法从服务中提取数据”或应用程序编程接口,允许开发者使用 GPT 创建自己的应用程序。

 

The Verge 报道称,字节跳动意识到了这一点,但仍继续使用 API 来训练和比较其模型。 The Verge 还表示,它看到了该公司指示员工使用“数据脱敏”来掩盖证据的内部通讯内容。

 

大约在字节跳动的聊天机器人豆包(Doubao)被国内监管机构批准使用时,公司指示员工停止使用该 API 来开发 Project Seed 项目。但 Verge 杂志报道称,该 API 仍被用于评估他们自己的聊天机器人的表现。据悉,豆包是字节在 8 月发布的首款 AI 对话产品,多家媒体评测结果显示,豆包的智能化水平在大模型 C 端助理类产品中不算突出。

 

对此,字节跳动相关负责人回应称,公司在使用 OpenAI 相关服务时,强调要遵守其使用条款。公司也正与 OpenAI 联系沟通,以澄清外部报道可能引发的误解。以下是字节跳动使用 OpenAI 服务相关情况的介绍:

 

  1. 今年年初,当技术团队刚开始进行大模型的初期探索时,有部分工程师将 GPT 的 API 服务应用于较小模型的实验性项目研究中。该模型仅为测试,没有计划上线,也从未对外使用。在 4 月公司引入 GPT API 调用规范检查后,这种做法已经停止。

  2. 早在今年 4 月,字节大模型团队已经提出了明确的内部要求,不得将 GPT 模型生成的数据添加到字节大模型的训练数据集,并培训工程师团队在使用 GPT 时遵守服务条款。

  3. 9 月,公司内部又进行了一轮检查,采取措施进一步保证对 GPT 的 API 调用符合规范要求。例如分批次抽样检测模型训练数据与 GPT 的相似度,避免数据标注人员私自使用 GPT。

  4. 未来几天里,字节会再次全面检查,以确保严格遵守相关服务的使用条款。

 

 参考链接:

https://www.theverge.com/2023/12/15/24003151/bytedance-china-openai-microsoft-competitor-llm

https://www.businessinsider.com/bytedance-openai-tech-artificial-intelligence-tiktok-sam-altman-2023-12

2023-12-18 15:186011

评论 6 条评论

发布
用户头像
666
2023-12-20 21:16 · 北京
回复
用户头像
OpenAI 发言人表示,所有 API 客户都必须遵守“我们的使用政策,以确保我们的技术是用来做好事的。”

根据 OpenAI 条款,客户不得“开发任何与我们的产品和服务竞争的人工智能模型”。用户也不能“使用 API 允许之外的任何方法从服务中提取数据”或应用程序编程接口,允许开发者使用 GPT 创建自己的应用程序。

站在道德制高点说好的事情,就是让我垄断,不要和我竞争,哈哈。
2023-12-19 17:39 · 北京
回复
用户头像
为什么不行,提供服务就是给别人用的,你管他是用来训练模型还是干嘛
2023-12-19 10:36 · 中国香港
回复
那还谈什么知识产权,各种许可协议不就没用了 ,大家可以随便使用。
2023-12-20 16:16 · 广东
回复
你这.....
2023-12-21 21:28 · 广东
回复
用户头像
没被封号的人生,是不完整的
2023-12-18 18:22 · 北京
回复
没有更多了
发现更多内容

快递鸟电子面单模板规格大全

快递鸟

快递 电子面单

AI Fabric:通往 GenAI 和数据驱动型企业的最快途径

Altair RapidMiner

人工智能 机器学习 数据分析 altair RapidMiner

「胖钱包」理论解析:钱包为何将超越协议与应用,赢下「最终用户」争夺战?

TechubNews

TDengine 签约山东港,赋能港口数字化转型

TDengine

数据库 tdengine 时序数据库

软件测试学习笔记丨Flask操作数据库-数据CRUD(增删改查)

测试人

软件测试 测试开发

5 年 “0” 故障,万亿级城商行的非结构化数据底座

XSKY星辰天合

鸿蒙Flutter实战:01-搭建开发环境

少湖说

flutter 鸿蒙 HarmonyOS NEXT

软件测试学习笔记丨Flask操作数据库-多对多

测试人

数据库 软件测试 测试开发

TDengine 荣膺双奖:引领储能与数据库创新

TDengine

tdengine 时序数据库 数据库·

DApp质押挖矿系统开发详细案例及源码部署指南

区块链软件开发推广运营

交易所开发 dapp开发 区块链开发 链游开发 代币阿凯

互联网大厂钟爱的压测工具分享

优测云服务平台

压力测试、

Fish Agent:多语言 Voice-to-Voice 开源语音模型;Runway 推出摄像机运镜功能丨 RTE 开发者日报

RTE开发者社区

软件测试学习笔记丨Flask操作数据库-一对多

测试人

软件测试

友商科技:热仿真分析咨询点击百万 热设计仿真公司

极客天地

Web3 游戏周报(10.27 - 11.02)

Footprint Analytics

链游

TDengine 检测数据最佳压缩算法工具,助你一键找出最优压缩方案

TDengine

tdengine 时序数据库 数据库·

在昇腾Ascend 910B上运行Qwen2.5推理

SEAL安全

华为云开源时序数据库openGemini:使用列存引擎解决时序高基数问题

华为云开发者联盟

Clickhouse 时序数据库 高基数 openGemini

小程序多端引流技术上的“降本增效”

FinFish

小程序技术 小程序容器技术 小程序多端引流

快递鸟上门取件API接口代码流程

快递鸟

快递物流

为什么使用海外云手机进行TikTok矩阵化运营?

Ogcloud

云手机 海外云手机 tiktok云手机 tiktok运营 TikTok矩阵运营

NFTScan | 10.28~11.3 NFT 市场热点汇总

NFT Research

NFT\ NFTScan

DNS解析常见问题有哪些?DNS解析出现问题怎么解决?

防火墙后吃泡面

项目经理把控项目质量真的很难吗?

Hi-CodeCaptain

代码质量 测试覆盖率 精准测试 软件开发、 质量内建

拼多多详情API的价值与应用解析

科普小能手

API 接口 API 测试 拼多多API接口 拼多多API 拼多多商品API接口

用ChatGPT自研大模型被封号,字节最新回应:最初有用GPT API,但没发布、已停止_企业动态_褚杏娟_InfoQ精选文章