9 月 13 日,2025 Inclusion・外滩大会「开源嘉年华」正在限量报名中! 了解详情
写点什么

用 ChatGPT 自研大模型被封号,字节最新回应:最初有用 GPT API,但没发布、已停止

  • 2023-12-18
    北京
  • 本文字数:1071 字

    阅读完需:约 4 分钟

大小:499.86K时长:02:50
用ChatGPT自研大模型被封号,字节最新回应:最初有用GPT API,但没发布、已停止

根据 The Verge 报道,字节跳动内部文件证实“其基础 LLM 的开发依赖 OpenAI API 进行”。名为为“Project Seed”的项目报告称,几乎涵盖了模型训练、评估等开发的每个阶段。为此,OpenAI 暂停了字节跳动的帐户。

 

OpenAI 发言人表示,所有 API 客户都必须遵守“我们的使用政策,以确保我们的技术是用来做好事的。”

 

“虽然字节跳动对我们 API 的使用很少,但我们在进一步调查期间已暂停了他们的帐户。如果我们发现他们的使用不遵守这些政策,我们将要求他们进行必要的更改或终止他们的帐户。”据称,字节跳动使用 GPT 违反了微软和 OpenAI 的开发者许可。

 

根据 OpenAI 条款,客户不得“开发任何与我们的产品和服务竞争的人工智能模型”。用户也不能“使用 API 允许之外的任何方法从服务中提取数据”或应用程序编程接口,允许开发者使用 GPT 创建自己的应用程序。

 

The Verge 报道称,字节跳动意识到了这一点,但仍继续使用 API 来训练和比较其模型。 The Verge 还表示,它看到了该公司指示员工使用“数据脱敏”来掩盖证据的内部通讯内容。

 

大约在字节跳动的聊天机器人豆包(Doubao)被国内监管机构批准使用时,公司指示员工停止使用该 API 来开发 Project Seed 项目。但 Verge 杂志报道称,该 API 仍被用于评估他们自己的聊天机器人的表现。据悉,豆包是字节在 8 月发布的首款 AI 对话产品,多家媒体评测结果显示,豆包的智能化水平在大模型 C 端助理类产品中不算突出。

 

对此,字节跳动相关负责人回应称,公司在使用 OpenAI 相关服务时,强调要遵守其使用条款。公司也正与 OpenAI 联系沟通,以澄清外部报道可能引发的误解。以下是字节跳动使用 OpenAI 服务相关情况的介绍:

 

  1. 今年年初,当技术团队刚开始进行大模型的初期探索时,有部分工程师将 GPT 的 API 服务应用于较小模型的实验性项目研究中。该模型仅为测试,没有计划上线,也从未对外使用。在 4 月公司引入 GPT API 调用规范检查后,这种做法已经停止。

  2. 早在今年 4 月,字节大模型团队已经提出了明确的内部要求,不得将 GPT 模型生成的数据添加到字节大模型的训练数据集,并培训工程师团队在使用 GPT 时遵守服务条款。

  3. 9 月,公司内部又进行了一轮检查,采取措施进一步保证对 GPT 的 API 调用符合规范要求。例如分批次抽样检测模型训练数据与 GPT 的相似度,避免数据标注人员私自使用 GPT。

  4. 未来几天里,字节会再次全面检查,以确保严格遵守相关服务的使用条款。

 

 参考链接:

https://www.theverge.com/2023/12/15/24003151/bytedance-china-openai-microsoft-competitor-llm

https://www.businessinsider.com/bytedance-openai-tech-artificial-intelligence-tiktok-sam-altman-2023-12

2023-12-18 15:185793

评论 6 条评论

发布
用户头像
666
2023-12-20 21:16 · 北京
回复
用户头像
OpenAI 发言人表示,所有 API 客户都必须遵守“我们的使用政策,以确保我们的技术是用来做好事的。”

根据 OpenAI 条款,客户不得“开发任何与我们的产品和服务竞争的人工智能模型”。用户也不能“使用 API 允许之外的任何方法从服务中提取数据”或应用程序编程接口,允许开发者使用 GPT 创建自己的应用程序。

站在道德制高点说好的事情,就是让我垄断,不要和我竞争,哈哈。
2023-12-19 17:39 · 北京
回复
用户头像
为什么不行,提供服务就是给别人用的,你管他是用来训练模型还是干嘛
2023-12-19 10:36 · 中国香港
回复
那还谈什么知识产权,各种许可协议不就没用了 ,大家可以随便使用。
2023-12-20 16:16 · 广东
回复
你这.....
2023-12-21 21:28 · 广东
回复
用户头像
没被封号的人生,是不完整的
2023-12-18 18:22 · 北京
回复
没有更多了
发现更多内容

软件测试学习笔记丨Allure2报告中添加附件-日志

测试人

软件测试 测试开发

解锁TikTok直播专线,提高使用体验

Ogcloud

海外直播专线 海外直播 tiktok直播 tiktok直播专线 tiktok直播网络

软件测试学习笔记丨Allure2 报告中添加附件(视频)

测试人

软件测试

深入了解一下http和https的区别

秃头小帅oi

JVM字节码分析与修改:探索代码覆盖率底层实现框架

测吧(北京)科技有限公司

测试

同城双活:交易链路的稳定性与可靠性探索

得物技术

Java 后端 中间件 双活

分享一些大数据处理算法

Chris Zhang

大数据

更轻松地部署和升级 NGINX Service Mesh

NGINX开源社区

nginx Kubernetes Helm Service Mesh 服务网格 mTLS

TikTok直播专线是什么?有什么用?

Ogcloud

海外直播专线 海外直播 tiktok直播 tiktok直播专线 海外直播网络

阿里云实时计算Flink的产品化思考与实践【上】

Apache Flink

大数据 flink 实时计算

云端简易指南:快速启动与管理您的ECS实例

极客天地

ECS公网连接指南:精明选择公网IP计费策略

极客天地

深度解析代码变更对业务的影响范围:业务影响范围关联分析

测吧(北京)科技有限公司

测试

实战代码静态分析工具:利用语法树数据工具提升代码质量

测吧(北京)科技有限公司

测试

利用Shell二次封装Elasticsearch客户端:简化数据检索与操作

测吧(北京)科技有限公司

测试

聊聊我做测试开发的十年心路历程

阿里技术

测试 开发

新版Redis不再“开源”,对使用者都有哪些影响?

华为云开发者联盟

数据库 redis 华为云 华为云开发者联盟 华为云GeminiDB

OLAP性能再获突破!火山引擎ByteHouse性能白皮书发布

极客天地

互联网公司裁员现象调查:探寻背后原因与应对策略

小魏写代码

SpringBoot集成ElasticSearch,实现模糊查询,批量CRUD,排序,分页,高亮...

Java技术精选

比 MyBatis 效率快 100 倍...

Java技术精选

深入理解精准测试理论与技术:揭秘测试技术的核心原理

测吧(北京)科技有限公司

测试

日立公司采用元太科技电子纸实现了无纸化营运

财见

敏捷开发:想要快速交付就必须舍弃产品质量?

敏捷开发

项目管理 Scrum 敏捷开发 产品研发 研发

中国 10 亿参数规模以上大模型数量已超 100 个;GitHub 推出代码自动修复工具丨 RTE 开发者日报 Vol.172

声网

码上时刻|通过逻辑视图 Logic View 快速实现批流一体

Kyligence

代码覆盖率提升策略:利用静态分析工具优化测试覆盖率

测吧(北京)科技有限公司

测试

如何轻松管理你的海外主机?实用技巧大公开!

一只扑棱蛾子

海外主机

“专业敏捷教练课程” 6月1-2日 · CSP-SM认证周末班【晋升高阶享多重福利】

ShineScrum

亚马逊云科技携手埃森哲、Anthropic助力企业打造负责任的AI

财见

搭建Elasticsearch、Kibana和Logstash环境:构建强大的数据分析平台

测吧(北京)科技有限公司

测试

用ChatGPT自研大模型被封号,字节最新回应:最初有用GPT API,但没发布、已停止_企业动态_褚杏娟_InfoQ精选文章