写点什么

新发布的面向令牌的对象表示法(TOON)有望通过减少令牌消耗来降低大型语言模型的成本

作者:Bruno Couriol

  • 2025-11-27
    北京
  • 本文字数:1207 字

    阅读完需:约 4 分钟

大小:385.00K时长:02:11
新发布的面向令牌的对象表示法(TOON)有望通过减少令牌消耗来降低大型语言模型的成本

最近发布的面向令牌的对象表示法(TOON)旨在成为一种支持模式识别的 JSON 替代方案,在保持相近精度的同时显著降低令牌消耗。虽然节省的令牌数量取决于数据结构,但部分基准测试表明,TOON 在某些场景下比 JSON 消耗的令牌少 40%,或许可以节省大型语言模型(LLM)及推理的成本。

 

TOON 将自己描述为一种紧凑的、人类可读的 JSON 数据模型编码,用于 LLM 提示。

 

考虑以下 JSON:

{  "context": {    "task": "Our favorite hikes together",    "location": "Boulder",    "season": "spring_2025"  },  "friends": ["ana", "luis", "sam"],  "hikes": [    {      "id": 1,      "name": "Blue Lake Trail",      "distanceKm": 7.5,      "elevationGain": 320,      "companion": "ana",      "wasSunny": true    },    {      "id": 2,      "name": "Ridge Overlook",      "distanceKm": 9.2,      "elevationGain": 540,      "companion": "luis",      "wasSunny": false    },    {      "id": 3,      "name": "Wildflower Loop",      "distanceKm": 5.1,      "elevationGain": 180,      "companion": "sam",      "wasSunny": true    }  ]}
复制代码

 

在 TOON 格式中,相同的数据变为:

context:  task: Our favorite hikes together  location: Boulder  season: spring_2025

friends[3]: ana,luis,sam

hikes[3]{id,name,distanceKm,elevationGain,companion,wasSunny}: 1,Blue Lake Trail,7.5,320,ana,true 2,Ridge Overlook,9.2,540,luis,false 3,Wildflower Loop,5.1,180,sam,true
复制代码

 

在在线游乐场中运行这个示例,它消耗的令牌与 Pretty JSON 相比减少了 55%,与 compact  JSON 相比减少了 25%,与 YAML 相比减少了 38%。



如上面的示例所示,TOON 通过组合 YAML(用于嵌套对象)和 CSV(用于统一数组)格式来节省令牌。然而,对于非统一数据,JSON可能更有效。对于深度嵌套对象,YAML则可能更节省令牌。对于扁平化数据集,CSV 仍然是最紧凑的格式。为提高 LLM 的准确性,TOON 额外增加了一小部分开销(约 5%)用于字段标题和数组声明。

 

Johann Schopplich在X上解释说

“令牌效率会损害准确性吗?”

不:) TOON 在 GPT 5 Nano 上达到了 99.4%的准确度,而使用的令牌减少了 46%。

已经针对大约 160 个问题和 3 个 LLM 进行了语义验证测试。

我认为,明确的长度+字段列表=更少的错误。

 

读者可以查看 TOON规范文档在线游乐场,并运行自己的效率和准确性基准测试。在延迟关键应用中,开发人员应该比较两种格式的首次令牌获取时间和每秒令牌数。

 

TypeScript/JavaScript 参考实现已经在github.com/toon-format/toon存储库中维护。其中包括一个完整的编码器和解码器,用于将 JSON 转换为 TOON 的 CLI 工具,以及性能基准测试。TOON 1.0 两周前在 MIT 许可下发布。

 

声明:本文为 InfoQ 翻译,未经许可禁止转载。

 

原文链接:https://www.infoq.com/news/2025/11/toon-reduce-llm-cost-tokens/

2025-11-27 10:462816

评论

发布
暂无评论

哪些人适合参加前端培训?

小谷哥

学历低可以参加大数据培训吗

小谷哥

年终最重磅!云原生实时数仓 SelectDB 首次产品发布等你来约!

SelectDB

数据库 云计算 大数据 实时计算

DevData Talks | 知乎艾辉:从工具建设到运营,千人团队研发提效最佳实践

思码逸研发效能

研发管理 研发效能

Amazon Braket 与量子计算

亚马逊云科技 (Amazon Web Services)

量子计算 Hero 专栏 Amazon Braket

元器件科普 | 无源元件之——电容基础知识(超详细)

元器件秋姐

元器件采购 华秋商城 电容 电容器 电解电容器

Serverless Devs 社区联合信通院邀请您参加 2022 中国 Serverless 用户调查

阿里巴巴云原生

阿里云 Serverless 云原生

阿里云云原生加速器成员企业袋鼠云创始人陈吉平:深耕国产自研数字化技术与服务,持续为客户创造价值

阿里巴巴云原生

阿里云 云原生

分布式存储之 etcd 的集群管理

焱融科技

云计算 分布式系统 etcd 高性能 分布式存储

Chrome 103支持使用本地字体,纯前端导出PDF优化

葡萄城技术团队

chrome 前端 HTTP PDF

数据监控预警系统,实现不同端信息推送

葡萄城技术团队

前端 数据可视化

如何通过 NFTScan 浏览器查询 NFT项目的 Metadata 数据【教程】

NFT Research

区块链 NFT

BANI时代下PMO如何求得生存?

PMO实践

项目管理 PMO 2022

云原生系列 二【轻松入门容器基础操作】

叶秋学长

云原生 沙箱实验 11月月更

前端自学能学会吗,培训怎么学

小谷哥

Stack Memory vs Heap Memory in Java

Mahipal_Nehra

Java heap memory Stack memory Java development

MatrixOne从入门到实践05——数据类型介绍

MatrixOrigin

数据库 分布式 MatrixOrigin MatrixOne

Hire Remote Developers

Mahipal_Nehra

Java angular blockchain React app development

怎么判断自己适不适合做大数据培训

小谷哥

10分钟为你全面解答HDFS的SecondaryNamenode的作用

好程序员IT教育

大数据 hdfs

《数据》杂志 | 浅析《网络安全法》修改对数据合规与隐私计算的影响

洞见科技

5步法助力自动化转型

FunTester

关于平台工程的开发者工具链,你还想加点啥?

阿里巴巴云原生

阿里云 微服务 云原生 EDAS

低代码开发是未来软件开发的主流模式

元年技术洞察

低代码 方舟PaaS

如何通过Java 合并和取消合并 Excel 单元格

在下毛毛雨

Java Excel 合并单元格

开源让这位00后逆袭成为各类大奖收割者

OpenI启智社区

开源 OpenI启智社区 免费算力

在大数据培训学习中怎么成为优秀的程序员

小谷哥

Zebec流支付生态,开启多链布局的“两手准备”

鳄鱼视界

MatrixOne从入门到实战04——MatrixOne的连接和建表

MatrixOrigin

数据库 分布式 MatrixOrigin MatrixOne

专利解析|多维建模结合AI识别商品特征的方法

元年技术洞察

AI 数字化转型

帮助中心:培养客户自助服务意识的实用工具

Baklib

新发布的面向令牌的对象表示法(TOON)有望通过减少令牌消耗来降低大型语言模型的成本_后端_InfoQ精选文章