写点什么

Token 纪元:从「马力」到「人天」再到「兆字元时」的认知革命

姚旭晨

  • 2025-06-11
    北京
  • 本文字数:13062 字

    阅读完需:约 43 分钟

大小:6.50M时长:00:00
Token纪元:从「马力」到「人天」再到「兆字元时」的认知革命

——从「马力」到「人天」再到「兆字元时」的认知革命


在这个系列里,我们详细阐述生成式人工智能的字元(Token)是如何作为像“水电网”一样的基础设施改变每个人的未来:


当 AI 成为基础设施,谁来计量它的劳动?


答案是:一个新单位,叫 马斯(MTH,兆字元时)


马力人天,再到马斯


一部人类生产力的进化史,藏在这条计量单位的变迁里。

系列文章索引:

Token 纪元 1:从马力到人天——一场被单位改变的工业革命


核心问题:工业革命如何通过“马力”和“人天”定义生产力?AI 时代需要怎样的新单位?


  • 马力神话:瓦特用“马力”将蒸汽机抽象为直观生产力符号,0.9 马力的奔驰汽车开启了机器替代牛马的时代。

  • 人天困境:知识经济用“人天”量化脑力劳动,但效率参差、996 文化暴露其本质缺陷——无法衡量真实价值。

  • AI 冲击:当 AGI 完成“30 人天”任务仅需“1 小时”,旧单位彻底失效,呼唤新标尺。

  • 隐喻未来:从“马力”到“马斯”,单位的进化史,本质是文明对生产力的认知革命。


Token 纪元 2:为什么需要为 AI 时代建立全新生产力计量单位


核心问题:Token 为何成为智能时代的“水电网”?它与传统资源有何本质不同?


  • Token 定义:字元(Token)是 AI 的“语言燃料”。

  • 基础设施化:AI 公司买硅买电,卖 Token 智能,商业逻辑类似农夫山泉“买水卖品牌”。

  • 历史教训:NASA 因单位混乱损失 1.9 亿美元,Token 亟需统一度量衡,避免重蹈覆辙。


Token 纪元 3:智能社会的三大关键指标——容量、速度、价格


核心问题:如何像管理水电一样精准计量 Token 资源?


  • 容量(MT/GT/TT):Token 用量决定 AI 任务规模上限。

  • 速度(T/s/KT/s):200T/s=AI 的“2G 网速”,1GT/s= 秒出小说——吞吐率决定用户体验。

  • 价格(¥/MT):GPT-4 生成百万字元需 430 元,成本是电力的千倍,算力稀缺性拉高溢价。

  • 能耗真相:生成 1TT 消耗 4.5 万度电,需 7 座三峡供电——Token 是“烧电的字元”。


Token 纪元 4:AI 的算力网络,为什么还停在 2G 时代?


核心问题:为何 AI 生成仍像“拨号上网”?算力基建如何跨越代际鸿沟?


  • 2T 现实:人均 200T/s= 生成短文需 10 秒,视频渲染等几分钟——体验堪比 2G 时代加载网页。

  • 基建挑战:实现 1TT/s 需 5.4 亿块 GPU+7 座三峡电站,成本 = 中国全年 GDP,技术代差悬殊。

  • 通信启示:从 2G 到 5G,网络速度提升千倍;AI 需同等算力革命,建“智元基站”铺路。

  • 未来愿景:5T 时代 =1GT/s 算力普惠,个人可实时生成 3A 游戏画质,社会效率指数级跃升。


Token 纪元 5:从人天到马斯——AI 劳动力的崛起


核心问题:当 AI 按“马斯”计价,人类劳动力价值如何重构?


  • 成本碾压:开发网站 = 人类 6 天 8,效率差 600 倍,白领工种首当其冲。

  • 单位定义:1 马斯 =1 小时消耗百万 Token,AI 任务明码标价,“脑力外包”进入工业化时代。

  • 就业冲击:律师、设计师、程序员面临替代,卢德运动或将重现,但抗拒终是徒劳。

  • 价值重估:人类工作转向创意与监管,体力劳动时薪 1,差距撕裂市场。


Token 纪元 6:字元时代的文明跃迁——人类社会的下一场大重构


核心问题:当 Token 流速超越人脑,文明将走向何方?


  • 硅基觉醒:AI 每秒处理万亿字元,碳基生物彻底退出重复劳动,仅存创意与伦理角色。

  • 教育革命:“学力”替代学历,人人配备“爱因斯坦 AI 导师”,知识获取成本归零。

  • 经济悖论:GDP 统计失效,Token 创造的价值无法用传统货币衡量,新体系呼之欲出。

  • 文明分界:Token 或成碳基与硅基文明的“罗塞塔石碑”,未来史书写此刻的度量衡革命。


让我们开始吧~

从马力到人天一场被单位改变的工业革命

1. 马力:蒸汽时代的功率

“这台 2025 年小米 Su7 Ultra 的峰值功率是 116 千千克·米 / 秒。”


听到这样的数字,大多数人可能只觉得一串冰冷的物理单位,脑海里根本浮现不出这台车到底有多强。


但如果换一种说法:“这台小米 Su7 Ultra 的峰值功率高达 1548 匹马力。”


想象一下,1548 匹马同时拖着你飞驰而去,是不是一下子就具体生动了?


这就是单位的魔力。为了让人们更好地理解蒸汽机的功率,18 世纪的工程师瓦特发明了“马力”这个词。简单来说,1 马力大约相当于一匹马在 1 秒钟内将 75 公斤的物体提升 1 米所做的功。


卡尔·奔驰的第一部汽车只有 0.9 马力,但它拉开了用四个轮子代替四个蹄子的生产力巨变之幕。


从第一辆 0.9 马力的奔驰汽车,到今天 1548 马力的电动车,动力的跃升见证了人类用机器替代牛马的工业奇迹。


而 1548 匹马力究竟有多猛?简单算算,它意味着可以在 1 秒钟内把 116 吨的重物提升 1 米!放在现实中,这台 2.5 吨重的汽车,从静止加速到 100 公里每小时,只需要短短两秒钟。


“马力”这种单位形象而易记,广泛流传。相比之下,另一个与动力相关的词——“扭矩”就没这么幸运了。尽管它同样重要,却因“牛顿·米”、“公斤·米”、“磅·英尺”这些复杂的表达方式,始终难以深入人心。


在那个工业咆哮的年代,飞速旋转的引擎成了生产力的象征——织布机的轰鸣、钻探机的咆哮、船只劈波斩浪,飞机腾空,火箭冲天,乃至阿姆斯特朗踏上月球的第一步,都离不开“马力”这一物理底层单位。

2. 人天:数字时代的工作量

直到某天,人类发明了名为"办公室"的新式工厂,西装革履的"知识工人"开始用键盘代替扳手,用 PPT 代替车床。人类的“生产力引擎”从轰鸣的机器变成了安静的办公室。无数打工人坐在电脑前,埋头处理文档、设计方案、计算表格、撰写报告、运营推广——每一天,像牛马一样辛勤劳动。


于是,“人·天”这个新计量单位应运而生。就像 19 世纪用马力衡量蒸汽机,20 世纪用"人天"量化脑力劳动。完成一项工作,究竟需要几个人、几天?比如开发一个小网站,也许是“3 个人天”;准备一份发布会 PPT,可能是“30 个人天”或“1 个人月”。


然而,这个单位有个天生的 Bug:人的工作时间并不一致。有人 8 小时认真努力,有人 12 小时摸鱼划水,还有人白天摸鱼晚上加班。到底怎么算?全凭“良心”打分。


当工程量巨大的时候,多加人是无法带来效率的线性提升的。《人月神话》早就揭示了这个单位的 bug——就像往怀孕项目里塞 9 个孕妇不会让宝宝 1 个月就出生,某些工作根本无法通过堆程序员来加速。


当年的牛马已经被发动机解放,成了餐桌上的美味。现代的牛马打工人,也在盼望着有一天能彻底“自由”,过上“要么户外钓鱼,要么办公室摸鱼”的理想生活。


这一切的转机,或许就靠正在崛起的“通用人工智能”(AGI)。未来,许多打工任务将由智能体 (Agent) 代劳——从计划、决策到执行,统统自动化。


但问题来了:这些 AI 智能体的工作量要怎么衡量?难道要说“GPT 干了 3 个人天”?光想就让人忍俊不禁!显然,新时代需要一个全新的度量单位。


不再是“马力”,不再是“人天”,那应该是?


答案也许是——“兆字元时”。

3. 马斯:通用人工智能时代的效率计量

读到这里,你可能不由自主地回头又看了一眼:“兆字元时?这是什么新玩意?”


别急,拆开来慢慢看:“兆·字元·时”。


“兆”指的是一百万 (Mega),这个你大概在“兆字节”(Megabyte,MB)里见过:一张 CD 大约是 700 MB,一张软盘 1.44 MB。


“字元”(Token)则是大模型处理信息的基本单位,相当于 AI 理解语言的“食粮”。


而“时”当然就是时间,一小时。


所以“兆字元时”(Mega-Token-Hour,MTH)可以理解为:一个智能体每小时消耗多少百万个 Token 去完成任务。


不过,这名字的确太绕口了。就像过去“千克·米 / 秒”被“马力”取代一样,人类总喜欢用更简洁、生动的词汇来帮助记忆。


还记得电费的单位“千·瓦·时”(kWh) 吗?咱们平常叫它“度”。“这辆电车有 100 度电”,听起来既直观又好理解。


同理,未来的“兆·字元·时”或许也会简化为一个新词——比如叫“马斯”,缩写 MTH,源自 Mega Token Hour。


帮助解放牛马打工人的智能体们,可以用马斯去衡量它们的功力。


想象一下,未来的工作场景:


“这个 2 分钟的抖音短视频,AI 智能体只用了 5 马斯。”


什么意思?就是说,AI 在一小时内,消耗了 500 万个 Token,完成了选题策划、脚本撰写、AI 配音、配乐剪辑、字幕生成、视频制作、平台发布,甚至包括用户标签分析和发布时间优化。成本?也许只要 10 块钱!


再比如:


“要为这家新开的餐厅做个在线点餐小程序,需要 20 马斯。”


也就是说,一个智能体连续工作 5 小时,每小时吞掉 4 百万 Token,完成从界面设计、功能开发、支付对接、测试部署,到广告文案、配图美化,甚至连虚拟好评都一并打包完成。


以前,打工人按“人天”卖命;未来,AI 按“马斯”结算劳动成果。


老板看着表,微微一笑:“这活,花了 1 马斯?智能体干得漂亮,划算!”


本文将带你走进这个正在到来的新世界:


一个用“字元”、“字元时”、“字元每秒”来重新定义生产力的世界。


先来预告几个有趣的事实:


  1. 字元 (Token) 是一种消耗传统资源的新质资源。 简单说:字元是一种消耗资源的资源。(如果用拼音说,ziyuan 是 ziyuan,消耗 ziyuan,语义很关键。)

  2. 用 Token 生成一整套英文版 Wikipedia,需要大约 300 度电。 这些电量,能把一辆 100 度电的电动车充满 3 次,跑上两千公里往返京沪。

  3. 1TB 的流量可能只需几百块人民币,但购买 1T Token 的 AI 智能,在 2025 年可能要花 800 万人民币,堪比数字黄金。 由此可见,Token 如今仍是一种稀缺的“新型燃料”。未来,什么时候能让普通人也拥有 1T Token 的“智能”随用随取?

  4. 要打造一个每秒万亿字元(1 TT/s,太字元每秒)的算力中心,可能需要掏出 2021 年全中国 GDP 的资金购买 GPU,还得 7 座三峡大坝全天候供电。 即使是在筹划的地球最强雅鲁藏布江水电站,也需要两座才行。

  5. AI 新基建的商业本质:买传统资源,卖智能资源:字元。 买的是硅芯片和电力,卖的是 Token 智能。这模式,跟“Buy Commodity,Sell Brand”这种传统品牌有点像:农夫山泉买水卖品牌瓶装水,麦当劳买肉卖品牌汉堡,德芙买可可粉卖品牌巧克力。未来,AI 公司买硅买电,卖 Token,卖智能。


这就像电力时代初期的场景重现:当爱迪生的电表开始转动,人们第一次意识到"看不见的能源"也能精确计量。不同的是,这次我们计量的不是电子流动,而是智能的跃动。

为什么需要为 AI 时代建立全新生产力计量单位?


现代文明建立在精确计量之上。


就像普罗米修斯带给人类火种,而瓦特带给世界蒸汽机,真正改变生活的却是那些不起眼的计量表。日常生活中,我们早已离不开这些单位:


  • 电力,用“千瓦时”(kWh)计量,

  • 电池容量,用“毫安时”(mAh)计量,

  • 网络流量,用“KB / MB / GB / TB / PB”计量,


网络速度,用“KB/s / MB/s / Gbps”计量。


这些计量单位不仅帮助我们理解“资源”,更和“钱”直接挂钩:


  • 居民月用电 500 千瓦时,电费约 250 元

  • 电动车 100 度电,家用充电 35 元,公共充电桩可达 150 元

  • 充电宝 一万毫安时,成本价约 20 - 50 元,共享充电宝每小时 2 - 5 元,可以给 iPhone 14 充满 2 - 3 次 (iPhone 14 电池容量为 3279 mAh)

  • 移动流量 10GB,月费 30 元;50GB,约 80 元,

  • 宽带 100Mbps 包月 99 元,500Mbps 包月 169 元。


资源 = 计量单位×价格,资源越贵,单位越重要。


那么,大语言模型(LLM)呢?


LLM 的基础资源单位,叫 Token(字元)。一个 Token,可能是一个字母、一个单词、一个子词(subword),取决于模型的编码方式。

1. 字元是什么?

在 AI 世界里,Token 就像电力世界里的电子,是最基础、最核心的资源单位。


Token 是语言的最小处理单元。只要一个字或者一个词能够被 Unicode 表示,它就能被字元 (Token) 表示。


不同于传统人类语言的“字”或“词”,Token 是为了让计算机能高效处理文本而划分的单位:


  • 一个英文单词 apple 通常是一个 Token;

  • 一个中文单词字符 黑 和 莓 可能分别是两个 Token;

  • 对于复杂词汇,如 internationalization,可能被切分成 international + ization 两个 Token。

  • 一个单字也有可能被拆分,比如中文字“猫”在早期的 ChatGPT-3.5 和 4 中被拆分分成了 3 个字元 (因为它的 unicode 表示是 3 个字节),在后期的 ChatGPT-4o 中因为字元表扩张又被单独用一个字元表示。


字元是一种比词或者字更小的表示单位,用它可以灵活表示各种单词的意思。比如”莓”是一个单独的字元,那么黑莓、蓝莓、草莓就可以通过组合去望其形而知其意。其他也有一些例子:


  • 门楼,角楼,钟楼:每个字都是一个字元,共有字元是“楼”,楼前面的字表示方位

  • 茶盅,酒盅,药盅:每个字都是一个字元,共有字元是“盅”,盅前面的字表示容器中的物体

  • 如果有些词从来没有见过,也可以通过单字组合大概知道新词的意思,例如:链球状菌,芽孢杆菌,弧水菌,耐酸菌;尘肺症,纤化症,颤舞症,血凝症。


字元的颗粒度并非最小。比如英文单词的最小组合单位是英文字母,但字元的颗粒度要比字母大。ChatGPT 早期出过一个 bug:它数不清 strawberry 中到底有几个”r”。这是因为 strawberry 这个单词就是一个字元,在计算机中用一个数值表示。这个就好像给你一滴水,让你数数里面有多少水分子。

2. 为什么是字元?

因为无论内容多复杂,最终在大模型眼中,一切都归结为一串字元流。 正如电流通过电线,Token 流经神经网络——激活、计算、再输出。


Token 是 LLM 的“粒度”。


  • 每生成 1 万个 Token,模型要经历数千亿次矩阵运算。

  • 每消耗 1 万个 Token,背后可能是几瓦时的电力消耗。

  • 每百万 Token 输入和输出,直接影响推理成本和用户体验。


正因为 Token 是 AI 运作的“基本颗粒”,所以:


  • API 计费按 Token 数计(如每 1K Token 价格 0.003 美元);

  • 大模型参数优化时,也以 Token 吞吐量(Token/s)为核心指标;

  • 未来智能生产力的规模、能耗、效率,也都围绕 Token 展开。

3. 为什么今天大家对 Token 还很陌生?

因为 缺少统一、标准化的计量体系


不同模型、不同平台,对 Token 的定义和计价方式都有微妙差异,导致:


用户在不同模型间切换时,不知道实际花了多少资源;


企业难以精准预算 AI 系统的运行成本;


市场难以透明、规范地交易 Token 资源。


这种混乱的状态,就像工业革命初期各地市斤、英镑混杂,商旅往来极其不便。


历史上,人类因为计量混乱,吃过很多大亏。


比如:


  • 温度单位:华氏度 vs 摄氏度;

  • 距离单位:公里 vs 英里;

  • 重量单位:斤 vs 磅;

  • 日期格式:年月日(中国)、月日年(美国)、日月年(英式)。


甚至,1999 年 NASA 的“火星气候轨道器”因为将“磅力”误当成“牛顿”进行操作,导致飞船高度过低,最终坠毁火星大气层,损失高达 1.93 亿美元。


秦始皇灭六国,历史书里重点记的不是战争,而是他统一了度量衡——这是千秋功业,百姓用斗舀米,商人用尺量布,才不至于各说各话,交易混乱。


正如开尔文所说:“当你能够衡量你所说的内容并用数字表达时,你对它有所了解;但是当你无法衡量它或用数字表达它时,你的知识就是贫乏的和不令人满意的。”


未来的智能社会,Token 就像水、电、流量一样,是不可或缺的“新型资源”。但遗憾的是,今天的 Token,既没有明确的度量标准,也没有普及的价格标尺,企业和用户往往“用起来没感觉,花钱时一脸懵”。


——智能时代的“度量衡革命”,从这里开始。

智能社会的三大关键指标容量、速度、价格

1. 数量单位:T 体系,从字节到字元的进化

正如存储空间有“Byte / KB / MB / GB / TB”的层级单位,Token 也需要自己的标准量纲。



为了避免误解,T 有三层含义:


  • 物理世界,T= 特斯拉(磁场单位);

  • 数字世界,T=Tera(万亿);

  • 智能时代,T=Token(字元)。


比如:“5TT”= 5 万亿个 Token。


举个例子


  • 普通一篇博客:5 KT;

  • 大英百科全书:约 53 MT;

  • 英文维基百科:约 6.4 GT;

  • GPT 训练数据:常以 TT、PT 计量。


未来,企业购买 AI 资源,就像买流量套餐一样。比如:10 GT 的套餐,够一个小公司用一个月的客服与内容生成。


电池类比


购买 Token 包 = 购买“AI 电池”,例如一块容量 50MT 的“字元电池”。调用模型时,Token 消耗,电量递减。复杂任务可能会快速消耗大量 Tokens,就像玩游戏会让手机电池掉电更快;而简单任务则相当于低功耗模式,可以更持久地使用这块“电池”。


遗憾的是,Token 不像电池,无法提前“充好电”,只能按需实时计算——你无法揣着“50MT 的充字宝”走天下。

2. 速度单位:T/s 体系,智能的"流速"革命

与网络带宽(MB/s)类似,大模型的处理速度也需要单位标注,建议采用:



举例


  • 某高端 GPU 单卡性能为 50 KT/s,即每秒可处理 5 万个 Tokens;若某任务需处理 30 MT,以 100 KT/s 吞吐速度,仅需 300 秒(5 分钟)即可完成。

  • 某低端 GPU (“中国特供”)单卡输出性能为 1.85 KT/s,即每秒可处理 1850 个 Tokens;若某任务需处理 30 MT,以 1.85 KT/s 吞吐速度,需要 4.5 小时才能完成。


吞吐速度的重要性,决定了等待时间。


就像:


  • 56K 猫时代下载 DVD=200 小时,

  • 家庭充电桩 120V 为电动车充满 =70 小时,用 240 伏 (Level 2) 充电,需要 10 小时,那就可以做到白天用车,夜间充满。

  • 笔记本跑大模型,2 T/s= 永远等不完。


如果某家 AI 公司卖你 5 GT 的 Token 包(超大流量),但带宽只有 30T/s,那一个月最多只能消耗 78 MT 的字元,堪比“无限流量,龟速限速版”。


这事在现实世界中还真有,比如某网盘,给你 2TB 的空间,但是下载速度给限流了~


所以,未来你买 AI 服务,记得看两个数: 一个看容量(Token 包多大),一个看速度(T/s 够不够快)!

3. 成本单位:¥/MT 与 kWh/MT,智能的"价格标签"

既然 Token 是资源,也应该有价格标签和能耗指标。类似电费以千瓦时(kWh)计算、网络花费用 GB 计算,我们也可以定义大模型使用成本和能耗:


  • 价格:¥/MT(每百万字元花费多少元人民币)

  • 能耗:kWh/MT(每百万字元需要消耗的千瓦时),kWh/TT(每万亿字元需要消耗的千瓦时)


实例


  • 2025 年初的时候,DeepSeek-chat 的百万字元输出定价为 8 元 /MT,DeepSeek-reasoner 的百万字元输出定价为 16 元 /MT。而耗电大概为 0.045 度 /MT。

  • 英文版的 Wikipedia 大致有 64 亿 token,也就是 6.4GT。

  • 若是 1GT 的输出则定价为 8000 元人民币,耗电为 45 度电。也就是说,一辆一百度的电车的电量仅仅支持输出 2 Giga Tokens(十亿字元)。需要 3 辆 1 百度电的电车才能有足够的电力去生成整个英文 Wikipedia。

  • 若是 1TT 的输出则定价为 800 万元人民币,耗电为 4 万五千度电,大概是一个小县城一小时的用电量。


所以,Token 虽然只是“字元”,但消耗的是真金白银与实打实的电力。这种"电力→智能"的转化效率,堪比炼金术士梦寐以求的"点石成金"。目前这个转化率还停留在工业革命初期的蒸汽机水平——瓦特改良的蒸汽机热效率仅 3%,而现代内燃机可达 40%。


在 4G/5G 早已普及的当代,很多人一个月消耗的数据流量就轻易超过了 1TB,一个月花费几百人民币。而 输出 1TT 的智能则需要 800 万人民币 的花费,这意味着我们 当前的算力还需要几个数量级的提升,同时成本还需要几个数量级的下降

4. 能源视角:Token 是极度消耗资源的字元

为了帮助大家更直观地理解,我们将新提出的 Token 计量体系与传统资源进行对比:



但这个表格还藏着一个事实:Token 不是“读”出来的,而是“算”出来的。 而这个“算”的过程,极其昂贵。


今天,1TB 的流量只要几十块钱,但 1TT 的 Token,可能需要 800 万元人民币。


在 1TB 的流量都已经是白菜价的今天,1TT 的智能还是白粉价。咱们还需要能够大规模生产 Token 的“算力工厂”(黄仁勋把它叫 AI Factory)。


这种"数字黄金"的特性,让人想起 19 世纪铝比黄金还贵的历史——直到电解法出现前,拿破仑三世用铝制餐具招待贵宾,而普通宾客只能用金餐具。


这就是智能社会的现实:算力是新的燃料,Token 是新型资源。


人类正走进一个时代:数据是原料,算力是工厂,Token 是产品。AI 的成本,决定了智能经济的规模。

AI 的算力网络,为什么还停在 2G 时代?


实现单机达到 1GT/s 的算力,其实并不难。难的是:能不能给 每一个人 都配备 1GT/s 的字元速度。


在 2025 年的今天,大多数人体验大模型写作,依然停留在一个肉眼可见的缓慢过程:等待十几秒,屏幕上刷出几千字;要生成一段几秒钟的视频,可能得等上几分钟。


什么时候大模型的输出速度才能快得飞起?


2025 年的 GPU 技术大会 (GTC),Nvidia 的黄仁勋在台上侃侃而谈新的数据中心能力,而有一张图预示了未来”AI 新基建”的走势:



请注意看图的横轴:“TPS for 1 User” —— 每个用户能分配到的字元速度,单位是 Token Per Second。纵轴则是“TPS/MW” —— 每兆瓦电力可以支持的 Token 速度,代表了算力中心的能效水平。


这张图的亮点在于,顶级算力 Blackwell 系列,已经能把单用户的字元速度推到 500 TPS,也就是每秒 500 字元。


看起来还不错对吧?其实不然!问题的关键在于图上那个小字:“for 1 User” —— 这是按全民普及来计算的单位。


也就是说,如果每人都开一台 AI 助手,服务器能为每人分配的,依然只有区区 200 T/s 的字元速度。


实现单一 1GT/s 的算力不难,难的是可以给 每个人 都实现 1GT/s 的算力。即使在 2025 年,老黄的算力图里,也只是给出了每个人 200 T/s 的算力。


想象一下,如果今天你的 5G 手机突然降级到 2G 网络——微信消息要转圈半分钟,刷短视频成了奢望。这正是当前 AI 算力面临的现实:虽然实验室里能达到 GT/s 级别,但人均算力却停留在 200T/s 的"2G 时代"。


从 200 T/s 到 十亿 /s (GT/s) ,离我们想象中“秒出小说,实时剪片,随叫随答”的 AI 生活,差得还很远哩。


这让我想起 1900 年的纽约:虽然爱迪生的珍珠街电站已运营 18 年,但普通家庭仍主要用煤油灯,因为电力太昂贵且稀缺。

1. 通信网络如何跨越的?AI 算力就得怎么跨越。

别小看这个“字元速度”的单位!它就像手机网络的“下载速度”,决定了体验的上限。


还记得手机从 2G 到 5G 的升级之路吗?在早期 2G 时代,只有区区 5KB/s,随着网络扩容,在 5G 时代甚至能够达到 1GB/s。


这需要巨大的算力投资,并且生产出来的算力可以通过既有的无线网络和宽带网络上传下传。仿照通信网络,我们也粗浅提出了对应的 2T、3T、4T、5T AI 字元算力网络的标准和类别。



在 2G 时代,我们用 BBS,网页要加载一分钟;


在 3G 时代,微博和朋友圈兴起,图片能刷,视频还得缓冲;


到了 4G,短视频狂潮来袭,抖音、快手随刷随看;


5G 甚至可以实现 4K 直播,几乎零等待。


而“智元网络”——也就是大模型的计算速度,今天却还在 2T 阶段:每秒 1,000 字元的极限,只有 10 秒才能生成一篇短文,还是个“半人工”体验。

2. 从“算力基站”到“算力城市”

每一轮网络速度的升级,都需要大量基建投入。


中国目前有:


  • 5G 基站:231 万个

  • 4G 基站:603 万个

  • 2G/3G 基站:250 万个


相对应的,未来“智元网络”也需要铺设 AI 基站,也许就是黄仁勋口中的“AI 工厂”(AI Factories),或者叫“智元发电站”。


而你买的不再是流量包,而是 Token 包,不再是宽带带宽,而是 字元带宽(T/s)


当我们在 2025 年抱怨"生成 5 秒视频要等好久"时,就像 2005 年用 56K 调制解调器下载 MP3:一首 3MB 的歌曲需要 7 分钟,而今天同样的时间足够 5G 网络下载 4K 电影。


未来的"5T 时代"将带来这些变革:


  • 创作民主化:个人能实时生成 3A 游戏画质内容

  • 教育革命:每个学生拥有 1GT/s 的"爱因斯坦 AI 导师"

  • 医疗普惠:乡村诊所获得与三甲医院同等的 AI 诊断能力


等有一天,人人都能拥有 5T 时代的 1GT/s 算力,也许就像我们今天拥有 5G 手机那样普通。而那一天的 AI 助手,才真正配得上“实时伴侣”四个字。

3. 跨越算力鸿沟的挑战

要实现从 200T/s 到 1GT/s 的跃迁,需要突破三重障碍:


  1. 硬件墙:量子计算 / 光学计算等新范式

  2. 能源墙:核聚变 / 太空太阳能等新能源

  3. 架构墙:神经形态计算等新架构


技术进步是指数级的,但人类的适应能力是线性的。这些指数级的技术进步狂奔到飞起,而社会应用还在蹒跚学步。


站在 2025 年这个"AI 的 2T 时代"回望,那些抱怨生成速度慢的声音,或许会像今天我们回忆"拨号上网的吱吱声"一样,成为数字文明进化的珍贵注脚。

从人天到马斯 AI 劳动力的崛起


从“人·天”到“马斯”,未来的 AI 智网像极了电力时代的重启。只不过,这次传输的不再是电,而是字元本身。

1. 从人·天到 Token-Hour:AI Agent 重新定义生产力

在传统工程世界中,任务成本一般按“人时”(man-hour)或“人天”(man-day)计价。这套单位在外包行业尤其常见,比如在美国,一个软件工程师的 man-hour 常常在 300 之间,一些顶尖咨询公司甚至高达 $900/ 小时。


以下是美国各类职业的典型收费标准:



其中不少工种,尤其是 初级软件开发、法律文件写作、设计初稿 等,正迅速被 AI Agent 取代。而像汽车维修、水管检修等实体劳动,虽暂难完全 AI 化,但机器人辅助也已在路上。


这种计价方法,某种意义上反映的是“人力劳动的价格”。但当 AI Agent 出现后,一切正在悄悄改变。


那么,AI Agent 的“工作量”怎么计?我们提出一个新单位:“Token-Hour”(字元·小时)或者“Mega-Token-Hour”(兆·字元·小时,简称 MTH,马斯),用于衡量 AI 的计算工作量与效率。简单来说,就是 AI 完成任务时,消耗了多少“字元(Token)”,以及这些 Token 的消耗速率。


我们来看一个对比案例:



是的,只需 1 小时,AI Agent 就以 8 马斯(Mega Token Hours) 的成本完成了原本需 6 人天的任务。


这让我想起 19 世纪纺织工人的卢德运动——当机械织布机的效率是手工的 200 倍时,抗拒变革终将是徒劳的。区别在于,这次"机器"不仅能纺纱织布,还能写代码、打官司、做设计。


当 AI Agent 逐步成熟,“1 小时”可能进一步压缩成几分钟。兆字元小时(MTH)——我们可以用一个更通俗的中文简称:“马斯”,来代表这种 AI 劳动力单位。就像过去用“马力”衡量引擎效率,现在我们可以说:“这任务消耗了 8 马斯”。


从“马力”到“马斯”,工作的事,又一次交回了“机器牛马”们。

2. Token 智网:AI「国家电网」的吞吐率决定能效和可行性

如果说过去的工业社会靠电力驱动,那么 Token 纪元的社会,将靠“字元”驱动。


AI Agent 的任务完成速度,取决于两件事:“够聪明”与“跑得快”。


聪明,是 AI 模型是否足够理解人类意图并完成任务;


跑得快,则取决于背后的字元吞吐率 —— 也就是算力基础设施的速率极限。


这就像当年 56K 猫下 DVD——不是你没资源,而是根本下不完。直到光纤网络普及,蓝光碟片才真正进入家庭。吞吐率的高低,决定了 AI 是否能“实用”。


我们来看看现实中一个惊人的算力场景。以下数据参考自 DeepSeek 开源的评估报告:


  • 每块 H800 GPU:约 20 万人民币

  • 功耗约 300W(瓦)

  • 当前 8 块 GPU 组合下的推理吞吐率:14,800 token/s

  • 电费按 0.6 元 /kWh 计


我们计算几个量级的吞吐目标下的成本:



想象一下——


达到 1 TT/s(太字元每秒) 的算力,意味着:


需要 5.4 亿块 GPU、108 万亿人民币投入(相当于中国 2021 年 GDP)、每秒消耗 4.5 万度电、每小时耗电 1.62 亿度。


三峡大坝每小时发电 2250 万度,要供电这个数据中心,得整整 7 个三峡大坝 同时工作!


而 2024 年全中国平均用电每小时约为 11 亿度。这意味着这个超算中心会消耗 全国 15% 的电力


难怪黄仁勋的演讲图表,吞吐率只画到了“200T/s for 1 user”。算力、电力,甚至国家财政,根本不够用。


而云服务厂商们也早已开始布局核电,OpenAI 的 Sam Altman 主导的“星际之门”计划,5000 亿美元投资并不是空穴来风。

3. 我们需要多少字元?太字元的意义

那 1 TT/s 的吞吐率可以支持多少人类使用呢?


以最近 Manus 中一个 AI Agent 的平均任务为例,约需 24 万 tokens(0.24 MT)。那么 1 TT(=1000 GT = 1,000,000 MT)就能支撑:


  • 每秒完成 4166 万个任务

  • 覆盖 14 亿人,每人每 33 秒完成一个中等难度任务


试想,我们日常办公中,一天能完成多少个类似的小任务?如果通用人工智能可以做到每 33 秒替你完成一个复杂任务,那人类打工人是不是可以真正上班“摸鱼”了?


从这个角度看,一个全国级别的 AGI 算力中心,也许真的足以支撑 14 亿人全职用 AI 办公。


当我们实现了 1 TT/s 的算力时,社会会变成什么样子?畅想一下:


  • 生产率悖论:GDP 统计方式彻底失效

  • 就业重构:90% 白领工作转型为 AI 管理岗

  • 教育革命:"学力"取代"学历"成为核心指标

  • 创新爆炸:个人可实现科研机构级创新


就像 1870 年代无法想象电气化社会,今天的我们也难以预见 1TT/s 算力带来的文明跃迁。唯一确定的是,正如法拉第面对电磁感应实验时的那句著名回答:


“一个刚出生的婴儿有什么用?”

—Token 经济这个婴儿,终将长成改变世界的巨人。

字元时代的文明跃迁 人类社会的下一场大重构


我们对 Token 的理解,其实是一场认知的进化旅程。这个旅程,像极了电力时代初期人们对“瓦特”和“度数”的摸索,随着 AI 的发展,Token 也将成为一种新的社会标准。


这个认知,可以分为六个层次:


第一层:Token,语言模型的基本单位


在最基本的层面上,token 是语言模型的处理单元。就像电子在电路中流动一样,token 在 AI 模型中流动。理解什么是 Token 字元是理解 AI 经济的第一步。


第二层:Token 的规模与聚合


单个 Token 不足以描述实际应用,正如一滴水不足以丈量江河。当 Token 数量级从千、万、兆扩展,我们需要像 KT、MT、GT 这样的进位单位,来构建 宏观认知,也像计算机存储单位一样,逐步从 KB 走向 TB。


第三层:Token 流动速度与吞吐量


Token 的生成并非瞬间完成,它受到模型算力、内存、带宽的约束。“Token 吞吐量”(T/s 或 KT/s)这个概念,就像网络带宽,决定了 AI 实际工作的响应速度和规模上限。


第四层:Token 的经济学属性


当 Token 成为可计价的资源,它也进入了经济学的范畴。不同服务商以“/MT”计价,模型能力越强,价格也随之波动,逻辑上与电力、水资源、云存储的分级定价极为相似。不同的服务提供商根据模型能力提供不同的费率,类似于分级定价的公用事业服务。


第五层:Token 的能源效率


Token 处理的能源效率(以 kWh/GT 计)在环境和经济层面都很重要。更高效的模型每个 token 消耗的能量更少,从而降低成本并减少环境影响。


第六层:Token 驱动的生产力革命


Token 的最终价值,体现在它所完成的工作量。以“兆字元小时”(MTH) 或“马斯”为单位来衡量生产力,为我们提供了一个将 AI 方法与传统人工方法进行比较的框架,成为新工业时代的 生产力度量基石


这六层的理解和规划,为我们展示了一个基于资源经济的将来:Token 像电力一样通过「智能网格」按需分配。每个人、企业、市场、以及国家都会有对应的产品、市场、和商业模式。

1. 从个人到国家,字元经济将全面渗透

个人使用


个人用户可能会有专属的字元配额:


  • 基础套餐:每月包含 1 MT

  • 高级套餐:每月 10 MT,并享有优先处理(更高的 T/s)

  • 专业套餐:每月 100 MT,并可使用专属模型


企业资源规划


公司可能会为不同部门分配字元预算:


  • 市场部:每月 50 MT 用于内容生成

  • 客服部:每月 100 MT 用于自动回复

  • 研发部:每月 200 MT 用于数据分析


字元交易市场


未来我们可能会看到字元期货和现货市场的出现:


  • 购买下季度交付的 1 GT 处理能力

  • 在高峰或低谷时段交易字元资源

  • 对冲字元价格波动的风险

  • 企业通过 TT 级算力期货对冲模型训练成本。


而当这些字元的产生和交易越来越多,就像基本的大宗商品或者耗材资源一样,需要国家层面的政策与统一协调。


国家政策措施


字元资源,终将进入公共治理视野:


  • Token 碳税:按消耗电力征收,鼓励绿色模型

  • Token 配额:按用途划分,优先保障公共服务

  • Token 交易监管:防止投机,保护社会公平

  • 跨境 Token 流动监管:守护数据主权,维护国家安全

2. 从“马力”到“马斯”:人类文明的标准进化

历史上,计量单位的进化,往往意味着一次技术革命的降临:


  • 蒸汽时代,诞生了“马力”;

  • 电气时代,诞生了“瓦特”;

  • 信息时代,诞生了“比特”;

  • 智能时代,正在诞生“马斯”。


从「马力」到「瓦特」,从「人天」到「马斯」,人类始终通过标准化单位 驾驭技术革命。


通过现在就建立这些标准,我们将更好地为未来做好准备——一个字元资源与电力、水资源、带宽同等重要的经济时代。


当 AI Agent 以马斯 (Mega-Token-Hour) 取代人天 (Man-Day),人类终于从重复劳动中解放——这才是工业革命 4.0 的真正内核。人类在实现 1 TT/s 的超算中心的时候,反过来回忆现在,有致敬一句前辈的老话:用“人天”来计算 AI 的效率,就像用蜡烛丈量太阳。


新世界的“瓦特计”已经诞生,它的名字叫:字元  当 AI 成为基础设施,字元经济将是衡量智能社会的标尺。Token 经济的终极意义在于:人类第一次能够精确测量并管理自己的集体智能。当未来史学家回望这个时代,或许会如此评价:


“21 世纪 20 年代,人类发明了字元 Token——这个看似简单的计量单位,最终成为了区分碳基文明与硅基文明的罗塞塔石碑。”

——而我们,正在书写它的第一行定义。


2025-06-11 18:243125

评论

发布
暂无评论

数据产品经理实战合集

第519区

内容合集 签约计划第二季 技术专题合集

在人均配备升降桌的公司工作,是一种怎样的体验?

LigaAI

开发者 LigaAI

融云直播 SDK 2.0 重磅上线,两步接入即可获得视频直播能力

融云 RongCloud

一款好用的Java插件 - Lombok

恒生LIGHT云社区

Java lombok

面向WEB开发的Docker(二):什么是Docker、镜像、编排?

devpoint

Docker Dockerfile 12月日更

阿里云手机正式公测,定义手机全新接入方式

阿里云弹性计算

阿里云 弹性云手机

实用机器学习笔记十三:随机梯度下降

打工人!

机器学习 AI 算法 学习笔记 12月日更

你怎么总是能写出两三千行的controller类?

CRMEB

Flutter流畅度优化神器-开源组件keframe详解

贝壳大前端技术团队

flutter 性能 滑动优化

声网把七年无全网事故的实时传输网络SD-RTN全面开放了——这就是FPA!

声网

人工智能 网络 SD-RTN

【AI最前线】精准优质-资讯|分享|热议第44期

百度大脑

人工智能

大势已来,区块链的真正价值是什么?

CECBC

你想知道的Kotlin version

Changing Lin

12月日更

元宇宙时代的业务、场景、技术机遇探索

融云 RongCloud

基于融云直播 SDK,快速实现连麦布局

融云 RongCloud

44 K8S之污点与容忍度

穿过生命散发芬芳

k8s 28天写作 12月日更

面向视频原生,火山引擎视频云与边缘云软硬一体的新云解决方案

火山引擎边缘云

基础设施 边缘计算 云服务 视频 云计算,

记录一次win10更新版本后IIS无法启动的解决办法

为自己带盐

28天写作 12月日更

CODING x 百果园,水果零售龙头迈出 DevOps 体系建设第一步

CODING DevOps

DevOps CODING 百果园 合作

面向 WEB 开发的 Docker(一)

devpoint

Docker 12月日更

【C++20协程原理】从Linux线程、线程与异步编程、协程与异步,一文带你弄清楚

奔着腾讯去

线程 多线程 进程 协程 C++20

团队实行996,就有人离职,怎么办?

石云升

996 28天写作 加班文化 职场经验 12月日更

一张图看懂融云直播 SDK

融云 RongCloud

不可错过的年度AI盛会 | 2021 新一代人工智能院士高峰论坛议程重磅发布

OpenI启智社区

人工智能 开源社区 院士峰会 启智开发者大会

Spring Cloud Config

李子捌

微服务 28天写作 12月日更

性能分析之 PHP 应用进程过多导致的 page faults

zuozewei

php 性能测试 性能分析 签约计划第二季

音视频学习--视频特性测试

Fenngton

音视频 测试环境 签约计划第二季

区块链引发了一场独特的社会运动

CECBC

Volatile 原理六:图解指令重排

悟空聊架构

volatile 28天写作 悟空聊架构 12月日更 指令重排

飞桨企业版重磅发布智能边缘控制台,5分钟零代码自动化模型部署

百度大脑

人工智能 百度

Redis(三):持久化

IT巅峰技术

Java redis 架构师 分布式缓存 redis分布式

Token纪元:从「马力」到「人天」再到「兆字元时」的认知革命_AI&大模型_InfoQ精选文章