Token狂飙这一年：巨头踩刹车，打工人用不起

作者｜懒人

编辑｜张洁

Token消耗量还在狂飙，但关于“该不该让员工放开用AI”，答案变得没那么简单。

过去几个月，我们看到两条时间线同时发生：一边是全球AI调用量继续创新高，中国大模型Token消耗也在快速上升；另一边，亚马逊、Uber、微软等公司开始给内部AI账单踩刹车。

更有意思的是，当这件事落到公司内部，它不再只是一个技术问题，而变成了管理问题：员工该不该自费买AI工具？公司给额度，是福利、基础设施，还是新型KPI？如果有人一个月烧掉几十万、上百万Token，到底是在提效，还是在刷存在感？

带着这些问题，我们也和几位正在一线使用、采购或管理AI工具的人聊了聊。巨额账单之外，真正棘手的问题是：Token到底该怎么配，又该怎么被用好？

根据OpenRouter最新数据，上周（6月15日至21日）全球AI大模型总调用量为46.7万亿Token，较此前一周增长4.7%，连续九周上涨。其中，中国AI大模型周调用量达18.81万亿Token，连续八周超过美国，稳居全球首位。

国家数据局的数据则拉长了这条增长曲线：我国大模型日均Token调用量，从2024年初的1000亿增长到2025年底的100万亿，再到2026年3月的140万亿以上。而据火山引擎6月23日最新披露，仅豆包大模型当前日均Token使用量已突破180万亿。

消耗数字还在涨，但巨头们正在悄悄踩刹车。

就在不到一年前，不少公司还在声势浩大地要求员工使用AI，把“用不用AI”包装成一种新的工作能力指标。而近几个月，亚马逊关掉了内部Token消耗排行榜，微软取消了部分业务线的Claude Code授权，多邻国撤回了“AI使用纳入绩效”的决定。

账单是导火索。

米哈游《崩坏》系列技术负责人郑银河上个月曾透露，公司内部一名工程师测试多Agent系统时忘设消耗上限，一夜烧掉约200万人民币。科技媒体The Pragmatic Engineer曾报道，Meta内部“Claudeonomics”排行榜上，榜首用户30天消耗了2810亿Token；Uber CTO也曾公开确认，公司给约5000名工程师配了Claude Code，4个月烧光全年AI预算。

另一个更极端的案例来自OpenClaw创始人Peter Steinberger，他在加入OpenAI后曾在社媒晒出过账单，一个月消耗了6030亿Token，花费高达130万美元以上。

当“用AI”变成一场比赛

这场浪潮的起点，是硅谷巨头们集体下场动员公司全员用AI。

2025年6月，亚马逊CEO安迪·贾西（Andy Jassy）在全员信中明确要求员工“尽可能用AI”；同月，微软开发者工具业务高管潘正磊（Panos Panay）在内部邮件中宣布，“使用AI已经不再是可选项，而是每个职位、每个层级的核心能力”；2025年11月，Meta首席人力官贾内尔·盖尔（Janelle Gale）宣布，从2026年起“AI驱动的影响力”将正式进入绩效评价。英伟达CEO黄仁勋今年3月在公开场合表示，假如公司年薪50万美元的工程师一年没有消耗至少25万美元的AI Token，自己会“非常担忧”。

最极致的，是Meta内部那个“Claudeonomics”排行榜——追踪超过8.5万名员工的Token消耗，列出前250名，授予“Token传说”“缓存大师”等称号。短短30天内，榜单记录的Token消耗超过60万亿个。

AI使用，变成了一场内部竞赛。而竞赛很快发生了异化。

今年5月底，据《金融时报》报道，亚马逊关闭了一个名为“KiroRank”的内部排行榜——这个由员工自行制作的榜单，用来追踪使用AI工具时消耗的Token数量。报道指出，一些员工开始使用亚马逊内部AI智能体平台MeshClaw运行非必要任务，以提高自己的AI使用数据，这种行为甚至有了专门的名字：“Tokenmaxxing（Token消耗最大化）”。

在Hacker News的相关讨论中，有人直接支招：把AI挂在后台持续分析源代码，Token自然累积。亚马逊高级副总裁戴夫·特雷德韦尔（Dave Treadwell）最终不得不在内部提醒员工：“请不要为了使用AI而使用AI。使用AI，是为了帮助你解决客户问题、解决业务问题、实现创新。”

风险投资人施鲁蒂·甘地（Shruti Gandhi）在X上写道：“花得多不等于产出多。大多数给员工发AI权限的公司，根本不知道员工拿来干了什么，是否改变了任何结果。”AI云基础设施公司Modal的CTO阿克沙特·布布纳（Akshat Bubna）也表示：“内部Token消耗里大概有50%是完全没用的，但现在很难分辨是哪50%。”

Reddit社区类似讨论也不少，有人吐槽公司把Token用量当绩效指标，有人专门发帖问“怎么刷高Token数”，评论区则反复用古德哈特定律来概括这种荒诞——当Token消耗量成为目标，它就不再是一个好指标。因为人们会开始优化指标本身，而不是指标背后真正想衡量的东西。

与员工想办法消耗相对应的，是企业不断膨胀的Token账单。据The Verge报道，微软5月开始取消部分业务线的Claude Code许可证。微软对内解释称，这是为了将工具链统一到自家的Copilot CLI，但The Verge指出，这同时也是一项财务决定——在6月底微软当前财年结束前集中关闭许可证，以削减部分运营成本。

国内公司的动作同样密集，只是说法不同。

今年4月，字节跳动推出AI产品体验费用报销政策，产品/技术序列报销上限为1000美元/人/年；安克创新宣布全员“无限词元”，累计消耗已达5万亿Token；5月初，360向全体员工发放每人1亿Token；58同城创始人姚劲波称，公司每天消耗接近2000亿Token。

另据《经济观察报》报道，自6月起，腾讯多个业务部门开始调整Token额度，从此前的统一发放转向差异化分配：混元大模型团队月度额度约7000元，优图实验室约5250元，部分娱乐业务外包员工仅有1000元。额度也不再直接发放给个人，而是先进入团队额度池，再由管理者根据实际需求分配。

国内社媒上，围绕公司该不该配Token的讨论同样热度不低。网友“燕双鹰猜叶孤城枪里没子弹”写道：“我们小厂只给250刀Claude加150刀Copilot，而我都用不完。”

网友“大红薯NULL”说：“很多Token都是被浪费掉的。就算是一天到晚工作写大项目，Token消耗太夸张也是有问题的……人家希望一个AI加一个你顶两三个，结果一个AI就顶两三个的工资。”

也有人看到了另一面，网友“joke”评论称，这是一种“逆向淘汰”，不断压缩Token量，不太会用、经常浪费多次迭代才完成任务的人就淘汰，一次就出结果的人留下。

当我们看向硬币的另一面，发现并非所有人都等得到公司发配额。在小红书的评论区，有一类更普遍的处境：公司根本不给配，或者配得远远不够，员工只能自掏腰包订阅AI工具。

更尴尬的是，自费提效之后，有人发现项目排期随之压缩。用自己的钱帮公司省了人力成本，本质上是一种隐性降薪。

配了，然后呢

对于到底应该不应该给员工配Token、具体怎么配，“AI新榜”对话了四位正在亲历这场浪潮的人。

国内某科技企业技术总监告诉我们，他们已经给产研团队配置了AI开发工具，设有通用限额，超额需主管审批。“对于研发来说，大部分业务80%的代码都是由AI生成的，”

他说，“但个人生产力的增长还是固化在既有岗位上，最多提升50%或100%。”目前，他所在公司每月在AI工具上的投入在5万到10万元人民币之间。

我们还问了问ColaOS创始人冯雷。他的做法是给每位员工配400美元/月的额度，同时对旗舰模型单独设限，必要时可申请。

他建议，公司可以先从100到200美元额度开始，等用完了再申请，防止滥用。他对无限配额持明确保留态度：“Token无限之后，反而会让人失去判断力。在今天，人的判断力依然重要。无尽的使用loop来优化其实没有ROI。”

他的判断，和美国AI模型评测机构METR去年发布的一项随机对照实验结果颇为吻合。在这项实验中，16名有经验的开源软件开发者，在允许使用AI的条件下完成真实任务。他们预估AI能让自己提速24%；实验结束后仍认为提速了20%。但实际数据显示，使用AI后，完成任务所需时间增加了19%。感觉在提效，不等于效率真的提高了。

OpenClacky创始人李亚飞的态度也很直接：“肯定要配，但不能做KPI指标。”他的逻辑是，让员工自费购买Token来提高工作效率，本身就说不通；但一旦把Token消耗列为考核指标，刷量就是必然结果。

他们目前的做法是给每人每周设50美元的固定额度，鼓励多用，用完可以申请追加，同时定期组织使用技巧分享、邀请外部专家交流。

某科技企业产品经理也表示，她认为这件事归根结底要算账。“有AI帮助，我可以从一个月做20个需求变成40个。那对我、对公司来讲，投入产出比是划算的，公司就应该报销，”她说，“但如果只从20个变成25个，公司为什么要为此买单？”她所在的公司给开发岗的报销额度更高，但前提是产出能对应上去。

麦肯锡2025年11月发布的《2025年AI现状：智能体、创新与转型》报告显示，AI对整个企业层面利润产生实质影响的，只有39%；称得上“AI高绩效企业”的，只有6%。

工程管理分析平台Jellyfish今年5月的数据则从另一个角度印证了这种分裂：重度AI用户的Token消耗是普通用户的10倍，但生产力提升只有约2倍。

钱花出去了，但大多数公司还没算清楚这笔账。

下一个问题：怎么花

过去几个月，行业一度流行“Tokenmaxxing”——谁用得多，谁看起来就更AI优先。员工刷Token，公司晒消耗，Token成了AI转型的进度条。但随着账单快速膨胀，风向正在转向另一个问题：这些消耗，最后有没有沉淀成真实业务能力？

硅谷软件公司Box的CEO亚伦·列维（Aaron Levie）在X上表示，Token成本在持续下降，但企业总支出仍在攀升，因为用量增速盖过了降价幅度。他认为，真正的竞争优势在于知道什么任务该交给哪个模型，能做好这件事的公司，才是下一波的赢家。

另据《商业内幕》报道，Coinbase、Hugging Face等公司的从业者也有类似判断：未来企业真正需要的，不是无差别地调用最强模型，而是更精细地匹配任务与工具，避免“杀鸡用牛刀”。道理不难懂，难的是执行。

这可能也是第一轮AI普及之后，企业必须补上的课。单纯烧Token，只会留下账单；真正值得花钱的部分，是那些能被复用的工作流、私有知识库、评估体系、提示词资产、模型路由经验，以及团队对Agent边界的判断力。

微软CEO纳德拉最近也提到，企业未来需要同时拥有“人力资本”和“Token资本”。换句话说，换了模型还在的组织经验、数据资产和工作流，才是企业在AI时代真正的资产。

也许Token消耗战的下一阶段，不再是谁敢烧，更重要的是谁能把烧掉的Token，变成可复用的工作流、可沉淀的知识库，以及对AI边界的判断力。

配Token只是起点。真正难的是，让每一次调用，都更接近真实产出。

AI浪潮席卷了整个内容全产业链，内容创作、分发运营到商业变现被全面重构，当前，自媒体、品牌、短剧MCN都在积极探索、落地AI工作流，行业变革，已然发生。在2026下半年即将开启之际，新榜计划在7月举办两场行业交流活动，欢迎各位来现场见面交流！

第一场：7月9日北京站，「AI新榜线下百人闭门局」，来聊聊AI到底怎么用。有人用AI创作提效工作流，有人用AI拍短剧、做内容，还有人跑通变现。小场可和同行深度交流，名额不多，先到先得！

第二场：7月15日杭州站，「2026新榜AI大会」，集结平台负责人、头部博主、短剧机构大咖，共探AI短剧、AIGC创作等赛道前沿趋势，解锁AI内容全新发展范式。

报名请扫下方2张海报二维码（免费报名），我们现场见！

【向左滑动，查看两场活动海报】

一起研究AI