扫描二维码
手机浏览

Token狂飙这一年:巨头踩刹车,打工人用不起|我们和四位从业者聊了聊

AI新榜
新榜独家
AIGC


作者|懒人

编辑|张洁


Token消耗量还在狂飙,但关于“该不该让员工放开用AI”,答案变得没那么简单。


过去几个月,我们看到两条时间线同时发生:一边是全球AI调用量继续创新高,中国大模型Token消耗也在快速上升;另一边,亚马逊、Uber、微软等公司开始给内部AI账单踩刹车。


更有意思的是,当这件事落到公司内部,它不再只是一个技术问题,而变成了管理问题:员工该不该自费买AI工具?公司给额度,是福利、基础设施,还是新型KPI?如果有人一个月烧掉几十万、上百万Token,到底是在提效,还是在刷存在感?


带着这些问题,我们也和几位正在一线使用、采购或管理AI工具的人聊了聊。巨额账单之外,真正棘手的问题是:Token到底该怎么配,又该怎么被用好?


根据OpenRouter最新数据,上周(6月15日至21日)全球AI大模型总调用量为46.7万亿Token,较此前一周增长4.7%,连续九周上涨。其中,中国AI大模型周调用量达18.81万亿Token,连续八周超过美国,稳居全球首位。


国家数据局的数据则拉长了这条增长曲线:我国大模型日均Token调用量,从2024年初的1000亿增长到2025年底的100万亿,再到2026年3月的140万亿以上。而据火山引擎6月23日最新披露,仅豆包大模型当前日均Token使用量已突破180万亿。


消耗数字还在涨,但巨头们正在悄悄踩刹车。


就在不到一年前,不少公司还在声势浩大地要求员工使用AI,把“用不用AI”包装成一种新的工作能力指标。而近几个月,亚马逊关掉了内部Token消耗排行榜,微软取消了部分业务线的Claude Code授权,多邻国撤回了“AI使用纳入绩效”的决定。


账单是导火索。


米哈游《崩坏》系列技术负责人郑银河上个月曾透露,公司内部一名工程师测试多Agent系统时忘设消耗上限,一夜烧掉约200万人民币。科技媒体The Pragmatic Engineer曾报道,Meta内部“Claudeonomics”排行榜上,榜首用户30天消耗了2810亿Token;Uber CTO也曾公开确认,公司给约5000名工程师配了Claude Code,4个月烧光全年AI预算。


另一个更极端的案例来自OpenClaw创始人Peter Steinberger,他在加入OpenAI后曾在社媒晒出过账单,一个月消耗了6030亿Token,花费高达130万美元以上。




当“用AI”变成一场比赛


这场浪潮的起点,是硅谷巨头们集体下场动员公司全员用AI。


2025年6月,亚马逊CEO安迪·贾西(Andy Jassy)在全员信中明确要求员工“尽可能用AI”;同月,微软开发者工具业务高管潘正磊(Panos Panay)在内部邮件中宣布,“使用AI已经不再是可选项,而是每个职位、每个层级的核心能力”;2025年11月,Meta首席人力官贾内尔·盖尔(Janelle Gale)宣布,从2026年起“AI驱动的影响力”将正式进入绩效评价。英伟达CEO黄仁勋今年3月在公开场合表示,假如公司年薪50万美元的工程师一年没有消耗至少25万美元的AI Token,自己会“非常担忧”。


最极致的,是Meta内部那个“Claudeonomics”排行榜——追踪超过8.5万名员工的Token消耗,列出前250名,授予“Token传说”“缓存大师”等称号。短短30天内,榜单记录的Token消耗超过60万亿个。



AI使用,变成了一场内部竞赛。而竞赛很快发生了异化。


今年5月底,据《金融时报》报道,亚马逊关闭了一个名为“KiroRank”的内部排行榜——这个由员工自行制作的榜单,用来追踪使用AI工具时消耗的Token数量。报道指出,一些员工开始使用亚马逊内部AI智能体平台MeshClaw运行非必要任务,以提高自己的AI使用数据,这种行为甚至有了专门的名字:“Tokenmaxxing(Token消耗最大化)”。


在Hacker News的相关讨论中,有人直接支招:把AI挂在后台持续分析源代码,Token自然累积。亚马逊高级副总裁戴夫·特雷德韦尔(Dave Treadwell)最终不得不在内部提醒员工:“请不要为了使用AI而使用AI。使用AI,是为了帮助你解决客户问题、解决业务问题、实现创新。”


风险投资人施鲁蒂·甘地(Shruti Gandhi)在X上写道:“花得多不等于产出多。大多数给员工发AI权限的公司,根本不知道员工拿来干了什么,是否改变了任何结果。”AI云基础设施公司Modal的CTO阿克沙特·布布纳(Akshat Bubna)也表示:“内部Token消耗里大概有50%是完全没用的,但现在很难分辨是哪50%。”


Reddit社区类似讨论也不少,有人吐槽公司把Token用量当绩效指标,有人专门发帖问“怎么刷高Token数”,评论区则反复用古德哈特定律来概括这种荒诞——当Token消耗量成为目标,它就不再是一个好指标。因为人们会开始优化指标本身,而不是指标背后真正想衡量的东西。



与员工想办法消耗相对应的,是企业不断膨胀的Token账单。据The Verge报道,微软5月开始取消部分业务线的Claude Code许可证。微软对内解释称,这是为了将工具链统一到自家的Copilot CLI,但The Verge指出,这同时也是一项财务决定——在6月底微软当前财年结束前集中关闭许可证,以削减部分运营成本。


国内公司的动作同样密集,只是说法不同。


今年4月,字节跳动推出AI产品体验费用报销政策,产品/技术序列报销上限为1000美元/人/年;安克创新宣布全员“无限词元”,累计消耗已达5万亿Token;5月初,360向全体员工发放每人1亿Token;58同城创始人姚劲波称,公司每天消耗接近2000亿Token。


另据《经济观察报》报道,自6月起,腾讯多个业务部门开始调整Token额度,从此前的统一发放转向差异化分配:混元大模型团队月度额度约7000元,优图实验室约5250元,部分娱乐业务外包员工仅有1000元。额度也不再直接发放给个人,而是先进入团队额度池,再由管理者根据实际需求分配。


国内社媒上,围绕公司该不该配Token的讨论同样热度不低。网友“燕双鹰猜叶孤城枪里没子弹”写道:“我们小厂只给250刀Claude加150刀Copilot,而我都用不完。”


网友“大红薯NULL”说:“很多Token都是被浪费掉的。就算是一天到晚工作写大项目,Token消耗太夸张也是有问题的……人家希望一个AI加一个你顶两三个,结果一个AI就顶两三个的工资。”


也有人看到了另一面,网友“joke”评论称,这是一种“逆向淘汰”,不断压缩Token量,不太会用、经常浪费多次迭代才完成任务的人就淘汰,一次就出结果的人留下。



当我们看向硬币的另一面,发现并非所有人都等得到公司发配额。在小红书的评论区,有一类更普遍的处境:公司根本不给配,或者配得远远不够,员工只能自掏腰包订阅AI工具。

更尴尬的是,自费提效之后,有人发现项目排期随之压缩。用自己的钱帮公司省了人力成本,本质上是一种隐性降薪。



配了,然后呢


对于到底应该不应该给员工配Token、具体怎么配,“AI新榜”对话了四位正在亲历这场浪潮的人。


国内某科技企业技术总监告诉我们,他们已经给产研团队配置了AI开发工具,设有通用限额,超额需主管审批。“对于研发来说,大部分业务80%的代码都是由AI生成的,”


他说,“但个人生产力的增长还是固化在既有岗位上,最多提升50%或100%。”目前,他所在公司每月在AI工具上的投入在5万到10万元人民币之间。


我们还问了问ColaOS创始人冯雷。他的做法是给每位员工配400美元/月的额度,同时对旗舰模型单独设限,必要时可申请。


他建议,公司可以先从100到200美元额度开始,等用完了再申请,防止滥用。他对无限配额持明确保留态度:“Token无限之后,反而会让人失去判断力。在今天,人的判断力依然重要。无尽的使用loop来优化其实没有ROI。”


他的判断,和美国AI模型评测机构METR去年发布的一项随机对照实验结果颇为吻合。在这项实验中,16名有经验的开源软件开发者,在允许使用AI的条件下完成真实任务。他们预估AI能让自己提速24%;实验结束后仍认为提速了20%。但实际数据显示,使用AI后,完成任务所需时间增加了19%。感觉在提效,不等于效率真的提高了。


OpenClacky创始人李亚飞的态度也很直接:“肯定要配,但不能做KPI指标。”他的逻辑是,让员工自费购买Token来提高工作效率,本身就说不通;但一旦把Token消耗列为考核指标,刷量就是必然结果。


他们目前的做法是给每人每周设50美元的固定额度,鼓励多用,用完可以申请追加,同时定期组织使用技巧分享、邀请外部专家交流。


某科技企业产品经理也表示,她认为这件事归根结底要算账。“有AI帮助,我可以从一个月做20个需求变成40个。那对我、对公司来讲,投入产出比是划算的,公司就应该报销,”她说,“但如果只从20个变成25个,公司为什么要为此买单?”她所在的公司给开发岗的报销额度更高,但前提是产出能对应上去。


麦肯锡2025年11月发布的《2025年AI现状:智能体、创新与转型》报告显示,AI对整个企业层面利润产生实质影响的,只有39%;称得上“AI高绩效企业”的,只有6%。


工程管理分析平台Jellyfish今年5月的数据则从另一个角度印证了这种分裂:重度AI用户的Token消耗是普通用户的10倍,但生产力提升只有约2倍。


钱花出去了,但大多数公司还没算清楚这笔账。



下一个问题:怎么花


过去几个月,行业一度流行“Tokenmaxxing”——谁用得多,谁看起来就更AI优先。员工刷Token,公司晒消耗,Token成了AI转型的进度条。但随着账单快速膨胀,风向正在转向另一个问题:这些消耗,最后有没有沉淀成真实业务能力?


硅谷软件公司Box的CEO亚伦·列维(Aaron Levie)在X上表示,Token成本在持续下降,但企业总支出仍在攀升,因为用量增速盖过了降价幅度。他认为,真正的竞争优势在于知道什么任务该交给哪个模型,能做好这件事的公司,才是下一波的赢家。


另据《商业内幕》报道,Coinbase、Hugging Face等公司的从业者也有类似判断:未来企业真正需要的,不是无差别地调用最强模型,而是更精细地匹配任务与工具,避免“杀鸡用牛刀”。道理不难懂,难的是执行。


这可能也是第一轮AI普及之后,企业必须补上的课。单纯烧Token,只会留下账单;真正值得花钱的部分,是那些能被复用的工作流、私有知识库、评估体系、提示词资产、模型路由经验,以及团队对Agent边界的判断力。


微软CEO纳德拉最近也提到,企业未来需要同时拥有“人力资本”和“Token资本”。换句话说,换了模型还在的组织经验、数据资产和工作流,才是企业在AI时代真正的资产。


也许Token消耗战的下一阶段,不再是谁敢烧,更重要的是谁能把烧掉的Token,变成可复用的工作流、可沉淀的知识库,以及对AI边界的判断力。


配Token只是起点。真正难的是,让每一次调用,都更接近真实产出。




AI浪潮席卷了整个内容全产业链,内容创作、分发运营到商业变现被全面重构,当前,自媒体、品牌、短剧MCN都在积极探索、落地AI工作流,行业变革,已然发生。在2026下半年即将开启之际,新榜计划在7月举办两场行业交流活动,欢迎各位来现场见面交流!


第一场:7月9日北京站「AI新榜线下百人闭门局」,来聊聊AI到底怎么用。有人用AI创作提效工作流,有人用AI拍短剧、做内容,还有人跑通变现。小场可和同行深度交流,名额不多,先到先得!


第二场:7月15日杭州站「2026新榜AI大会」,集结平台负责人、头部博主、短剧机构大咖,共探AI短剧、AIGC创作等赛道前沿趋势,解锁AI内容全新发展范式。


报名请扫下方2张海报二维码(免费报名),我们现场见!


【向左滑动,查看两场活动海报】



           

 欢迎分享、点赞、推荐
 一起研究AI

分享文章链接