178直播 OpenAI明升, Anthropic暗涨: AI包月扣头没了


新智元报说念

[新智元导读]4月,OpenAICodex崇敬把计费口径从按音讯估算转向按token用量;Anthropic侧的企业续约和新版模子tokenizer(分词器),也让ClaudeCode的践诺账单压力汇聚知道。明升与暗涨,两家各有各的玩法。
2180.16好意思元的token,他只付了200好意思元。
这是独处设立者SimonWillison,在我方札记本上跑出来的一笔账。

Simon并非普通用户,他是Django框架的聚首创始东说念主,写了二十年代码,亦然英语圈最早把AI编程器用用到极致的东说念主之一。
他终年在博客上纪录我方怎样用各式AI编程器用,ClaudeCode和Codex是脚下的主力。
夙昔30天,他用ClaudeCode烧掉了价值1199.79好意思元的token,用Codex烧掉了980.37好意思元,加起来2180.16好意思元。
而他每月实付,仅仅Anthropic的100好意思元Max加上OpenAI的100好意思元Pro,一共200好意思元。
200块的订阅,薅出2180块的算力。「这营业不亏。」Simon合计我方赚翻了。
但他随后发现,我方透彻念念错了一件事:他原以为,那些重度使用Agent的大公司,凭借采购范围,单元本钱只会比他更低。着力碰巧相悖,企业续约背濒临的,常常是更接近API原价的token账单。
销毁的包月扣头
先看OpenAI这边,它的官方匡助中心写说念:
2026年4月2日,Codex计费姿色改为与API的token用量对皆,不再按音讯估算。

这一改,先粉饰了新老Plus、Pro、Business以及新的Enterprise决策。
旧姿色(按音讯估算):发一条音讯≈固定扣N个额度,岂论这条音讯背后Agent读了多长潦倒文、调了几次器用、重试了几遍。
新姿色(按token用量):凯旋按输入token、缓存输入token、输出token三类分手计费,跑几许算几许。
打个譬如说:旧的姿色像「自助餐按东说念主头收费,吃多吃少一个价」,新的姿色像「按克称重,拿几许付几许」。关于那些动辄读几十万token潦倒文、反复调器用的重度Agent任务,新姿色算下来庸俗更贵,也更接近实在本钱。
三周后,4月23日,这套token计费彭胀到了统共现存的Enterprise决策,连同Edu、Health、Gov和ChatGPTforTeachers一齐,全部囊括进来。
企业夙昔柔柔的是「每东说念主每月几许钱」,当今实在决定账单的,是Agent到底跑了几许token。
夙昔企业签的是包月套餐,用量基本管够,等于享受了一笔看不见的大都扣头。4月之后,这层扣头被抽掉了,续约时他们才发现,实在要付的,是API原价。
标价没涨,账单却涨了
OpenAI是明着加价。
官方价钱页自满,GPT-5.5的API单价是输入5好意思元、输出30好意思元,每百万token。而上一代GPT-5.4是输入2.5好意思元、输出15好意思元。
GPT-5.5在4月23日发布,一上来就把价签翻了一番。

Anthropic这边,乍一看价钱没动。
2026世界杯官方指定中国区认证平台官方价钱内外,Opus4.7和Opus4.6的样式单价一模一样,都是输入5好意思元、输出25好意思元,每百万token。

但Anthropic换了种「涨法」,微妙就藏在另一转小字里。
Anthropic的样式单价没变,但Opus4.7的新tokenizer可能让兼并固定文本最多多计35%的token,因此部单干作负载的有用本钱会上涨。
不异一篇文档喂进去,被切成的token更多。单价没动,总价却高了。
SimonWillison据此估算,把tokenizer算进去,Opus4.7的有用价钱能够是Opus4.6的1.4倍。
是以真相是:OpenAI把价钱写在台面上,Anthropic把本钱藏进了tokenizer里。
一个明升,一个暗涨,各有各的玩法。
代码智能体
第一次让大厂赚到了钱
两个竞争敌手,为什么敢在兼并个月、险些同阵势往上提价?
答案等于一个投资东说念主和创业者常常挂在嘴边的一个词:PMF(product-marketfit,产物与商场契合)。
说白了,等于这两家终于找到了PMF,作念出了一个用户自得大把烧钱、还离不开的产物。
先看消费者订阅这笔账。

本年2月,ChatGPT产物负责东说念主NickTurley发推官宣:周活跃用户刚刚打破9亿,付用度户打破5000万,这个数字很漂亮。
但SimonWillison替OpenAI算了笔细账。
9亿东说念主在用,5000万东说念主掏钱,178直播2026世界杯比赛直播付费率5.6%,不到六分之一。每东说念主每月10到20好意思元,看着不少,可OpenAI我方的见地,是上万亿好意思元的基建参加。
照这个收法,要让账平得凑够10亿到20亿付用度户,要花上四年,这条路太长了。
代码智能体走的是另一条路。因为它面向的是一群极高薪的专科东说念主士工程师,他们烧掉的token要比普通用户多得多。
像SimonWillison这样的重度用户,单一家厂商每月就能烧出约1000好意思元的token账单。一个时代员一个月的付费时代,顶得上几十个聊天框用户。
Anthropic一运行就把我方产物押在了编程和企业用户,Opus4.7专诚面向专科软件工程、复杂的智能体责任流,以及高风险的企业任务,切的恰是「高价值责任加高耗尽」这条线。
据《华尔街日报》报说念,Anthropic向投资者瞻望,二季度营收有望冲到109亿好意思元,并可能初度实现季度运营盈利。

标的也曾很澄莹:消费者订阅孝敬东说念主气,代码智能体才是大厂第一张能终了的支票。
PMF说穿了,不是看用户有几许,而是要看他们自得烧几许。
被绕过的中间商
与失控的预算
这场变局里,有东说念主狂喜,也有东说念主坐立难安。
发轫疼痛的是夹在中间的器用商。ClaudeCode和Codex直战斗达企业的工程团队,等于把Cursor、Copilot、Devin这些中间层的议价空间,一口一口吃掉。
这些中间层对模子厂商的依赖有多深?
据VentureBeat在2025年8月的报说念,那时Anthropic约40亿好意思元的营收里,光是Cursor和GitHubCopilot两家,就孝敬了12亿好意思元。
大厂直连工程师的那一刻,中间商的议价权就运行摇晃。如今,Cursor也曾运行以自研模子反击上游,否则,运说念就要攥在别东说念主手里。

继3月的Composer2后,Cursor于5月再发自研模子Composer2.5,价钱较旧版降约86%,基准并排Opus4.7。
另一边,是被频频拿出来当反例的「AI账单失控」,其中一个焦点等于Uber。
据TheInformation报说念,Uber进入2026年才几个月,就把全年的AI预算花光了,主因恰是ClaudeCode。
听上去有点吓东说念主,其实不难斡旋。
ClaudeCode直到2025年11月才好用到能当日常主力,一份2025年定下的预算,没猜度2026年需求会这样猛,超支再浅显不外。
还有微软取消部分ClaudeCode许可的传奇。
据TheVerge报说念,这背后除了念念推自家的CopilotCLI,也夹着财年节点的本钱考量。若是两笔账一齐算,就怕是ClaudeCode不值。
把这些案例摆在一齐,你会发现一个共同点:暴涨的AI算力需求,正在冲垮那套保守的旧预算模子。
这场波浪中,实在被迫的,是那些站在巨头和工程师之间、靠差价吃饭的中间商。
从座次费到FinOps
那么,当Agent按token计费成了常态,企业该怎样活?
这内部的游戏端正也曾变了。
决定账单的,不再是每东说念主每月几许好意思元的座次费,而是Agent跑了多长的潦倒文、调用了几许次器用、重试了几遍、有莫得开Fastmode、缓存掷中率高不高。
这意味着企业用AI,也曾进入了云筹办式的本钱解决阶段。
预算上限、模子路由、缓存政策、审批进程、用量可不雅测性……这套FinOps(云本钱解决)的责任,一样都不可少。
AI智能体不再是「买了座次松弛用」,而是要像云账单一样,被量入制出地管制起来。
这场变局有多大,实在的数字还没出来。从SpaceX最近的S-1文献里不错窥见冰山一角:

SpaceX的S-1招股文献原文。Anthropic自2026年5月起与SpaceX签署云管事左券,获取COLOSSUS和COLOSSUSII的算力容量,商定用度最高/约为每月12.5亿好意思元,期限至2029年5月。
Anthropic与其签了云管事左券,本旨从当今起到2029年5月,每月支付12.5亿好意思元,只为疏通算力。而这还仅仅它广阔算力供应商中的一家。
一家公司自得每月砸12.5亿好意思元买推理算力,账单另一头那串营收数字,只会更惊东说念主,要等Anthropic和OpenAI的IPO招股书,那儿才有经过审计的数字。
在那之前178直播,企业能作念的唯有一件事:先管好我方的token。