2026年5月,OpenAI把GPT-5.5 Instant设成了ChatGPT的默认免费模型。几乎同一周,谷歌在I/O大会上把那个统治了25年的搜索框,改成了AI智能体的任务入口。

这两件事放在一起,意味着一个拐点到了。

不是技术的拐点,是商业逻辑的拐点。当最顶尖的模型开始免费,靠卖API权限赚钱这条路,基本走到头了。AI的下半场,竞争焦点转向了两件事:算力,和入口。

一、免费是最强的壁垒

5月的这波发布潮,没有涨价,全是降价或免费。

OpenAI的GPT-5.5 Instant主打速度和多模态,直接对所有用户免费开放。谷歌推出Gemini 3.5系列,顺带发布了全天候AI助手Spark。百度财报会上,李彦宏说了一句意味深长的话:AI进入了下半场,评判标准不再是模型参数,而是DAU。

这背后的逻辑其实不难理解。当模型能力趋同,当训练成本的边际递减越来越快,单纯卖调用权限的生意就撑不住了。收费的那家,用户直接跑去用免费的。于是大家都免费,用免费本身来筑壁垒——你想超越我,先在用户习惯上赢过我再说。

竞争焦点因此从”谁的模型更聪明”,转移到了”谁先占住用户每天打开的那个入口”。谷歌动搜索框,不是因为它觉得搜索框有问题,而是它很清楚:如果它不动,别人会替它动。

基础模型的闭源收费时代,到这里差不多结束了。大模型正在往水电的方向走——便宜、普遍、没有什么特别的差异化。

二、应用越多,底层越赚

应用层热闹,底层跟着受益,这个逻辑在2026年的财报季里说得很清楚。

英伟达在5月批准了超1000亿美元的股票回购计划,现金流宽裕到连传统行业都眼红。阿里巴巴宣布未来算力资产扩增十倍,背后是AI相关产品收入连续11个季度三位数增长这个硬需求。B站这个没有自研大模型的视频平台,靠承接AI公司的广告,一个季度AI广告收入暴涨了170%。

百度李彦宏提出的”日抛软件”概念,现在真的在发生。AI大幅拉低了软件开发门槛,应用数量在爆发。每一个应用,每一次Agent跑任务,都在消耗Token和算力。需求越大,底层的议价权越高。

B站的案例有点讽刺,但很说明问题。它不需要懂AI,不需要有模型,它只需要站在流量的十字路口,收过路费就够了。英伟达和云厂商更不关心你的应用是否盈利,只要你在烧算力,它们就在赚钱。

三、夹缝里能活下来的,靠的是什么

既然做不了底层算力,也没法靠卖模型赚钱,大多数企业只剩一条路:把体验做厚。

5月,DeepSeek计划首轮融资500亿元,月之暗面总融资额超376亿元。腾讯把AI嵌进微信和腾讯文档这些高频场景,一季度资本开支319.4亿元,全部砸向算力和生态。智谱AI则靠GLM-5.1高速版API的极致速度,在市场里咬住一块份额。

这几家的打法各不相同,但有一点是共同的:它们没有在通用模型上死磕,而是在某个具体场景里做到别人替代不了。

通用大模型的终局,大概率是少数几个巨头的游戏。对大多数企业来说,与其想着在模型层胜出,不如想清楚:你掌握什么数据,你的用户有什么别处得不到的东西,你能不能用AI把这些连起来。

腾讯的案例其实挺典型。微信的社交关系链、支付、服务生态,本来就是稀缺的。AI做的事,是把这些东西连得更紧、用起来更顺。模型本身倒是其次,没人因为腾讯用了哪家的模型而留在微信里。

结语

不要把时代赋予的红利,错当成自己的战略。

现在的局面挺清晰:一边是免费、同质化的模型,一边是昂贵、集中的算力。中间是大多数企业的生存空间,这个空间越来越窄。

三条建议,没有废话:

一,停止押注通用大模型。 把企业自己的数据和业务流程翻出来,做专属Agent。能解决一个微小问题也行,做深了就是护城河。

二,把产品里的AI伪功能砍掉。 用AI Native的方式重构交互,只留下能提升效率的部分。用户为结果付钱,不为参数付钱。

三,用好免费API,把省下来的钱投进用户增长和留存。 GPT-5.5、Gemini 3.5这些低价甚至免费的API,已经足够用了。现在流量运营能力比算法能力值钱。