算力黑洞：当AI模型沦为公共品，真正的暴利藏在哪里？

2026年5月，OpenAI把GPT-5.5 Instant设成了ChatGPT的默认免费模型。几乎同一周，谷歌在I/O大会上把那个统治了25年的搜索框，改成了AI智能体的任务入口。

这两件事放在一起，意味着一个拐点到了。

不是技术的拐点，是商业逻辑的拐点。当最顶尖的模型开始免费，靠卖API权限赚钱这条路，基本走到头了。AI的下半场，竞争焦点转向了两件事：算力，和入口。

一、免费是最强的壁垒

5月的这波发布潮，没有涨价，全是降价或免费。

OpenAI的GPT-5.5 Instant主打速度和多模态，直接对所有用户免费开放。谷歌推出Gemini 3.5系列，顺带发布了全天候AI助手Spark。百度财报会上，李彦宏说了一句意味深长的话：AI进入了下半场，评判标准不再是模型参数，而是DAU。

这背后的逻辑其实不难理解。当模型能力趋同，当训练成本的边际递减越来越快，单纯卖调用权限的生意就撑不住了。收费的那家，用户直接跑去用免费的。于是大家都免费，用免费本身来筑壁垒——你想超越我，先在用户习惯上赢过我再说。

竞争焦点因此从”谁的模型更聪明”，转移到了”谁先占住用户每天打开的那个入口”。谷歌动搜索框，不是因为它觉得搜索框有问题，而是它很清楚：如果它不动，别人会替它动。

基础模型的闭源收费时代，到这里差不多结束了。大模型正在往水电的方向走——便宜、普遍、没有什么特别的差异化。

应用层热闹，底层跟着受益，这个逻辑在2026年的财报季里说得很清楚。

英伟达在5月批准了超1000亿美元的股票回购计划，现金流宽裕到连传统行业都眼红。阿里巴巴宣布未来算力资产扩增十倍，背后是AI相关产品收入连续11个季度三位数增长这个硬需求。B站这个没有自研大模型的视频平台，靠承接AI公司的广告，一个季度AI广告收入暴涨了170%。

百度李彦宏提出的”日抛软件”概念，现在真的在发生。AI大幅拉低了软件开发门槛，应用数量在爆发。每一个应用，每一次Agent跑任务，都在消耗Token和算力。需求越大，底层的议价权越高。

B站的案例有点讽刺，但很说明问题。它不需要懂AI，不需要有模型，它只需要站在流量的十字路口，收过路费就够了。英伟达和云厂商更不关心你的应用是否盈利，只要你在烧算力，它们就在赚钱。

既然做不了底层算力，也没法靠卖模型赚钱，大多数企业只剩一条路：把体验做厚。

5月，DeepSeek计划首轮融资500亿元，月之暗面总融资额超376亿元。腾讯把AI嵌进微信和腾讯文档这些高频场景，一季度资本开支319.4亿元，全部砸向算力和生态。智谱AI则靠GLM-5.1高速版API的极致速度，在市场里咬住一块份额。

这几家的打法各不相同，但有一点是共同的：它们没有在通用模型上死磕，而是在某个具体场景里做到别人替代不了。

通用大模型的终局，大概率是少数几个巨头的游戏。对大多数企业来说，与其想着在模型层胜出，不如想清楚：你掌握什么数据，你的用户有什么别处得不到的东西，你能不能用AI把这些连起来。

腾讯的案例其实挺典型。微信的社交关系链、支付、服务生态，本来就是稀缺的。AI做的事，是把这些东西连得更紧、用起来更顺。模型本身倒是其次，没人因为腾讯用了哪家的模型而留在微信里。

不要把时代赋予的红利，错当成自己的战略。

现在的局面挺清晰：一边是免费、同质化的模型，一边是昂贵、集中的算力。中间是大多数企业的生存空间，这个空间越来越窄。

三条建议，没有废话：

一，停止押注通用大模型。 把企业自己的数据和业务流程翻出来，做专属Agent。能解决一个微小问题也行，做深了就是护城河。

二，把产品里的AI伪功能砍掉。 用AI Native的方式重构交互，只留下能提升效率的部分。用户为结果付钱，不为参数付钱。

三，用好免费API，把省下来的钱投进用户增长和留存。 GPT-5.5、Gemini 3.5这些低价甚至免费的API，已经足够用了。现在流量运营能力比算法能力值钱。