事情是这样的。
昨天晚上,6月1日,我刷到一条消息,当时就没绷住。
Agnes AI,一家全球排名前十的AI实验室,把他们的全模态API,无限期免费开放了。
不是限时不限量,不是新用户送额度,是无限期免费。
文本、图像、视频,三个模态,一次性全放开。
我盯着屏幕看了好一会。
先说说Agnes AI是谁。
可能很多人没听过这个名字,正常,这家实验室不算高调,但实力摆在那。
全球AI Lab排名,他们排第九。
文本模型Agnes-2.0-Flash,上了Claw-Eval榜单。图像模型Agnes-Image-2.0-Flash,进了Artificial Analysis的Image Editing Leaderboard。视频模型Agnes-Video-V2.0,也上了Artificial Analysis的Image to Video榜,还带音频。
三个模型,各自都在国际权威榜单上有名有姓。
不是那种跑出来刷榜的野鸡实验室,是真刀真枪在全球前十待着的。
结果就是这样一个玩家,突然把全模态API免费了。
全模态API到底是个什么东西,为什么这事值得专门写一篇,我来试着说清楚。
以前你接AI能力,文本归文本,图像归图像,视频归视频,三个API要分别对接,分别计费,分别管理调用逻辑。
开发者做一个人机交互的应用,要先调文本模型理解意图,再调图像模型生成配图,再调视频模型做内容输出,三套API Key,三套错误处理,三套计费账单。
全模态API的意思,一套接口,文本图像视频全跑通。
不是简单的把三个模型塞一个文件夹里打包,是真正在同一个语义空间里,文本推理、图像生成、视频合成可以串联、可以交错、可以同一个上下文里连续完成。
举个具体场景。
你做一个AI旅行助手,用户说,帮我规划一下杭州三日游,要小众一点的,最好附上每个景点的实景参考图,最后给我剪一个15秒的短视频预览。
以前这件事要拆成三块来做,文本模型出行程规划,图像模型根据每个景点生成配图,视频模型再把配图和文字合成预览视频,三块之间还要做状态同步和错误处理。
全模态API下面,这一个请求可以在同一个上下文里连续完成,文本规划出来了直接喂给图像生成,图像生成完了直接喂给视频合成,中间不需要人工把输出拷来拷去。
这才是全模态的真正价值,不是三个模型打包卖,是三个模态在同一个智能体工作流里协同。
然后最狠的地方来了。
免费。
无限期。
这件事在2026年的今天,冲击力比很多人想象的要大。
我来解释为什么。
2025年到2026年,AI行业发生了一件事,大家可能都有体感,就是Token越来越贵,或者说,用起来越来越心疼。
Claude API按Token计费,跑一个大项目,账单出来几千刀,跟割肉一样。GPT-4o的API,图像生成按张收费,做内容创作的人,每次点生成之前都要犹豫一下,这张能不能用,不能用的话钱就白花了。
视频生成更夸张,一秒钟多少钱,跑出来四秒钟的预览片,钱包先瘦了一圈。
所以2026年上半年,AI圈其实出现了一个词,叫Token焦虑。
不是AI不够强,是用不起。
个人开发者做Side Project,还没等验证产品方向,先被API账单劝退了。大学生想做个AI小工具练手,一看文档里面的定价页,关掉网页去刷题考公了。
做内容创作的自媒体,想用AI生成配图配视频提升效率,算了一下月度开销,还是打开了Canva手动改。
Agnes AI这个时候把全模态API免费了,等于在大家都在绞尽脑汁怎么省Token的时候,有人直接在高速公路上宣布,这条路以后不收费了。
我也是半信半疑的去试了一下。
登录platform.agnes-ai.com,注册,创建API Key,整个流程大概两分钟。
然后我拿了一个真实场景去测。
我让Agnes-2.0-Flash帮我生成一个可交互的地图App原型,要把某个城市的咖啡店数据可视化,支持按评分筛选,点击弹出详情卡片。
以前这件事,我要么自己写前端代码折腾半天,要么让Claude帮我写,但Claude出完代码我还要自己调试、装依赖、跑本地服务器。
Agnes-2.0-Flash直接出了完整可运行的HTML文件,包含CSS和JavaScript,下载下来用浏览器打开,功能完整,交互流畅,地图渲染用的是Leaflet,数据点加载正常,筛选逻辑也没问题。
我看完代码,心里一个念头冒出来。
这玩意如果一直免费,前端工程师的部分工作,确实在被重新定义。
不是AI替代人类那种陈词滥调,是具体的一件事,以前可能要花半天折腾,现在两分钟出结果,而且出来的质量,能直接拿去给客户演示。
然后我测了图像模型。
Agnes-Image-2.0-Flash,我给的Prompt是,赛博朋克风格的城市夜景,中文霓虹灯招牌写着AI时代,街道上有无人驾驶出租车驶过,画面要有景深,近处有一个机器人坐在路边摊吃面。
出来的图,我就不贴在这里了,省得你们觉得我收了钱。
我只说一点,指令遵循的准确度,比我之前测过的很多收费图像API要强。
中文霓虹灯招牌写着某某文字这个需求,一半以上的图像模型会直接忽略,或者生成乱码一样的伪汉字。Agnes-Image-2.0-Flash生成的霓虹灯招牌,AI时代四个字,是正确的简体中文,笔画没问题,甚至霓虹灯管的光晕效果都处理了。
这件事说小很小,说大很大。
AI生成图像能不能正确处理中文,背后是训练数据的语言覆盖问题。能搞定这个,说明他们的训练数据里,中文语料的占比和质量,是认真做了工作的。
不是那种拿英文模型汉化一下的半成品。
视频模型我也测了。
Agnes-Video-V2.0,我给的剧本是,一个龙族苏醒的片段,15秒,史诗风格,要有烟雾、有鳞片反光、有低沉的背景音效。
生成出来的视频,15秒,带音频,音画同步。
龙鳞反光的物理渲染,说顶尖肯定算不上,但放在2026年6月的今天,这个质量的视频生成,如果是在别的平台,我大概率要付钱,可能还不便宜。
它现在是免费的一部分。
我在测的过程中,脑子里一直在转一个念头。
他们图什么。
全球前十的AI实验室,三个模态的模型同时开放免费API,服务器成本、推理成本、带宽成本,这都是真金白银花出去的。
不可能永远免费,这个道理大家都懂。
但正是这个不可能永远,让这件事变得特别有意思。
Agnes AI不是慈善机构,免费开放全模态API,底层逻辑跟当年Google开放Android是一样的,先把生态占位做起来,让尽可能多的开发者和创作者的第一行的AI代码跑在他们的接口上,等生态长成了,收费的抓手多得是。
但这恰恰是这件事最值得关注的地方。
AI能力的基础设施化,正在以超出很多人预期的速度发生。
2026年之前,大家还在讨论AI能力的壁垒在哪里,2026年过了不到一半,已经有人在把全模态能力当公共基础设施来铺了。
把视角拉远一点,这件事拆开来看,味道就出来了。
对开发者来说,Token焦虑暂时缓解了一个口子。
不是所有AI能力都免费了,但Agnes AI这个口子一开,别的实验室面临的压力会变大。
你免费,我是不是也要跟?你不跟,开发者流量就往你竞争对手那边跑。
这种一石激起千层浪的效应,在AI行业不是第一次发生。2024年GPT-4o发布的时候,多模态能力突然免费开放了一段时期,直接把一大批收费多模态API的产品打懵了。
现在Agnes AI干的事,规模更大,是全模态,是无限期,是三个模型一起放。
对AI应用生态来说,一批之前被成本卡住的项目,现在有可能跑起来了。
我举个例子。
一个做教育内容的小团队,之前想做AI自动生成知识点讲解视频的功能,脚本都写好了,一算API成本,生成一分钟的视频要花X块钱,如果每天有几千个学生在用,这个成本小团队根本扛不住。
现在这个团队可以把Agnes-Video-V2.0接进去,成本这一步先去掉,先把产品跑起来,先让用户用起来,先让数据转起来。
产品活下来了,才有资格谈以后。
这种先让产品活下来的意义,很多人可能没有体感,但做过Side Project的开发者都懂,一个好的API免费政策,救活的不只是一个项目,是一批本来应该存在但被成本掐死在摇篮里的想法。
第三层,对国内AI圈来说,这件事有一个很微妙的对比效应。
Agnes AI这家实验室,名字听起来不像国内的,但他们的模型对中文的处理质量,我实测下来是认真的。
这时候就会出现一种很微妙的声音,为什么不是国内实验室第一个做这件事。
这个问题我没有答案,我也不打算在这篇文章里展开讨论。
我只说一个观察。
2026年,中国AI的使用量、调用量、开发者规模,在全球都是靠前的。我们在应用层、在落地层、在让AI真正被普通人用起来这个维度上,有很多做得非常出色的地方。
但基础设施层的免费开放这件事,目前看起来,还是海外实验室走在了前面。
这事值得想一想。
写到这,我想起来一件事。
大概两个月前,我写了一篇关于面壁智能ForgeTrain的文章,讲的是AI自己写训练框架这件事。
当时写完,有人在后台留言,说,卡兹克你有没有发现,我们现在讨论AI的姿势,跟2010年前后大家讨论移动互联网的姿势,其实很像。
我看完这条留言,想了很久。
2010年,大家在讨论的是,智能手机会不会普及,APP Store能不能赚到钱,移动端的体验跟PC比差这么多,谁会用。
2026年,大家在讨论的是,AI会不会替代我的工作,大模型能不能免费,Agent能不能真正跑起来。
两个问题,问的是同一件事。
技术在变,人在问的问题,好像一直没变。
回到Agnes AI这件事。
我不会告诉你赶快去接他们的API,再不接就晚了这种话,因为我自己也不知道他们的免费政策会持续多久,也不知道服务的稳定性怎么样,更不知道以后如果收费的话定价会是什么样的。
这些信息,需要时间给出答案。
但有一件事,我觉得是值得现在就想一想的。
AI能力的获取成本,正在发生结构性的变化。
不是线性下降,是阶跃式的。
一个全球前十的AI实验室,把全模态API免费了,这件事本身会倒逼整个行业重新审视自己的定价策略,会倒逼更多的实验室把让开发者先用起来放在先从开发者身上赚钱前面。
这种倒逼,对每一个想用AI做点什么的人来说,都是好事。
最后一个想法。
我有时候在想,2026年再过几年回头看,大家会怎么描述这个时代。
可能不会是那个AI替代了很多工作的时代,可能也不会是那个大模型变得越来越聪明的时代。
更有可能是,那个AI能力变成水和电的时代。
你打开水龙头,水就出来了。你按下开关,灯就亮了。
你写一个Prompt,AI就帮你把文本、图像、视频全部生成好了。
这件事在发生,Agnes AI的免费全模态API,是朝这个方向走的其中一步。
是很大的一步,还是很小的一步,我现在也说不准。
但方向是清楚的。
测完三个模型,关掉平台页面,我坐在电脑前又想了一会。
做AI公众号做了三年,看了无数产品的发布和关闭,看了无数API的开放和收费,有一个感受越来越清晰。
每一次免费的出现,短期看是价格战,长期看是在重新定义什么是基础设施。
2010年,大家觉得智能手机是奢侈品。2026年的今天,智能手机是日用品。
2026年,大家觉得AI能力是专业工具。不知道哪一年,也会变成日用品。
Agnes AI这一步,是在往那个方向推了一把。
至于推了多远,要看后面有没有人跟。
以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~
谢谢你看我的文章,我们,下次再见。
