AI使用成本上升,Agnes AI带来免费契机
过去一年,真正使用AI的人都感受到AI使用成本越来越高。以前每月20美元的订阅可能都花不完,但随着agent和vibe coding流行,token消耗如流水,一个coding agent运行一下午,账单金额就会不断增加。于是,人们开始精打细算,很多想法因担心token消耗而被搁置。AI本应助力创造,如今却成了需按表计费、能省则省的事。
然而,有一家名为Agnes AI的初创团队带来了转机。6月1号,该团队将旗下文本、图片、视频三个模型的API token全部免费。消息发布后,几天内十几个群被挤爆。免费后的第一周内,Agnes - 2.0 - Flash的调用量飙升超过1万亿Token;Agnes - Image - 2.1 - flash生成了超过200万张图片;Agnes - Video - 2.0产出了超过200万秒的视频。最初涌入的几乎全是极客,随后群里的使用场景变得丰富多样,有人用其生成几分钟长的视频,有人配上工作流制作整套素材,还有人将女儿成长片段剪成短片并配上AI旁白。
模型性能与成本优势
很多人质疑免费模型的性能,认为价格高的模型才好,价格低或免费的模型性能不行。但实际上,DeepSeek价格便宜,在很多指标上不亚于更贵的模型。Agnes AI的模型虽免费,但性能不妥协。其文本模型在一些agentic场景中,如PinchBench和ClawEval,处于全球Lab前十;图片和视频模型在Artificial Analysis全球最权威的盲评榜单上,也位列全球前十AI Lab。模型还在不断优化,本月会更新一版,之后可能每月更新。
在成本方面,Agnes AI的模型也具有优势。免费前,文本模型输入token是0.15美元每百万,约为GPT和Anthropic的1/100,比DeepSeek的flash版便宜一半;图片每1000张3美元,即0.003美元一张;视频实际成本每分钟约0.3美元,每秒大致一分钱人民币,约为市场头部模型报价的1/100。现在免费使用,仅稍微限制QPS和RPM,每分钟可request 20次,正常个人开发者用量足够。
多模态模型协同与发展愿景
与多数公司只在单一模型形态发力不同,Agnes AI将文字、图片、视频三个模态一起做并全部免费。这主要有两个原因:一是从真实使用需求出发,很多一人公司、小作坊配置不同公司的接口有挑战,整合在一起可降低使用成本和门槛;二是训练之间有协同,多模态理解文本模型能支持图片和视频生成,多模态场景生成的新数据对进一步训练有帮助。
Agnes AI团队希望实现更广度的AGI,让最广泛的用户在最大的场景中使用AI。他们虽不是每个模型都最强,但保持在前列,不落后一个代际,希望模型能力相辅相成、共同进步,建立生态以促进自身发展、了解市场需求和降低使用门槛。
免费策略的商业思考与挑战
Agnes AI免费策略带来了大量用户,也引发了一些问题。用户帮助团队找到了产品问题,发掘了新场景,如用户用自己的harness和skills生成几分钟的视频。但也有人担心出现二道贩子,团队通过限制RPM来应对,对企业用户未来可能采用收费模式。
在成本控制上,Agnes AI做的是优化问题,限制条件与主流公司不同。他们不做200B以上的模型,只优化200B以内的,重点押注agent和coding。此外,他们还尝试通过循环调用Transformer的层来逼近更大模型的效果。图片和视频模型则注重数据获取和训练的know - how。
关于商业思考,Agnes AI希望达到OpenRouter第一名两倍的规模,目前团队规模与OpenRouter排名第一的模型相当,主要面向个人消费者。商业化路径包括企业用户、推出自己的harness产品以及对用量大的极客小范围收费。
AI平权的愿景与实践
Agnes AI创始人Bruce Yang有让AI平权的情结。他出身四线城市,凭借奖学金获得良好教育。他认为AI现在因成本问题变得不平权,很多有创意的人因token消耗不敢大规模使用。他希望通过免费让AI成为平权的能力,让每个人都能借AI创造更多。
此外,Agnes AI还积极开源,不仅开源参数,还开源方法,希望证明自身创新能力,回馈开源社区。他们认为普通人应尽早拥抱AI,利用免费资源大胆尝试,全面理解AI,适应新时代的AI平权。团队还将分享大量场景和案例,帮助大家无门槛上手。