news 2026/6/7 9:33:47

RSI火了!AI递归自我改进引行业狂欢,国内厂商已悄悄摸到边?

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
RSI火了!AI递归自我改进引行业狂欢,国内厂商已悄悄摸到边?

RSI突然在AI圈火了

“递归”这个词,最近在AI圈子里突然火了。两家初创公司直接将其作为公司名,许多实验室在路线图里加入了RSI(递归的英文名recursive self - improvement,即递归式自我改进)。像AGI一样,RSI正成为一个让人既兴奋又忐忑的行业暗号,尽管大家对它的定义还未完全统一。

什么是RSI

简单来说,RSI就是让AI自己训练自己。在技术界,RSI一直被视为人工智能进步的主要标志之一,与记忆、推理和多模态并列,唯一的限制是算力,人类在其中并非必要条件,甚至连帮手都算不上。

AI行业的狂热与RSI的可能狂欢

这并非AI行业的第一次狂热。从2016年的AlphaGo到2023年的ChatGPT,再到如今各家大模型参数军备竞赛,AI行业的天性就是追逐下一个“改变一切”的东西。在雷科技AGI(ID:leikejiagi)看来,RSI可能就是下一场狂欢。

RSI相关案例

今年5月,AI界知名研究员Richard Socher创办了一家叫Recursive Superintelligence的新公司,名字直接就是RSI。他表示:“我们的核心目标是构建真正意义上的递归自我改进超级智能,整个研究的构思、实现和验证过程,全部自动完成。”

另一个案例是安德烈·卡帕西(Andrej Karpathy)推进的Auto - Research项目,用智能体集群来训练语言模型,让模型自己做简单的研究任务并改进自己。安德烈·卡帕西是传奇人物,他在特斯拉做自动驾驶、在OpenAI做GPT都有出色成果。现在他全力投入RSI,且以公开透明的方式推进,还定期在推特上更新进展,代码也在GitHub公开。不过他也表示目前工作还是在GPT - 2级别的小模型上迭代,“还不是什么突破性研究(暂时)”,但已带动大批研究者跟进。

安德烈·卡帕西最近加入了Anthropic的预训练团队。Anthropic有Claude,卡帕西有auto - research方法论,两者结合,大模型 + 自训练循环若跑通,就不是GPT - 2级别的小打小闹了。

另一家叫Adaption的公司推出了AutoScientist工具,目标是自动化前沿模型的训练过程,逻辑与安德烈·卡帕西的auto - researchers一样,训练agent做渐进式改进,且Adaption野心更大,想直接搞定全尺寸前沿模型的训练闭环。这两家代表了两种路线:安德烈·卡帕西从底层逐块验证,开源并在社区攒势能;Adaption直接冲着商业化的大模型训练场景去,落地意愿更强。两条路谁先跑通,对行业影响不同。

AI圈大佬对RSI的看法

Google CEO桑达尔·皮查伊上个月在一档播客里谨慎承认:“(RSI)是一个连续体,我们确实都在进步。但如果按照大家描述RSI的方式,那代表的是下一个量级的加速,会有很多影响,但我们还没到那一步。”

今年1月,Anthropic一位主导Claude Code开发的程序员称,团队里接近100%的代码是Claude Code写的,这是AI在写自己。Anthropic关于Mythos预览版本的内部调查显示,18位工程师里,有5位认为,若配套系统改进,这个版本的Mythos可替代一个L4工程师。但Claude也有弱点,它在自我驱动方面较弱,而自我驱动是RSI的根基。

Georgetown安全与新兴技术研究中心(CSET)去年组织专家研究RSI,专家评估出现分裂,一部分人预期“超级智能爆炸”,另一部分人预期进展慢且会触达瓶颈期。但他们共识是:递归让未来难以预测。METR研究员Ajeya Cotra将RSI进程拆解成几个里程碑,第一级“足够”是把人类完全移除后系统仍能做研究;第二级“对等”是AI独立完成的研究和人类独立完成的研究质量相当;第三级“超越”是AI独立系统表现超过人类与AI协作的系统。Ajeya Cotra判断我们离第一级很近,但第二级何时到来未给时间表,不过她推演一旦第二级到来,后续加速会远超以往。

国内厂商与RSI

国内厂商很少公开喊RSI,但在让AI自己改进自己方面,其实已在不同路径上悄悄摸到边。比如DeepSeek,花钱比OpenAI少一个数量级,在很多推理任务上能正面竞争,靠的是算法效率的极致优化。百度文心用强化学习驱动模型自我优化,虽未用RSI之名,但做的是同一件事。不过,OpenAI和Anthropic的人才密度目前国内厂商比不了,国内在RSI探索上仍处于跟随状态。但历史经验显示,国内厂商在路径明确后的追赶速度惊人,一旦可复现路径走通,国内玩家的成本控制能力和落地场景密度会是被低估的变量。

RSI面临的问题

事实上,AI自己生成的数据用于训练下一版AI,质量会下降。RSI逻辑是AI生成好数据训练下一代AI使其更强,但实际可能相反,AI生成的数据会混入幻觉、偏见等,循环几代后系统会塌,这叫模型坍缩,已有论文验证。此外,RSI需要无限算力和全球开放协作的研究生态,但现实中训练前沿模型成本高,芯片产能、能源、优质数据有限,出口管制和技术脱钩使AI研究圈子不流通,基础条件难以满足。

行业发展的观察

整个行业过去五年,先是大规模预训练让人陷入“参数崇拜”,接着RLHF让人相信“价值观可以微调”,现在RSI讲“机器自己跑完整个研发链条”的故事。每一步都让人类在决策链条中往后退,这种退法不一定是坏事,但不可逆。一旦环节被自动化接管,人的直觉、经验、判断力会退化,到那时,我们可能都无法真正理解工具是如何造出来的。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/7 9:33:40

Linux内核学习轨迹第五部:进程地址空间与虚拟内存管理(第六小节)

进程地址空间与虚拟内存管理进程地址空间是Linux虚拟内存模型的核心载体,它为每个用户态进程提供了独立、连续、私有的虚拟地址空间,彻底隔离了不同进程的内存访问,同时通过页表映射实现了物理内存的复用与高效管理。我们日常使用的malloc/fr…

作者头像 李华
网站建设 2026/6/7 9:25:51

避开Tableau分析常见坑:用超市数据教你正确设置计算字段和预测模型

Tableau实战避坑指南:超市数据分析中的计算字段与预测模型优化超市运营数据看似简单,但真正用Tableau分析时,90%的初学者会在计算字段和预测模型上栽跟头。上周帮某零售企业做数据诊断时,发现他们用错了一个简单的日期计算&#x…

作者头像 李华
网站建设 2026/6/7 9:11:18

告别硬件SPI资源紧张:用GPIO模拟SPI驱动ADS8684的避坑指南与性能实测

告别硬件SPI资源紧张:用GPIO模拟SPI驱动ADS8684的避坑指南与性能实测在嵌入式系统开发中,SPI接口资源紧张是许多工程师面临的共同挑战。当主控芯片的硬件SPI接口被其他关键外设占用,或者PCB布局限制了硬件SPI引脚的使用时,软件模拟…

作者头像 李华