RSI火了！AI递归自我改进引行业狂欢，国内厂商已悄悄摸到边？-Seo优化-塔城地区网站建设公司

RSI突然在AI圈火了

“递归”这个词，最近在AI圈子里突然火了。两家初创公司直接将其作为公司名，许多实验室在路线图里加入了RSI（递归的英文名recursive self - improvement，即递归式自我改进）。像AGI一样，RSI正成为一个让人既兴奋又忐忑的行业暗号，尽管大家对它的定义还未完全统一。

什么是RSI

简单来说，RSI就是让AI自己训练自己。在技术界，RSI一直被视为人工智能进步的主要标志之一，与记忆、推理和多模态并列，唯一的限制是算力，人类在其中并非必要条件，甚至连帮手都算不上。

AI行业的狂热与RSI的可能狂欢

这并非AI行业的第一次狂热。从2016年的AlphaGo到2023年的ChatGPT，再到如今各家大模型参数军备竞赛，AI行业的天性就是追逐下一个“改变一切”的东西。在雷科技AGI（ID：leikejiagi）看来，RSI可能就是下一场狂欢。

RSI相关案例

今年5月，AI界知名研究员Richard Socher创办了一家叫Recursive Superintelligence的新公司，名字直接就是RSI。他表示：“我们的核心目标是构建真正意义上的递归自我改进超级智能，整个研究的构思、实现和验证过程，全部自动完成。”

另一个案例是安德烈·卡帕西（Andrej Karpathy）推进的Auto - Research项目，用智能体集群来训练语言模型，让模型自己做简单的研究任务并改进自己。安德烈·卡帕西是传奇人物，他在特斯拉做自动驾驶、在OpenAI做GPT都有出色成果。现在他全力投入RSI，且以公开透明的方式推进，还定期在推特上更新进展，代码也在GitHub公开。不过他也表示目前工作还是在GPT - 2级别的小模型上迭代，“还不是什么突破性研究（暂时）”，但已带动大批研究者跟进。

安德烈·卡帕西最近加入了Anthropic的预训练团队。Anthropic有Claude，卡帕西有auto - research方法论，两者结合，大模型 + 自训练循环若跑通，就不是GPT - 2级别的小打小闹了。

另一家叫Adaption的公司推出了AutoScientist工具，目标是自动化前沿模型的训练过程，逻辑与安德烈·卡帕西的auto - researchers一样，训练agent做渐进式改进，且Adaption野心更大，想直接搞定全尺寸前沿模型的训练闭环。这两家代表了两种路线：安德烈·卡帕西从底层逐块验证，开源并在社区攒势能；Adaption直接冲着商业化的大模型训练场景去，落地意愿更强。两条路谁先跑通，对行业影响不同。

AI圈大佬对RSI的看法

Google CEO桑达尔·皮查伊上个月在一档播客里谨慎承认：“（RSI）是一个连续体，我们确实都在进步。但如果按照大家描述RSI的方式，那代表的是下一个量级的加速，会有很多影响，但我们还没到那一步。”

今年1月，Anthropic一位主导Claude Code开发的程序员称，团队里接近100%的代码是Claude Code写的，这是AI在写自己。Anthropic关于Mythos预览版本的内部调查显示，18位工程师里，有5位认为，若配套系统改进，这个版本的Mythos可替代一个L4工程师。但Claude也有弱点，它在自我驱动方面较弱，而自我驱动是RSI的根基。

Georgetown安全与新兴技术研究中心（CSET）去年组织专家研究RSI，专家评估出现分裂，一部分人预期“超级智能爆炸”，另一部分人预期进展慢且会触达瓶颈期。但他们共识是：递归让未来难以预测。METR研究员Ajeya Cotra将RSI进程拆解成几个里程碑，第一级“足够”是把人类完全移除后系统仍能做研究；第二级“对等”是AI独立完成的研究和人类独立完成的研究质量相当；第三级“超越”是AI独立系统表现超过人类与AI协作的系统。Ajeya Cotra判断我们离第一级很近，但第二级何时到来未给时间表，不过她推演一旦第二级到来，后续加速会远超以往。

国内厂商与RSI

国内厂商很少公开喊RSI，但在让AI自己改进自己方面，其实已在不同路径上悄悄摸到边。比如DeepSeek，花钱比OpenAI少一个数量级，在很多推理任务上能正面竞争，靠的是算法效率的极致优化。百度文心用强化学习驱动模型自我优化，虽未用RSI之名，但做的是同一件事。不过，OpenAI和Anthropic的人才密度目前国内厂商比不了，国内在RSI探索上仍处于跟随状态。但历史经验显示，国内厂商在路径明确后的追赶速度惊人，一旦可复现路径走通，国内玩家的成本控制能力和落地场景密度会是被低估的变量。

RSI面临的问题

事实上，AI自己生成的数据用于训练下一版AI，质量会下降。RSI逻辑是AI生成好数据训练下一代AI使其更强，但实际可能相反，AI生成的数据会混入幻觉、偏见等，循环几代后系统会塌，这叫模型坍缩，已有论文验证。此外，RSI需要无限算力和全球开放协作的研究生态，但现实中训练前沿模型成本高，芯片产能、能源、优质数据有限，出口管制和技术脱钩使AI研究圈子不流通，基础条件难以满足。

行业发展的观察

整个行业过去五年，先是大规模预训练让人陷入“参数崇拜”，接着RLHF让人相信“价值观可以微调”，现在RSI讲“机器自己跑完整个研发链条”的故事。每一步都让人类在决策链条中往后退，这种退法不一定是坏事，但不可逆。一旦环节被自动化接管，人的直觉、经验、判断力会退化，到那时，我们可能都无法真正理解工具是如何造出来的。