给AI一个代码库，让它分饰两角死斗，诞生超越人类的编程奇迹

xw123333gg2025-12-271

要是能去设想一番，人工智能不但会去修复程序漏洞，甚至还能够主动地制造出连它自身都很难去解决的程序漏洞，这可是意味着软件自动化踏入到一种全新的阶段了。

_华人一作！Meta等复刻AlphaZero神话，AI甩开人类自修成神_华人一作！Meta等复刻AlphaZero神话，AI甩开人类自修成神

自我博弈的训练闭环

构建出一个独特训练场的是这种名为SSR的方法，AI于其中充当两个角色，一个角色是负责破坏，另一个角色是负责修复，它们在一个真实的代码库，像一个流行的Python库里面，展开循环对抗，这个过程并不需要人类持续去提供错误样本，AI凭借自己制造问题用来磨练解决问题的能力，进而形成了一个自我驱动的学习系统，这种自我博弈作为系统持续进化的核心动力，它脱离了对大量人工标注数据的依赖。

_华人一作！Meta等复刻AlphaZero神话，AI甩开人类自修成神_华人一作！Meta等复刻AlphaZero神话，AI甩开人类自修成神

破坏者的潜入与制造

AI若要扮演破坏者，那首先得理解目标代码库，它会认真细致地剖析该代码库中源代码的结构，以及其逻辑和数据流，从中找寻能够下手的关键节点，其目的绝非任意胡乱破坏，而是致力于制造出既隐蔽无形又合乎逻辑的缺陷，比如，它也许会在一个条件判断里悄悄偷偷地去修改运算符，又可在数据处理流程当中引入一种极其难以触发的边界情况，以此来确保Bug具备“质量”以及多样性，进而模拟出真实开发过程里会遭遇到的复杂问题。

严格的一致性验证

为防止AI于制造缺陷时生出无意义的“幻觉”，SSR设计了一套严谨的验证流程。该流程恰似机场安检，会核查所生成的缺陷是否契合代码的原本语义以及上下文逻辑。它会施行一系列检查，保障这个缺陷并非因随意插入字符或破坏语法所致，而是一个切实改变了程序行为、能够被测试捕捉到的合法瑕疵，进而确保后续训练的有效性。

修复者的侦探式挑战

遭遇极大挑战的修复者智能体，面对的是一个代码库，这个代码库已被植入Bug，并且部分测试可能被弱化了，它无从得悉原始Bug是怎样被注入的，恰似侦探面对一桩悬案，修复者必须凭借静态代码审查、动态运行测试、分析失败日志以及报错信息，一步步推断出问题的根源所在，并最终生成一个能够通过所有测试的修复补丁。

从失败中学习的循环

不是修复者的每次尝试都能够成功，有的时候，它提交的修复或许仅仅解决了一部分问题，甚至还引入了新的Bug，SSR系统会把此类“半成品”修复当作新的、更为复杂的Bug状态，再次投入训练循环，这样的机制使得AI不得不处理自身之前所犯下的错误，在不断反复试错里学习更稳健且更全面的修复策略，进而让能力边界持续拓展。

华人一作！Meta等复刻AlphaZero神话，AI甩开人类自修成神_华人一作！Meta等复刻AlphaZero神话，AI甩开人类自修成神_

超越人类数据的表现

研究团队把SSR模型跟运用传统人类数据开展训练的基准模型做了对比，人类数据一般源自GitHub上“问题描述+测试用例”的格式，实验结果表明，在长时间训练以后，SSR模型于代码修复任务方面的表现稳步超过基准，并且未曾出现过拟合，这证实，由AI自博弈产生的及难度渐进的“课程”或许比单纯模仿人类历史数据更具效率。

难道这一技术路径所蕴含的意义是，在未来去构建具备超强能力的编程AI之时，不再需要人类以亲手指导的方式去教导它，仅仅只需要为其提供一个能够让其进行自我博弈的“代码战场”就行？

华人一作！Meta等复刻AlphaZero神话，AI甩开人类自修成神__华人一作！Meta等复刻AlphaZero神话，AI甩开人类自修成神

Tags： AI 代码库自博弈编程奇迹软件工程

给AI一个代码库，让它分饰两角死斗，诞生超越人类的编程奇迹

相关推荐