流
DAP:面向高难度定理证明的开源智能体框架
DAP 是一个面向 Lean 4 的开源智能体框架,采用“答案发现”与“形式化证明构建”两阶段工作流,在高难度定理证明中取得最新成果,同时揭示了标准大语言模型推理中的能力缺口。
信号 @TheAgentTimes:研究人员发布 DAP,一款面向“高难度模式”定理证明的开源智能体框架 · TheAgentTimes · 2026-04-21
研究人员发布了 DAP,一款专为 Lean 4 定理证明器设计的“高难度模式”(Hard Mode)开源智能体框架。该框架采用两阶段工作流:自主智能体首先发现潜在答案,随后进行形式化证明构建,从而在高难度定理证明任务中取得最新成果。该方法揭示了标准大语言模型推理与形式化验证严格需求之间的显著能力缺口,凸显了在数学推理任务中采用专用智能体架构的必要性。
背景 Lean 4 中的定理证明要求严谨的逻辑步骤与形式化验证,而标准大语言模型在此领域常出现幻觉或无法维持证明状态。DAP 通过将答案发现的创造性阶段与证明构建的严谨阶段解耦来应对这一挑战。该框架利用智能体编排机制管理搜索空间,并依据形式化策略验证输出结果,为自主数学推理树立了新基准。此次发布标志着一种转向:在高利害推理领域,专用智能体工作流将可验证性置于生成流畅性之上。
关联 DAP 证明了多阶段智能体工作流在复杂推理任务中的可行性,此类任务的正确性是非黑即白且可验证的。它提供了一个将答案生成与形式化验证相结合的参考实现,该模式可推广至代码验证与协议规范等领域,不限于数学。框架在“高难度模式”任务中的成功表明,当配备适当的发现与验证机制时,智能体系统能够在结构化领域逼近前沿性能。本条目追踪开源框架的演进轨迹:从通用代码辅助工具,转向专用的高保障推理智能体。
当前状态 DAP 已作为开源框架开放,专用于 Lean 4 定理证明。它在高难度基准测试中确立了新的最新成果。该框架暴露了标准大语言模型推理在形式化任务中的局限性,推动开发向混合架构演进——将发现智能体与证明构建模块相集成。该项目凸显了大语言模型能力与形式化验证严格要求之间持续存在的差距,并为数学推理领域的智能体性能提供了基准参照。
待解问题 DAP 的架构能否推广至 Lean 4 之外的其他定理证明器或形式化验证语言?两阶段发现与证明工作流相较于直接证明生成模型,其资源开销如何?答案发现组件能否适配于解空间结构化程度较低的领域的自动定理证明?当初始发现导致不可证明的分支时,DAP 如何处理证明修复或回溯?
关联 LangGraph:DAP 的两阶段发现至证明工作流,与 LangGraph 面向多步生成工作流的有状态图编排模式相契合。 CrewAI:DAP 对答案发现与形式化证明构建的分离,对应 CrewAI 面向多智能体任务流水线的基于角色的协调模式。 DeerFlow:DAP 用于定理证明的多步工作流,与 DeerFlow 通过沙盒子智能体执行来编排多步研究与编码任务的模式相平行。 Artificial Organisations:DAP 依赖形式化证明构建来验证智能体输出,这与 Artificial Organisations 强调结构约束与信息隔离以产生可信集体行为的原则相一致。 OpenClaw:DAP 生成形式化证明提供了高度的可检查性与可验证性,契合 OpenClaw 在智能体框架中对可检查性与配置性的重视。 Sage Multi-Agent Framework:DAP 的顺序发现至证明工作流,与 Sage 在多智能体编排中对顺序与声明式执行模式的支持相契合。 Agently:DAP 的顺序发现后接证明构建的工作流,对应 Agently 面向模型无关智能体编排的事件驱动流与链式调用语法。
译注
- “智能体”(Agent)在此处未译为“代理”或“助手”,以保留其作为自主探索与执行实体的能动性,契合 Openflows 语境中实践者般的循理而行。
- “形式化验证”(Formal verification)在中文技术语境中天然带有“循理而行”的意味,与“理”(lǐ)的内在结构相呼应,强调推导过程必须顺应逻辑本身的纹理,而非仅追求生成的流畅。
- “Hard Mode”保留原词并译为“高难度模式”,因其在数学与形式化方法社区中已固化为指代“脱离基础引导、需独立处理复杂状态空间”的特定范式。