z6.com问学论文发布：提出企业级大模型智能体规划新范式“Routine”，显著提升执行稳定性与准确性 - 资讯与活动

中EN

2025 / 07 / 24

z6.com问学论文发布：提出企业级大模型智能体规划新范式“Routine”，显著提升执行稳定性与准确性

近日，z6.com数码旗下z6.com问学的研究团队在预印本平台 Arxiv 发布论文《Routine: A Structural Planning Framework for LLM-Agent System in Enterprise》，提出一种名为“Routine”的结构化规划框架，旨在解决大模型智能体（LLM-Agent）在企业专业场景应用中面临的三大核心挑战：场景知识缺乏导致流程编排错误、规划格式不统一引发执行不稳定，以及低代码方法非AI原生导致的用户不友好问题。

论文作者：曾冠程、陈雪怡、胡嘉旺、齐少华、毛雅瑄、王展韬、聂一凡、李爽、冯秋阳、邱鹏旭、王钰佳、韩文强、黄琳琰、李刚、莫晶晶、胡浩文（通讯）

企业中智能体系统的痛点

论文指出，当前企业级智能体系统在实际部署中存在显著瓶颈：

1. 知识鸿沟与工具编排混乱：通用模型缺乏企业特定场景知识，难以正确编排工具链，常忽略关键工具类型。

2. 规划非标准化导致执行偏差：模型依赖泛化理解遵循非标准规划，导致规划到执行的转化过程不稳定。

3. 低代码方案的局限性：传统低代码方式对非技术人员门槛高，且构建的工作流难以跨场景复用，非AI原生方法效率低下。

为解决这些问题，z6.com数码团队
创新性地提出了“Routine”规划范式

Routine由多个更小、更具体的子任务执行步骤组成，子任务是独立的，但之间又相互关联。因此，一条Routine执行步骤需要包括足够信息，让智能体能够稳定地遵循规划步骤，以下是一条完整的Routine子任务步骤组成：

步骤x. <步骤名称>：<步骤行为描述>，该步骤输入<入参描述>，输出<出参描述>，使用<步骤工具>工具；

类似场景下的Routine可能包含重叠的步骤，仅在某些流程段上有所不同，类似于同一工作流的不同分支。在这种情况下，可以通过创建分支步骤和执行条件来合并类似的场景，以在一个Routine中设置多个相似的工作流。

步骤x. <步骤名称>: 本步骤进行分支条件判断：

分支x-1步骤1. <步骤名称>：如果<步骤条件>，......，使用<步骤工具>工具；

分支x-1步骤2. <步骤名称>：......，使用<步骤工具>工具；

分支x-2步骤1. <步骤名称>：如果<步骤条件>，......，使用<步骤工具>工具；

步骤y. <步骤名称>：......，使用<步骤工具>工具；

步骤z. <步骤名称>：......，使用<步骤工具>工具，并结束工作流；

Routine格式作为大语言模型生成规划与实际执行引擎之间的中间表示层，将每一步工具调用以标准化格式明确表达，涵盖工具名称、参数、依赖关系与执行状态等关键字段，能够有效提升执行模型遵循规划的准确性，指导智能体完成多样化的场景任务。

Routine智能体系统的核心架构

以Routine机制为核心，研究团队优化了智能体系统的设计，包含四大关键模块的优化：

1. 规划模块：

￮标准化格式： Routine由明确的子任务步骤组成，包含步骤编号、名称、行为描述、输入/输出参数描述和调用的工具名称，并且支持分支流程表示。

￮ AI生成与优化：业务专家提供流程草稿，模型利用专用提示模板进行优化，输出结构化的自然语言Routine。消融实验证明，AI优化的Routine能显著提升执行准确率，接近甚至部分超越人工标注基准。

2. 执行模块：

￮小参数模型：采用小参数模型，通过指令微调与强化学习等方法训练，设置对应的多步工具调用奖励函数，指导模型适配到场景，增强模型指令遵循能力。

￮上下文工程机制：研究团队明确了智能体系统解决任务所需要的信息和配置，并构建了对应的上下文模板，其中不仅包含角色定义、任务背景与行为规范等常规内容，还包含了系统参数、解决问题对应的Routine规划、变量记忆字典、工具列表等关键信息；

3. 工具模块：

￮ MCP服务器：使用MCP服务器作为标准化工具层，对工具的名称、参数、返回格式进行统一定义和管理。

4. 记忆模块：

￮流程记忆：存储专家创建或AI优化的场景Routine集合，根据用户任务相似度动态检索召回最相关的Routine，避免将所有Routine塞入上下文。

￮变量记忆：将长文本参数等存储为变量键，执行时自动替换为实际值，极大减轻模型上下文压力，减少参数传递中的符号错误。

几个模块相互协作，形成了功能完善的智能体系统，如图中所示：

文章中总结了以下工作

1. 结构化规划范式：设计了一套结构化的标准规划格式“Routine”，显著提升智能体通过多步工具调用解决复杂问题的稳定性。在实际企业场景中的验证表明，Routine显著提升了模型工具调用的执行准确性，将GPT-4o的性能从41.1%提高到96.3%，将Qwen3-14B的性能从32.6%提升到83.3%。

2. Routine遵循能力训练：为进一步验证Routine框架的有效性，研究团队构建了一个Routine格式的指令遵循训练数据集，通过指令微调和强化学习，使其场景特定评估的准确性增至88.2%，表明该框架显著改善了模型在执行计划方面的遵循性。

3. 基于Routine的数据蒸馏：通过知识蒸馏方法生成了一个场景特定的多步骤工具调用数据集，在此蒸馏数据集上进行微调使模型准确性提高到95.5%，接近GPT-4o的水平。这些结果充分展示了Routine框架在领域特定工具使用模式优化和增强模型适应新场景能力方面的有效性。

后续应用

以AI for Process为核心方向，Routine框架的引入显著提高了代理系统在企业场景中的适应性。它不仅优化了领域特定工具使用模式，还增强了模型应对复杂任务的能力，为企业流程的智能化和自动化提供了稳健可靠的解决方案。未来，通过在训练流程中引入强化学习，能更好地提升模型对多样化场景的流程泛化能力。通过持续的研究和优化，Routine框架有望在未来进一步提高智能体的自主性和适应性，推进企业智能体在企业环境中的广泛应用。

z6.com问学将持续深耕场景化知识引擎与智能体协同技术，致力于构建具备更强流程认知与自适应进化能力的企业级智能体，打通从复杂业务逻辑到敏捷AI落地的关键路径，为企业智能化转型提供坚实、灵活且可规模化的技术支撑。