网络优化网站建设学习,aspx网站架设,网站图片像素,适合ps新手兼职RPA暖阳脚本
近日#xff0c;来自清华大学的研究人员联合面壁智能、中国人民大学、MIT、CMU 等机构共同发布了新一代流程自动化范式 “智能体流程自动化” Agentic Process Automation#xff08;APA#xff09;#xff0c;结合大模型智能体帮助人类进行工作流构建#x…RPA暖阳脚本
近日来自清华大学的研究人员联合面壁智能、中国人民大学、MIT、CMU 等机构共同发布了新一代流程自动化范式 “智能体流程自动化” Agentic Process AutomationAPA结合大模型智能体帮助人类进行工作流构建并让智能体自主处理工作流中涉及复杂决策与动态处理的环节进一步提升自动化的程度提高效率将人类从繁重的劳动中解放出来。
在历史的长河中自动化是人类技术发展的主要动力帮助人类从复杂、危险、繁琐的劳动环境中解放出来。自早期农业时代的水车灌溉到工业时代的蒸汽机人类一直在不断寻求更加先进的自动化技术从而解放自身于繁重的工作。
随着信息时代的到来软件作为信息处理、存储和通信的基础成为了人类生产生活密不可分的一环从而催成了机器人流程自动化Robotic Process Automation, RPA技术。其通过人工编制规则将多个软件协调成一个固化的工作流Workflow通过模拟人交互的方式来和软件交互实现高效执行。
图 1 机器人流程自动化 RPA 与智能体流程自动化 APA 对比
RPA 利用软件机器人或称为 “BOT” 来模拟和执行重复性、规则性的任务从而解放人力资源提高工作效率。RPA 的应用范围非常广泛。很多企业包括银行、保险公司、制造业、零售业等各个行业常利用 RPA 机器人来自动执行一些常规和繁琐的任务例如数据录入、数据提取、数据处理。通过自动化任务RPA 可以大幅度减少错误率并且能够在 24*7 不间断地执行任务从而提高了业务的可靠性和响应能力。
根据市场研究RPA 市场正在迅速增长并取得巨大成功。Gartner 预测2023 年全球 RPA 市场收入将达到 33 亿美元相比 2022 年增长 17.5%。这表明了企业对于 RPA 的强烈需求和认可。
但是RPA 仅能替代简单、机械的人力工作一些复杂的流程仍旧依赖人工
编写 RPA 工作流本身需要繁重的人类劳动成本较高。
复杂任务非常灵活通常涉及动态决策难以固化为规则进行表示。
图 2 RPA 与 APA 的效率与智能对比
幸运的是最近 AI 领域兴起的大模型智能体技术Large Language Model based Agents, LLM-based Agents也许给自动化技术创造了新的可能性。有没有可能将 Agent 技术的灵活性引入到 RPA 领域中来进一步减少人的参与呢
该团队的研究探讨了大模型智能体时代下新型自动化范式 “智能体流程自动化” Agentic Process Automation (APA)。和传统 RPA 相比在 APA 范式中Agent 可以根据人类的需求自主完成工作流构建同时其可以识别人类需求中需要动态决策的部分将自动编排进工作流中并在工作流执行到该部分时主动接管工作流的执行完成相应复杂决策。
为了探索 APA 的可能性该研究工作实现了一个自动化智能体 ProAgent其可以接收人类指令以生成代码的方式构建工作流同在工作流中引入 DataAgent 和 ControlAgent 来在工作流中实现复杂数据处理与逻辑控制。ProAgent 的研究展现了 APA 在大模型智能体时代下的可行性也揭示了 LLM 时代下自动化技术的崭新可能性。
方法介绍
在 RPA 中工作流是由一系列工具调用组成的图状结构节点代表一个原子化的工具调用如 Gmail、Twitter、Google Sheets而边代表了执行的逻辑顺序承接、分支、循环。一个工作流往往包含了对于一个或一类任务的所有先验知识其中包含解决问题的路径遇到异常时的处理逻辑等等。因此人编写固化出来的工作流往往是非常稳定周全、非常高效的。
图 3 智能体工作流描述语言示例
在 ProAgent 中由于 LLM 本身在代码数据中进行预训练学习到了较强代码能力该研究便基于代码的智能体工作流描述语言 Agentic Workflow Description Language。该语言使用 JSON 实现对工作流中数据的组织与管理选择 Python 语法实现对工作流的逻辑控制将控制流中的跳转、循环等直接通过 Python 语法进行表征同时将工作流中的工具调用封装为 Python Function。于是对于 ProAgent工作流构建任务便转化为代码生成任务。当接收到人类指令时ProAgent 便编写相应的 Agentic Workflow Description Language从而实现了工作流自动化构建。
图 4 结合 DataAgent 和 ControlAgent 的智能体工作流描述语言示例
复杂的现实任务中通常会涉及动态决策单纯的 Python 式的逻辑控制规则以及 JSON 式的数据组织形式在面对灵活的需求时便无能为力此时便需要引入 agent。因此该研究工作进一步定义出了两种 Agent 操作 DataAgent对于一个复杂的数据处理需求工作流构建时会使用自然语言来描述处理的任务然后在执行时会初始化一个 DataAgent其会基于该自然语言描述自主处理并完成该数据处理任务。 ControlAgent对于难以用规则表示的逻辑控制规则工作流构建时使用自然语言对控制逻辑进行描述然后在运行时会初始化一个 ControlAgent其会基于该自然语言描述自主选择工作流后续需要执行的分支。
ProAgent 使用 ReACT 模式逐步构建工作流其共包含四个工作流构建步骤
Action_Define决定在工作流中添加什么工具。
Action Implement将工具的输入 / 输出参数转化为 JSON 结构同时将工具的调用封装为 Python 函数。
Workflow Implement定义一个 mainWorkflow 函数用以组织整个 workflow 的逻辑控制与数据处理。
Task Submit: 当 ProAgent 构建完 workflow 时以该操作标识构建过程结束。
图 5 ProAgent 工作流构建过程示例
另外为了优化 ProAgent 的效果又引入了几个优化技巧
1.Testing-on-Constructing在构建过程中ProAgent 会在一次修改工作流之后对工作流进行测试以保证工作流的正确性。
Function Calling工作流构建的所有操作均封装为了 GPT-4 的 Function从而提高对工作流构建过程的控制。
Chain-of-ThoughtProAgent 在编写工作流代码时需要对于每个 function 都要给出注释 comment 和一个编写 plan从而提高 ProAgent 工作流构建的性能。
工作流执行过程基于 Python interpreter。给定一个工作流其对应的 mainWorkflow 函数用作为工作流执行的入口来开始整个执行过程。执行过程遵循 Python 代码执行规则即按照顺序逐行执行。一旦 mainWorkflow 函数返回工作流执行就成功完成了。
可行性验证
为了验证 Agentic Process Automation 的可行性该研究使用 OpenAI GPT-4 作为基础模型并以一个开源的 RPA 平台 n8n 作为载体实现了上述的 ProAgent。同时设计了一个需要兼顾灵活与效率的任务这是一个典型的商业场景需要从 Google Sheets 中提取各种业务线的营利数据同时根据业务是否属于 2B 或是 2C决定后续的行为。一旦确定业务线为 2C就会向 Slack 频道发送一条消息。而对于 2B 的业务线则会向相应的经理发送一封电子邮件其中包括对业务线的评估和简要的盈利概况。
图 6 任务 Instruction 展示
对于该任务首先它是一个重复性的任务对于多条产品线应该走相同的处理流程。其次分辨一个业务线是 2C 还是 2B 很难通过规则判断需要涉及 Agent 动态决策来判断后续的工作流执行操作。最后根据撰写业务线的评估邮件需要一定的智能所以需要 Agent 的介入。
在 ProAgent 生成中对于该任务编写出了一个包含四个原子操作一个 DataAgent 和一个 ControlAgent 的工作流。总体过程大致如下图所示
图 7 ProAgent 工作流构建过程展示
可以看到ProAgent 通过自主编写代码的方式自动完成了工作流的构建过程其中无需涉及人工介入。在需要判断业务线是 2B 还是 2C 时ProAgent 引入了 ControlAgent 来做判断ControlAgent 的 Prompt 被设置为 “Decide Whether the business line is toC or toB”。当业务线为 2B 时ProAgent 还引入了一个 DataAgent其任务设置为 “Write a email of the business line of profit, together with your suggestion”从而利用 agent 的智能来根据不同业务线的实际情况来撰写邮件。
在工作流被编写、固化下来以后工作流就会根据不同的数据自动分支到不同的逻辑进行高效地数据处理了。
图 8 ProAgent 工作流执行过程展示
在处理 2C 业务线数据时ControlAgent 可以根据业务线描述判断出当前业务线的类型选择调用 Slack 工具。当遇到 2B 业务线数据时DataAgent 可以撰写邮件发到相应经理的邮箱中。
总结
该研究提出了大模型时代下新的自动化范式 ——Agentic Process Automation和传统 Robotic Process Automation 技术相比其可以实现工作流构建的自动化以及工作流执行时动态决策的自动化。该研究进一步实现了 ProAgent 并通过实验揭示了大模型智能体在自动化中的可行性与潜力。相信未来大模型智能体技术会帮助人类实现更高层次的自动化将人类从各种繁重的劳动中解放出来。