Proactive Agents · Idle-Time Preparation

ProAct

把空闲等待变成可验证的下一步准备

ProAct 在用户暂时离开对话、等待观察结果或切换任务时，预测可能的后续需求，提前检索与验证证据，并整理成可审核的草稿、清单或摘要；系统只在低风险、低打扰时交付给用户确认，不自动执行敏感操作。

观看 4 个 Demo 查看安全边界了解评测设计

4 个原型流程 demo 覆盖 project mgmt、engineering、casework、farm ops 四类场景，每个 demo 都展示一次 push 交付。

可审计行为链 每个 demo 都展示从预测到交付的 trace：预测、检索、验证、整理、交付。

用户确认边界 系统准备材料和建议；敏感操作不自动执行。

Demo-first evidence

4 个原型流程 demo：从空闲等待到主动准备可审核材料

以下 demo 使用虚构人物、组织和合成事实表，不包含真实用户数据，也不代表线上生产系统效果。它们展示 ProAct 的目标行为链：当用户暂时离开对话、等待观察结果或切换任务时，系统预测下一步需求，提前补齐证据，整理成可供用户审核的材料，并在用户确认边界内交付。

用户上下文: PM 需要在启动会前确认项目时间线、预算、负责人和文档位置。
提前准备: 整理项目基本事实 + 准备带有 area / prepared finding / next step 的决策表。
为什么有用: 用户拿到结构化 brief，不必手动从多个文档中提取启动信息。

预测
检索
验证
整理
推送

用户上下文: 发布经理需要判断 canary cohort 是否满足扩大部署的条件。
提前准备: 整理 cache hit rate、延迟、致命错误率和回滚触发条件。
为什么有用: 用户拿到基于证据的决策材料，而不是逐个查看监控面板。

预测
检索
验证
整理
推送

用户上下文: 案例工作者需要确认申请材料是否齐全，包括收入证明、身份文件和居住证明。
提前准备: 识别缺失文档、过期文档和姓名不匹配项，生成优先级排序的缺口清单。
为什么有用: 用户拿到结构化 checklist，不必逐项手动核对申请材料完整性。

预测
检索
验证
整理
推送

用户上下文: 农场经理需要确保从采摘到标签到清洗站接收的全链路可追溯。
提前准备: 整理满箱规则、标签格式、AgriTrace Pro 扫描、清洗站接收和异常处理流程。
为什么有用: 用户拿到紧凑的交接卡，可以直接用于现场操作而不需要额外整理。

预测
检索
验证
整理
推送

减少追问

把可预测的后续问题提前覆盖，用户不必一轮轮补问规则、材料清单、变更链或联系人信息。

减少切换上下文

空闲时间用于检索、验证和整理来源，用户回来时看到的是可审核材料，而不是新的搜索任务。

保持可控

主动交付限定在摘要、草稿、清单和候选证据；关键决定仍由用户确认。

Reactive Assistant

用户问一句，系统答一句。它擅长响应当前问题，但通常不会利用空闲窗口准备下一步。

触发方式：用户显式提问

Memory Agent

能记住长期偏好、事实和历史摘要，但多数情况下仍等待用户触发后再组织回答。

触发方式：记忆增强的被动响应

ProAct

在空闲时间预测下一步需求，提前准备证据和草稿，并在确认边界内交付。

触发方式：空闲窗口中的受控准备

长期记忆 Persistent Memory

持续维护用户偏好、任务上下文、历史事实和约束，作为主动准备的边界。

后续需求预测 Future-State Prediction

在用户暂停对话、切换任务或上下文累积后，预测用户可能的下一步需求。

价值与风险评估 Value Evaluation

判断提前准备是否值得做，并检查打扰、隐私、幻觉或越权风险。

空闲时检索与验证 Idle-Time Acquisition

利用空闲时间检索证据、补齐事实、对齐来源，而不是等待用户明确追问。

效用感知交付 Utility-Aware Delivery

根据价值和风险选择 push、queue 或 drop。高风险操作必须等待用户确认。

Push

低风险、低打扰、及时有用的信息可以主动提示。

Queue

需要上下文或确认的内容排队等待合适时机。

Drop

低价值、高风险或证据不足的内容不交付。

可以准备

摘要、草稿、清单、候选证据、对话 trace 和待确认问题。

不能自动执行

不自动外发消息、提交表单、变更账户、修改生产系统，或处理医疗、福利、金融敏感动作。

高风险进入 Queue

涉及外发、账户、福利、医疗、生产变更等动作时，内容只能排队等待用户显式确认。

证据不足则 Drop

低价值、高风险或无法回溯来源的主动内容不应交付，避免把主动性变成打扰或无来源断言。

页面中的所有 demo 均为虚构场景，不包含真实用户数据。

闭世界虚构场景

避免真实隐私和不可控外部事实，让每个场景的来源、约束和正确性边界都能被审计。

合成事实表

每个场景有可验证来源，系统准备的内容必须能回溯到事实表或可检查材料。

隐藏需求标注

评估端记录合理后续需求，系统运行时看不到这些标注，避免用评测答案引导自身输出。

证据约束

准备内容要说明来源和不确定性，不允许把缺失事实包装成确定结论。

安全约束

系统不能越权执行敏感操作；高风险内容应进入 queue，而不是被自动完成。

打扰成本

不是越主动越好。低价值主动提示应被惩罚，低风险且及时有用的提示才适合 push。

ProAct 会不会一直打扰用户？

不会。系统会在 push、queue、drop 之间选择，只有预期收益高、打扰成本低且事实风险可控时才主动提示。

ProAct 会自动替用户执行操作吗？

不会。ProAct 只准备材料、草稿、清单和下一步建议，不自动发送邮件、提交表单、修改账户或执行敏感操作。

Demo 用的是真实用户数据吗？

不是。页面 demo 使用虚构人物、组织和合成事实表，不包含真实用户数据，也不代表线上生产系统效果。

研究者和合作者应该先看哪里？

先看 4 个 demo 理解行为链，再看机制、安全边界和评测设计。

Next step

从 demo 看清主动智能体的可控边界

观看原型流程，理解 ProAct 如何预测、检索、验证、整理，并在用户确认边界内交付可审核的下一步材料。

观看 Demo 查看机制了解评测设计

ProAct

4 个原型流程 demo：从空闲等待到主动准备可审核材料

Project Kickoff · Kickoff Brief Push

Software Release · Rollout Signal Brief Push

Nonprofit Case · Document Gap Checklist Push

Farm Operations · Traceability Handoff Card Push

从“回答这一句”升级为“准备下一步”

减少追问

减少切换上下文

保持可控

三类助手的行为差异

Reactive Assistant

Memory Agent

ProAct

五步 pipeline：把空闲时间变成可验证准备

长期记忆 Persistent Memory

后续需求预测 Future-State Prediction

价值与风险评估 Value Evaluation

空闲时检索与验证 Idle-Time Acquisition

效用感知交付 Utility-Aware Delivery

主动交付不等于自动执行

可以准备

不能自动执行

高风险进入 Queue

证据不足则 Drop

如何评测主动智能体是否真的有用？

闭世界虚构场景

合成事实表

隐藏需求标注

证据约束

安全约束

打扰成本

常见问题

从 demo 看清主动智能体的可控边界