Proactive Agents · Idle-Time Preparation

ProAct

把空闲等待变成可验证的下一步准备

ProAct 在用户暂时离开对话、等待观察结果或切换任务时,预测可能的后续需求,提前检索与验证证据,并整理成可审核的草稿、清单或摘要;系统只在低风险、低打扰时交付给用户确认,不自动执行敏感操作。

4 个原型流程 demo 覆盖 project mgmt、engineering、casework、farm ops 四类场景,每个 demo 都展示一次 push 交付。
可审计行为链 每个 demo 都展示从预测到交付的 trace:预测、检索、验证、整理、交付。
用户确认边界 系统准备材料和建议;敏感操作不自动执行。

Demo-first evidence

4 个原型流程 demo:从空闲等待到主动准备可审核材料

以下 demo 使用虚构人物、组织和合成事实表,不包含真实用户数据,也不代表线上生产系统效果。它们展示 ProAct 的目标行为链:当用户暂时离开对话、等待观察结果或切换任务时,系统预测下一步需求,提前补齐证据,整理成可供用户审核的材料,并在用户确认边界内交付。

Project Mgmt 准备 kickoff brief

Project Kickoff · Kickoff Brief Push

用户准备项目启动会,ProAct 在用户翻阅文档时预测需要 kickoff brief,提前整理时间线、预算、治理和基础设施信息,并主动推送。

用户上下文
PM 需要在启动会前确认项目时间线、预算、负责人和文档位置。
提前准备
整理项目基本事实 + 准备带有 area / prepared finding / next step 的决策表。
为什么有用
用户拿到结构化 brief,不必手动从多个文档中提取启动信息。
  1. 预测
  2. 检索
  3. 验证
  4. 整理
  5. 推送
Engineering 整理 rollout 信号

Software Release · Rollout Signal Brief Push

发布经理监控 canary 部署,ProAct 在等待观察期预测需要 rollout decision brief,提前整理成功指标、延迟护栏和回滚条件,主动推送。

用户上下文
发布经理需要判断 canary cohort 是否满足扩大部署的条件。
提前准备
整理 cache hit rate、延迟、致命错误率和回滚触发条件。
为什么有用
用户拿到基于证据的决策材料,而不是逐个查看监控面板。
  1. 预测
  2. 检索
  3. 验证
  4. 整理
  5. 推送
Casework 识别材料缺口

Nonprofit Case · Document Gap Checklist Push

案例工作者准备资格申请,ProAct 在用户切换任务时预测需要材料缺口清单,识别缺失、过期和姓名不一致的文档,主动推送。

用户上下文
案例工作者需要确认申请材料是否齐全,包括收入证明、身份文件和居住证明。
提前准备
识别缺失文档、过期文档和姓名不匹配项,生成优先级排序的缺口清单。
为什么有用
用户拿到结构化 checklist,不必逐项手动核对申请材料完整性。
  1. 预测
  2. 检索
  3. 验证
  4. 整理
  5. 推送
Farm Ops 准备交接卡

Farm Operations · Traceability Handoff Card Push

农场经理检查采摘流程,ProAct 在等待期间预测需要可追溯性交接卡,整理从田间到清洗站的完整链路,主动推送。

用户上下文
农场经理需要确保从采摘到标签到清洗站接收的全链路可追溯。
提前准备
整理满箱规则、标签格式、AgriTrace Pro 扫描、清洗站接收和异常处理流程。
为什么有用
用户拿到紧凑的交接卡,可以直接用于现场操作而不需要额外整理。
  1. 预测
  2. 检索
  3. 验证
  4. 整理
  5. 推送

Value shift

从“回答这一句”升级为“准备下一步”

减少追问

把可预测的后续问题提前覆盖,用户不必一轮轮补问规则、材料清单、变更链或联系人信息。

减少切换上下文

空闲时间用于检索、验证和整理来源,用户回来时看到的是可审核材料,而不是新的搜索任务。

保持可控

主动交付限定在摘要、草稿、清单和候选证据;关键决定仍由用户确认。

Capability comparison

三类助手的行为差异

Reactive Assistant

用户问一句,系统答一句。它擅长响应当前问题,但通常不会利用空闲窗口准备下一步。

触发方式:用户显式提问

Memory Agent

能记住长期偏好、事实和历史摘要,但多数情况下仍等待用户触发后再组织回答。

触发方式:记忆增强的被动响应

ProAct

在空闲时间预测下一步需求,提前准备证据和草稿,并在确认边界内交付。

触发方式:空闲窗口中的受控准备

Mechanism

五步 pipeline:把空闲时间变成可验证准备

ProAct 先用记忆确定任务边界,再预测后续需求、评估价值与风险,最后利用空闲时间检索证据,并选择 push、queue 或 drop 的交付策略。

01

长期记忆 Persistent Memory

持续维护用户偏好、任务上下文、历史事实和约束,作为主动准备的边界。

02

后续需求预测 Future-State Prediction

在用户暂停对话、切换任务或上下文累积后,预测用户可能的下一步需求。

03

价值与风险评估 Value Evaluation

判断提前准备是否值得做,并检查打扰、隐私、幻觉或越权风险。

04

空闲时检索与验证 Idle-Time Acquisition

利用空闲时间检索证据、补齐事实、对齐来源,而不是等待用户明确追问。

05

效用感知交付 Utility-Aware Delivery

根据价值和风险选择 push、queue 或 drop。高风险操作必须等待用户确认。

Push

低风险、低打扰、及时有用的信息可以主动提示。

Queue

需要上下文或确认的内容排队等待合适时机。

Drop

低价值、高风险或证据不足的内容不交付。

Safety boundary

主动交付不等于自动执行

安全边界必须早于产品想象:ProAct 可以准备材料和建议,但不能越过用户确认权。

可以准备

摘要、草稿、清单、候选证据、对话 trace 和待确认问题。

不能自动执行

不自动外发消息、提交表单、变更账户、修改生产系统,或处理医疗、福利、金融敏感动作。

高风险进入 Queue

涉及外发、账户、福利、医疗、生产变更等动作时,内容只能排队等待用户显式确认。

证据不足则 Drop

低价值、高风险或无法回溯来源的主动内容不应交付,避免把主动性变成打扰或无来源断言。

页面中的所有 demo 均为虚构场景,不包含真实用户数据。

ProActEval design

如何评测主动智能体是否真的有用?

评测区定位为评测设计,而不是实验结果。ProActEval 用闭世界虚构场景、合成事实表和隐藏需求标注,观察系统是否能在用户明确追问前准备可验证材料,同时避免无来源断言和越权动作。

闭世界虚构场景

避免真实隐私和不可控外部事实,让每个场景的来源、约束和正确性边界都能被审计。

合成事实表

每个场景有可验证来源,系统准备的内容必须能回溯到事实表或可检查材料。

隐藏需求标注

评估端记录合理后续需求,系统运行时看不到这些标注,避免用评测答案引导自身输出。

证据约束

准备内容要说明来源和不确定性,不允许把缺失事实包装成确定结论。

安全约束

系统不能越权执行敏感操作;高风险内容应进入 queue,而不是被自动完成。

打扰成本

不是越主动越好。低价值主动提示应被惩罚,低风险且及时有用的提示才适合 push。

FAQ

常见问题

ProAct 会不会一直打扰用户?

不会。系统会在 push、queue、drop 之间选择,只有预期收益高、打扰成本低且事实风险可控时才主动提示。

ProAct 会自动替用户执行操作吗?

不会。ProAct 只准备材料、草稿、清单和下一步建议,不自动发送邮件、提交表单、修改账户或执行敏感操作。

Demo 用的是真实用户数据吗?

不是。页面 demo 使用虚构人物、组织和合成事实表,不包含真实用户数据,也不代表线上生产系统效果。

研究者和合作者应该先看哪里?

先看 4 个 demo 理解行为链,再看机制、安全边界和评测设计。

Next step

从 demo 看清主动智能体的可控边界

观看原型流程,理解 ProAct 如何预测、检索、验证、整理,并在用户确认边界内交付可审核的下一步材料。