Proactive Agents · Idle-Time Preparation
ProAct
把空闲等待变成可验证的下一步准备
ProAct 在用户暂时离开对话、等待观察结果或切换任务时,预测可能的后续需求,提前检索与验证证据,并整理成可审核的草稿、清单或摘要;系统只在低风险、低打扰时交付给用户确认,不自动执行敏感操作。
Demo-first evidence
4 个原型流程 demo:从空闲等待到主动准备可审核材料
以下 demo 使用虚构人物、组织和合成事实表,不包含真实用户数据,也不代表线上生产系统效果。它们展示 ProAct 的目标行为链:当用户暂时离开对话、等待观察结果或切换任务时,系统预测下一步需求,提前补齐证据,整理成可供用户审核的材料,并在用户确认边界内交付。
Project Kickoff · Kickoff Brief Push
用户准备项目启动会,ProAct 在用户翻阅文档时预测需要 kickoff brief,提前整理时间线、预算、治理和基础设施信息,并主动推送。
- 用户上下文
- PM 需要在启动会前确认项目时间线、预算、负责人和文档位置。
- 提前准备
- 整理项目基本事实 + 准备带有 area / prepared finding / next step 的决策表。
- 为什么有用
- 用户拿到结构化 brief,不必手动从多个文档中提取启动信息。
- 预测
- 检索
- 验证
- 整理
- 推送
Software Release · Rollout Signal Brief Push
发布经理监控 canary 部署,ProAct 在等待观察期预测需要 rollout decision brief,提前整理成功指标、延迟护栏和回滚条件,主动推送。
- 用户上下文
- 发布经理需要判断 canary cohort 是否满足扩大部署的条件。
- 提前准备
- 整理 cache hit rate、延迟、致命错误率和回滚触发条件。
- 为什么有用
- 用户拿到基于证据的决策材料,而不是逐个查看监控面板。
- 预测
- 检索
- 验证
- 整理
- 推送
Nonprofit Case · Document Gap Checklist Push
案例工作者准备资格申请,ProAct 在用户切换任务时预测需要材料缺口清单,识别缺失、过期和姓名不一致的文档,主动推送。
- 用户上下文
- 案例工作者需要确认申请材料是否齐全,包括收入证明、身份文件和居住证明。
- 提前准备
- 识别缺失文档、过期文档和姓名不匹配项,生成优先级排序的缺口清单。
- 为什么有用
- 用户拿到结构化 checklist,不必逐项手动核对申请材料完整性。
- 预测
- 检索
- 验证
- 整理
- 推送
Farm Operations · Traceability Handoff Card Push
农场经理检查采摘流程,ProAct 在等待期间预测需要可追溯性交接卡,整理从田间到清洗站的完整链路,主动推送。
- 用户上下文
- 农场经理需要确保从采摘到标签到清洗站接收的全链路可追溯。
- 提前准备
- 整理满箱规则、标签格式、AgriTrace Pro 扫描、清洗站接收和异常处理流程。
- 为什么有用
- 用户拿到紧凑的交接卡,可以直接用于现场操作而不需要额外整理。
- 预测
- 检索
- 验证
- 整理
- 推送
Value shift
从“回答这一句”升级为“准备下一步”
减少追问
把可预测的后续问题提前覆盖,用户不必一轮轮补问规则、材料清单、变更链或联系人信息。
减少切换上下文
空闲时间用于检索、验证和整理来源,用户回来时看到的是可审核材料,而不是新的搜索任务。
保持可控
主动交付限定在摘要、草稿、清单和候选证据;关键决定仍由用户确认。
Capability comparison
三类助手的行为差异
Reactive Assistant
用户问一句,系统答一句。它擅长响应当前问题,但通常不会利用空闲窗口准备下一步。
触发方式:用户显式提问Memory Agent
能记住长期偏好、事实和历史摘要,但多数情况下仍等待用户触发后再组织回答。
触发方式:记忆增强的被动响应ProAct
在空闲时间预测下一步需求,提前准备证据和草稿,并在确认边界内交付。
触发方式:空闲窗口中的受控准备Mechanism
五步 pipeline:把空闲时间变成可验证准备
ProAct 先用记忆确定任务边界,再预测后续需求、评估价值与风险,最后利用空闲时间检索证据,并选择 push、queue 或 drop 的交付策略。
长期记忆 Persistent Memory
持续维护用户偏好、任务上下文、历史事实和约束,作为主动准备的边界。
后续需求预测 Future-State Prediction
在用户暂停对话、切换任务或上下文累积后,预测用户可能的下一步需求。
价值与风险评估 Value Evaluation
判断提前准备是否值得做,并检查打扰、隐私、幻觉或越权风险。
空闲时检索与验证 Idle-Time Acquisition
利用空闲时间检索证据、补齐事实、对齐来源,而不是等待用户明确追问。
效用感知交付 Utility-Aware Delivery
根据价值和风险选择 push、queue 或 drop。高风险操作必须等待用户确认。
低风险、低打扰、及时有用的信息可以主动提示。
需要上下文或确认的内容排队等待合适时机。
低价值、高风险或证据不足的内容不交付。
Safety boundary
主动交付不等于自动执行
安全边界必须早于产品想象:ProAct 可以准备材料和建议,但不能越过用户确认权。
可以准备
摘要、草稿、清单、候选证据、对话 trace 和待确认问题。
不能自动执行
不自动外发消息、提交表单、变更账户、修改生产系统,或处理医疗、福利、金融敏感动作。
高风险进入 Queue
涉及外发、账户、福利、医疗、生产变更等动作时,内容只能排队等待用户显式确认。
证据不足则 Drop
低价值、高风险或无法回溯来源的主动内容不应交付,避免把主动性变成打扰或无来源断言。
页面中的所有 demo 均为虚构场景,不包含真实用户数据。
ProActEval design
如何评测主动智能体是否真的有用?
评测区定位为评测设计,而不是实验结果。ProActEval 用闭世界虚构场景、合成事实表和隐藏需求标注,观察系统是否能在用户明确追问前准备可验证材料,同时避免无来源断言和越权动作。
闭世界虚构场景
避免真实隐私和不可控外部事实,让每个场景的来源、约束和正确性边界都能被审计。
合成事实表
每个场景有可验证来源,系统准备的内容必须能回溯到事实表或可检查材料。
隐藏需求标注
评估端记录合理后续需求,系统运行时看不到这些标注,避免用评测答案引导自身输出。
证据约束
准备内容要说明来源和不确定性,不允许把缺失事实包装成确定结论。
安全约束
系统不能越权执行敏感操作;高风险内容应进入 queue,而不是被自动完成。
打扰成本
不是越主动越好。低价值主动提示应被惩罚,低风险且及时有用的提示才适合 push。
FAQ
常见问题
ProAct 会不会一直打扰用户?
不会。系统会在 push、queue、drop 之间选择,只有预期收益高、打扰成本低且事实风险可控时才主动提示。
ProAct 会自动替用户执行操作吗?
不会。ProAct 只准备材料、草稿、清单和下一步建议,不自动发送邮件、提交表单、修改账户或执行敏感操作。
Demo 用的是真实用户数据吗?
不是。页面 demo 使用虚构人物、组织和合成事实表,不包含真实用户数据,也不代表线上生产系统效果。
研究者和合作者应该先看哪里?
先看 4 个 demo 理解行为链,再看机制、安全边界和评测设计。
Next step
从 demo 看清主动智能体的可控边界
观看原型流程,理解 ProAct 如何预测、检索、验证、整理,并在用户确认边界内交付可审核的下一步材料。