完整流程复现示例

一、示例概览

本节使用一个 产品测试效率对比 的真实案例,完整展示多 Agent 协作从方案制定到结果审阅的全过程。这个示例可以帮助理解各角色之间的协作关系、人工参与节点以及最终产出的文档形式。

基本信息

项目 内容
分析任务 产品测试效率对比
所属阶段 第二阶段 - 负责人效能与产品洞察
数据文件 脱敏数据_特征增强.xlsx
数据口径 6671 条记录,完全不去重
全流程用时 约 20 分钟(主要耗时在人工阅读与确认)

二、阶段一:方案制定(DataAnalyst)

输入

DataAnalyst 接收任务描述:深入分析各子产品的测试效率和转化表现,识别高效产品与低效产品的差异特征

关键设计决策

在方案制定中,DataAnalyst 做了以下核心设计:

分析范围

需求清单(Checklist 格式):

### 1. 产品基础效能排名
- [ ] 各子产品的记录总数
- [ ] 各子产品的平均测试周期(天)、中位数、标准差
- [ ] 各子产品的申请→已接入转化率(%)(核心指标)
- [ ] 各子产品的申请→已调用转化率(%)
- [ ] 各子产品的不接入流失率(%)

### 2. 产品不接入原因分布
- [ ] 各子产品的不接入原因分布(产品力不足/客户侧收益不足等)

### 3. 高效产品与低效产品对比
- [ ] 高效产品(转化率 Top 2)的特征汇总
- [ ] 低效产品(转化率 Bottom 2)的特征汇总

输出检查清单

输出项 格式 路径
Excel 详细数据 .xlsx 执行分析结果/
Markdown 关键指标摘要 .md 执行分析结果/
产品效能排名图 .png 执行分析结果/
高效 vs 低效产品对比图 .png 执行分析结果/

注意事项

三、阶段二:脚本编写与执行(ScriptWriter + Human)

脚本生成

ScriptWriter 根据方案文档生成 Python 脚本,核心逻辑包括:

  1. 读取数据 → 按子产品维度分组统计
  2. 计算测试周期(平均/中位数/标准差)
  3. 计算转化率(申请→已接入转化率、申请→已调用转化率)
  4. 计算流失率(不接入流失率)
  5. 生成综合效能得分(基于转化率百分位排名)
  6. 分析不接入原因分布
  7. 识别 Top 2 高效产品和 Bottom 2 低效产品
  8. 输出 Excel、Markdown、PNG 三种格式的结果

关键代码片段

# 产品基础效能排名计算
product_total = df.groupby("子产品名称").size().rename("记录总数")

cycle_stats = df.groupby("子产品名称")["测试周期(天)"].agg(
    平均测试周期="mean",
    中位数测试周期="median",
    标准差测试周期="std",
)

# 转化率计算
product_stats["申请→已接入转化率(%)"] = (
    product_stats["已接入数量"] / product_stats["记录总数"] * 100
).round(2)

# 高效/低效产品识别
top_products = stats_for_rank.sort_values(
    "申请→已接入转化率(%)", ascending=False
).head(2).index.tolist()

人工执行

Human 在本地环境执行脚本,生成:

四、阶段三:一致性审阅(Reviewer)

审阅过程

Reviewer 对比方案文档和脚本执行结果,逐项检查一致性。

审阅结论

整体结论:方案需求清单已全部在脚本和 Markdown 摘要中实现,脚本设计严谨,计算逻辑与方案高度一致。

一致性详情

检查项 结果 说明
数据口径 使用特征增强数据,未去重,与方案一致
产品维度 仅分析子产品,符合方案要求
基础效能排名 所有信息项齐全
不接入原因分布 数量 + 占比均已计算
高效/低效产品对比 Top 2/Bottom 2 识别正确
输出文件完整性 Excel + Markdown + 两张 PNG 均已生成

发现的细节问题

  1. ⚠️ "最低产品"与 Bottom 2 展示不一致:Markdown 摘要中"低效产品特征"展示的是数字平台、云引擎(转化率 0%),而"关键发现"中写的是"转化率最低产品:数字工具(0.00%)"。原因是 Bottom 2 和 idxmin() 使用了不同的排序逻辑。

  2. ⚠️ 综合效能得分的计算口径在方案中未显式定义,脚本中使用的是"转化率百分位排名",逻辑合理但建议在方案中补充说明。

审阅的工程价值

这个示例展示了审阅 Agent 在实际使用中的重要价值:

五、阶段四:人工复核

Human 阅读审阅报告后:

六、流程总结

时间分配

环节 时间 主导者
方案制定与多轮确认 ~8 分钟 DataAnalyst + Human
脚本编写 ~3 分钟 ScriptWriter
本地执行 ~2 分钟 Human
一致性审阅 ~3 分钟 Reviewer
人工复核 ~4 分钟 Human
总计 ~20 分钟 -

关键启示

  1. 职责分明:每个角色只做自己分内的事,不越界
  2. 过程留痕:所有交互以文档形式保存,可完整回溯
  3. 质量闭环:从方案到执行再到审阅,形成质量保障链
  4. 人工可控:在关键节点人工介入,保证方向和质量的正确性
  5. 高效协同:约 20 分钟完成从方案到交付的完整闭环

← 上一章:数据安全与人工在环机制 | Multi-Agent协作框架-MOC | 下一章:实战案例 →