Stream 1a · AI Coach 达标对话行为分析
IPP · 2025 GMBA
分支逻辑 + 生成式文本。同一场景零逐字重复,话题顺序每次不同。
D-005 · 3 场景 × 5 对话逐轮比对
JSON 存储 customer→sales_rep,实际 sales_rep→customer。修正后答非所问从 14→0。
D-009 · 25/25 轮次对验证
标准化 AI 刺激下,差异反映个人策略选择,不是脚本差异。
主动性维度成立的基础
| 3 个不可用 | 培训/团队/客户维护 — 模拟不涉及 |
| 3 个粒度过粗 | 产品推荐/销售技巧/客户沟通 — 覆盖 95% |
| 4 个可用 | 促单/异议/服务/竞争(低频) |
D-001 · 10 份对话预测试验证
Q — 员工原话,直接复用
E — 必须引用前序客户发言
C — 一轮可提取多个 Code
D-011 · Category 不适配 ≠ QEC 方法不适配
Stream 2 用双路验证(BERTopic + LLM 归纳),因为 Code 是 LLM 一次性产出,质量参差。
Stream 1a 的 2,279 Code 经过手工校准,输入质量更高 → 单路 BERTopic 足够。真正的交叉验证在 Cross-stream。
paraphrase-multilingual-MiniLM-L12-v2 · UMAP · HDBSCAN
| 层级 | 高可信 | CV | 选择 |
|---|---|---|---|
| 8 | 5 | 1.03 | — |
| 12 | 7 | 0.79 | 候选 |
| 15 | 9 | 0.69 | 最优 |
| 20 | 9 | 0.88 | 拐点后 |
| # | 主题 | QEC | 覆盖率 | 产品线 |
|---|---|---|---|---|
| 高可信 · ≥30% + 跨产品线 + 跨人设 | ||||
| 0 | 迎客破冰与需求探询 | 339 | 83% | iPhone+Watch |
| 2 | 屏幕亮度与决策推进 | 284 | 81% | iPhone+Watch |
| 1 | 核心硬件参数陈述 | 319 | 73% | iPhone+Watch |
| 3 | 场景化功能演示 | 250 | 69% | iPhone+Watch |
| 4 | 芯片性能与系统流畅 | 151 | 61% | iPhone+Watch |
| 5 | 续航与快充 | 124 | 57% | iPhone+Watch |
| 8 | 材质与耐用性 | 93 | 43% | iPhone+Watch |
| 6 | 蜂窝网络与GPS | 106 | 38% | iPhone+Watch |
| 9 | 关系建立与产品定位 | 90 | 38% | iPhone+Watch |
中等可信 | ||||
| 7 | 健康监测 | 103 | 30% | Watch |
| 10 | 运动与防水 | 69 | 25% | iPhone+Watch |
| 11 | 安全功能 | 49 | 24% | iPhone+Watch |
| 12 | 产品线引导 | 45 | 22% | iPhone+Watch |
| 13 | 坦诚与异议处理 | 41 | 20% | iPhone+Watch |
标准问候、探询需求、了解旧设备
"欢迎光临,您平时用手机做什么比较多?"
339 QEC · 83%
将功能关联到客户具体使用场景
"看演唱会时同时录现场和自己的反应"
250 QEC · 69%
参数介绍后引导颜色/配置选择
"3000尼特户外也看得清。您喜欢什么颜色?"
284 QEC · 81%
• 2,372 个可追溯的行为 Code
• 14 个语义聚类主题,9 个高可信
• QEC + 聚类参数完整记录,可复制
• 没有评价行为好坏
• 没有覆盖真实门店行为
• 没有好/差对比(无 <80 分对照组)
• AI Coach 场景 ≠ 真实销售场景
IPP · 2025 GMBA