Stream 1a · AI Coach 达标对话行为分析

从 176 份对话
到 14 个销售行为主题

0Dialogues

0Employees

0QEC Codes

0Themes

IPP · 2025 GMBA

Research Question

176 份 AI Coach 达标对话中，
员工展现的销售行为模式有哪些？

模拟数据达标样本 ≥80 描述性分析

176 对话→ 1,922 轮次→ 2,372 QEC→ 14 主题

112+64iPhone · Watch

3人设

22Avg 轮次

80-84分数窄带

Phase 0 · 关键发现

三个改变分析设计的发现

AI 客户是 LLM Agent

分支逻辑 + 生成式文本。同一场景零逐字重复，话题顺序每次不同。

D-005 · 3 场景 × 5 对话逐轮比对

时序错位

JSON 存储 customer→sales_rep，实际 sales_rep→customer。修正后答非所问从 14→0。

D-009 · 25/25 轮次对验证

行为差异来自员工

标准化 AI 刺激下，差异反映个人策略选择，不是脚本差异。

主动性维度成立的基础

编码体系

从 Stream 2 适配到对话数据

Stream 2 的 10 个 Category

3 个不可用	培训/团队/客户维护 — 模拟不涉及
3 个粒度过粗	产品推荐/销售技巧/客户沟通 — 覆盖 95%
4 个可用	促单/异议/服务/竞争（低频）

D-001 · 10 份对话预测试验证

QEC 适配

Q — 员工原话，直接复用

E — 必须引用前序客户发言

C — 一轮可提取多个 Code

D-011 · Category 不适配 ≠ QEC 方法不适配

关联-快充与开会补电 / 关联-功能与场景

对比-维修3298vs碎屏保188 / 对比-机型差异

坦诚-无超广角长焦 / 坦诚-能力边界

探询需求建立关系产品参数陈述需求场景关联锚定对比场景化表达坦诚与变通增值服务推荐促单与决策推进异议处理

Phase 1b · 编码结果

2,372 个具体行为

2,372QEC

2,279唯一 Code

96%唯一率

产品参数陈述

47%

需求场景关联

20%

促单与决策推进

8%

建立关系

7%

探询需求

6%

其他 5 项

12%

Phase 2 · 语义聚类

BERTopic → 53 初始主题 → 14 最终主题

Stream 2 用双路验证（BERTopic + LLM 归纳），因为 Code 是 LLM 一次性产出，质量参差。

Stream 1a 的 2,279 Code 经过手工校准，输入质量更高 → 单路 BERTopic 足够。真正的交叉验证在 Cross-stream。

paraphrase-multilingual-MiniLM-L12-v2 · UMAP · HDBSCAN

层级	高可信	CV	选择
8	5	1.03	—
12	7	0.79	候选
15	9	0.69	最优
20	9	0.88	拐点后

Findings

14 个行为主题。9 个高可信。

#	主题	QEC	覆盖率	产品线
高可信 · ≥30% + 跨产品线 + 跨人设
0	迎客破冰与需求探询	339	83%	iPhone+Watch
2	屏幕亮度与决策推进	284	81%	iPhone+Watch
1	核心硬件参数陈述	319	73%	iPhone+Watch
3	场景化功能演示	250	69%	iPhone+Watch
4	芯片性能与系统流畅	151	61%	iPhone+Watch
5	续航与快充	124	57%	iPhone+Watch
8	材质与耐用性	93	43%	iPhone+Watch
6	蜂窝网络与GPS	106	38%	iPhone+Watch
9	关系建立与产品定位	90	38%	iPhone+Watch
中等可信
7	健康监测	103	30%	Watch
10	运动与防水	69	25%	iPhone+Watch
11	安全功能	49	24%	iPhone+Watch
12	产品线引导	45	22%	iPhone+Watch
13	坦诚与异议处理	41	20%	iPhone+Watch

Findings

关键发现

#0 迎客破冰与需求探询

标准问候、探询需求、了解旧设备

"欢迎光临，您平时用手机做什么比较多？"

339 QEC · 83%

#3 场景化功能演示

将功能关联到客户具体使用场景

"看演唱会时同时录现场和自己的反应"

250 QEC · 69%

#2 屏幕亮度与决策推进

参数介绍后引导颜色/配置选择

"3000尼特户外也看得清。您喜欢什么颜色？"

284 QEC · 81%

参数占主导 47% QEC 是产品参数陈述，但 20% 是需求场景关联

坦诚稀缺仅 1%（35 QEC），但高分员工做到了

跨场景稳定 iPhone vs Watch、三种人设分布一致 — 反映个人行为倾向

Watch 专属健康监测（心率/血氧/睡眠/体温/经期）仅在 Watch 对话中出现

诚实声明

方法论的边界

做到了什么

• 2,372 个可追溯的行为 Code

• 14 个语义聚类主题，9 个高可信

• QEC + 聚类参数完整记录，可复制

没有做到什么

• 没有评价行为好坏

• 没有覆盖真实门店行为

• 没有好/差对比（无 <80 分对照组）

• AI Coach 场景 ≠ 真实销售场景

What's Next

Cross-stream
交叉验证

Stream 2 11 主题 · 销冠声称

⇄

Stream 1a 14 主题 · 模拟展现

→

收敛/分歧分析

收敛 = 双源互证 S2 独有 = 场景限制？ S1a 独有 = 隐性胜任力？