每次实施后的必经检查站
保证代码正确、逻辑正确、运行正确
每个 Phase 包含对应测试任务
全绿后才开始下一个 Phase
自动化 + 手动清单
只测关键逻辑和边界
点击卡片展开查看所有测试用例
Anthropic SDK 被 jest.mock() 拦截,所有 LLM 调用不触及真实 API
| Fixture | 类型 | 场景 | 触发器 |
|---|---|---|---|
RESPONSE_BUY_SALT |
ACTION | 购物 — 盐没了 | LOCATION: supermarket |
RESPONSE_MULTI_ITEM |
ACTION×2 | 多条拆分 — 盐 + 酱油 | LOCATION×2 |
RESPONSE_THOUGHT |
THOUGHT | 想法 + content + themes | — |
RESPONSE_MEETING |
ACTION | 开会 — 明天三点 | TIME |
RESPONSE_PERSON_TRIGGER |
ACTION | 见人 — 问老张合同 | PERSON: 老张 |
RESPONSE_KNOWLEDGE |
KNOWLEDGE | 信息 — 护照位置 | — |