开发工作流与策略
一、Vibe Coding 核心方法论
原则
- 先跑通再优化:每一步追求「最小可跑版本」,ugly
but working
- AI 写 80%,你调 20%:让 Claude Code / Cursor
生成大部分代码,你负责架构决策和体验把控
- 每步可验证:每完成一个模块必须能看到效果(屏幕上有输出、API
有响应、通知能弹出)
每日工作节奏
- 开始前:回顾昨天的验收结果,确认今天的目标
- 开发中:一次只做一个模块,完成 → 验证 →
下一个
- 结束时:记录遇到的问题和明天需要调整的内容
二、与 Claude Code 协作策略
Prompt 编写原则
- 给足上下文:每次开新模块前,描述清楚整体架构和这个模块的目标
- 分层递进:先描述「是什么」,再描述「怎么做」,最后描述「约束条件」
- 提供范例:给出期望的输入/输出格式,LLM
输出更稳定
- 明确限制:说清楚 iOS
版本(17+)、不用哪些库、性能要求
关键 Prompt 模板
注意:以下为 Claude Code 通用模板。Cursor(iOS
开发)的 5 个专用 Prompt 模板详见 kept-blueprint.html
的「Cursor Prompt 范本」章节,涵盖语音服务、Core
Data、Widget、地理围栏和 API 调用。
新模块开发
我正在开发 Kept 应用的 [模块名]。
背景:Kept 是一个 AI 记忆助手 iOS App,[模块在整体架构中的位置和作用]。
需求:
1. [功能点 1]
2. [功能点 2]
3. [功能点 3]
技术约束:
- iOS 17+, SwiftUI, @Observable macro
- [其他约束]
请保持简洁,不要过度抽象。
Bug 修复
[模块名] 出现了问题:[症状描述]
预期行为:[应该怎样]
实际行为:[实际怎样]
请先分析可能的原因,然后写一个测试来重现这个 bug,再修复它。
代码优化
当前 [模块名] 的实现可以工作,但 [具体问题]。
请在不改变外部接口的前提下优化 [具体方面]。
三、7 天 Sprint 执行策略
每天的执行模式
| 日 |
主题 |
核心验收标准 |
| D1 搭骨架 |
项目初始化 + 语音录入 |
按住说话松开后文字出现 |
| D2 AI 大脑 |
云端 API + LLM 意图理解 |
curl 发送文本,返回结构化 JSON |
| D3 贯通 |
端云串联 + Core Data 存储 |
说话 → API → 列表显示记忆 |
| D4 提醒 |
时间通知 + 地理围栏 |
到超市附近手机推送通知 |
| D5 Widget |
锁屏 Widget + 完成确认 |
锁屏看到记忆,点完成后消失 |
| D6 打磨 |
UI 打磨 + 边界处理 |
整体视觉统一,核心流程流畅 |
| D7 试跑 |
自测 + Bug 修复 |
真实使用出现 1 次 aha moment |
每日验收流程
- 完成当天任务清单中的所有项目
- 在真机上运行并测试(不只依赖模拟器)
- 录一段屏幕演示当天的功能(D2 为纯 API,用 curl
输出截图代替录屏)
- 记录发现的问题到 bug 列表
- 确认通过后才进入下一天的内容
四、迭代优化策略
LLM Prompt 调优
- 上线后收集分类错误的 case
- 每攒 5-10 个更新 few-shot examples
- 重点关注:ACTION 误判为 INTENT、触发条件遗漏
- 保持 prompt 版本记录,方便回滚
性能优化路径
- Phase 1 (MVP):端侧 Apple Speech
Framework(零成本、离线可用)+ 云端 Claude Haiku
- Phase 2:评估端侧 Whisper
是否能提升中英混杂准确率 + 更快的 LLM
- Phase 3:端侧小模型做初步分类,云端只处理复杂
case
体验优化顺序
- 录入速度(松开到确认 ≤ 0.5s 端侧,2-5s 云端完成理解)
- 提醒准确度(对的时间、对的地点)
- 文案温度(像朋友随口说,不像机器通知)
- 视觉体验(warm, minimal, 不 overwhelming)
五、风险管理
| 风险 |
应对 |
| Action Button 体验不丝滑 |
同时做 App 内长按按钮作为备选 |
| LLM 分类不准 |
持续收集错误 case,密集调优 |
| 地理围栏不精准 |
200m 半径,后期改 significant location |
| 20 个围栏上限 |
importance 排序,动态管理 |
| 后台位置权限被拒 |
回退到时间触发 + Widget |
| 中英混杂识别差 |
优先中文,LLM 纠错英文实体 |
六、种子验证方法
观测指标
- 习惯形成:每天 2-3 条以上,连续 7 天不衰减 =
成功
- Aha Moment:前两周每人至少 1-2 次精准提醒惊喜 =
成功
数据收集
- 每条记忆的分类正确率
- 提醒触发的时机是否合适
- 用户的使用频率变化趋势
- 哪些场景用户想记但不方便录入
收集方式
- MVP(D7 阶段):手动记录 — 自己和 Amy
使用时,遇到问题截图 + 文字记录到共享备忘录
- Phase 2:App
内加入简单的本地统计(每日记忆数、分类分布),不上传云端