PlanGate の差別化は「ゲート」だけでなく、承認に値する高品質な実行計画を生むまでのプロセスにあります。本ページは、PBI INPUT から C-3 承認に至るまで 何を・なぜ・どの順で 行っているかを 1 本に通した解説です。
判定基準や不変条件の厳密な定義は再掲せず、開発者向けの正本(GitHub 上のルール・契約ファイル)へリンクします。本ページは「流れと意図」を担います。
AI コーディングエージェントの失敗の多くは「実装が下手」ではなく「前提の取り違え・スコープの誤認・規模の過小評価」から起きます。PlanGate は実装前にこれらを潰すため、計画を 作文(それらしい文章)ではなく 実行可能な計画(誰が・何を・どの順で・どう検証するかが決まっている状態)として生成することを契約で求めます。
NO EXECUTION WITHOUT REVIEWED PLAN FIRST(正本: core-contract.md)計画フェーズの成果物(plan.md / todo.md / test-cases.md)が承認ゲート C-3 を通って初めて、実装(exec)が解禁されます。計画の品質がそのまま実装の安全性と完遂率を決める——これが投資の理由です。
PlanGate 全体の位置づけは Product Overview を、導入前後の変化は Before / After を参照してください。
Brainstorm(任意)
↓ 対話で要件・設計を発散→収束(PBI INPUT PACKAGE の素地)
A: PBI INPUT PACKAGE 👤 ← 人間が「何を・なぜ」を構造化して入力
↓
B-1: 確認質問(最大 3 問)🤖 ← 曖昧さを潰す
↓
★ 事前メトリクス検証(mandatory gate)🤖 ← 「全件」系は実数を取る/3 倍ルール
↓
B-2: アプローチ比較(2〜3 案の trade-off)🤖
↓
B-3: plan / todo / test-cases 同時生成 + Mode 判定 🤖
↓
C-1: セルフレビュー(17 項目)🤖
↓
C-2: 外部 AI レビュー(任意 / 観点固定)🤖
↓
C-3: 人間レビュー(APPROVE / CONDITIONAL / REJECT)👤
↓
→ exec 解禁
A〜B は Workflow の WF-02(Requirement Expansion)〜 WF-03(Solution Design)に対応します。
計画の出発点。人間が「何を・なぜ」を構造化して渡します。
docs/working/TASK-XXXX/pbi-input.mdここが曖昧だと後続すべてが揺れます。Brainstorm フェーズ(任意)は、この PBI INPUT を対話で固めるための前処理です。
AI が PBI INPUT を読み、計画を立てる前に曖昧さを最大 3 問だけ確認します。質問を絞るのは、際限ない往復を避け、本質的な不確実性だけを潰すためです。
PlanGate の計画品質を支える要のひとつ。「全部 / 全件 / 残り N 件」のような規模に関わる対象は、AI の見積もりだけで進めず実数を取得します。
grep -rln ... | wc -l / find ... | wc -l / rg --files | wc -l で対象範囲を限定して実数を取るplan.md に Metrics Evidence 欄(見積もり / 実数 / 比率 / 判定)を必須化実例: ある画像描き直しタスクで AI は「規模 M」と推奨したが、実数を取ると 1697 ファイル(約 17 倍)。検証なしで着手していれば 1 セッションで完遂不能だった。このゲートが軌道修正を生みます。
単一案に飛びつかず、2〜3 案を trade-off 付きで比較してから採用案を選びます。後から「なぜこの方式か」を C-3 レビュアーが追えるよう、選定理由を残します(主要判断は decision-log.jsonl に追記専用で記録)。
3 ファイルを同時に生成します。実装の手順(todo)と検証の基準(test-cases)を計画と同時に確定させることで、「計画はあるがテストがない」状態を構造的に防ぎます。
plan.md: Goal / Constraints / Approach Overview / Work Breakdown / Files / Testing Strategy / Risks / Mode 判定 / Metrics Evidencetodo.md: タスク粒度 2〜5 分、各タスクに Owner(agent/human)・depends_on・files を必須test-cases.md: 各 受入基準 → テストケースのマッピング、Edge case、自動化可否生成した計画を AI 自身が 17 項目で点検します(Plan 7 / ToDo 5 / TestCases 3 + 判定)。受入基準の網羅、Unknowns 処理、スコープ制御、テスト戦略、依存関係などを PASS / WARN / FAIL で評価します。
別モデル(Codex / Gemini 等)による計画レビュー。指摘は追記専用で集約し、計画本体への反映は 1 回だけ確定します(版管理の破綻を防ぐ)。設計妥当性レーン(plan を読む)とコードベース整合レーン(既存パターンとの不整合を見る)に責務を分けます。
計画を承認できるかを人間が判断します。ここを通るまで実装は 1 行も解禁されません。
計画品質は「頑張る」ではなく構造で担保しています。
| 仕組み | 何を防ぐか |
|---|---|
| Success criteria | 必須セクション欠落(実行不能な計画) |
| Stop rules | 受入基準未カバー/scope 外作業の混入 |
| 事前メトリクス検証(3 倍ルール) | 規模の過小評価・スコープ過大 |
| 安全側不変条件 | 判定不能時に楽観側へ倒れること |
| 3 ファイル同時生成 | 「計画はあるがテストがない」 |
| C-1 / C-2 / C-3 多層レビュー | 単一視点の見落とし |
| plan_hash + C-3 ゲート | 承認後の計画こっそり改変 |
pbi-input.md に受入基準・In/Out of scope があるplan.md に Goal / Constraints / Approach / Work Breakdown / Files / Testing Strategy / Risks / Mode / Metrics Evidence が揃っているtodo.md の全タスクが 2〜5 分粒度 + Owner / depends_on / files 付きtest-cases.md で全受入基準 → テストケースが紐づき、Edge case を含む