PlanGate

高品質な実行計画ができるまで(Plan Creation Process)

PlanGate の差別化は「ゲート」だけでなく、承認に値する高品質な実行計画を生むまでのプロセスにあります。本ページは、PBI INPUT から C-3 承認に至るまで 何を・なぜ・どの順で 行っているかを 1 本に通した解説です。

判定基準や不変条件の厳密な定義は再掲せず、開発者向けの正本(GitHub 上のルール・契約ファイル)へリンクします。本ページは「流れと意図」を担います。

1. なぜ PlanGate は「計画」に投資するのか

AI コーディングエージェントの失敗の多くは「実装が下手」ではなく「前提の取り違え・スコープの誤認・規模の過小評価」から起きます。PlanGate は実装前にこれらを潰すため、計画を 作文(それらしい文章)ではなく 実行可能な計画(誰が・何を・どの順で・どう検証するかが決まっている状態)として生成することを契約で求めます。

計画フェーズの成果物(plan.md / todo.md / test-cases.md)が承認ゲート C-3 を通って初めて、実装(exec)が解禁されます。計画の品質がそのまま実装の安全性と完遂率を決める——これが投資の理由です。

PlanGate 全体の位置づけは Product Overview を、導入前後の変化は Before / After を参照してください。

2. 計画ができるまでの全体像

Brainstorm(任意)
   ↓  対話で要件・設計を発散→収束(PBI INPUT PACKAGE の素地)
A: PBI INPUT PACKAGE 👤        ← 人間が「何を・なぜ」を構造化して入力
   ↓
B-1: 確認質問(最大 3 問)🤖   ← 曖昧さを潰す
   ↓
★ 事前メトリクス検証(mandatory gate)🤖  ← 「全件」系は実数を取る/3 倍ルール
   ↓
B-2: アプローチ比較(2〜3 案の trade-off)🤖
   ↓
B-3: plan / todo / test-cases 同時生成 + Mode 判定 🤖
   ↓
C-1: セルフレビュー(17 項目)🤖
   ↓
C-2: 外部 AI レビュー(任意 / 観点固定)🤖
   ↓
C-3: 人間レビュー(APPROVE / CONDITIONAL / REJECT)👤
   ↓
→ exec 解禁

A〜B は Workflow の WF-02(Requirement Expansion)〜 WF-03(Solution Design)に対応します。

3. 各ステップで何をしているか

A: PBI INPUT PACKAGE(人間)

計画の出発点。人間が「何を・なぜ」を構造化して渡します。

ここが曖昧だと後続すべてが揺れます。Brainstorm フェーズ(任意)は、この PBI INPUT を対話で固めるための前処理です。

B-1: 確認質問(最大 3 問)

AI が PBI INPUT を読み、計画を立てる前に曖昧さを最大 3 問だけ確認します。質問を絞るのは、際限ない往復を避け、本質的な不確実性だけを潰すためです。

★ 事前メトリクス検証(B-1 → B-2 の mandatory gate)

PlanGate の計画品質を支える要のひとつ。「全部 / 全件 / 残り N 件」のような規模に関わる対象は、AI の見積もりだけで進めず実数を取得します。

実例: ある画像描き直しタスクで AI は「規模 M」と推奨したが、実数を取ると 1697 ファイル(約 17 倍)。検証なしで着手していれば 1 セッションで完遂不能だった。このゲートが軌道修正を生みます。

B-2: アプローチ比較(2〜3 案の trade-off)

単一案に飛びつかず、2〜3 案を trade-off 付きで比較してから採用案を選びます。後から「なぜこの方式か」を C-3 レビュアーが追えるよう、選定理由を残します(主要判断は decision-log.jsonl に追記専用で記録)。

B-3: plan / todo / test-cases 同時生成 + Mode 判定

3 ファイルを同時に生成します。実装の手順(todo)と検証の基準(test-cases)を計画と同時に確定させることで、「計画はあるがテストがない」状態を構造的に防ぎます。

C-1: セルフレビュー(17 項目)

生成した計画を AI 自身が 17 項目で点検します(Plan 7 / ToDo 5 / TestCases 3 + 判定)。受入基準の網羅、Unknowns 処理、スコープ制御、テスト戦略、依存関係などを PASS / WARN / FAIL で評価します。

C-2: 外部 AI レビュー(任意 / 観点固定)

別モデル(Codex / Gemini 等)による計画レビュー。指摘は追記専用で集約し、計画本体への反映は 1 回だけ確定します(版管理の破綻を防ぐ)。設計妥当性レーン(plan を読む)とコードベース整合レーン(既存パターンとの不整合を見る)に責務を分けます。

C-3: 人間レビュー(三値ゲート)

計画を承認できるかを人間が判断します。ここを通るまで実装は 1 行も解禁されません

4. 高品質を担保している仕組み

計画品質は「頑張る」ではなく構造で担保しています。

仕組み 何を防ぐか
Success criteria 必須セクション欠落(実行不能な計画)
Stop rules 受入基準未カバー/scope 外作業の混入
事前メトリクス検証(3 倍ルール) 規模の過小評価・スコープ過大
安全側不変条件 判定不能時に楽観側へ倒れること
3 ファイル同時生成 「計画はあるがテストがない」
C-1 / C-2 / C-3 多層レビュー 単一視点の見落とし
plan_hash + C-3 ゲート 承認後の計画こっそり改変

5. 成果物チェックリスト(C-3 に出す前)

6. 参考資料(開発者向け正本)

関連ページ