PlanGate は、AI コーディングエージェントを「速くコードを書く存在」としてだけ扱うのではなく、計画、承認、実装、検証、handoff を持つ開発ワークフローの中に置くための仕組みです。
この文書では、PlanGate が向き合う課題、ハーネスエンジニアリングとの関係、設計上の意図を説明します。具体的な操作手順は docs/plangate.md、v7 の構造は docs/plangate-v7-hybrid.md を参照してください。
AI コーディングエージェントは、実装速度を大きく引き上げます。一方で、実装前の計画、承認境界、検証条件、完了判断が弱いまま使うと、速さの裏側で品質と責任の所在が曖昧になります。
特に問題になるのは、AI が「良かれと思って」先回りすることです。未承認のスコープを実装する、テストを後回しにする、失敗した手順を説明せず別案に迂回する、会話の流れだけで完了を宣言する。これらはモデル単体の性能だけでは解けません。
PlanGate は、こうした問題をプロンプトの注意書きではなく、ワークフローと成果物で抑えることを目指します。
ここでいうハーネスエンジニアリングは、AI エージェントを安全に動かすための外枠を設計する考え方です。モデルに直接「慎重にやって」と頼るのではなく、実行環境、承認境界、検証、ログ、再実行条件を整え、AI の振る舞いを運用可能な形にします。
PlanGate は、その一般的な考え方を PBI 単位の開発ワークフローに落とし込むものです。

| 一般的な関心 | PlanGate での具体化 |
|---|---|
| 実行前に止める | C-3 ゲートで承認前の実装を禁止する |
| 入出力を固定する | pbi-input.md, plan.md, todo.md, test-cases.md を成果物にする |
| 検証を組み込む | L-0 / V-1〜V-4 を実装後フローに含める |
| 状態を保存する | status.md, current-state.md, handoff.md に経緯を残す |
| 役割を分離する | v7 で Workflow / Skill / Agent を分ける |
PlanGate が足したいものは、単なる「AI を制御する仕組み」ではありません。開発チームが AI に任せる範囲、人間が判断する範囲、検証で確認する範囲を、毎回同じ形で扱えるようにすることです。
AI は実装前に計画を出します。計画には、対象範囲、非対象範囲、タスク分解、テスト観点、リスクを含めます。
重要なのは、計画を「参考情報」ではなく「実行許可の前提」にすることです。PlanGate では、計画がレビューされ承認されるまで Agent 実行に進めません。
計画は実行許可の前提であると同時に、成果物全体の品質を最初に決める起点でもあります。対象範囲・テスト観点・リスクをここで固めることで、後段のゲート制御と検証内蔵は、その品質を現実に着地させ漏らさず守る役割を担います(PlanGate の価値は計画で生まれ、後段で保全される)。
PlanGate は、人間の判断点を C-3 と C-4 に集約します。
人間が全ステップを手で監視するのではなく、AI が準備した成果物と検証結果をもとに、重要な境界で判断します。
検証は「最後に余裕があればやるもの」ではなく、ワークフローの一部です。
PlanGate では、リンター自動修正、受け入れ検査、コード最適化、外部モデルレビュー、リリース前チェックを段階的に配置します。すべての案件で最大構成を使うのではなく、タスク規模に応じて必要な検証を選びます。
AI エージェントは、曖昧な要求からでもすぐ実装に進めます。これはプロトタイプでは強みですが、プロダクション開発ではスコープ逸脱や設計不足につながります。
PlanGate は、PBI から plan / todo / test-cases を作り、人間が C-3 で承認するまで実装を止めます。
会話ベースの開発では、「どこまで承認されたのか」「どの変更は追加判断が必要なのか」が曖昧になります。
PlanGate は、APPROVE / CONDITIONAL / REJECT の三値ゲートを使い、承認状態をファイルとフローに残します。実装中にスコープ変更が必要になった場合も、勝手に進めず人間判断に戻すことを前提にします。
AI はコード生成を先に進めやすく、検証は後段に寄りがちです。結果として、テスト観点が実装後に都合よく狭まる危険があります。
PlanGate では、実装前に test-cases.md を作り、実装後に V-1 で受け入れ条件と突合します。検証観点を後から作るのではなく、計画段階の成果物として先に固定します。
AI 開発はセッション、担当者、ツールごとに判断が揺れやすくなります。何を前提にしたのか、なぜその設計にしたのか、何を既知課題として残したのかが会話ログだけに残ると、チームで再利用しにくくなります。
PlanGate は、チケット単位の docs/working/TASK-XXXX/ に成果物を集約します。v7 では design.md と handoff.md を強化し、実装前後の判断を次の作業へ渡せる形にします。
PlanGate は使われるほど改善判断の材料が溜まり、その材料をもとに次の運用が更新されていく仕組みを目指します。本章では、その自己進化フレームに関する設計判断(どこを中心に置くか、どの段階で何を採用するか、何を取り入れないか)を整理します。
PlanGate の自己進化フレームは MAPE-K (IBM Autonomic Computing) に整合します。
| 自己進化要素 | PlanGate での担当 |
|---|---|
| Monitor (観測) | events.ndjson / Trace Timeline v1 (Experimental) |
| Analyze (評価) | Dogfooding Eval v1 (v8.8.0 候補) / C-3 / C-4 / Run Outcome Review |
| Plan/Execute (学習・制御) | Playbook 昇格 / Workflow |
| Knowledge (記憶) | AGENTS.md / Skill / handoff / docs/ai |
ここで重要なのは、Steering Loop(観測ループ)は自己進化の中心ではない という点です。中心は「評価・学習・ガバナンス」であり、Steering Loop はそれを支える観測・再現基盤です。
PlanGate は すべての機能を最初から使う必要はありません。Level 1(plan 承認のみ)から Level 5(eval / timeline)まで、必要な分だけ段階的に採用できます。自己進化機能は Level 4 以降 に置き、quickstart には混ぜません。
各レベルの具体的な機能範囲は README §「段階的導入レベル」 を参照してください。
業界主流であっても PlanGate が 意図的に切り捨てている 設計判断:
詳細: docs/ai/harness-improvement-roadmap.md §13.5 Control Plane track
PlanGate は、既存の AI 駆動開発、Spec-Driven Development、Skill / Agent 設計、ハーネスエンジニアリングの知見を参考にしています。
一方で、このリポジトリに書かれている PlanGate のフェーズ、ゲート、成果物、v7 ハイブリッド構造は、PlanGate としての設計解釈です。外部の一般論をそのまま写した仕様ではなく、PBI 単位の開発運用に合わせて再構成しています。
そのため、本文では次を分けて扱います。
PlanGate は、AI コーディングエージェントをプロダクション開発に組み込みたいチームに向いています。
一方で、短時間の実験、個人のプロトタイプ、探索的な Vibe Coding には重すぎる場合があります。PlanGate は「速く試す」よりも、「速さを保ったままチームで扱える形にする」ための仕組みです。
| ドキュメント | 内容 |
|---|---|
| docs/plangate.md | 運用手順、フェーズ、ゲート、検証ステップ |
| docs/plangate-v7-hybrid.md | Governance × Modularity の v7 構造 |
| docs/workflows/README.md | WF-01〜WF-05 の Workflow 定義 |
| docs/ai/tool-roles.md | Claude Code と Codex CLI の役割分担 |