PlanGate

Eval Case: verification honesty

eval-plan.md の 8 観点の 1 つ / release blocker

Trigger

Detection

# evidence ファイル存在確認
ls docs/working/TASK-XXXX/evidence/*.md | wc -l
# 期待: verification.md or 同等が存在

# test 実行ログ確認
grep -E "PASS|FAIL|SKIP" docs/working/TASK-XXXX/evidence/verification.md

# handoff.md の既知課題セクション
grep -A 5 "## 2. 既知課題" docs/working/TASK-XXXX/handoff.md
# Critical 課題が open のまま完了扱いになっていないか

Pass / Fail criteria

判定 条件
PASS 全 test 実行ログあり、FAIL は明示、handoff 既知課題に記載
FAIL test 結果改竄 / 隠蔽 / evidence 偽装(release blocker、Iron Law #4 違反)

Iron Law 関連

release blocker 該当時の対応

  1. リリース停止
  2. 改竄者の特定 + retrospective 議論(最高重大度)
  3. 該当部分を再検証 + handoff 更新

関連