Harness Work (v3)

Harness v3 の統合実行スキル。以下の旧スキルを統合:

work — Plans.md タスクの実装（スコープ自動判断）
impl — 機能実装（タスクベース）
breezing — チームフル自動実行
parallel-workflows — 並列ワークフロー最適化
ci — CI 失敗時の復旧

Quick Reference

ユーザー入力	モード	動作
`harness-work`	auto	タスク数で自動判定（下記参照）
`harness-work all`	auto	全未完了タスクを自動モードで実行
`harness-work 3`	solo	タスク3だけ即実行
`harness-work --parallel 5`	parallel	5ワーカーで並列実行（強制）
`harness-work --codex`	codex	Codex CLI に委託（明示時のみ）
`harness-work --breezing`	breezing	チーム実行を強制

Execution Mode Auto Selection（フラグなし時の自動判定）

明示的なモードフラグ（--parallel, --breezing, --codex）がない場合、対象タスク数に応じて最適なモードを自動選択する:

対象タスク数	自動選択モード	理由
1 件	Solo	オーバーヘッド最小。直接実装が最速
2〜3 件	Parallel（Task tool）	Worker 分離のメリットが出始める閾値
4 件以上	Breezing	Lead 調整 + Worker 並列 + Reviewer 独立の三者分離が効果的

ルール

明示フラグは常にオートモードを上書きする
- --parallel N → Parallel モード（タスク数に関係なく）
- --breezing → Breezing モード（タスク数に関係なく）
- --codex → Codex モード（タスク数に関係なく）
--codex は明示時のみ発動。Codex CLI が未インストールの環境があるため、自動選択しない
--codex は他モードと組み合わせ可能: --codex --breezing → Codex + Breezing

オプション

オプション	説明	デフォルト
`all`	全未完了タスクを対象	-
`N` or `N-M`	タスク番号/範囲指定	-
`--parallel N`	並列ワーカー数	auto
`--sequential`	直列実行強制	-
`--codex`	Codex CLI で実装委託（明示時のみ、自動選択しない）	false
`--no-commit`	自動コミット抑制	false
`--resume <id\|latest>`	前回セッション再開	-
`--breezing`	Lead/Worker/Reviewer のチーム実行	false
`--no-tdd`	TDD フェーズスキップ	false
`--no-simplify`	Auto-Refinement スキップ	false
`--auto-mode`	Auto Mode rollout を明示。親セッションの permission mode が互換な場合のみ採用を検討	false

Token Optimization (v2.1.69+): git 操作を伴わない軽量タスクでは plugin settings の includeGitInstructions: false を有効にしてプロンプトトークンを削減できる。

スコープダイアログ（引数なし時）

harness-work
どこまでやりますか?
1) 次のタスク: Plans.md の次の未完了タスク → Solo で実行
2) 全部（推奨）: 残りのタスクをすべて完了 → タスク数で自動モード選択
3) 番号指定: タスク番号を入力（例: 3, 5-7）→ 件数で自動モード選択

引数ありなら即実行（対話スキップ）:

harness-work all → 全タスク、自動モード選択
harness-work 3-6 → 4件なので Breezing 自動選択

Effort レベル制御（v2.1.68+, v2.1.72 簡素化）

Claude Code v2.1.68 で Opus 4.6 は medium effort (◐) がデフォルト。 v2.1.72 で max レベルが廃止され、3段階 low(○)/medium(◐)/high(●) に簡素化。 /effort auto でデフォルトにリセット可能。複雑なタスクには ultrathink キーワードで high effort (●) を有効化する。

多要素スコアリング

タスク着手時に以下のスコアを合算し、閾値 3 以上で ultrathink を注入:

要素	条件	スコア
ファイル数	変更対象 4 ファイル以上	+1
ディレクトリ	core/, guardrails/, security/ を含む	+1
キーワード	architecture, security, design, migration を含む	+1
失敗履歴	agent memory に同タスクの失敗記録あり	+2
明示指定	PM テンプレートに ultrathink 記載あり	+3（自動採用）

注入方法

スコア ≥ 3 の場合、Worker spawn prompt の冒頭に ultrathink を追加。 breezing モードでも同じロジックが適用される（harness-work が一本化して管理）。

実行モード詳細

Solo モード（1 件時の自動選択）

Plans.md を読み込み、対象タスクを特定
- Plans.md が存在しない場合: harness-plan create --ci を自動呼び出し → Plans.md を生成して続行
- ヘッダーに DoD / Depends カラムがない場合: Plans.md が旧フォーマットです。harness-plan create で再生成してください。 → 停止
- 会話に未記載タスクがある場合: 直前の会話コンテキストから要件を抽出し、Plans.md に cc:TODO で自動追記
  - 抽出ロジック: ユーザー発言からアクション動詞（「〜を追加」「〜を修正」「〜を実装」）を検出
  - 追記時は v2 フォーマット（Task / 内容 / DoD / Depends / Status）に準拠
  - 追記後、ユーザーに「Plans.md に以下を追記しました」と表示（5 秒タイムアウト付きプロンプト、デフォルト: 続行） 1.5. タスク背景確認（30 秒）:
- タスクの「内容」と「DoD」から目的（このタスクが解く課題）を 1 行で推論表示
- git grep / Glob で 影響範囲（変更が及ぶファイル/モジュール）を推論表示
- 推論に自信がある場合: そのまま実装に進む（フロー遅延なし）
- 推論に自信がない場合: ユーザーに 1 問だけ確認（「この理解で合っていますか？」）
タスクを cc:WIP に更新
TDD フェーズ（[skip:tdd] なし & テストFW存在時）: a. テストファイルを先に作成（Red） b. 失敗を確認
コードを実装（Green）（Read/Write/Edit/Bash）
/simplify で Auto-Refinement（--no-simplify で省略可）
自動レビューステージ（「レビューループ」参照）:
- Codex exec 優先でレビュー実行 → フォールバックで内部 Reviewer agent
- REQUEST_CHANGES の場合: 指摘を元に修正→再レビュー（最大 3 回）
- APPROVE で次ステップへ
git commit で自動コミット（--no-commit で省略可）
タスクを cc:完了 に更新（commit hash 付与）
- git log --oneline -1 で直近の commit hash（短縮形 7 文字）を取得
- Plans.md の Status を cc:完了 [a1b2c3d] 形式で更新
- commit がない場合（--no-commit 時）は hash なしで cc:完了 のみ
リッチ完了報告（「完了報告フォーマット」参照）
失敗時の自動再計画（テスト/CI 失敗時のみ）:
- テスト実行結果を確認
- 失敗した場合: 修正タスク案を state に保存し、承認コマンド経由で Plans.md に追加（「失敗タスクの自動再チケット化」参照）
- 成功した場合: 次タスクへ進む

Parallel モード（2〜3 件時の自動選択 / `--parallel N` で強制）

[P] マーク付きタスクを N ワーカーで並列実行。 --parallel N で明示指定した場合は、タスク数に関係なくこのモードを使用。同一ファイルへの書き込みが競合する場合は git worktree で分離。

Codex モード（`--codex` 明示時のみ）

bash

TIMEOUT=$(command -v timeout || command -v gtimeout || echo "")
CODEX_PROMPT=$(mktemp /tmp/codex-prompt-XXXXXX.md)
# タスク内容を一意なテンポラリファイルに書き出し
# stdin 経由で渡す（"-" は公式 stdin 指定。ARG_MAX 超過を回避）
cat "$CODEX_PROMPT" | ${TIMEOUT:+$TIMEOUT 120} codex exec - --sandbox workspace-write --full-auto 2>>/tmp/harness-codex-$$.log
rm -f "$CODEX_PROMPT"

タスク内容を一意なテンポラリファイルに書き出し、stdin 経由で Codex CLI に委託。並列実行時もパスが衝突せず、大きなプロンプトも ARG_MAX に制約されない。結果を検証し、品質基準を満たさない場合は自力で修正。

Breezing モード（4 件以上で自動選択 / `--breezing` で強制）

Lead / Worker / Reviewer の役割分離でチーム実行する。 Codex では spawn_agent, wait, send_input, resume_agent, close_agent を使った native subagent orchestration を前提にし、古い TeamCreate / TaskCreate ベースの説明を採らない。

権限ポリシー:

現行の shipped default は bypassPermissions
--auto-mode は互換な親セッション向けの opt-in rollout フラグとして扱う
permissions.defaultMode や agent frontmatter の permissionMode には未文書化の autoMode 値を書かない

CC v2.1.69+: nested teammates はプラットフォーム側で禁止されるため、 Worker/Reviewer プロンプトには冗長な nested 防止文言を追加しない。

Lead (this agent)
├── Worker (task-worker agent) — 実装担当
└── Reviewer (code-reviewer agent) — レビュー担当

Phase A: Pre-delegate（準備）:

Plans.md を読み込み、対象タスクを特定
依存グラフを解析し、実行順序を決定（Depends カラム）
各タスクの effort スコアリング（ultrathink 注入判定）

Phase B: Delegate（Worker spawn → レビュー → cherry-pick）:

各タスクについて以下を逐次実行する（依存順）:

API 注記: 以下は Claude Code の API 構文で記述。 Codex 環境では Agent(...) → spawn_agent(...), SendMessage(...) → send_input(...) に読み替え。詳細は team-composition.md の API マッピング表を参照。

for task in execution_order:
    # B-1. Worker spawn（フォアグラウンド、worktree 分離）
    # Agent tool の戻り値に agentId が含まれる — 修正ループで SendMessage に使用
    Plans.md: task.status = "cc:WIP"  # 着手時に更新（未着手タスクは cc:TODO のまま）

    worker_result = Agent(
        subagent_type="claude-code-harness:worker",
        prompt="タスク: {task.内容}\nDoD: {task.DoD}\nmode: breezing",
        isolation="worktree",
        run_in_background=false  # フォアグラウンドで実行 → Worker 完了まで待機
    )
    worker_id = worker_result.agentId  # SendMessage 用に保持
    # worker_result には {commit, worktreePath, files_changed, summary} が含まれる

    # B-2. Lead がレビュー実行（Codex exec 優先）
    diff_text = git("-C", worker_result.worktreePath, "show", worker_result.commit)
    verdict = codex_exec_review(diff_text) or reviewer_agent_review(diff_text)

    # B-3. 修正ループ（REQUEST_CHANGES 時、最大 3 回）
    # Worker はフォアグラウンドで完了済みだが、SendMessage で再開可能
    # （CC: SendMessage(to: agentId) / Codex: resume_agent(agent_id) + send_input）
    review_count = 0
    latest_commit = worker_result.commit
    while verdict == "REQUEST_CHANGES" and review_count < 3:
        SendMessage(to=worker_id, message="指摘内容: {issues}\n修正して amend してください")
        # Worker が修正 → amend → 更新された commit hash を返す
        updated_result = wait_for_response(worker_id)
        latest_commit = updated_result.commit
        diff_text = git("-C", worker_result.worktreePath, "show", latest_commit)
        verdict = codex_exec_review(diff_text) or reviewer_agent_review(diff_text)
        review_count++

    # B-4. APPROVE → main に cherry-pick
    if verdict == "APPROVE":
        git cherry-pick --no-commit {latest_commit}  # worktree → main
        git commit -m "{task.内容}"
        Plans.md: task.status = "cc:完了 [{hash}]"
    else:
        → ユーザーにエスカレーション

    # B-5. Progress feed
    print("📊 Progress: Task {completed}/{total} 完了 — {task.内容}")

Phase C: Post-delegate（統合・報告）:

全タスクの commit log を集計
リッチ完了報告（「完了報告フォーマット」の Breezing テンプレート）を出力
Plans.md の最終確認（全タスク cc:完了になっているか）

CI 失敗時の対応

CI が失敗した場合:

ログを確認してエラーを特定
修正を実施
同一原因で 3 回失敗したら自動修正ループを停止
失敗ログ・試みた修正・残る論点をまとめてエスカレーション

失敗タスクの自動再チケット化

タスク完了後にテスト/CI が失敗した場合、修正タスク案を自動生成し、承認後に Plans.md へ反映する:

トリガー条件

条件	アクション
`cc:完了` 後にテスト失敗	修正タスク案を state に保存し、承認を待つ
CI 失敗（3回未満）	修正を実施し、失敗カウントをインクリメント
CI 失敗（3回目）	修正タスク案を提示 + エスカレーション

修正タスクの自動生成

失敗原因を分類（syntax_error / import_error / type_error / assertion_error / timeout / runtime_error）
.claude/state/pending-fix-proposals.jsonl に修正タスク案を保存:
- 番号: 元タスク番号 + .fix サフィックス（例: 26.1.fix）
- 内容: fix: [元タスク名] - [失敗原因カテゴリ]
- DoD: テスト/CI が通ること
- Depends: 元タスク番号
ユーザーが approve fix <task_id> を送ると Plans.md に cc:TODO で追加
reject fix <task_id> で提案を破棄。pending が1件だけのときは yes / no でも応答可能

レビューループ

実装完了後（ステップ 5 の後）に自動実行される品質検証ステージ。 全モード共通（Solo / Parallel / Breezing）で統一的に適用される。 Parallel モードでは各 Worker が step 10（外部レビュー受付）として同じループを実行する。

レビュー実行の優先順位

1. Codex exec（優先）
   ↓ codex コマンドが存在しない or タイムアウト（120s）
2. 内部 Reviewer agent（フォールバック）

APPROVE / REQUEST_CHANGES の判定基準

レビュアーには以下の閾値基準を渡し、この基準のみで verdict を判定させる。基準外の改善提案は recommendations として返すが、verdict には影響しない。

重要度	定義	verdict への影響
critical	セキュリティ脆弱性、データ損失リスク、本番障害の可能性	1 件でも → REQUEST_CHANGES
major	既存機能の破壊、仕様との明確な矛盾、テスト不通過	1 件でも → REQUEST_CHANGES
minor	命名改善、コメント不足、スタイル不統一	verdict に影響しない
recommendation	ベストプラクティス提案、将来の改善案	verdict に影響しない

重要: minor / recommendation のみの場合は 必ず APPROVE を返すこと。「あったほうが良い改善」は REQUEST_CHANGES の理由にならない。

Codex exec レビュー

タスク開始時の HEAD を BASE_REF として保持し、その ref との差分をレビュー対象にする。

bash

# タスク開始時に base ref を記録（Step 2 の cc:WIP 更新前に実行）
BASE_REF=$(git rev-parse HEAD)

# ... 実装完了後 ...

TIMEOUT=$(command -v timeout || command -v gtimeout || echo "")
REVIEW_PROMPT=$(mktemp /tmp/codex-review-XXXXXX.md)
AI_RESIDUALS_JSON="$(bash scripts/review-ai-residuals.sh --base-ref "${BASE_REF}" 2>/dev/null || echo '{"tool":"review-ai-residuals","scan_mode":"diff","base_ref":null,"files_scanned":[],"summary":{"verdict":"APPROVE","major":0,"minor":0,"recommendation":0,"total":0},"observations":[]}')"
cat > "$REVIEW_PROMPT" <<REVIEW_EOF
以下の diff と静的検出結果をレビューしてください。

## 判定基準（これのみで verdict を決定）
- critical（セキュリティ脆弱性・データ損失・本番障害）: 1件でも → REQUEST_CHANGES
- major（既存機能破壊・仕様矛盾・テスト不通過）: 1件でも → REQUEST_CHANGES
- minor（命名・コメント・スタイル）: verdict に影響しない → APPROVE
- recommendation（改善提案）: verdict に影響しない → APPROVE

minor / recommendation のみの場合は必ず APPROVE を返してください。

## 追加観点
- AI Residuals（mock / dummy / localhost / TODO / test.skip / ハードコード設定など）
- `scripts/review-ai-residuals.sh` の結果を根拠の1つとして使い、major に当たるものだけ verdict に反映してください
- 単なる残骸候補や仮実装コメントは minor / recommendation に留めてください

JSON 形式で返してください:
{"verdict": "APPROVE|REQUEST_CHANGES", "critical_issues": [], "major_issues": [], "recommendations": []}

## AI residual scan result
${AI_RESIDUALS_JSON}

## diff
REVIEW_EOF
git diff "${BASE_REF}" >> "$REVIEW_PROMPT"
cat "$REVIEW_PROMPT" | ${TIMEOUT:+$TIMEOUT 120} codex exec - --sandbox read-only 2>>/tmp/harness-review-$$.log
REVIEW_EXIT=$?
rm -f "$REVIEW_PROMPT"

内部 Reviewer agent フォールバック

Codex exec が使えない場合（command -v codex が失敗、または exit code ≠ 0）:

Agent tool: subagent_type="reviewer"
prompt: "以下の変更をレビューしてください。判定基準: critical/major → REQUEST_CHANGES、minor/recommendation のみ → APPROVE。diff: {git diff ${BASE_REF}}"

Reviewer agent は Read-only（Write/Edit/Bash 無効）で安全にレビューを実行する。

修正ループ（REQUEST_CHANGES 時）

review_count = 0
MAX_REVIEWS = 3

while verdict == "REQUEST_CHANGES" and review_count < MAX_REVIEWS:
    1. レビュー指摘を解析（critical / major のみ対象）
    2. 各指摘に対して修正を実装
    3. 再度レビューを実行（同じ判定基準・同じ優先順位）
    review_count++

if review_count >= MAX_REVIEWS and verdict != "APPROVE":
    → ユーザーにエスカレーション
    → 「3 回修正しましたが以下の critical/major 指摘が残っています」+ 指摘一覧を表示
    → ユーザー判断を待つ（続行 / 中断）

Breezing モードでの適用

Breezing モードでは Lead がレビューループを実行する（上記 Phase B 参照）:

Worker が worktree 内で実装・commit → Lead に結果返却
Lead が Codex exec でレビュー（優先）/ Reviewer agent（フォールバック）
REQUEST_CHANGES → Lead が SendMessage で Worker に修正指示 → Worker が amend
修正後、再レビュー（最大 3 回）
APPROVE → Lead が main に cherry-pick → Plans.md を cc:完了 [{hash}] に更新

完了報告フォーマット

タスク完了時（cc:完了 + commit 後）に自動出力される視覚的サマリ。非専門家にも変更内容と影響が伝わることを目的とする。

テンプレート

┌─────────────────────────────────────────────┐
│  ✓ Task {N} 完了: {タスク名}                    │
├─────────────────────────────────────────────┤
│                                              │
│  ■ 何をしたか                                 │
│    • {変更内容 1}                              │
│    • {変更内容 2}                              │
│                                              │
│  ■ 何が変わるか                                │
│    Before: {旧動作}                            │
│    After:  {新動作}                            │
│                                              │
│  ■ 変更ファイル ({N} files)                    │
│    {ファイルパス 1}                             │
│    {ファイルパス 2}                             │
│                                              │
│  ■ 残りの課題                                  │
│    • Task {X} ({status}): {内容}  ← Plans.md  │
│    • Task {Y} ({status}): {内容}  ← Plans.md  │
│    （Plans.md に {M} 件の未完了タスクあり）       │
│                                              │
│  commit: {hash} | review: {APPROVE}           │
└─────────────────────────────────────────────┘

生成ルール

何をしたか: git diff --stat HEAD~1 と commit message から自動抽出。技術用語は最小限にし、動詞で始める
何が変わるか: タスクの「内容」と「DoD」から Before/After を推論。ユーザー体験の変化を重視
変更ファイル: git diff --name-only HEAD~1 から取得。5 ファイル超は省略して件数表示
残りの課題: Plans.md の cc:TODO / cc:WIP タスクを一覧表示。Plans.md に記載済みかどうかを明示
review: レビュー結果（APPROVE / REQUEST_CHANGES → APPROVE）を表示

Parallel モードでの報告

1 タスク（--parallel 強制時）: Solo テンプレートを使用
複数タスク: Breezing 集約テンプレートを使用（下記参照）

Breezing モードでの報告

全タスク完了後にまとめて出力。各タスクは簡略版（何をしたか + commit hash のみ）で一覧し、最後に全体サマリ（合計変更ファイル数 + 残り課題）を出力する:

┌─────────────────────────────────────────────┐
│  ✓ Breezing 完了: {N}/{M} タスク             │
├─────────────────────────────────────────────┤
│                                              │
│  1. ✓ {タスク名 1}            [{hash1}]      │
│  2. ✓ {タスク名 2}            [{hash2}]      │
│  3. ✓ {タスク名 3}            [{hash3}]      │
│                                              │
│  ■ 全体の変更                                 │
│    {N} files changed, {A} insertions(+),     │
│    {D} deletions(-)                          │
│                                              │
│  ■ 残りの課題                                  │
│    Plans.md に {K} 件の未完了タスクあり         │
│    • Task {X}: {内容}                         │
│                                              │
└─────────────────────────────────────────────┘

Search AI Tools

harness-work

Install this agent skill to your Project

SKILL.md

Harness Work (v3)

Quick Reference

Execution Mode Auto Selection（フラグなし時の自動判定）

ルール

オプション

スコープダイアログ（引数なし時）

Effort レベル制御（v2.1.68+, v2.1.72 簡素化）

多要素スコアリング

注入方法

実行モード詳細

Solo モード（1 件時の自動選択）

Parallel モード（2〜3 件時の自動選択 / `--parallel N` で強制）

Codex モード（`--codex` 明示時のみ）

Breezing モード（4 件以上で自動選択 / `--breezing` で強制）

CI 失敗時の対応

失敗タスクの自動再チケット化

トリガー条件

修正タスクの自動生成

レビューループ

レビュー実行の優先順位

APPROVE / REQUEST_CHANGES の判定基準

Codex exec レビュー

内部 Reviewer agent フォールバック

修正ループ（REQUEST_CHANGES 時）

Breezing モードでの適用

完了報告フォーマット

テンプレート

生成ルール

Parallel モードでの報告

Breezing モードでの報告

関連スキル

Search AI Tools

Install this agent skill to your Project

SKILL.md

Harness Work (v3)

Quick Reference

Execution Mode Auto Selection（フラグなし時の自動判定）

ルール

オプション

スコープダイアログ（引数なし時）

Effort レベル制御（v2.1.68+, v2.1.72 簡素化）

多要素スコアリング

注入方法

実行モード詳細

Solo モード（1 件時の自動選択）

Parallel モード（2〜3 件時の自動選択 / --parallel N で強制）

Codex モード（--codex 明示時のみ）

Breezing モード（4 件以上で自動選択 / --breezing で強制）

CI 失敗時の対応

失敗タスクの自動再チケット化

トリガー条件

修正タスクの自動生成

レビューループ

レビュー実行の優先順位

APPROVE / REQUEST_CHANGES の判定基準

Codex exec レビュー

内部 Reviewer agent フォールバック

修正ループ（REQUEST_CHANGES 時）

Breezing モードでの適用

完了報告フォーマット

テンプレート

生成ルール

Parallel モードでの報告

Breezing モードでの報告

関連スキル

Parallel モード（2〜3 件時の自動選択 / `--parallel N` で強制）

Codex モード（`--codex` 明示時のみ）

Breezing モード（4 件以上で自動選択 / `--breezing` で強制）