AIエージェント

Claude Code Agent Teams完全ガイド【2026年最新】|セットアップから実践活用まで徹底解説

2026年2月8日 18分で読める AQUA合同会社
Claude Code Agent Teams完全ガイド【2026年最新】|セットアップから実践活用まで徹底解説

2026年2月5日、AnthropicはClaude Opus 4.6のリリースと同時に、Claude Codeの新機能「Agent Teams」を正式に公開しました。複数のAIエージェントがチームを組み、並列でコードを書き、互いに議論しながらタスクを遂行する ―― SF映画のような話ですが、もう現実です。

Anthropicのエンジニアは、この機能を使って16体のエージェントを同時稼働させ、2週間で10万行のRustコードを書いてCコンパイラを構築しました。

本記事では、公式ドキュメント・エンジニアリングブログ・実際の使用事例を基に、Agent Teamsの仕組みからセットアップ、コスト、実践的な活用パターンまで徹底解説します。

目次

  1. Agent Teamsとは?従来のAIコーディングと何が違うのか
  2. アーキテクチャ:Team Lead・Teammates・共有タスクリスト
  3. セットアップ方法:3ステップで始める
  4. サブエージェント vs Agent Teams:どう使い分けるか
  5. コミュニケーションシステム:message & broadcast
  6. 表示モードとDelegate Mode
  7. タスク管理と依存関係の仕組み
  8. Hooksで品質ゲートを設ける
  9. コスト分析:Agent Teamsはいくらかかるのか
  10. 実践事例:16エージェントでCコンパイラを構築
  11. 競合比較:GitHub Agent HQ・Google Jules・OpenAI Codex
  12. Agent Teamsを使うべき場面・使わない場面
  13. まとめ:マルチエージェント開発の新時代

1. Agent Teamsとは?従来のAIコーディングと何が違うのか

Agent Teamsは、複数のClaude Codeインスタンスがチームとして並列に動作し、自律的に連携する機能です。従来のAIコーディングツールでは1つのAIが順番にタスクを処理していましたが、Agent Teamsでは複数のAIが同時に異なるタスクを担当し、互いにメッセージを送り合いながら成果物を仕上げます。

たとえば、新機能を実装する場面を考えてみましょう。

  • 従来:1つのAIがバックエンドAPI → フロントエンドUI → テストコード → ドキュメントを順番に作成(直列処理)
  • Agent Teams:バックエンド担当・フロントエンド担当・テスト担当・ドキュメント担当が同時並行で作業し、互いの進捗を確認しながら矛盾なく完成させる(並列処理)

Google Chromeのエンジニアリーダーとして知られるAddy Osmani氏は、Agent Teamsの設計思想について次のように述べています。

「LLMはコンテキストが広がるほど性能が低下する。各エージェントに狭いスコープとクリーンなコンテキストを与えることで、それぞれの領域で優れた推論が可能になる」

つまり、1つの巨大なコンテキストで全てを処理するより、専門分野ごとに分けて並列処理する方が品質が上がるという発想です。

現在のステータス:Agent Teamsはリサーチプレビューとして提供されています。機能は実験的(experimental)で、デフォルトでは無効化されています。

2. アーキテクチャ:Team Lead・Teammates・共有タスクリスト

Agent Teamsは4つのコンポーネントで構成されています。

Team Lead(チームリーダー)

メインのClaude Codeセッションがチームリーダーとなります。リーダーの役割は以下の通りです。

  • チームメイトの生成(spawn)と管理
  • タスクの作成と割り当て
  • チームメイトからの成果物を統合
  • 最終的な判断とユーザーへの報告

Teammates(チームメイト)

各チームメイトは独立したClaude Codeインスタンスです。それぞれが独自のコンテキストウィンドウを持ち、CLAUDE.md・MCPサーバー・Skillsを自動的に読み込みます。ただし、リーダーの会話履歴は引き継がれません。そのため、spawn時のプロンプトで必要なコンテキスト(ファイルパス、制約条件、完了基準)を明示的に伝える必要があります。

共有タスクリスト

全エージェント間で共有されるタスクリストが、Agent Teamsの協調の基盤です。各タスクは3つの状態を持ちます。

状態 英語 説明
未着手 pending まだ誰も担当していないタスク
作業中 in progress チームメイトが作業を開始したタスク
完了 completed 作業が終了したタスク

チームメイトはタスクを完了すると、次の未割り当て・未ブロックのタスクを自律的にピックアップします。人間が毎回指示する必要はありません。

Mailbox(メールボックス)

エージェント間のメッセージング基盤です。チームメイトがメッセージを送信すると、受信者に自動配信されます。リーダーがポーリングする必要はなく、チームメイトがアイドルになると自動的にリーダーに通知されます。

データの保存場所:チーム設定は~/.claude/teams/{team-name}/config.json、タスクリストは~/.claude/tasks/{team-name}/に保存されます。

3. セットアップ方法:3ステップで始める

Agent Teamsはデフォルトで無効化されているため、明示的に有効化する必要があります。

ステップ1:環境変数を設定する

3つの方法があります。

方法A:環境変数(推奨)

.bashrc.zshrcに以下を追加します。

export CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1

方法B:settings.json

Claude Codeの設定ファイルに追加します。

{
  "env": {
    "CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS": "1"
  }
}

方法C:セッション単位で有効化

CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1 claude

ステップ2:Claude Codeを起動する

通常通りclaudeコマンドでClaude Codeを起動します。Agent Teamsが有効化されていれば、モデルにTeammateTool(チームメイト生成ツール)が自動的に追加されます。

ステップ3:チームを起動する

プロンプトでチームを使うよう指示します。たとえば以下のように伝えます。

「このプロジェクトのバグ修正を3人のチームメイトで並列に進めてください。
- チームメイト1:認証モジュールのバグ調査
- チームメイト2:決済モジュールのバグ調査
- チームメイト3:テストカバレッジの改善」

リーダーがこの指示を解釈し、各チームメイトをspawnして適切なコンテキストとともにタスクを割り当てます。

4. サブエージェント vs Agent Teams:どう使い分けるか

Claude Codeには以前から「サブエージェント」機能がありました。Agent Teamsとの違いは何でしょうか?

比較項目 サブエージェント Agent Teams
通信方式 親エージェントにのみ結果を報告 チームメイト間で直接メッセージを送受信
コンテキスト 親セッションのコンテキストを共有 各エージェントが独立したコンテキスト
連携方式 人間が指示して調整 エージェント同士が自律的に連携
ライフサイクル タスク完了で終了(ワンショット) 持続的に稼働し、複数タスクを処理
相互議論 不可(互いの存在を知らない) 可能(発見の共有、仮説の反証)
トークンコスト 比較的低い チーム規模に比例して高い
適した用途 テスト実行、ファイル検索、ログ分析 並列コードレビュー、マルチモジュール開発、大規模リファクタリング

判断基準:タスクが独立していて結果を戻すだけならサブエージェント、タスク間の調整や相互チェックが必要ならAgent Teamsが適しています。

5. コミュニケーションシステム:message & broadcast

Agent Teamsの最大の特徴は、エージェント同士が直接コミュニケーションできる点です。2つの通信手段が用意されています。

message(1対1メッセージ)

特定のチームメイトに直接メッセージを送ります。たとえば「バックエンド担当のチームメイトに、APIのレスポンス形式を確認する」といった用途です。

broadcast(全体通知)

全チームメイトに一斉にメッセージを送ります。「全員に設計変更を通知する」「新しい制約条件を共有する」といった場面で使います。

実際の連携パターン

たとえば「対立仮説デバッグ」では、複数のエージェントが異なる仮説を同時に調査し、メッセージで互いの仮説を反証しようとします。1つのエージェントが「原因はメモリリークだ」と主張し、別のエージェントが「レースコンディションが原因だ」と主張する ―― 議論を通じてコンセンサスが形成されるのです。

これは単一エージェントの「アンカリングバイアス」(最初の仮説に固執する傾向)を克服する効果的なアプローチです。

6. 表示モードとDelegate Mode

2つの表示モード

モード 説明 操作方法 要件
in-process(デフォルト) 全チームメイトが同じターミナル内で動作 Shift+Up/Downでチームメイト切替、Enterでセッション表示、Escapeで中断、Ctrl+Tでタスクリスト表示 特になし(VS Code、iTerm等で動作)
split-pane 各チームメイトが別ペインに表示 各ペインを直接操作 tmuxまたはiTerm2が必要

注意:split-paneモードはVS Codeの統合ターミナル、Windowsターミナル、Ghosttyでは動作しません。

設定方法:

// settings.json
{
  "teammateMode": "in-process"
}

// またはCLIオプション
claude --teammate-mode in-process

Delegate Mode

Shift+Tabを押すとDelegate Modeが有効になります。このモードでは、リーダーがタスクの調整・管理のみに制限され、実際のコード変更はチームメイトに委任されます。

これは「リーダーが自分で実装してしまう」問題を防ぎます。大規模なタスクを本当に並列で処理したい場合に有効です。

7. タスク管理と依存関係の仕組み

Agent Teamsの共有タスクリストは、単なるToDoリストではありません。タスク間の依存関係をサポートしています。

依存関係の自動解決

タスクAがタスクBに依存している場合(例:「API設計」→「フロントエンド実装」)、タスクAが完了するまでタスクBは自動的にブロックされます。タスクAが完了すると、タスクBのブロックが自動解除され、待機していたチームメイトが即座に着手します。

自律的なタスクピックアップ

チームメイトはタスクを完了すると、次の未割り当て・未ブロックのタスクを自律的に取得して作業を開始します。リーダーが毎回指示を出す必要はなく、「完了 → 次のタスク」のサイクルが自動で回ります。

推奨されるタスク設計

公式ドキュメントでは、2〜5人のチームメイト、各チームメイトに5〜6タスクが最適なスケールとされています。各タスクは以下を意識して設計します。

  • ファイル所有権の分離:タスクの取得にはファイルベースのロック機構がありますが、ファイル編集にはロック機構がありません(最後の書き込みが優先)。異なるチームメイトが同じファイルを編集しないよう設計すること
  • 明確な完了基準:「テストが通ること」「型チェックがパスすること」など客観的な基準を設ける
  • 適切な粒度:大きすぎるタスクは分割し、小さすぎるタスクは統合する

8. Hooksで品質ゲートを設ける

Claude CodeのHooks機能を使えば、Agent Teamsの品質管理を自動化できます。Agent Teamsに関連する主要なフックイベントは以下の2つです。

TeammateIdle

チームメイトがアイドル状態になろうとした時に発火します。exit code 2を返すと、チームメイトはアイドルにならず作業を継続します(stderrメッセージがフィードバックとして渡される)。タスクの割り当て漏れや、チームメイトがスタックしている状態を検出し、追加作業を指示できます。

TaskCompleted

タスクが完了としてマークされる直前に発火します。exit code 2を返すと、タスクは完了にならず、stderrメッセージがフィードバックとして渡されます。以下のような品質チェックを自動実行できます。

  • 完了したコードに対してリンター・型チェックを実行
  • テストスイートを自動実行して合格を確認
  • コードフォーマットの統一チェック

設定例

settings.jsonでフックを設定します。

{
  "hooks": {
    "TaskCompleted": [
      {
        "matcher": "",
        "hooks": [
          {
            "type": "command",
            "command": "npm run lint && npm test"
          }
        ]
      }
    ]
  }
}

これにより、チームメイトがタスクを完了するたびに自動でlintとテストが実行され、品質の一貫性が保たれます。

9. コスト分析:Agent Teamsはいくらかかるのか

Agent Teamsを使う上で最も気になるのがコストです。結論から言うと、通常のClaude Code使用の約7倍のトークンを消費します。

コスト構造

項目 通常使用 Agent Teams(5人チーム)
平均日次コスト 約$6/日 約$30〜42/日(推定)
月間コスト(API使用) $100〜200/開発者 $500〜1,400/開発者(推定)
トークン消費倍率 1x 約5〜7x
理由 1つのコンテキスト 各チームメイトが独自のコンテキストウィンドウを持つ

コスト最適化の5つの戦略

  1. チームメイトにはSonnetを使う:リーダーはOpus 4.6、チームメイトはSonnet 4.5にすることで、性能と費用のバランスを取れます。APIモデル料金はOpus($5/$25/100万トークン)に対してSonnet($3/$15/100万トークン)と約40%安価です
  2. チームを小さく保つ:トークン消費はチームサイズにほぼ比例するため、不必要に大きなチームを組まないこと
  3. spawnプロンプトを簡潔にする:チームメイトはCLAUDE.md、MCPサーバー、Skillsを自動ロードしますが、spawnプロンプトの内容はさらにコンテキストに追加されます
  4. 作業完了後はチームを解散する:アイドル状態のチームメイトもトークンを消費し続けます
  5. Claude Maxプラン($100/月)またはMax 5x($200/月)を検討する:API従量課金ではなく定額制で利用できるため、Agent Teamsを頻繁に使うならコスト上限を設けられます

10. 実践事例:16エージェントでCコンパイラを構築

Agent Teamsの実力を最も端的に示すのが、AnthropicのエンジニアリングチームによるCコンパイラ構築プロジェクトです。

プロジェクト概要

Anthropicのセーフガードチームに所属するNicholas Carlini氏が、Claude Code Agent Teamsを使って本番品質のCコンパイラを構築しました。

  • 使用エージェント数:16体(並列稼働)
  • 開発期間:約2週間
  • 総セッション数:約2,000セッション
  • 生成コード量:約100,000行のRust(外部crateへの依存なし、標準ライブラリのみ)
  • トークン消費:入力20億トークン + 出力1.4億トークン
  • APIコスト:約$20,000(約300万円)
  • 対応アーキテクチャ:x86、ARM、RISC-V
  • コンパイル対象:Linux 6.9カーネル(ブート可能)

何を達成したのか

このCコンパイラは単なるデモではなく、実用的な成果物です。

  • Linux 6.9のブートに成功
  • QEMU、FFmpeg、SQLite、PostgreSQL、Redisなど実世界のプロジェクトをコンパイル可能
  • GCCのtorture testスイートに合格
  • ほとんどのコンパイラテストスイートで99%のパス率
  • Doomをコンパイルして実行可能

ただし、現時点では「GCCの完全な代替」ではありません。16ビットx86コンパイラはGCCに委任しており、アセンブラ・リンカも外部ツールを使用。生成されるコードの効率もGCC(最適化無効)に劣ります。

成功の鍵:5つの教訓

  1. テスト検証器の品質:Carlini氏は「タスク検証器がほぼ完璧でなければ、Claudeは間違った問題を解いてしまう」と述べています。自動テストによる即座のフィードバックが不可欠でした
  2. 環境設計:各エージェントが自己位置を把握できるよう「頻繁に更新される詳細なREADMEと進捗ファイル」を配置
  3. 並列化戦略:GCCを「既知の正解を出すオラクル」として利用し、出力結果を比較することで品質を担保
  4. エージェント専門化:コード重複排除、パフォーマンス最適化、効率的コード生成、設計批評、ドキュメント管理など、異なる役割を各エージェントに割り当て
  5. 同期メカニズム:各エージェントが「テキストファイルにロックを書き込む」gitベースのロックシステムで、同一問題への同時作業を防止

事例2:令和トラベル ―― コードではなく経営戦略に活用

Agent Teamsの適用範囲は、ソフトウェア開発だけではありません。旅行アプリ「NEWT」を運営する令和トラベルの篠塚孝哉CEOは、Agent Teamsを経営戦略の議論に活用したことをSNSで公開しています。

篠塚氏は約11体のAIエージェントにそれぞれ異なる役割を持たせました。

  • リサーチャー:市場調査と競合分析
  • アナリスト:財務分析と収益予測
  • レッドチーム:戦略の批判的レビューとリスク指摘

篠塚氏は結果について「圧倒的に質が変わった」と評価しています。複数のエージェントが異なる視点から同時に議論することで、1つのAIに順番に聞くよりも深い洞察が得られたということです。

この事例の意義:Agent Teamsは「AIコーディングツール」の枠を超え、経営判断や戦略立案にも適用できることが実証されました。コード生成に限らず、調査・分析・批評を並列で行う知的作業全般に有効です。

11. 競合比較:GitHub Agent HQ・Google Jules・OpenAI Codex

2026年2月現在、マルチエージェント型のAIコーディングツールは急速に進化しています。

比較項目 Claude Code Agent Teams GitHub Agent HQ Google Jules OpenAI Codex
リリース時期 2026年2月(リサーチプレビュー) 2026年2月(パブリックプレビュー) 2025年(正式版、2026年大幅アップデート) 2025年(2026年更新)
エージェント間通信 直接メッセージ+ブロードキャスト Mission Controlで管理 なし(独立タスク) なし(独立タスク)
並列タスク数 推奨2〜5体(最大は制限なし) 複数エージェント(Claude + Codex + Copilot混在可) 最大15タスク同時 複数タスク(クラウドVM)
自律連携 あり(仮説反証、発見共有) オーケストレーション型 なし なし
実行環境 ローカルターミナル GitHub Web / VS Code / Mobile クラウドVM クラウドVM
最大の強み エージェント同士が議論・反証できる 異なるAIベンダーを混在利用可能 Gemini 3 Pro搭載、非同期処理 GPT-5.3-Codex搭載

Agent Teamsの独自性:競合ツールの多くが「複数タスクを独立して並列実行」するのに対し、Agent Teamsはエージェント間の直接対話と自律的な連携ができる点で差別化されています。これは、コードレビューや設計議論のような「合意形成が必要なタスク」で大きなアドバンテージとなります。

一方、GitHub Agent HQは2026年2月4日にClaude・Codex・Copilotを同一プラットフォーム上で利用可能にしたことで、「タスクに応じてAIベンダーを使い分ける」新しいパラダイムを提案しています。なお、Agent HQは「管理レイヤー」であり、Agent Teamsのような協調システムではないため、Agent HQ上でClaude Code Agent Teamsを利用することも可能です。

現時点での結論:エージェント間の直接対話による自律的な連携は、Agent Teams独自の機能です。競合ツールはいずれも「並列だが独立」なアプローチであり、エージェント同士が互いの仮説を反証し合えるのはAgent Teamsだけです。

12. Agent Teamsを使うべき場面・使わない場面

Agent Teamsは強力ですが、万能ではありません。

Agent Teamsが効果的な場面

  • 並列コードレビュー:セキュリティ・パフォーマンス・テストカバレッジを別々の専門エージェントに同時レビューさせる
  • 対立仮説デバッグ:複雑なバグに対して複数の仮説を同時調査し、互いに反証させる
  • マルチモジュール機能開発:バックエンドAPI・フロントエンド・統合テストを各チームメイトに担当させる
  • 大規模リファクタリング:モジュールごとにチームメイトを割り当て、互いの変更の整合性を確認しながら進める
  • ドキュメント生成:コード解析・API仕様作成・使用例作成を並列で行う

Agent Teamsが不向きな場面

  • 同一ファイルの編集が必要なタスク:ファイルロック機構がないため、最後に書き込んだ内容が優先される
  • 順序依存性の高いタスク:A → B → C と順番に進める必要がある場合、並列化のメリットがない
  • 小規模なタスク:チーム起動のオーバーヘッドが、並列化によるスピードアップを上回る
  • コスト制約が厳しい場面:約5〜7倍のトークンコストを許容できない場合

現在の既知の制限事項

  • /resumeでセッションを復帰してもチームメイトは復元されない(新規にspawnが必要)
  • ネスト(チーム内チーム)は不可
  • 1セッションにつき1チームのみ
  • リーダーの役割は固定(途中で変更不可)
  • 権限はチームメイト全員に継承される
  • タスクのステータス更新に数秒〜十数秒のラグが発生する場合がある
  • チームメイトがタスク完了をマークし忘れるケースがあり、依存タスクがブロックされることがある

13. まとめ:マルチエージェント開発の新時代

Claude Code Agent Teamsは、AIコーディングツールの進化における次のステージを体現する機能です。

現時点での評価:

  • 革新性:エージェント間の直接対話・自律連携は、競合にはないユニークな強み
  • 実用性:Cコンパイラ構築(10万行、2週間)という実績が、大規模プロジェクトでの有効性を証明
  • コスト:5〜7倍のトークン消費は無視できない。Sonnetの活用やチーム規模の最適化が必須
  • 成熟度:リサーチプレビューであり、セッション復帰やファイルロックなど改善の余地あり

導入の推奨フロー:

  1. まずは読み取り専用タスク(コードレビュー、バグ調査)でAgent Teamsを試す
  2. テストスイートが充実しているプロジェクトで書き込みタスクに段階的に移行
  3. ファイル所有権を明確に分離し、2〜3人の小規模チームから始める
  4. コスト推移を/costコマンドで監視しながらスケールアップ

AIコーディングツールは「1人のAIアシスタント」から「AIチーム」へ進化しています。Agent Teams、GitHub Agent HQ、Google Jules ―― この3つのアプローチが競争し、融合していく中で、開発者の生産性は新しい次元に入ろうとしています。

関連記事

参考文献

  1. Anthropic公式 – Agent Teams Documentation
  2. Anthropic Engineering – Building a C Compiler with Agent Teams
  3. Anthropic公式 – Claude Code コスト管理ガイド
  4. Addy Osmani – Claude Code Swarms
  5. GitHub Changelog – Claude and Codex Available on GitHub
  6. Paddo.dev – Agent Teams: The Switch Got Flipped
  7. Google Jules – Autonomous Coding Agent

AI開発・導入のご相談はAQUA合同会社へ

「何から始めればいいか分からない」「費用感を知りたい」など、AI導入に関するご相談を無料で承っております。
大手SIerのような高額な費用は不要。経験豊富なエンジニアが直接対応します。

メール: お問い合わせフォームをご利用ください

この記事をシェア