AnthropicがClaude Managed Agentsを発表。AIエージェント開発の「本当のボトルネック」がついに解消されます

AIエージェントを作ろうとしたことがあるなら、あの感覚はよくわかるはずです。

「自分でも作れそう」と思って始めます。
そしてすぐに気づきます。

あれ、これ…コードより設定の方が多くない?

ループ処理を書きます。ツールのラッパーを書きます。コンテキスト管理を書きます。セッション管理を書きます。サンドボックスを用意します。エラーハンドリングを書きます。

そして1行も「本当にやりたいこと」を書いていないまま、週が終わります。

その苦しみには名前があります

「インフラの罠」。

AIエージェント開発の本当のボトルネックは、AIの能力ではありません。
それを動かすための配管工事です。

ほとんどの開発者が詰まるのはここです。プロンプトではありません。ツール呼び出しのラッパー実装で詰まります。コンテキストが溢れてセッションが死ぬことで詰まります。本番途中でエラーが出て、AIのデバッグではなくインフラのデバッグをするはめになります。

これはあなたの実力の問題ではありません。
構造的な問題です。

AnthropicはAPIをまた一つ増やしたわけではありません

2026年4月、AnthropicはClaude Managed Agentsを発表しました。

正直に言います。最初は「また新しいAPIか」と思いました。
(私はAIツールの追いかけには慎重な方です。毎週出る新ツールを全部試すのは時間の無駄だと思っています。)

でもこれは違いました。

Anthropicが渡してきたのはAPIではありません。ランタイムです。

つまり、エージェントが動く「環境そのもの」を提供するということです。ファイルを読んで、コードを実行して、Webを検索して——その全部を、Anthropicのクラウド上で、すでに動いている状態で使えるようになりました。

2つのものが同時にリリースされました

まず整理します。今回のリリースは2本立てです。

Claude Managed Agents — Anthropicのクラウド上で動く、フルマネージドのエージェント実行環境です。あなたはエージェントを定義してタスクを投げるだけで、コンテナ・ツール・セッション管理はすべてAnthropicが面倒を見ます。

Claude Agent SDK(旧称: Claude Code SDK) — PythonとTypeScriptのライブラリです。Claude Codeのエージェントループを自分のアプリに組み込めます。実行インフラは自分で用意しますが、難しい部分はすでに作られています。

同じ問題を解決しますが、エージェントをどこで動かすかが違います。

  • SDK → 自分のインフラで動かす
  • Managed Agents → Anthropicのクラウドで動かす

ほとんどの人にとって、今すぐ恩恵を受けやすいのはManaged Agentsの方です。この記事ではこちらを掘り下げます。

4つの概念を理解すれば全部わかります

Claude Managed Agentsは4つの概念で成り立っています。これさえ押さえれば、全体像が一気にクリアになります。

Claude Managed Agentsの4つの構成要素

Agent(エージェント)
あなたが設定するものです。モデル、システムプロンプト、使うツール、MCPサーバー。一度作ればIDで何度でも参照できます。

Environment(環境)
エージェントが作業するクラウドコンテナです。Python、Node.js、Goなどが最初から入っていて、ネットワークアクセスも設定済みです。

Session(セッション)
エージェントが特定のタスクを実行する「作業インスタンス」です。ファイル・会話履歴・コンテキストがすべてここに保持されます。

Events(イベント)
あなたのアプリとエージェントの間を流れるメッセージです。ユーザーの指示、ツールの実行結果、ステータス更新、レスポンスのストリームが含まれます。

コードで書くとこうなります:

import anthropic
client = anthropic.Anthropic()
# エージェントを一度作成。IDで何度でも再利用できる
agent = client.beta.agents.create( model="claude-sonnet-4-6", system="You are a software engineer. Fix bugs, run tests, and report results.", tools=[{"type": "bash"}, {"type": "file_operations"}, {"type": "web_search"}], name="bug-fixer"
)
print(agent.id) # このIDを保存しておく

セッションを開始してタスクを投げます:

# エージェントが必要なパッケージをインストールした環境を作成
environment = client.beta.environments.create( packages=["pytest", "requests"]
)
# エージェントと環境を紐づけてセッションを開始
session = client.beta.sessions.create( agent_id=agent.id, environment_id=environment.id
)
# タスクをイベントとして送信
response = client.beta.sessions.events.create( session_id=session.id, content="auth.py のテストを見つけて修正してください"
)

これで完了です。 エージェント定義・環境・セッション。あとはClaudeがやります。

エージェントは「1回答えて終わり」ではありません

ここが重要なポイントです。

従来のChatGPT的なAI利用のイメージ:質問する→答えが返ってくる→終わり。

Managed Agentsは違います。

Claudeはプロンプトを受け取ったら、ループを回し続けます。
「タスクを評価する → ツールを呼ぶ → 結果を処理する → また評価する」
これを繰り返して、仕事が完了するまで自律的に動き続けます。

「auth.py のテストを修正して」というタスクを例にすると:

  • ターン1 → Bashでテストスイートを実行。3つ失敗していることを確認
  • ターン2auth.py とテストファイルを読んで問題を理解
  • ターン3 → ファイルを修正してテストを再実行。3つとも通過
  • 最終ターン → ツール呼び出しなしのテキスト応答。タスク完了
async for event in client.beta.sessions.stream( session_id=session.id, event={ "type": "user", "content": "auth.py のテストを見つけて修正してください" }
): # Claudeが何をしているかリアルタイムで見える if event.type == "assistant_message": print(event.content) # 最終結果を取得 if event.type == "result": print(f"完了: {event.result}") print(f"使用ターン数: {event.num_turns}") print(f"コスト: ${event.total_cost_usd:.4f}")

ツール呼び出し・結果・ターンの全履歴がリアルタイムで流れてきます。ブラックボックスではありません。

コンテキストが溢れる問題、自動で解決されます

DIYのエージェントで最も頭を悩ませるのがコンテキストウィンドウ問題です。

ターンが増えるたびにコンテキストが積み上がります。プロンプト・ツール定義・ファイルの中身・コマンドの出力・会話履歴——全部が乗っかります。上限に達した瞬間、セッションが死にます。

Managed Agentsはこれを自動で処理します。

上限に近づくと、古い会話履歴を要約してスペースを確保しながら、最近のやり取りと重要な判断内容を保持し続けます。セッションは止まりません。

3つのコントロール

思考の深さ(Effort level)

Effort Level

各ターンでClaudeがどれだけ深く考えるかを設定します。トークン消費とコストに直結するので、意図的に設定してください。

最大ターン数とコスト上限

session = client.beta.sessions.create( agent_id=agent.id, environment_id=environment.id, max_turns=20, # 20ターンで停止 max_budget_usd=0.50 # または$0.50消費で停止
)

どちらかの上限に達した場合、理由が明示されたresultが返ってきます。セッションIDを保存しておけば後から再開できます。

パーミッションモード

  • default — 事前承認外の操作はコールバック経由で確認します
  • acceptEdits — ファイル編集は自動承認。シェルコマンドは確認します
  • bypassPermissions — 全操作を確認なしで実行します(CI環境・隔離コンテナ専用)

タスクの途中で指示を変えられます

セッションが動いている最中に、追加のイベントを送ってリダイレクトできます:

client.beta.sessions.events.create( session_id=session.id, content="やっぱり auth_token のテストだけ修正して。login のテストは触らないで"
)

完了を待つ必要はありません。おかしな方向に進んでいたら、その場で修正できます。

組み込みツール一覧

手動でエージェントを作る場合、時間を最も食うのがツールのラッパー実装です。エラーハンドリング・結果をコンテキストに戻す処理——全部自分で書く必要があります。

Managed Agentsでは、これが全部すでに完成しています。

Claude Managed Agentsの組み込みツール

ファイル操作

  • Read — コンテナ内の任意ファイルを読みます
  • Write — 新規ファイルを作成します
  • Edit — 既存ファイルを修正します

検索

  • Glob — パターンでファイルを検索します
  • Grep — 正規表現でコンテンツを検索します

実行

  • Bash — シェルコマンド・スクリプト・git操作・パッケージインストール・テスト実行ができます

Web

  • WebSearch — インターネット検索ができます
  • WebFetch — 任意URLのページコンテンツを取得・解析します

オーケストレーション

  • Task — サブエージェントを生成して独立した作業を委任します
  • Skill — 再利用可能なワークフローを呼び出します
  • AskUserQuestion — 処理を一時停止して人間に確認します
  • TodoWrite — セッションをまたいだマルチステップ作業を追跡します

組み込みツールに加えて、MCPサーバーで外部サービスを接続したり、独自のカスタムツールを定義することもできます。

始め方

Claude Managed Agentsは現在ベータ版です。

APIアカウントがあればデフォルトで使えます。すでにClaude APIキーを持っているなら、今すぐ始められます。

必要なものは以下の3つです:

  • platform.claude.com で発行したClaude APIキー
  • managed-agents-2026-04-01 ベータヘッダー(SDKを使えば自動で付与されます)
  • PythonまたはTypeScriptのSDK
pip install anthropic
export ANTHROPIC_API_KEY=your-api-key

20行以内で動く最初のエージェント:

import anthropic
import asyncio
client = anthropic.Anthropic()
async def main(): agent = client.beta.agents.create( model="claude-sonnet-4-6", system="You are a helpful engineering assistant.", tools=[{"type": "bash"}, {"type": "file_operations"}], name="my-first-agent" ) environment = client.beta.environments.create( packages=["pytest"] ) session = client.beta.sessions.create( agent_id=agent.id, environment_id=environment.id, max_turns=10, max_budget_usd=0.25 ) async for event in client.beta.sessions.stream( session_id=session.id, event={"type": "user", "content": "このディレクトリのPythonファイルを一覧表示して"} ): if event.type == "result": print(event.result) print(f"コスト: ${event.total_cost_usd:.4f}")
asyncio.run(main())

なお、以下の3つの機能はリサーチプレビュー段階で、別途アクセスリクエストが必要です:

  • Outcomes(成果の追跡)
  • Multi-agent coordination(複数エージェントの協調)
  • Persistent memory(永続メモリ)

アクセスリクエストは claude.com/form/claude-managed-agents からできます。

正直な評価

Claude Managed Agentsが解決するのは実在する問題です。

エージェントループ・コンテキスト管理・ツール実行・セッション継続性——これらを自前で構築するのに数週間かかっていた作業が、設定ファイルとAPIコール数行になりました。プロダクション品質のエージェントを速く作りたい人には、意味のある前進です。

ただし、勘違いしないでほしい点があります。

インプットの質がアウトプットの質を決める、この原則は変わりません。どんなにインフラが整っても、曖昧なプロンプト・設計の甘いエージェント・目的の不明確なタスクは、そのまま曖昧な結果を返します。

ツールが上手くなっても、考える力が不要になるわけではありません。 むしろ「何をClaudeに任せるか」「どう指示するか」の設計力がより問われるようになります。

TL;DR(要点まとめ)

  • Claude Managed Agents = Anthropicのクラウド上で動くフルマネージドのエージェント実行環境。インフラ構築を自分でやらなくて済みます。
  • 4つの概念: Agent(設定)・Environment(実行環境)・Session(作業インスタンス)・Events(メッセージ)
  • エージェントループ: タスク完了まで自律的にツールを呼び続けます。1ターンでは終わりません。
  • コンテキスト管理が自動: 上限に近づくと古い履歴を要約して継続。セッションが死ななくなります。
  • コントロール手段: 思考の深さ・最大ターン数・コスト上限・パーミッションモードで制御できます。
  • 今すぐ使えます: APIキーがあればベータとして利用可能。pip install anthropic で開始できます。
  • インプットの質は変わりません: ツールが整っても、設計力と指示の質がアウトプットを決めます。