Anthropic、Claude Opus 4.6を発表——複数AIが協調する「エージェントチーム」機能を搭載

Anthropicは2026年2月5日、フラッグシップモデル「Claude Opus 4.6」を正式リリースした。最大の目玉は、複数のAIエージェントがチームとして自律的に協調動作する「エージェントチーム」機能だ。さらに100万トークンのコンテキストウィンドウ、最大12万8000トークンの出力、適応型思考(Adaptive Thinking)など、前世代から大幅な機能強化が施されている。

この記事のポイント

  • 複数AIエージェントが並列・協調して作業する「エージェントチーム」がClaude Codeに搭載(リサーチプレビュー)
  • コンテキストウィンドウが100万トークンに拡大、出力も最大12万8000トークンに対応
  • GDPval-AAベンチマークでGPT-5.2を約144 Eloポイント上回り、複数のベンチマークで最高スコアを記録

エージェントチーム:AIが「チーム」で働く新時代

Opus 4.6の最大の新機能が「エージェントチーム」だ。これはClaude Codeにおいて、複数のAIエージェントをチームとして編成し、並列で自律的に協調作業させる仕組みである。従来は1つのエージェントがタスクを順番に処理していたが、エージェントチームではプランナー、リサーチャー、コーダー、テスターといった専門的な役割を複数エージェントに割り当て、それぞれが状態を共有しながら同時並行で作業を進める。特にコードベースレビューのような独立性が高く読み取り中心のタスクで効果を発揮する。ユーザーはキーボードショートカットやtmuxコマンドで個々のサブエージェントを直接制御することも可能だ。Replit社は「エージェント的な計画能力の大きな飛躍であり、複雑なタスクを独立したサブタスクに分解して並列実行できる」と評価している。

100万トークンコンテキストと適応型思考

コンテキストウィンドウがベータながら100万トークンに拡大された。これはOpusクラスのモデルとしては初めてだ。MRCR v2(100万トークン版)ベンチマークでは、Sonnet 4.5の18.5%に対してOpus 4.6は76%のスコアを記録しており、大量の情報を保持しながらドリフト(情報の逸脱)を抑えた推論が可能になった。さらに出力トークンも最大12万8000トークンに対応し、長大なコード生成やドキュメント作成に対応する。

もう一つの重要な新機能が「適応型思考(Adaptive Thinking)」だ。これはClaudeがプロンプトの文脈から、どの程度の深さで思考すべきかを自動判断する仕組みで、Anthropicモデルとしては初の搭載となる。開発者向けにはeffortパラメータ(low / medium / high / max)が用意されており、品質・推論速度・コストのトレードオフを明示的にコントロールできる。

ベンチマーク:複数指標でトップ性能

Opus 4.6は複数のベンチマークで最先端のスコアを達成している。エージェント的なコーディング評価であるTerminal-Bench 2.0では最高スコアを記録。多分野の推論テストであるHumanity’s Last Examでも全フロンティアモデル中トップだ。経済的に価値のある知識作業(金融、法務など)を測定するGDPval-AAでは、OpenAIのGPT-5.2を約144 Eloポイント、前世代のOpus 4.5を190 Eloポイント上回った。計算生物学の分野ではOpus 4.5の約2倍の性能を示している。安全性面では、過剰拒否(無害な質問を拒否してしまう問題)の発生率が過去のClaudeバージョンの中で最も低く、実用性と安全性の両立が図られている。

エンタープライズ連携とパートナー評価

Opus 4.6はclaude.ai、Claude API、主要クラウドプラットフォームで即時利用可能だ。APIでのモデルIDはclaude-opus-4-6。料金は標準で入力100万トークンあたり5ドル、出力100万トークンあたり25ドル。20万トークンを超える長文プロンプトにはプレミアム料金(入力10ドル/出力37.5ドル)が適用される。

さらにExcelやPowerPointとのネイティブ連携も強化された。Claude in Excelでは計画立案→実行のフローで非構造化データを高精度に処理。Claude in PowerPoint(リサーチプレビュー)ではスライドのレイアウトやフォーマットを読み取り、ブランドの一貫性を維持したプレゼンテーション作成が可能だ。

早期導入パートナーからの評価も高い。Notionは「複雑な要求を受けて実際に最後までやり遂げる」、GitHubは「複雑で多段階のコーディング作業」への能力を評価。楽天はOpus 4.6が「1日で13件のIssueを自律的にクローズし、12件のIssueを適切なチームメンバーにアサインした」と報告しており、6つのリポジトリにまたがる50人規模の組織を横断的にマネジメントした実績を示している。

知っておくと便利なTips

  • Claude CodeでAPIを利用する場合、モデルIDはclaude-opus-4-6を指定する
  • effortパラメータ(low / medium / high / max)を活用することで、簡単な質問にはlowで高速・低コストに、難しい問題にはmaxで最高品質の回答を得るなど、用途に応じた使い分けが可能
  • エージェントチーム機能はリサーチプレビュー段階のため、今後仕様が変更される可能性がある
  • 20万トークンを超える長文を扱う場合はプレミアム料金が適用されるため、コスト管理に注意が必要

まとめ

Claude Opus 4.6は、エージェントチーム、100万トークンコンテキスト、適応型思考という3つの大型新機能を搭載し、AIコーディングアシスタントとしての能力を大幅に引き上げた。特にエージェントチームは、複数のAIが協調してプロジェクト規模の作業を並列処理するという新しいパラダイムを提示しており、開発ワークフローの根本的な変革を予感させる。ベンチマークでもGPT-5.2を上回る性能を示し、楽天やNotion、GitHubなど実際の企業環境での高い評価も得ている。Claude Codeユーザーにとって、Opus 4.6は間違いなく注目すべきアップデートだ。


📎 元記事: https://techcrunch.com/2026/02/05/anthropic-releases-opus-4-6-with-new-agent-teams/

コメント

タイトルとURLをコピーしました