Claude 4.6 Sonnet リリース — Adaptive Thinking搭載で「考える」AIへ

概要

AnthropicがClaude 4.6 Sonnetを発表した。最大の進化はAdaptive Thinkingエンジンの搭載。タスクの複雑さに応じて推論の深さを動的に調整し、コーディングベンチマークで大幅なスコア向上を達成している。

出典: Anthropic News — 2026-02-17

従来のextended thinkingモードは単純なON/OFFだった。Claude 4.6 Sonnetでは新しいeffortパラメータにより、モデルがタスクの複雑さを判断して思考深度を調整する。

これにより、レースコンディションのようなバグでも「推測でコードを出す」のではなく、思考段階で根本原因を特定してから修正コードを生成する。

カテゴリ	3.5 Sonnet	4.6 Sonnet	改善ポイント
SWE-bench Verified	49.0%	79.6%	複雑なバグ修正・マルチファイル編集
OSWorld（Computer Use）	14.9%	72.5%	自律UI操作・ツール使用
MATH	71.1%	88.0%	アルゴリズム論理の強化
BrowseComp（Search）	33.3%	46.6%	Python実行による動的フィルタリング

特に注目すべきはOSWorld 72.5%。スプレッドシート操作、Webブラウジング、ローカルファイル操作を人間並みの精度で実行できることを示している。

リポジトリ全体、または大規模な技術ドキュメントを一括でプロンプトに投入可能。コヒーレンスを失わずに長文脈を処理できる。

Claude 4.6 Sonnetは「コーディングエージェントの実用性」を一段引き上げた。特に以下のユースケースで威力を発揮する：

extended thinking APIのeffortパラメータを試して、自分のワークフローでどこまで自動化できるか検証してみるのがオススメだ。

軸	スコア	理由
Newsworthiness	5/5	Anthropicのフラグシップモデル更新、業界最高水準のベンチマーク
Value	5/5	コーディング・エージェント開発に直結する機能強化
Actionability	5/5	即座にAPI経由で利用可能、価格据え置き
Credibility	5/5	公式発表、詳細なベンチマークデータあり
Timeliness	5/5	昨日発表のホットなニュース
合計	25/25