1. 3行要約
- OpenAIがGPT-5.4をリリースし、OSWorld-Vベンチマークで人間のベースラインを初めて上回った
- Anthropicが米国防総省と対立し、自律兵器・大規模監視へのClaude使用を拒否。連邦訴訟に発展しAI業界全体の倫理議論を喚起
- エンタープライズAI支出が1.4兆ドル規模に急増し、東京でのロボタクシー実証やAI価格の転換点など、ビジネス面でも大きな動きが続いている
2. 今回の更新内容
OpenAI GPT-5.4のリリース
3月5日、OpenAIが最新モデルGPT-5.4を正式リリースした。100万トークンのコンテキストウィンドウ(入力922K、出力128K)に対応し、ネイティブなコンピュータ操作やTool Search機能を搭載。Thinking版とPro版の2バリエーションで提供され、ハルシネーションがGPT-5.2比で33%削減されている。OSWorld-Vベンチマークで75%を記録し、人間のベースライン72.4%を初めて超えた。miniとnanoも同時発表され、miniは前世代比2倍以上の高速化を実現している。
Anthropic vs 米国防総省
Anthropic CEOのDario Amodeiが、Claudeを自律兵器やアメリカ国民の大規模監視に使用することを拒否した。トランプ大統領が全米政府機関にAnthropicの利用停止を命じ、国防総省がAnthropicを「サプライチェーンリスク」に指定(通常は外国の敵対勢力に適用される措置で、米国企業への適用は前例なし)。AnthropicはカリフォルニアとワシントンD.C.で訴訟を提起し、3月24日の法廷審理で連邦判事は国防総省の対応を「troubling(憂慮すべき)」と表現した。OpenAIとGoogle DeepMindの従業員30人以上がAnthropicを支持する声明を提出し、「We Will Not Be Divided」嘆願書にはAI業界から約1,000人が署名している。なお、国防総省は対イラン作戦「Operation Epic Fury」でClaudeを現在も使用中であることが上院小委員会で確認されている。
Claude 4.6シリーズの進化
Anthropicが2月にリリースしたClaude 4.6シリーズ。Claude Opus 4.6(2月5日)はARC AGI 2で68.8%を記録し、前世代Opus 4.5の37.6%から83%改善。Opusモデルとして初の100万トークンコンテキストに対応し、METRによる推定で14時間30分の自律タスク実行時間を記録した。Claude Sonnet 4.6(2月17日)はSWE-bench Verifiedで79.6%を達成し、Opus 4.6の80.8%にほぼ匹敵する性能を1/5のコストで実現。両モデルともアダプティブシンキングを採用し、状況に応じて思考の深さを自動調整する。
Googleの動向
AnthropicとOpenAIが国防総省問題で注目を集める中、Googleは着実にシェアを拡大している。300万人規模の国防総省職員にAIエージェントを提供する契約を獲得し、Docs・Sheets・Slides・DriveにGemini AIを統合。Google Mapsでも「Ask Maps」として会話型ナビゲーションクエリに対応した。アナリストのPatrick Moorhead氏は「最も得をしたのはGoogleだが、誰もそれを語っていない」と指摘している。
日本関連のAIニュース
Uber・日産自動車・Wayveの3社が3月11日に協業を発表し、2026年後半に東京でロボタクシーのパイロット実証を開始する。富士通は防衛装備庁から自衛隊の指揮官の意思決定を支援するAIエージェント「AI幕僚」の開発を受託し、独自LLM「Takane」をベースに開発中。総務省がG7のAIルールに賛同する約30カ国・地域との対面会議を東京で開催し、国際的なAIガバナンスの議論が加速している。
エンタープライズAI支出の急増とAI価格の転換点
Gartnerの最新レポートによると、2026年のエンタープライズソフトウェア支出は前年比15%以上増の1.4兆ドルに達する見込み。Microsoft Copilot Cowork、Samsung Galaxy S26の「エージェンティックAI」コンセプト、OpenAI Skillsの導入など企業向けAI機能の拡充が続いている。一方、現在のAIサービス価格は大幅に補助金で支えられており、Anthropicは2028年、OpenAIは2030年の収支均衡を見込む。OpenAIの年間収益は250億ドル超、Anthropicも190億ドルに迫り、サブスクリプション価格やAPI利用料の値上げが今後避けられない状況にある。
3. 誰に関係あるか
GPT-5.4とClaude 4.6のリリースは、LLMを業務に活用しているエンジニアやプロダクトチーム全般に関わる。Anthropic vs 国防総省の問題は、Claudeを利用している米政府関連のプロジェクトや、AI倫理方針を検討する企業の意思決定者に影響する。エンタープライズAI支出の拡大とAI価格の転換点は、AIサービスを利用する全企業のIT予算・調達担当者に関係する。東京ロボタクシー実証は、日本の自動運転・モビリティ関連事業者にとって重要な動きである。
4. 実務への影響
GPT-5.4の100万トークンコンテキストとネイティブコンピュータ操作により、大規模ドキュメント処理やアプリケーション横断ワークフローの自動化が現実的な選択肢になった。Claude 4.6 Sonnetの高いコストパフォーマンスは、Claude Codeなどの開発ツールでの活用に有効である。AI価格の値上げが見込まれるため、現在のAPI利用コストを前提としたROI計算は見直しが必要になる可能性がある。エンタープライズAIの本番運用が拡大する中、フレームワーク選定やガバナンス体制の整備が実務上の課題となっている。
5. 今すぐやること
- GPT-5.4のThinking版・Pro版を検証し、既存ワークフローでの性能向上とコスト変動を評価する
- Claude 4.6 Sonnetの費用対効果を検証し、Opus 4.6との使い分け基準を策定する
- AIサービスの価格改定に備え、現在のAPI利用量とコスト構造を棚卸しする
- 東京ロボタクシー実証の動向を注視し、モビリティ関連の事業機会を評価する
- Anthropic vs 国防総省の訴訟結果を注視し、ベンダーリスク管理の観点から代替サービスの検討を進める
6. 出典
- 公式: OpenAI(GPT-5.4リリース)、Anthropic(Claude 4.6シリーズ)、Gartner(エンタープライズソフトウェア支出レポート)、Uber・日産・Wayve(ロボタクシー協業発表)
- 参考: Patrick Moorhead氏のコメント(Google動向分析)、上院小委員会(Operation Epic Fury確認)、FEC記録
- 補足: 記事内で言及された情報に基づく