1. 今何が話題か
2026年3月16日、パリ拠点のMistral AIがGTC 2026でMistral Small 4を発表した。推論特化のMagistral、マルチモーダル処理のPixtral、コーディング支援のDevstralという3つの専門モデルを単一モデルに統合し、Apache 2.0ライセンスで公開している。MoE(Mixture-of-Experts)アーキテクチャにより、119Bの総パラメータを持ちながら推論時のアクティブパラメータは約6.5Bに抑えられている。
2. 話題になっている理由
3つの用途別モデルを1つに統合することで、デプロイの複雑さとコストを大幅に削減できる点が注目されている。reasoning_effortパラメータの切り替えだけで推論の深さを制御でき、1つのAPIで多様なタスクに対応可能になった。前モデルのMistral Small 3と比較してレイテンシを40%削減し、スループットは3倍を達成している。加えて、ヨーロッパ発のオープンソースモデルとしてGDPRやEU AI法に準拠したデータ処理を可能にする点が、米国クラウドに依存したくない企業にとって明確な差別化要因となっている。
3. 実際に起きている変化
ベンチマークではLiveCodeBenchでGPT-OSS 120Bを上回り、出力量は20%少ない。AA LCRでは0.72のスコアを1.6K文字で達成し、Qwenモデルが同等スコアに5.8K〜6.1K文字を要するのと対照的だ。GPQA Diamondでは大学院レベルの科学的推論で76.9%を記録した。コンテキストウィンドウは256kトークンに対応し、テキストと画像の両方を処理できる。
エンタープライズ領域では、フランス国防省がMistralとの枠組み合意を締結し全軍でのAI展開を進めている。HSBCは与信審査やコンプライアンスレビューにセルフホストモデルを導入した。企業向けモデル訓練プラットフォーム「Forge」にはASML、Ericsson、欧州宇宙機関などが参画している。
4. 過熱評価されている点
「Small」という名称は誤解を招きやすい。119Bの総パラメータを保持するため、実行にはH100クラスのGPUが複数台必要であり、VRAMの要件は大規模モデルと同等である。推論時のアクティブパラメータが少ないことと、デプロイのハードルが低いことは別問題だ。セルフホストが可能とはいえ、実際に自社運用するには相応のインフラ投資が求められる。
5. 現実的な使いどころ
256kコンテキストを活かした社内ドキュメント分析では、長文の契約書や報告書を画像付きで処理できる。Devstral由来のコーディング能力はCI/CDパイプラインへの統合に適している。推論深度の切り替えにより、簡単な問い合わせには高速応答、複雑な技術質問には詳細な分析を提供するカスタマーサポートが実現可能だ。GDPR準拠が必要な環境では、オンプレミスでのデータ処理が大きな利点となる。NVIDIAのNIMコンテナ、vLLM、llama.cppといった主要推論フレームワークに対応しており、Mistral APIやHugging Faceからもアクセスできる。
6. 今後見るべきポイント
ヨーロッパ発のAIモデルがデータ主権の観点からどこまでシェアを獲得できるかが注目される。Forgeプラットフォームを通じた企業カスタマイズの事例が増えるかも重要な指標だ。MoEアーキテクチャの効率化がさらに進めば、より小規模なインフラでの運用が可能になり、セルフホストの実用性がさらに高まるだろう。
7. 出典
- 公式: Mistral AI GTC 2026発表、Apache 2.0ライセンス公開
- 参考: LiveCodeBench、AA LCR、GPQA Diamondベンチマーク結果、フランス国防省・HSBC・ASML・Ericsson・欧州宇宙機関の導入事例
- 補足: 記事内で言及された情報に基づく