新たにリリースされた「Gemini 3.1 Flash-Lite」と、前世代の「Gemini 2.5 Flash」の違いについて、性能、コスト、および無料枠の観点から整理します。
目次
1. 性能面の進化:賢さとスピードの両立
3.1 Flash-Liteは「軽量・高速版」でありながら、処理スピードと推論能力が大きく向上しています。
- レスポンスの高速化: 最初の回答が出始めるまでの時間(TTFT)が約2.5倍高速化され、全体の出力スピードも最大45%向上しています。
- 高い推論能力: 各種ベンチマークにおいて標準モデルに匹敵するスコアを記録し、複雑な指示の理解力も向上しています。
- 思考レベルの調整: タスクの難易度に合わせて、AIの「考える深さ」を調整できる機能が備わっています。
2. 価格面の比較:大量処理に最適なコストパフォーマンス
100万トークンあたりのAPI利用コストを比較すると、3.1 Flash-Liteは出力コストが大幅に削減されています。
| モデル | 入力コスト(100万トークン) | 出力コスト(100万トークン) |
|---|---|---|
| Gemini 2.5 Flash | 0.30ドル | 2.50ドル |
| Gemini 3.1 Flash-Lite | 0.25ドル | 1.50ドル |
出力コストが40%安くなっているため、大量のテキスト処理や翻訳、長文の要約などにおいて、圧倒的なコストメリットを発揮します。
3. 無料枠(Free Tier)の違い
どちらのモデルにもクレジットカード登録不要で使える無料枠が存在しますが、1日あたりの上限回数に違いがあります。処理が軽く低コストな3.1 Flash-Liteの方が、より多く無料で利用できます。
| モデル | 1分あたりの上限(RPM) | 1日あたりの上限(RPD) |
|---|---|---|
| Gemini 2.5 Flash | 15回 / 分 | 500回 / 日 |
| Gemini 3.1 Flash-Lite | 15回 / 分 | 1,000回 / 日 |
※課金設定(Billing)を有効にすると無料枠は適用されなくなり、1トークン目から完全な従量課金に切り替わる点に注意が必要です。
4. 参考資料
APIの価格や無料枠(レート制限)に関する公式な仕様は、以下のGoogle公式ドキュメントにて確認できます。
