MENU

Gemini 3.1 Flash-Liteと2.5 Flashの比較まとめ:性能・コスト・無料枠の違い

新たにリリースされた「Gemini 3.1 Flash-Lite」と、前世代の「Gemini 2.5 Flash」の違いについて、性能、コスト、および無料枠の観点から整理します。

目次

1. 性能面の進化:賢さとスピードの両立

3.1 Flash-Liteは「軽量・高速版」でありながら、処理スピードと推論能力が大きく向上しています。

  • レスポンスの高速化: 最初の回答が出始めるまでの時間(TTFT)が約2.5倍高速化され、全体の出力スピードも最大45%向上しています。
  • 高い推論能力: 各種ベンチマークにおいて標準モデルに匹敵するスコアを記録し、複雑な指示の理解力も向上しています。
  • 思考レベルの調整: タスクの難易度に合わせて、AIの「考える深さ」を調整できる機能が備わっています。

2. 価格面の比較:大量処理に最適なコストパフォーマンス

100万トークンあたりのAPI利用コストを比較すると、3.1 Flash-Liteは出力コストが大幅に削減されています。

モデル 入力コスト(100万トークン) 出力コスト(100万トークン)
Gemini 2.5 Flash 0.30ドル 2.50ドル
Gemini 3.1 Flash-Lite 0.25ドル 1.50ドル

出力コストが40%安くなっているため、大量のテキスト処理や翻訳、長文の要約などにおいて、圧倒的なコストメリットを発揮します。

3. 無料枠(Free Tier)の違い

どちらのモデルにもクレジットカード登録不要で使える無料枠が存在しますが、1日あたりの上限回数に違いがあります。処理が軽く低コストな3.1 Flash-Liteの方が、より多く無料で利用できます。

モデル 1分あたりの上限(RPM) 1日あたりの上限(RPD)
Gemini 2.5 Flash 15回 / 分 500回 / 日
Gemini 3.1 Flash-Lite 15回 / 分 1,000回 / 日

※課金設定(Billing)を有効にすると無料枠は適用されなくなり、1トークン目から完全な従量課金に切り替わる点に注意が必要です。

4. 参考資料

APIの価格や無料枠(レート制限)に関する公式な仕様は、以下のGoogle公式ドキュメントにて確認できます。

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

目次