★3 LLM EN Google AI Blog

Gemini APIでコストと信頼性のバランスを取る新たな方法

New ways to balance cost and reliability in the Gemini API

記事のポイント

ニュースGoogleがGemini APIに「Flex」と「Priority」の2つの新しい推論ティアを導入しました。
注目ポイントユーザーはコストとレイテンシのバランスを、用途に応じて柔軟に選択できるようになります。
これからどうなる開発者はアプリケーションの要件に合わせ、より効率的にGeminiモデルを利用できるようになります。
Flexティアは低コストで利用できるが、レイテンシは保証されません。
一方、Priorityティアは高コストですが、低レイテンシと高い信頼性が保証されます。
これにより、開発者はリアルタイム応答が必要なアプリケーションと、コスト重視のバッチ処理などで最適な選択が可能です。
💡
編集部の視点

APIの料金体系と性能オプションの多様化は、LLMの商用利用を促進する重要な動きとなるだろう。

概要

Google is introducing two new inference tiers to the Gemini API, Flex and Priority, to balance cost and latency.

元記事を読む →

関連記事