「Gemini APIを使ってみたいけど、いつの間にか課金されないか心配…」
「無料枠がどれくらい残ってるか確認したい」
「気づいたら料金が発生していた!」
こんな不安を抱えていませんか?
今回は、Gemini APIの無料枠(クレジット)の確認方法から、課金を避ける設定、料金管理まで、初心者でも分かるように詳しく解説していきます。
Gemini APIの無料枠とは

2種類の「無料」
Gemini APIには、2種類の無料が存在します。これが混乱の原因です。
①Google Cloudの無料トライアルクレジット($300)
特徴:
- 新規登録時に提供される
- 90日間有効
- $300分のクレジット
- Google Cloud全体で使える
注意:
これは「Google Cloud Platform(GCP)」全体の新規登録特典であり、Gemini API専用ではありません。
②Gemini APIの永続的な無料枠(Free Tier)
特徴:
- 期間制限なし(永続的)
- 毎日・毎分リセットされる
- モデルごとに上限が設定
- クレジットカード登録不要
本記事で解説するのは、この②の方です。
無料枠の制限内容
無料枠には、モデルごとに以下の制限があります。
制限の種類:
- RPM(Requests Per Minute): 1分あたりのリクエスト数
- TPM(Tokens Per Minute): 1分あたりのトークン数
- RPD(Requests Per Day): 1日あたりのリクエスト数
主要モデルの無料枠(2025年1月時点)
Gemini 2.5 Flash(最新・推奨):
- RPM:10回/分
- TPM:400万トークン/分
- RPD:500回/日
Gemini 2.5 Pro:
- RPM:5回/分
- TPM:25万トークン/分
- RPD:25回/日
Gemini 1.5 Flash:
- RPM:15回/分
- TPM:100万トークン/分
- RPD:1,500回/日
Gemini 1.5 Pro:
- RPM:2回/分
- TPM:3.2万トークン/分
- RPD:50回/日
重要: 無料枠は毎日米国太平洋時間の0時にリセットされます。
日本時間では:
- 太平洋夏時間:16時頃
- 太平洋標準時間:17時頃
無料枠を超えるとどうなる?
課金が無効なプロジェクト:
- エラーが返される
- APIが使えなくなる
- 料金は発生しない
課金が有効なプロジェクト:
- 自動的に従量課金に移行
- 料金が発生する
使用量の確認方法
方法1:Google Cloud Consoleで確認(詳細)
最も詳細に確認できる方法です。
手順1:Google Cloud Consoleにアクセス
- ブラウザで「Google Cloud Platform」と検索
- console.cloud.google.com にアクセス
- Googleアカウントでログイン
手順2:プロジェクトを選択
画面上部のプロジェクト名(例:My First Project)を確認・選択します。
手順3:APIとサービスを開く
- クイックアクセスの「APIとサービス」をクリック
- 左メニューの「有効なAPIとサービス」をクリック
手順4:Generative Language APIを選択
一覧から「Generative Language API」を探してクリックします。
手順5:割り当てとシステム上限を確認
- 上部タブの「割り当てとシステム上限」をクリック
- モデルごとの使用状況が表示される
表示される情報:
- 値列: 上限値
- 現在の使用量列: リアルタイムの消費量
例:
gemini-2.5-flash
RPM: 10 / 0(上限10、現在0使用)
TPM: 4,000,000 / 0(上限400万、現在0使用)
RPD: 500 / 5(上限500、現在5使用)
この数字を見れば、無料枠をどれくらい使っているか一目で分かります。
方法2:Google AI Studioで確認(簡易)
Google AI Studioでも使用状況を確認できます。
手順:
- aistudio.google.com にアクセス
- 右上のプロジェクト名をクリック
- 使用状況が表示される(簡易版)
ただし、Google Cloud Consoleほど詳細ではありません。
方法3:コードで確認
APIを使用する際に、レスポンスから使用トークン数を取得できます。
Pythonの例:
import google.generativeai as genai
genai.configure(api_key="YOUR_API_KEY")
model = genai.GenerativeModel("gemini-2.5-flash")
response = model.generate_content("こんにちは")
# 使用トークン数を確認
print(response.usage_metadata)
# 出力例: prompt_token_count: 5, candidates_token_count: 10, total_token_count: 15
課金を避けるための設定
無料で使い続けるための重要な設定を解説します。
重要:課金を無効にする
2024年5月2日以降の重要な変更:
課金が有効なGoogle Cloudプロジェクトでは、無料枠を超えると自動的に従量課金されます。
課金を避ける方法:
方法1:課金を無効にしたプロジェクトを使う
- Google Cloud Consoleを開く
- 左メニュー→「お支払い」
- 「課金を無効にする」を選択
注意: 課金を無効にすると、一部のGoogle Cloudサービスが使えなくなります。
方法2:Gemini API専用のプロジェクトを作る
課金を有効にしたプロジェクトと、無料枠専用のプロジェクトを分けます。
手順:
- Google Cloud Consoleで新しいプロジェクトを作成
- このプロジェクトでは課金を設定しない
- Google AI StudioでこのプロジェクトのAPIキーを発行
- このAPIキーを使用する
メリット:
- 課金プロジェクトは他のGoogle Cloudサービスで使用
- 無料枠プロジェクトはGemini APIのみ
- 確実に無料で使い続けられる
予算アラートの設定(課金有効の場合)
課金を有効にする場合は、必ず予算アラートを設定しましょう。
手順1:Cloud Billingを開く
- Google Cloud Console→左メニュー→「お支払い」
- 対象の請求先アカウントを選択
手順2:予算とアラートを作成
- 「予算とアラート」をクリック
- 「予算を作成」をクリック
手順3:予算の設定
プロジェクトとサービスを指定:
- 対象プロジェクト:使用中のプロジェクト
- サービス:「Generative Language API」のみに絞る
予算金額を設定:
- 月額の上限を入力(例:$10)
- 日本円でも設定可能
アラートのしきい値を設定:
- 50%、90%、100%で通知
- 通知先メールアドレスを登録
手順4:保存
「保存」をクリックして完了。
予算に達すると、メールで通知が来ます。
重要: アラートは通知のみで、自動的に課金を停止する機能はありません。
使いすぎを防ぐコード実装
アプリケーション側でも制限をかけられます。
Pythonの例:
import time
from datetime import datetime
class RateLimiter:
def __init__(self, rpm_limit=10, rpd_limit=500):
self.rpm_limit = rpm_limit
self.rpd_limit = rpd_limit
self.minute_requests = []
self.daily_requests = 0
self.last_reset = datetime.now().date()
def can_make_request(self):
now = datetime.now()
# 日次リセット
if now.date() != self.last_reset:
self.daily_requests = 0
self.last_reset = now.date()
# 1分以内のリクエストをカウント
self.minute_requests = [t for t in self.minute_requests
if (now - t).seconds < 60]
# 制限チェック
if len(self.minute_requests) >= self.rpm_limit:
return False
if self.daily_requests >= self.rpd_limit:
return False
return True
def record_request(self):
self.minute_requests.append(datetime.now())
self.daily_requests += 1
# 使用例
limiter = RateLimiter(rpm_limit=10, rpd_limit=500)
if limiter.can_make_request():
# APIを呼び出す
response = model.generate_content("テキスト")
limiter.record_request()
else:
print("レート制限に達しました")
Gemini APIの料金体系

無料枠を超えた場合の料金を理解しておきましょう。
従量課金の料金(2025年1月時点)
Gemini 2.5 Flash:
- 入力:$0.15 / 100万トークン
- 出力:$0.60 / 100万トークン
Gemini 2.5 Pro:
- 入力:$1.25 / 100万トークン
- 出力:$5.00 / 100万トークン
Gemini 1.5 Flash:
- 入力:$0.075 / 100万トークン
- 出力:$0.30 / 100万トークン
Gemini 1.5 Pro:
- 入力:$1.25 / 100万トークン(128K以下)
- 出力:$5.00 / 100万トークン(128K以下)
実際のコスト例
例1:チャットボット(Gemini 2.5 Flash)
仮に以下の使用量だとします:
- 1回のやり取り:入力500トークン、出力200トークン
- 1日100回のやり取り
月額コスト計算:
入力:500トークン × 100回 × 30日 = 150万トークン
出力:200トークン × 100回 × 30日 = 60万トークン
入力コスト:150万 / 100万 × $0.15 = $0.225
出力コスト:60万 / 100万 × $0.60 = $0.36
合計:$0.585(約90円)
無料枠を超えても、月額100円程度で使えます。
例2:要約ツール(Gemini 2.5 Pro)
- 1回の要約:入力5,000トークン、出力500トークン
- 1日10回
月額コスト計算:
入力:5,000 × 10 × 30 = 150万トークン
出力:500 × 10 × 30 = 15万トークン
入力コスト:150万 / 100万 × $1.25 = $1.875
出力コスト:15万 / 100万 × $5.00 = $0.75
合計:$2.625(約400円)
他のAI APIとの比較
100万トークンあたりの料金比較:
Gemini 2.5 Flash:
- 入力:$0.15
- 出力:$0.60
ChatGPT(GPT-4o mini):
- 入力:$0.15
- 出力:$0.60
Claude(Claude 3.5 Haiku):
- 入力:$0.25
- 出力:$1.25
重要な違い:
- Gemini:無料枠あり
- ChatGPT・Claude:無料枠なし(最初から課金)
Geminiは無料枠があるため、小規模な利用や学習目的には最適です。
料金の確認方法
実際に発生した料金を確認する方法です。
Google Cloud Consoleで確認
手順1:お支払いを開く
- Google Cloud Console→左メニュー→「お支払い」
- 対象の請求先アカウントを選択
手順2:レポートを確認
- 左メニュー→「レポート」
- 期間を選択(今月、先月など)
- サービス別の料金が表示される
手順3:詳細を確認
「Generative Language API」の項目を確認すると:
- 使用トークン数
- リクエスト数
- 発生した料金
が表示されます。
請求書の確認
手順:
- お支払い→「請求書」
- 該当月を選択
- PDFでダウンロード可能
よくある質問
Q1:無料枠はいつリセットされる?
A: 毎日、米国太平洋時間の0時にリセットされます。
日本時間では:
- 太平洋夏時間(3月〜11月):16時頃
- 太平洋標準時間(11月〜3月):17時頃
Q2:無料枠を超えたらどうなる?
A: プロジェクトの設定によります。
- 課金無効: エラーが返され、APIが使えなくなる(料金発生なし)
- 課金有効: 自動的に従量課金に移行(料金発生)
Q3:クレジットカード登録は必要?
A: 無料枠のみを使う場合は不要です。
ただし、予算アラートなどの機能を使いたい場合は、課金アカウントの設定が必要です。
Q4:無料枠は永続的に使える?
A: はい、期間制限はありません。
ただし、Googleが予告なく変更する可能性はあります。
Q5:複数のプロジェクトを作れば無料枠が増える?
A: 技術的には可能ですが、利用規約違反の可能性があります。
Googleアカウント1つにつき、1つのプロジェクトでの利用を推奨します。
Q6:Google AI Studioは課金される?
A: いいえ、Google AI Studioの使用は完全無料です。
課金を設定したプロジェクトでも、Google AI Studio内での利用は無料です。
Q7:APIキーは複数作れる?
A: はい、1つのプロジェクトで複数のAPIキーを作成できます。
ただし、無料枠はプロジェクト単位なので、複数のキーでも合算されます。
Q8:課金を自動停止できる?
A: いいえ、Googleの仕様では自動停止機能はありません。
アラート通知を受け取ったら、手動でAPIキーを無効化するか、課金を停止する必要があります。
Q9:無料トライアルの0は使える?
A: はい、Gemini APIの料金にも使えます。
ただし、90日間の期限があります。
Q10:学生や教育機関向けの無料枠は?
A: 現時点では、通常の無料枠と同じです。
学生も社会人も同じ条件で利用できます。
無料枠を最大限活用するコツ
1. 軽量モデルを使う
Gemini 2.5 Flash または Gemini 1.5 Flash を使いましょう。
- 無料枠が大きい
- レスポンスが速い
- 料金も安い
性能も十分高いため、多くの用途で問題ありません。
2. リクエストをまとめる
複数の質問を1つのリクエストにまとめることで、リクエスト数を削減できます。
悪い例:
response1 = model.generate_content("日本の首都は?")
response2 = model.generate_content("フランスの首都は?")
response3 = model.generate_content("アメリカの首都は?")
→ 3回のリクエスト
良い例:
prompt = """
以下の国の首都を教えてください:
1. 日本
2. フランス
3. アメリカ
"""
response = model.generate_content(prompt)
→ 1回のリクエスト
3. キャッシュを活用する
同じ質問を何度もAPIに送らず、結果をキャッシュします。
cache = {}
def get_response(prompt):
if prompt in cache:
return cache[prompt]
response = model.generate_content(prompt)
cache[prompt] = response.text
return response.text
4. トークン数を最適化する
- 不要な空白や改行を削除
- 簡潔な表現を使う
- システムプロンプトを短くする
5. バッチ処理を活用する
大量のリクエストがある場合は、時間を分散させます。
import time
for item in items:
process(item)
time.sleep(10) # 10秒待機
まとめ
Gemini APIのクレジット(無料枠)確認方法についてまとめます。
無料枠の制限:
- モデルごとに異なる
- RPM(1分あたり)・RPD(1日あたり)で制限
- 毎日リセット(米国太平洋時間0時)
使用量の確認方法:
- Google Cloud Console(詳細)
- 割り当てとシステム上限で確認
- リアルタイムの使用量が分かる
- Google AI Studio(簡易)
- コード(プログラム内で確認)
課金を避ける設定:
- 課金を無効にする
- 無料枠専用プロジェクトを作る
- 予算アラートを設定する(課金有効の場合)
- コードでレート制限を実装する
料金体系:
- 無料枠あり(他のAI APIにはない利点)
- 従量課金は100万トークン単位
- Gemini 2.5 Flashが最もコスパが良い
確認すべきポイント:
- RPM/RPDの残り
- 毎日のリセット時間
- プロジェクトの課金設定
- 予算アラートの設定
無料枠活用のコツ:
- 軽量モデル(Flash系)を使う
- リクエストをまとめる
- キャッシュを活用
- トークン数を最適化
Gemini APIは、無料枠が豊富で、小規模な利用や学習目的には最適です。
適切に管理すれば、クレジットカードなしで、ずっと無料で使い続けることができます。
この記事を参考に、安心してGemini APIを活用してください!

コメント