【Antigravity 2.0】週間クオータ制限を賢く「いなす」フォールバック戦略と設定実装

AI駆動開発の統合プラットフォームとして進化を続ける「Google Antigravity」。しかし、直近のバージョン2.0へのアップデート以降、多くの開発者が「高性能モデルの週間クオータ（利用制限）が一瞬で枯渇し、作業が完全にストップする」という致命的な課題に直面しています。

本記事では、ツールの仕様変更に振り回されることなく、システムの「分業」というアーキテクチャ of 工夫によってリソースの暴走を賢く「いなす」フォールバック戦略について解説します。

1. クオータ急激枯渇のメカニズム
2. 解決アプローチ：「分業」のアーキテクチャ
3. 設定ファイル：GEMINI.mdの実装
4. 本戦略が成立するための「前提条件」
5. 実装のリアルと計測の限界（適合性マップ）
6. まとめ：仕様変更を「いなす」という姿勢

1. クオータ急激枯渇のメカニズム

Antigravity 2.0において、なぜこれほどまでに早く利用制限に達してしまうのか。その主因は、アプリのバックグラウンドで自律的に動く「サブエージェント（Subagents）の暴走」にあります。

ユーザーが表側のチャットUIで1つの指示を出した際、アプリ側はタスクの複雑さを補うため、裏側で勝手に複数の子エージェントを生成します。これらの子エージェントが、デフォルト仕様のまま高コストな上位モデル（Gemini 3.1 ProやClaude等）を呼び出して長大なソースコードの読み書きやデバッグループを繰り返すため、共通のクオータプールが一瞬で消費されてしまうのです。

2. 解決アプローチ：「分業」のアーキテクチャ

この課題に対する現実的な防衛策は、「思考」と「実作業」の実行エンジンを完全に分離する分業体制の構築です。

表側のチャットUI（メインAI）：最初の指示受付や最終的な完了報告といった、高度なコンテキスト理解が必要な「司令塔」としての役割に限定する。
裏方の泥臭い実作業（実行エンジン）：最もトークンを消費するファイルの読み込み、差分書き換え、デバッグの繰り返しを、上位モデルに比べ桁違いに安価（Proモデルの約20倍安価）かつ100万トークンの広大なコンテキストを持つ gemini-3.1-flash-lite へ強制的にオフロード（委譲）する。

なお、この gemini-3.1-flash-lite は、現在Antigravity 2.0のアプリUI上の選択肢一覧には表示されませんが、Google AI Studio（API経由）において開発者向けに限定的に解放されているため、バックエンドからの呼び出しルートとしては確実に機能します。この隠れたAPIを、Antigravity 2.0の公式機能である「Customizations（カスタムルール）」を利用して強制適用します。

3. 設定ファイル：GEMINI.mdの実装

プロジェクトのルート、またはグローバル設定（~/.gemini/GEMINI.md）に以下のファイルを配置することで、バックグラウンドエージェントの挙動を厳格に拘束します。

# Antigravity Agent Resource Control Rules

## [CRITICAL CONSTRAINT: MODEL ENFORCEMENT]
- **Primary Execution Engine:** You MUST route all background operations, token-heavy execution tasks, code generation loops, and step-by-step file modifications to the backend API endpoint configured with `gemini-3.1-flash-lite`.
- **Subagent Delegation Ban:** You are STRICTLY PROHIBITED from spawning subagents, dynamic multi-agent teams, or background routing processes that call upon alternative, higher-tier, or more expensive models (such as Gemini 3.5 Flash, Gemini 3.1 Pro, or external flagship models) unless a human user explicitly requests a specific model shift in the primary chat interface.
- **Resource Conservation Mode:** Minimize multi-turn reasoning overhead. Process the given task autonomously within a single-agent loop utilizing the `gemini-3.1-flash-lite` context window to ensure the highest speed and lowest API consumption.

## [WORKFLOW DIRECTIVES]
1. **Planning & Execution:** When generating an implementation plan or task list, execute all validation, code writing, and file rewrites directly under the `gemini-3.1-flash-lite` runtime configuration.
2. **Error Recovery:** If a compilation error or test failure occurs, handle the iterative debugging loops locally within the same model boundary. Do not escalate to a higher-tier model for debugging.

※注意：もし限定解放枠の権限不足などの理由でモデルの指定エラーが発生し、Antigravityの処理が完全に停止（クラッシュ）する場合は、現在一般解放されている gemini-3.5-flashや gemini-1.5-flashに記述を変更してフォールバックしてください。

4. 本戦略が成立するための「前提条件」

このフォールバック戦略は万能の魔法ではなく、以下の環境的・運用的前提条件がクリアされて初めて機能する「人間主導の協調システム」です。

ルールの継承仕様： アプリのCustomizations（カスタムルール）が、親エージェントだけでなく、バックグラウンドで生成される「子エージェント」に対しても厳格に強制適用される仕様になっていること。
APIの固定環境：バックエンドの実行ルートを gemini-3.1-flash-lite に確実にルーティング・固定できる状態であること。
人間による手綱引き（オーケストレーション）：軽量モデルゆえに複雑なバグで堂々巡り（スタック）するリスクがあるため、人間が表側から具体的かつ精度の高い中間指示を与えてコントロールすること。

5. 実装のリアルと計測の限界（適合性マップ）

私自身、効果を見込んでこのアーキテクチャをすでに実装し、日々の開発環境に投入しています。

しかし、技術的に見て「この方法でクオータが〇％削減できた」という厳密な効果計測（比較）は原理的に不可能です。開発タスクごとに消費されるトークン量やエラーの発生頻度は毎回異なるため、同一条件でのA/Bテストができないからです。したがって、本設定は「劇的な体感効果」を保証するものではなく、あくまで理論上の暴走リスクを抑えるためのお守り（保険）としての運用が実態です。

また、巨大なモノリス（大規模システム）の開発や、要件定義が極めて抽象的な新規設計など、AI側に高度な推論（Reasoning）を丸投げしたい環境には向いていません。中・小規模なプロジェクトや、構造が綺麗に分離されたコンポーネント開発において最も真価を発揮します。さらに、軽量モデル特有の弱点として、複雑な出力フォーマット（JSONやXML等）のスキーマを維持できずに破壊してしまい、エラーすら吐かずにエージェントが沈黙・スタックする「サイレントエラー」のリスクがある点も留意が必要です。

6. まとめ：仕様変更を「いなす」という姿勢

AIツールの進化とマネタイズの変遷は激しく、今後運営側が「サブエージェントのモデル強制固定」や「カスタムルールの優先順位変更」などの対策（仕様変更）を講じてくる可能性は十分にあります。

本記事で紹介した戦略は、あくまで現時点（2026年5月現在）の仕様を上手に乗り切るための「1つの発想」に過ぎません。しかし、プラットフォーム側に主導権を握られ、制限に怯えながら開発するのではなく、アーキテクチャの力でリソースを「管理・運用」する視点を持つことは、これからのAI時代を生きるエンジニアにとって不可欠な自衛策と言えるでしょう。

不確定要素も含め、ご自身の環境で試される方は、ぜひ【自己責任】の範囲でこの実験的なコントロール術を楽しんでみてください。