AI_USAGE=false
公開日: 2024 年 12 月 12 日、最終更新日: 2025 年 5 月 20 日
組み込みの AI API を使用すると、ウェブ アプリケーションは独自の AI モデルをデプロイまたは管理することなく、AI を活用したタスクを実行できます。Google は、ブラウザ間でこれらの API を標準化する取り組みを進めています。
要件
組み込み AI を使用するには、モデルとハードウェアの要件があります。
モデル
Prompt API、Summarizer API、Writer API、Rewriter API は、パソコンやノートパソコンでローカルに実行するように設計された大規模言語モデルをダウンロードします。これらの API はモバイル デバイスでは動作しません。これらの API を使用する前に、Google の生成 AI の使用禁止に関するポリシーをご確認ください。
Summarizer API、Writer API、Rewriter API は、テキストからテキストへのモダリティのみをサポートしています。Prompt API にマルチモーダル機能が追加され、早期プレビュー プログラムの参加者はローカル プロトタイピングで利用できるようになりました。
ハードウェア
Chrome でこれらの API を使用して機能を操作するデベロッパーとユーザーには、次の要件があります。他のブラウザでは動作要件が異なる場合があります。
言語検出 API と翻訳 API は、パソコン版 Chrome で動作します。これらの API はモバイル デバイスでは動作しません。Prompt API、Summarizer API、Writer API、Rewriter API は、次の条件を満たす場合に Chrome で動作します。
- オペレーティング システム: Windows 10 または 11、macOS 13 以降(Ventura 以降)、Linux。Gemini Nano を使用する API は、Chrome for Android、iOS、ChromeOS ではまだサポートされていません。
- ストレージ: Chrome プロファイルを含むボリュームに 22 GB 以上の空き容量がある。
- GPU: 4 GB を超える VRAM。
- ネットワーク: 無制限のデータ通信または従量制でない接続。
Gemini Nano の正確なサイズは、ブラウザがモデルを更新するにつれて変化する可能性があります。現在のサイズを確認するには、chrome://on-device-internals
にアクセスして [モデルのステータス] に移動します。リストに表示された [ファイルパス] を開いて、モデルのサイズを確認します。
構築を開始
開発のさまざまな段階で、いくつかの組み込み AI API を利用できます。一部は Chrome 安定版で利用可能、一部はオリジン トライアルの参加者のみが利用可能、一部は早期プレビュー プログラムの参加者のみが利用可能です。
各 API には、ローカル プロトタイピングとオリジン トライアルを使用した本番環境の両方で、モデルの利用を開始してダウンロードするための独自の手順が用意されています。
- Translator API
- Language Detector API
- Summarizer API
- Prompt API
- Chrome 拡張機能の Prompt API には、拡張機能デベロッパーが Prompt API を使用してビルドするのに役立つ具体的な手順が記載されています。
- Writer API と Rewriter API
これらの API はすべて、Chrome 拡張機能の構築時に使用できます。
モデルのダウンロード
API とモデルは Chrome に組み込まれています。ユーザーがこれらの API を初めて操作するときは、モデルをブラウザにダウンロードする必要があります。
API が使用可能で準備ができているかどうかを判断するには、非同期の availability()
関数を呼び出します。この関数は、次のいずれかの値を含む Promise を返します。
"unavailable"
: ユーザーのデバイスまたはリクエストされたセッション オプションがサポートされていません。デバイスの電力またはディスク容量が不足している可能性があります。"downloadable"
: セッションを作成するには追加のダウンロードが必要です。これには、エキスパート モデル、言語モデル、ファインチューニングが含まれる場合があります。create()
を呼び出すには、ユーザーの有効化が必要になる場合があります。"downloading"
: ダウンロードが進行中であり、セッションを使用するにはダウンロードを完了する必要があります。"available"
: セッションをすぐに作成できます。
ユーザーのアクティブ化
必要なモデルと構成をブラウザにダウンロードするには、ユーザーの操作が必要です。ウェブサイトやウェブ アプリケーションが特定の組み込み AI API をユーザーが初めて利用する場所である場合、create()
でセッションを開始するには、一時的なユーザー インタラクションが必要です。
UserActivation.isActive
` プロパティを使用して、ユーザーのアクティベーション(クリック、タップ、キー押下など)を確認します。
// Check for user activation.
if (navigator.userActivation.isActive) {
// Create an instance of a built-in API
}
たとえば、Summarizer API を使用して、ユーザーに [要約] ボタンをクリックして Summarizer.create()
を有効にするよう求めることができます。
localhost で API を使用する
これらの API はすべて Chrome の localhost
で利用できます。
chrome://flags/#prompt-api-for-gemini-nano
に向かいます。- [有効] を選択します。
- [再起動] をクリックするか、Chrome を再起動します。
Gemini Nano がダウンロードされ、意図したとおりに動作することを確認するには、DevTools を開き、コンソールに await LanguageModel.availability();
と入力します。これにより、available
が返されます。
localhost のトラブルシューティング
モデルが想定どおりに機能しない場合は、次の手順を行います。
- Chrome を再起動します。
chrome://components
に向かいます。- Optimization Guide On Device Model が存在することを確認します。これは、Gemini Nano が利用可能であるか、ダウンロード中であることを意味します。
- バージョン番号が表示されていない場合は、[更新を確認] をクリックしてダウンロードを強制します。
- DevTools を開き、コンソールに
LanguageModel.availability();
と入力します。これにより、available
が返されます。
必要に応じて、しばらく待ってから上記の手順を繰り返します。
標準プロセス
Google では、これらの API がすべてのブラウザで動作するように、標準化に取り組んでいます。つまり、Google はウェブ プラットフォーム コミュニティに API を提案し、さらなる議論のために W3C Web Incubator Community Group に移行しました。
各 API について、W3C、Mozilla、WebKit にフィードバックを求めています。
意見交換とフィードバックの提供
組み込み AI をお試しになり、フィードバックがございましたら、ぜひお聞かせください。
- 組み込み AI API をすべて確認する。
- 早期プレビュー プログラムに参加して、新しい API をいち早く確認し、メーリング リストにアクセスしましょう。
- Chrome の実装についてフィードバックがある場合は、Chromium のバグを報告してください。
- ウェブ標準について学習します。