このページは Cloud Translation API によって翻訳されました。

組み込みの AI を使ってみる

AI_USAGE=false

Alexandra Klepper

公開日: 2024 年 12 月 12 日、最終更新日: 2025 年 5 月 20 日

組み込みの AI API を使用すると、ウェブアプリケーションは独自の AI モデルをデプロイまたは管理することなく、AI を活用したタスクを実行できます。Google は、ブラウザ間でこれらの API を標準化する取り組みを進めています。

要件

組み込み AI を使用するには、モデルとハードウェアの要件があります。

モデル

Prompt API、Summarizer API、Writer API、Rewriter API は、パソコンやノートパソコンでローカルに実行するように設計された大規模言語モデルをダウンロードします。これらの API はモバイルデバイスでは動作しません。これらの API を使用する前に、Google の生成 AI の使用禁止に関するポリシーをご確認ください。

Summarizer API、Writer API、Rewriter API は、テキストからテキストへのモダリティのみをサポートしています。Prompt API にマルチモーダル機能が追加され、早期プレビュープログラムの参加者はローカルプロトタイピングで利用できるようになりました。

ハードウェア

Chrome でこれらの API を使用して機能を操作するデベロッパーとユーザーには、次の要件があります。他のブラウザでは動作要件が異なる場合があります。

言語検出 API と翻訳 API は、パソコン版 Chrome で動作します。これらの API はモバイルデバイスでは動作しません。Prompt API、Summarizer API、Writer API、Rewriter API は、次の条件を満たす場合に Chrome で動作します。

オペレーティングシステム: Windows 10 または 11、macOS 13 以降（Ventura 以降）、Linux。Gemini Nano を使用する API は、Chrome for Android、iOS、ChromeOS ではまだサポートされていません。
ストレージ: Chrome プロファイルを含むボリュームに 22 GB 以上の空き容量がある。
組み込みモデルは大幅に小さくなるはずです。正確なサイズは、更新によって多少異なる場合があります。
GPU: 4 GB を超える VRAM。
ネットワーク: 無制限のデータ通信または従量制でない接続。
重要な用語: 従量制課金接続とは、データ使用量に制限のあるインターネット接続のことです。Wi-Fi 接続とイーサネット接続はデフォルトで従量制ではない傾向がありますが、モバイル接続は従量制であることがよくあります。

Gemini Nano の正確なサイズは、ブラウザがモデルを更新するにつれて変化する可能性があります。現在のサイズを確認するには、chrome://on-device-internals にアクセスして [モデルのステータス] に移動します。リストに表示された [ファイルパス] を開いて、モデルのサイズを確認します。

構築を開始

開発のさまざまな段階で、いくつかの組み込み AI API を利用できます。一部は Chrome 安定版で利用可能、一部はオリジントライアルの参加者のみが利用可能、一部は早期プレビュープログラムの参加者のみが利用可能です。

各 API には、ローカルプロトタイピングとオリジントライアルを使用した本番環境の両方で、モデルの利用を開始してダウンロードするための独自の手順が用意されています。

Translator API
Language Detector API
Summarizer API
Prompt API
- Chrome 拡張機能の Prompt API には、拡張機能デベロッパーが Prompt API を使用してビルドするのに役立つ具体的な手順が記載されています。
Writer API と Rewriter API

これらの API はすべて、Chrome 拡張機能の構築時に使用できます。

モデルのダウンロード

API とモデルは Chrome に組み込まれています。ユーザーがこれらの API を初めて操作するときは、モデルをブラウザにダウンロードする必要があります。

API が使用可能で準備ができているかどうかを判断するには、非同期の availability() 関数を呼び出します。この関数は、次のいずれかの値を含む Promise を返します。

"unavailable": ユーザーのデバイスまたはリクエストされたセッションオプションがサポートされていません。デバイスの電力またはディスク容量が不足している可能性があります。
"downloadable": セッションを作成するには追加のダウンロードが必要です。これには、エキスパートモデル、言語モデル、ファインチューニングが含まれる場合があります。create() を呼び出すには、ユーザーの有効化が必要になる場合があります。
"downloading": ダウンロードが進行中であり、セッションを使用するにはダウンロードを完了する必要があります。
"available": セッションをすぐに作成できます。

ユーザーのアクティブ化

必要なモデルと構成をブラウザにダウンロードするには、ユーザーの操作が必要です。ウェブサイトやウェブアプリケーションが特定の組み込み AI API をユーザーが初めて利用する場所である場合、create() でセッションを開始するには、一時的なユーザーインタラクションが必要です。

UserActivation.isActive` プロパティを使用して、ユーザーのアクティベーション（クリック、タップ、キー押下など）を確認します。

// Check for user activation.
if (navigator.userActivation.isActive) {
  // Create an instance of a built-in API
}

たとえば、Summarizer API を使用して、ユーザーに [要約] ボタンをクリックして Summarizer.create() を有効にするよう求めることができます。

localhost で API を使用する

これらの API はすべて Chrome の localhost で利用できます。

chrome://flags/#prompt-api-for-gemini-nanoに向かいます。
[有効] を選択します。
[再起動] をクリックするか、Chrome を再起動します。

Gemini Nano がダウンロードされ、意図したとおりに動作することを確認するには、DevTools を開き、コンソールに await LanguageModel.availability(); と入力します。これにより、available が返されます。

localhost のトラブルシューティング

モデルが想定どおりに機能しない場合は、次の手順を行います。

Chrome を再起動します。
chrome://componentsに向かいます。
Optimization Guide On Device Model が存在することを確認します。これは、Gemini Nano が利用可能であるか、ダウンロード中であることを意味します。
- バージョン番号が表示されていない場合は、[更新を確認] をクリックしてダウンロードを強制します。
DevTools を開き、コンソールに LanguageModel.availability(); と入力します。これにより、available が返されます。

必要に応じて、しばらく待ってから上記の手順を繰り返します。

標準プロセス

Google では、これらの API がすべてのブラウザで動作するように、標準化に取り組んでいます。つまり、Google はウェブプラットフォームコミュニティに API を提案し、さらなる議論のために W3C Web Incubator Community Group に移行しました。

各 API について、W3C、Mozilla、WebKit にフィードバックを求めています。

意見交換とフィードバックの提供

組み込み AI をお試しになり、フィードバックがございましたら、ぜひお聞かせください。

組み込み AI API をすべて確認する。
早期プレビュープログラムに参加して、新しい API をいち早く確認し、メーリングリストにアクセスしましょう。
Chrome の実装についてフィードバックがある場合は、Chromium のバグを報告してください。
ウェブ標準について学習します。