W3C WebNN(Web Neural Network)API。Web ブラウザからネイティブ AI 推論アクセラレータ(NPU / GPU / CPU)を呼び出す標準 API、ONNX Runtime Web / TensorFlow.js / Transformers.js で活用、2024 年 Chrome 実装。
WebNN API(ウェブ エヌエヌ エーピーアイ、Web Neural Network API)は、W3C(World Wide Web Consortium)が 2020 年から策定を開始し、2024 年に Chrome 121+ で実装公開された、Web ブラウザからネイティブ AI 推論アクセラレータ(NPU / GPU / CPU)を呼び出す標準 JavaScript API です。仕様策定は W3C Machine Learning for the Web Community Group(2018 年設立)が主導し、Microsoft / Google / Intel / Apple 等の主要ブラウザベンダー + AI ハードウェアベンダーが協業しています。
技術背景として、従来の Web 上 AI 推論は WebAssembly + WebGPU(2023 年実装)経由で間接的に GPU を利用するアプローチが主流でした。これは性能面では十分実用的でしたが、最新の AI PC(Microsoft Copilot+ PC、Intel Lunar Lake、AMD Ryzen AI Strix、Apple Silicon M シリーズ)+ スマートフォン搭載の NPU(Neural Processing Unit、専用 AI 推論アクセラレータ)を直接利用できないという制約がありました。
NPU は AI 推論専用に設計されたアクセラレータで、Microsoft Surface Pro Copilot+ PC の Hexagon NPU(45 TOPS)・Intel Lunar Lake NPU 4(48 TOPS)・AMD Ryzen AI Strix XDNA 2(50 TOPS)・Apple Silicon M4 Neural Engine(38 TOPS)・Snapdragon 8 Gen 4 Hexagon(40 TOPS)などが搭載されており、従来 GPU(電力 50-200W、推論 100-500 TOPS)より遥かに低消費電力(5-10W)で AI 推論を実行できます。
WebNN API は、OS 標準の AI 推論 API(Windows DirectML / macOS Core ML / iOS Core ML / Android NNAPI / Linux OpenVINO / ONNX Runtime 等)を抽象化した低レベルアクセスを提供します。Web アプリは具体的なハードウェアを意識せず、navigator.ml.createContext({ deviceType: 'npu' }) のような JavaScript 呼出だけで NPU / GPU / CPU の最適なアクセラレータを自動選択 + 高速 AI 推論を実行できます。
API は計算グラフベースで、(1)MLGraphBuilder で計算グラフを定義(matmul / conv2d / relu / softmax 等の演算ノード接続)・(2)MLContext.compute() で実行・(3)結果を JavaScript の TypedArray + ArrayBuffer 経由で受け取る、というフローです。ONNX Runtime Web(Microsoft、ONNX モデルを WebNN 経由で実行)・TensorFlow.js(Google、TF モデルを WebNN backend で実行)・Transformers.js(Hugging Face、Hugging Face Transformers モデルを WebNN 経由で実行)などのライブラリが WebNN backend を実装しており、開発者は普通の AI モデルコードを WebNN 上で動作させられます。
主な採用シナリオは、(1)Web ブラウザ上のローカル AI 推論(プライバシー保護 + 高速 + オフライン)・(2)Web 上の Stable Diffusion / Llama / Whisper / TTS / OCR 等のローカル AI 機能・(3)動画 / 画像のリアルタイム AI 処理(背景ぼかし / アップスケーリング / 物体検出)・(4)プライバシー重視の翻訳 / チャット / 音声認識・(5)AI PC + スマートフォン搭載 NPU を活用した低消費電力 AI 機能、などです。
実装状況は、Chrome 121+(2024 年 1 月、Windows DirectML / macOS Core ML / Linux ONNX Runtime backend で先行実装)・Edge 121+(Chrome ベース、Windows DirectML 連携)・Safari(2025 年実装予定、Apple Silicon Core ML)・Firefox(2025-2026 予定)で順次対応が進んでいます。Web 上の AI 推論市場(Stable Diffusion Web / ChatGPT 風ローカル LLM / Whisper Web 等)が WebNN により大きく拡大すると予想されています。
MLGraphBuilder + MLContext.compute()。| 技術 | アクセラレータ | 性能 | 主な用途 |
|---|---|---|---|
| WebNN API | NPU / GPU / CPU | 業界最速 | プライバシー AI 推論 |
| WebGPU + WebGPU Compute |
| GPU |
| 高 |
| 汎用並列計算 |
| WebAssembly + SIMD | CPU | 中 | フォールバック |
| WebGL + Compute Shader | GPU | 中-高 | レガシー |
| サーバ AI(API 経由) | クラウド GPU | 中 | プライバシー懸念 |
WebNN API は Web 開発者向け技術ですが、コンシューマ自作 PC ユーザーにも間接的に大きな影響があります。AI PC(Microsoft Copilot+ PC + Intel Lunar Lake / AMD Ryzen AI / Snapdragon X / Apple Silicon)を持つユーザーは、Chrome / Edge ブラウザ経由で Web 上のローカル AI 機能(Stable Diffusion / Llama / Whisper)を低消費電力 + 高速で利用可能となります。
Chrome 121+ で WebNN API を有効にするには、chrome://flags/ から「Web Machine Learning Neural Network API」を Enable に設定する必要があります(2024 年時点では実験的機能)。ONNX Runtime Web / Transformers.js のサンプルアプリ(WebNN.dev / Hugging Face Spaces / Microsoft AI on Web デモ)で動作確認可能で、自宅 PC の NPU 性能を測定 + 体験できます。
Q1: WebNN は WebGPU と何が違いますか? A: WebGPU は汎用 GPU 並列計算 API、WebNN は AI 推論特化 API です。WebNN は AI モデルの計算グラフを高水準で定義 + NPU + GPU + CPU の最適アクセラレータを自動選択するため、AI 推論専用なら WebNN のほうが高速 + 低消費電力 + 開発容易です。WebGPU は AI 以外の物理シミュレーション + 動画処理 + ゲーム等の汎用用途に向いています。
Q2: AI PC を持っていない PC でも WebNN を使えますか? A: 使えますが、NPU が無いため CPU + GPU フォールバックで動作します。性能は AI PC + NPU 構成より大幅に劣りますが、Chrome / Edge 経由で Web 上の AI 機能(Stable Diffusion Web、Whisper Web 等)を試すことは可能です。
Q3: プライバシー観点での意義は? A: 大きな意義があります。従来は AI 機能(チャット / 翻訳 / 画像認識 / 音声認識)を使う際、データをクラウド AI API に送信する必要があり、プライバシー懸念がありました。WebNN + ローカル AI 推論ではデータが PC + ブラウザから外に出ないため、プライバシー重視ユーザーに大きなメリットがあります。