Cloudflare が提供するサーバーレス AI 推論プラットフォーム。グローバルエッジネットワーク上で LLM、画像生成、埋め込みモデルを実行できるサービス。2023 年公開、2024-2025 年に機能拡大。
Cloudflare Workers AI は、Cloudflare が 2023 年 9 月に発表したサーバーレス AI 推論プラットフォームです。Cloudflare のグローバルエッジネットワーク(330+ 都市)上で LLM、画像生成、音声認識、埋め込みモデルを実行でき、低遅延でグローバルに AI 機能を提供します。Workers、D1、R2、KV、Vectorize などの Cloudflare Developer Platform と統合され、フルスタックの AI アプリケーションを構築できます。
// worker.js
export default {
async fetch(request, env) {
const messages = [
{ role: "system", content: "You are a helpful assistant" },
{ role: "user", content: "What is quantum computing?" }
];
const response = await env.AI.run(
"@cf/meta/llama-3.3-70b-instruct",
{ messages }
);
return Response.json(response);
}
};
const imageBuffer = await env.AI.run(
"@cf/black-forest-labs/flux-1-schnell",
{ prompt: "A futuristic gaming PC, neon lights" }
);
return new Response(imageBuffer, {
headers: { "Content-Type": "image/png" }
});
const audioBlob = await request.blob();
const audioBuffer = await audioBlob.arrayBuffer();
const transcription = await env.AI.run(
"@cf/openai/whisper-large-v3",
{ audio: [...new Uint8Array(audioBuffer)] }
);
return Response.json(transcription);
// 埋め込み生成
const { data } = await env.AI.run(
"@cf/baai/bge-large-en-v1.5",
{ text: ["Your document text"] }
);
// Vectorize に保存
await env.VECTOR_INDEX.insert([
{ id: "1", values: data[0], metadata: { title: "Doc 1" } }
]);
// 検索
const results = await env.VECTOR_INDEX.query(queryEmbedding, { topK: 5 });
| サービス | 特徴 | |---------|------| | Cloudflare Workers AI | エッジ実行、低遅延 | | AWS Bedrock | 豊富なモデル | | Azure AI Foundry | OpenAI 統合 | | Replicate | コミュニティモデル | | Together AI | オープンモデル特化 | | Groq | 超高速推論 |