1978件の用語
中国法律文書に特化した大規模言語モデル。中国語の法令・判例・司法試験データで訓練し、法律相談・文書生成に対応する。
LLM生成において情報量がモデルの予測エントロピーに近いトークンを優先選択するデコーディング手法。top-p/top-kより自然な文章生成が可能で、繰り返しや意味のないトークン選択を抑制する。
LLM・画像生成・音声認識をOpenAI API互換インターフェースでセルフホストするためのオープンソースサーバー。GPUなしCPUのみでも動作し、単一エンドポイントで複数AIモダリティを統合提供できる。
2023年Ettore Di Giacinto (Itlyイタリア発・元SUSE Senior Engineer) 発表のLocalAI・OSS OpenAI API互換 Self-Host LLM platform。MIT License・GitHub Star 25k+ (2024年Q4・OSS Self-Host LLM最大級)・Go実装・Docker Compose一発デプロイ・llama.cpp / vLLM / Whisper / Stable Diffusion / TTS統合・Function Calling + Tool use + Vision + Audio + Image gen + Embedding 全Endpoint対応・OpenAI Python/JS SDK 完全互換 (drop-in replacement) で Self-Host AI Stack の業界標準OSS。
Local LLM実行スタック。Ollama 0.5+ (Go・OpenAI互換)・LM Studio 0.3.10+ (GUI・MLX)・Jan 0.5 OSS Desktop・GPT4All 3.x・llama.cpp b4400+ (CUDA/Metal/Vulkan/CPU)・llamafile (Mozilla)・vLLM 0.7 (推論サーバ)・SGLang・Text Generation WebUI (Oobabooga)・KoboldCPP・msty.app・¥0 OSS、2026年70B Q4家庭普及。
ローカル環境での大規模言語モデル処理。プライバシー保護とレスポンス向上
Local Image Generation Workflow。GPU要件: VRAM 12GB+ (SDXL min)/16GB(Flux Dev)/24GB+(Flux Pro/Multi-LoRA)・RTX 3090 24GB(Best Value)/RTX 4090 24GB/RTX 5090 32GB・ComfyUI(Node Workflow・OS-agnostic)・Flux.1 Dev FP8/Q8(VRAM 16GB ok)・SD 3.5 Large GGUF Q4(VRAM 8GB)・Forge(Auto1111 fork・高速)・SwarmUI Web UI・LoRA training: Kohya_ss Web UI・OneTrainer・15-30 image data + 4 hour 4090 train・Civitai model hub(検閲注意)・2026年 Flux + Civitai LoRA定番、画像生成 Mac mini 16GB unable。
アテンション計算でQueryとKeyベクトルを回転行列で変換することで相対位置情報を直接エンコードする位置エンベディング手法。絶対位置埋め込みより長距離依存を捉えやすく、学習時より長いコンテキストへの外挿性が高い。
Rotary Position Embedding(Su et al. 2021)・LLM位置エンコーディング。Llama/Mistral/Qwen/Yi/DeepSeek/Gemma/Command-R採用、Linear RoPE・NTK-Aware RoPE・YaRN・LongRoPE(Microsoft)・NTK-by-parts派生、Long Context対応+absolute→relative position transform、2026年LLMアーキ標準。
LLMの位置エンコーディング手法RoPE(Rotary Position Embedding)を拡張し、学習時より長いコンテキストを処理できるようにする技術。YaRN・LongRoPE・DynamicNTKなどの派生手法が存在する。
Rotary Position Embedding(RoPE)の周波数を調整し、事前学習時より長いコンテキストウィンドウを実現する手法の総称。線形スケーリング・NTK-awareスケーリング等の派生が存在する。
2024年発表RoPE-based Extrapolation・Industry-leading RoPE extrapolation methods + Industry-leading LongRoPE + Industry-leading SelfExtend + Industry-leading CLEX + Industry-leading 2M context RoPE extrapolation。
RoPEのθ(theta)基底値を拡大することで追加学習なしにコンテキスト長を延ばす最もシンプルな手法。Llama 3ではθ=500,000を採用し、500kトークン超えのコンテキストを目指した事前学習を実施している。
LLMの特定の事実を局所的に書き換える知識編集手法。勾配を使わずRank-One行列更新でFF層の重みを直接変更し、副作用を最小化する。
Low-Rank Adaptation の略。LLM の全パラメータを更新せず、低ランク行列の積を注入して効率的にファインチューニングする手法。学習パラメータ数を 99% 以上削減しながら同等の性能を実現する。
Low-Rank Adaptation・低ランク適応ファインチューニング(Hu et al. 2021)。QLoRA・DoRA・LoRA+・rsLoRA派生、画像Stable Diffusion LoRA(Kohya-ss・OneTrainer・AI Toolkit)・LLM LoRA(Unsloth・Axolotl・PEFT)が2026年代表、GPU VRAM 8-24GBで訓練可、merge/swap実行時併用。
2021年Hu et al. + Microsoft発表LoRA paper・Industry-leading Low-Rank Adaptation PEFT paradigm Pioneer + Industry-leading 全LLM PEFT industry-standard + Industry-leading 3年heritage LoRA Pioneer foundation。
事前学習済みモデルの重みを凍結したまま、低ランク行列(Low-Rank)のみを学習させるパラメータ効率の高い微調整手法。計算リソースとメモリ消費量を劇的に削減しつつ、高性能な適応を実現する。
2024年成熟LoRA・Industry-leading Low-Rank Adaptation parameter-efficient fine-tuning + Industry-leading low-rank matrix decomposition + Industry-leading 10,000x parameter reduction + Industry-leading Microsoft Research LoRA MIT parameter-efficient fine-tuning method 2024。
大規模言語モデルを効率的にファインチューニングする手法。重み行列を低ランク行列の積で近似し、元のパラメータを固定したまま少数のアダプタ重みのみ更新する。