1978件の用語
LLMのファインチューニングを少数の追加パラメータで実現するPEFT手法。元の重み行列を凍結し、低ランク行列ΔW=BA(B∈R^{d×r}, A∈R^{r×k}, r≪d)を追加することでGPUメモリを大幅に削減する。
LLM低ランク適応訓練。LoRA(Microsoft・Low-Rank Adaptation・ΔW=BA)・QLoRA(4-bit quantize + LoRA・Tim Dettmers)・DoRA(Weight Decomposed)・GaLore・OLoRA・PEFT library(HuggingFace)・Unsloth(2-5x高速)・Axolotl・LLaMA-Factory・TRL・OpenPipe対応、2026年Consumer GPU(RTX 5090 32GB)で70B Fine-tune可能。
LLM低コストファインチューン。LoRA(Low-Rank Adaptation・2021年・rank 8-64)・QLoRA(4-bit NF4 + LoRA・consumer GPU 24GB でLlama 65B学習)・DoRA(Weight-Decomposed・2024年)・VeRA(Vector-based・Minimal param)・GaLore(Gradient Low-rank・full fine-tune)・Galore-bit・Unsloth(2-5x高速)・Axolotl YAML config・Hugging Face PEFT・TRL library対応、2026年コンシューマGPU学習定着。
Low-Rank Adaptation(LoRA)を活用した継続学習手法。新タスクごとに軽量なLoRAアダプタモジュールを追加することで、ベースモデルのパラメータを保護しながら新知識を段階的に学習する。壊滅的忘却を構造的に防ぐアーキテクチャ設計。
大規模言語モデルの重み行列を低ランク分解で近似し、少数パラメータのみ学習する効率的なファインチューニング手法。
LoRAのA/B行列に異なる学習率を設定する改良手法。B行列をA行列より大幅に高い学習率(デフォルト16倍)で学習することで収束速度と精度を向上させる。Hayou et al. 2024提案。
2024年Q2 Stanford University発表LoReFT paper・Industry-emerging Low-rank Representation Finetuning paradigm + Industry-leading Representation editing fine-tuning Industry-emerging paradigm Pioneer + Industry-leading hidden state representation editing fine-tuning + Industry-leading LoRA alternative Industry-emerging Representation finetuning paradigm・Industry-leading Stanford academic AI research foundation。
アウトライナー形式のOSSノートアプリLogseqにおいて、Local LLMやOpenタリーAPIを統合し、ブロック単位の知識管理(PKM)を自動化・高度化するAI機能群。
LLMの自然言語推論を論理プログラム(Prolog等)に変換して外部ソルバーで正確に解くニューロシンボリックフレームワーク。LLMの流暢さと形式論理の確実性を組み合わせる。
2024年Hyper3D公開Rodin Gen-1。Pro 業界Pro Mainstream Text/Image-to-3D両対応低価格 + Pro 米国San Francisco Hyper3D + Pro Sculpture特化 + Pro 1分生成 + Pro $5/月低価格 + Pro AAA Quality Mesh + 累計2023-2026年3年Heritage継承代表機。
中国Rockchip2024年公開ミドルレンジSBC SoC。Cortex-A72 4 + A53 4、6 TOPS NPU、RK3588 廉価版位置づけ。$60-$100 SBC展開。
中国Rockchip社2022年公開8コア ARM SoC。Cortex-A76 4+A55 4、Mali-G610 MP4 GPU、6 TOPS NPU、SBC統合で人気。
LoRA ファインチューニングを意識した量子化手法。ベースモデルの量子化と LoRA 初期化を交互に繰り返すことで量子化誤差を最小化する。
LoRAと量子化を交互に適用することで量子化誤差を最小化するQLoRAの初期化改良手法。Liu et al.(2023)提案。標準的なNF4量子化より低い量子化誤差から学習を開始でき、ファインチューニング精度が向上。
LLM 効率的Fine-tuning。LoRA(Low-Rank Adaptation・Microsoft 2021・W=W+BA rank decomposition)・QLoRA(4-bit quantization + LoRA・$300 GPU小型で70B可)・PEFT library(Hugging Face・LoRA/AdaLoRA/Prefix/P-tuning)・Unsloth(Python lib・2-5x高速・VRAM 70%削減・Daniel Han)・Axolotl(YAML config・community定番)・Llama Factory(中国・GUI)・DoRA(Weight-Decomposed LoRA)・Galore(Memory efficient FT)・2026年 Unsloth + QLoRA で Llama 3.3 70B Fine-tune local実用化。
LLM 長文context window競争。Claude Opus 4.7 1M(2026年・Anthropic)・Gemini 2.5 Pro 2M(Google・2024年から1M)・Gemini 1.5 Pro 10M experimental・GPT-4 Turbo 128K・GPT-4o 128K・Llama 3.3 128K・Llama 4 Scout 10M claim(2025年)・MiniMax-01 4M(中国)・Qwen2.5-Turbo 1M・Jamba 1.5(256K MoE)・Mamba/Hybrid Arch(Transformer+SSM)・YaRN extension・Needle-in-a-Haystack benchmark・Long context Effective rate度合差、2026年 1M+ context書籍全文処理が現実に。
Long Context LLM。Anthropic Claude Sonnet 4.6/Opus 4.7 1M context (Tier 4 Enterprise)・Google Gemini 2.5 Pro 2M context・Llama 4 Maverick 10M context (Theoretical)・Magic.dev LTM-2-Mini 100M context・Qwen2.5-Turbo 1M・MiniMax-Text-01 4M context・Needle in a Haystack NIAH Test・RULER Benchmark・Long Bench・¥¥¥/M tokens、2026年家庭LLM 1M context常用化。
100,000トークン以上の長いコンテキストウィンドウを持つLLM。書籍全体・コードベース・長大な文書を一度のプロンプトで処理できる。Gemini 1.5 Pro(100万トークン)などが代表例。
100K〜100万トークン以上の長いコンテキストを処理できる大規模言語モデルの総称。Gemini 1.5 Pro(100万)・Claude 3(200K)・GPT-4 Turbo(128K)が代表例で、コードベース全体や長編文書の一括処理が可能。
2023年Dacheng Li et al. (LMSYS)発表LongChat・Industry-leading 32K context LLaMA + Industry-leading Condensing Rotary Embedding + Industry-leading LongEval benchmark + Industry-leading LMSYS Vicuna-based long context。