1978件の用語
2024年Anthropic + Block Inc. (米San Francisco・Jack Dorsey founded former Square・Industry-leading Cash App + Block payments + Tidal music) 共同発表Goose・Open-source AI assistant CLI tool・Industry-leading Claude-optimized AI assistant framework + Industry-leading Block Inc. commercial backing + Industry-leading Anthropic Claude integration + Industry-leading Open-source AI assistant CLI + Industry-emerging AI assistant CLI Pioneer position 2024年Q4。
概要
NVIDIA GPU計算SDK。CUDA 12.8(2026年Q1・Blackwell最適化)・cuDNN 9.8・cuBLAS・cuSPARSE・NCCL 2.25・TensorRT 11・Nsight Systems/Compute・CUTLASS 3.8・nvprof・Grace Hopper対応、2026年AI/HPC計算インフラ標準、ROCm/SYCL対抗も性能差顕著。
Alibaba が 2025 年 9 月リリースした画像編集特化マルチモーダルモデル。テキスト指示による画像のローカル編集・物体追加削除・スタイル変換に対応し、生成だけでなく編集領域で OSS 最先端の地位を確立。
Alibaba Qwen が 2026 年公開した次世代コーディング特化 LLM。Qwen3 Coder の後継としてエージェント駆動コード生成と長文コードベース理解を強化、Devstral/Claude Code と競合する OSS コーダーモデル。
2024年Q3 Alibaba Cloud (中国Hangzhou・Alibaba Group cloud computing arm・Qwen LLM family + Multi-version evolution Top Asian LLM provider・Qwen Open weights LLM Industry-leading brand position確立) 発表Qwen2-VL 72B・Industry-leading 中国AI Open weights multimodal LLM・72B parameters + Vision encoder integrated + Apache 2.0 license + Industry-leading Open weights multimodal scale + Industry-leading Asian multimodal AI Open weights + Industry-leading 中国AI Open weights multimodal brand。
2024年Q4 Alibaba Cloud (中国Hangzhou・Alibaba Group cloud computing arm・累計売上$15B+/year cloud computing・Qwen LLM family 2023年Qwen 1.0以来 2年継続・Multi-version evolution Top Asian LLM provider) 発表Qwen2.5-Max・Mixture of Experts MoE Closed flagship LLM・Trained on 20T tokens pretraining + Supervised fine-tuning + RLHF + DPO post-training・Qwen2.5 family (Qwen2.5-72B Dense + Qwen2.5-32B + Qwen2.5-14B + Qwen2.5-7B + Qwen2.5-3B + Qwen2.5-1.5B + Qwen2.5-0.5B Dense lineup + Qwen2.5-Max MoE flagship)・GPT-4o + Claude 3.5 Sonnet competitive + Alibaba Cloud API access + 中国AI proprietary MoE flagship。
LLM量子化フォーマット比較。GGUF (llama.cpp Q2_K~Q8_0/i-Quants IQ1-IQ4)・GPTQ 4bit (AutoGPTQ)・AWQ 4bit (Activation-aware・vLLM対応)・EXL2 (ExLlamaV2・Mixed-Precision)・bitsandbytes 8bit/4bit NF4・FP8 (Hopper/Blackwell native)・INT8・QAT (Quantization-Aware Training)・SmoothQuant・QuaRot・¥0 OSS、2026年FP8 Hopper/Blackwellネイティブ主流。
Quantizationは、人工知能・機械学習分野における重要な概念・技術です。この技術は、ニューラルネットワークや機械学習モデルの精度を維持しながら、計算処理の効率性とメモリ使用量を大幅に削減するための手法です。特に、エッジコンピューティングやスマートデバイス、AIアクセラレーションハードウェアの分野において、重要性が高まっています。
LLM量子化formats。GGUF(llama.cpp/Ollama・Q4_K_M sweet spot・Q8_0 high quality・FP16 baseline)・AWQ(Activation-aware Weight Quantization・vLLM/SGLang・4-bit GPU推論)・GPTQ(Generative PreTrained Transformer Quantization・classic 4-bit)・bitsandbytes(Hugging Face・Q4/Q8 dynamic)・MLX-quantized(Apple Silicon Q4/Q8)・FP8(Blackwell H100/B100 native・Hopper以降)・FP4(Blackwell・Multi Frame Gen訓練)・Q2/Q3 extreme(quality低下大)・Q5_K_M sweet・2026年 GGUF Q4 Local/AWQ Server主流。
LLM Quantization+Calibration。GPTQ (Optimal Brain Quantization・Post-Training)・AWQ Activation-aware Weight Quantization・GPTQModel (新Fork)・SmoothQuant (Activation Outlier Migration)・QuaRot (Rotation Matrix Outlier除去)・SpinQuant・LLM.int8() (bitsandbytes・Outlier Treatment)・FP8 SmoothQuant・MXFP4 Microscaling・Calibration Dataset (C4・WikiText-2)・llmcompressor 0.x (Sparse+Quant)・¥0 OSS、2026年QuaRot+SpinQuant主流。
Quantum Computingは、最新のCPU/GPU技術における重要な要素です。
Rustで実装された高性能なオープンソースベクトルデータベース。ニューラル埋め込みの保存・検索に特化し、フィルタリング付きの近似最近傍探索(ANN)を高速に実行する。
2024年Qdrant 1.13 GA BM42 Hybrid Search。Sparse Vector(BM42)+Dense Vector Hybrid+Multi-stage Querying+Quantization Scalar/Binary+Cluster Sharding+ANN改善+RAG最適化搭載。
2024年Qdrant発表v1.12・Industry-leading Rust-based vector database + Industry-leading fastest filtering + Industry-leading binary + scalar quantization + Industry-leading Qdrant Apache 2.0 Rust-based vector database 2024。
Hybrid Search+Reranking。Qdrant 1.13 Hybrid Search (Dense+Sparse BM25/SPLADE)・Reciprocal Rank Fusion RRF・Jina Reranker v2-multilingual・Cohere Rerank 3.5・BAAI bge-reranker-v2-m3・Voyage rerank-2・mixedbread mxbai-rerank-large-v2 (1.5B)・ColBERT v2 Late Interaction・PylateX2・Sentence Transformers・MTEB Rerank Benchmark・¥0 OSS-API、2026年Reranking Standard Pipeline。
2024年Christ et al.発表Undetectable Watermarks paper・Industry-leading undetectable cryptographic watermark + Industry-leading information-theoretically secure + Industry-emerging Christ undetectable watermark Pioneer。
2024年Saoud Rizwan公開Cline。Pro 業界Pro Mainstream Open Source AI Agent IDE Top + Pro 米国Saoud Rizwan + Pro VSCode拡張 + Pro Plan/Act Mode + Pro Anthropic推奨 + Pro Apache 2.0 License + 累計2024-2026年2年Heritage継承代表機。
Saoud Rizwan 2024年公開の VS Code 自律 AI 拡張機能。OSS Apache 2.0 + 無料 + LLM API 自前・「OSS AI コーディング主流」.
2024年公開Cline AI Coding VSCode拡張。Claude/GPT-4o Multi-step Autonomous Agent+File Edit+Terminal Execute+Browser Use+VSCode Native+Open Source Apache 2.0搭載。