2472件の用語
2023年Stanford Hazy Research (Christopher Ré + Michael Poli + Stefano Massaroli共同) 発表Hyena Operator paper・Industry-emerging Sub-quadratic convolution attention architecture・Industry-emerging Transformer alternative + Industry-leading O(L log L) sub-quadratic context complexity + Industry-emerging implicit convolution attention paradigm + Industry-leading Stanford academic research foundation・Industry-leading Hyena Hierarchical convolution attention paradigm Pioneer。
Microsoftが2022年に発表した生物医学テキスト特化の生成言語モデル。PubMed文献1500万件で学習し、生物医学的関係抽出・質問応答・文献要約に特化。
NVIDIA NeMoフレームワーク上で構築された生命科学・医療特化型BERTモデル。PubMedの大量バイオメディカル文書で事前学習し、医薬品名・遺伝子名・疾患の固有表現抽出(NER)で高精度を発揮する。
Pydanticチームが開発した型安全なAIエージェントフレームワーク。Pythonの型システムとPydanticバリデーションを活かし、構造化出力・依存性注入・FastAPIライクなDIコンテナでプロダクション品質のエージェントを構築できる。
Hypothetical Document Embeddings。クエリそのものでなく、LLMに仮の回答文書を生成させ、その埋め込みで検索するRAG手法。質問と文書の表現ギャップを埋め検索精度を高める。
LLMにクエリから仮想的な回答文書を生成させ、その文書の埋め込みベクトルで検索することで、クエリと文書の意味的ギャップを埋めるRAG検索手法。2022年にGao et al.が提案した。
>-
PyTorch公式の完全シャード化データ並列(Fully Sharded Data Parallel)フレームワーク。DeepSpeed ZeROと同様にパラメータ・勾配・オプティマイザ状態をGPU間で分割し、大規模モデルの学習を効率化する。PyTorch 2.0以降で安定版として提供される。
PyTorchネイティブの完全シャードデータ並列学習ライブラリ。モデルパラメータ・勾配・オプティマイザ状態をGPU間で完全分散し、DeepSpeed ZeRO Stage 3相当のメモリ削減を実現。LLaMA/Mistral系モデルの学習で広く採用されている。
Meta (旧Facebook) 主導開発の Python 機械学習フレームワーク。動的計算グラフ + 研究 + プロダクション両用・GitHub スター82,000+ で世界最大 ML フレームワーク.
Meta AI 2022年12月リリースのPyTorch 2.0。torch.compile+TorchDynamo+Inductor+C++フロントエンド統合・性能2倍向上。
Pytorch Frameworkは、現代の人工知能(AI)および機械学習 (ML) 分野において不可欠な存在となっているオープンソースのソフトウェアフレームワークです。Facebook(現Meta)傘下のAI研究チームによって開発され、その柔軟性と使いやすさから急速に普及し、研究者やエンジニアにとって標準的なツールへと進化しました。PytorchはPythonを基盤としており、動的計算グラフとい
RAG改善技術。クエリに対してLLMが仮想的な回答ドキュメントを生成し、その埋め込みベクトルで検索することで関連文書の召喚精度を向上させる手法。
Gao ら CMU 2022年 RAG 改良手法。LLM で仮想ドキュメント生成→そのembedding で検索→クエリ-ドキュメント間 vocabulary gap 解消
BPE(Byte Pair Encoding)は、テキストをサブワード単位に分割するトークン化アルゴリズムで、GPT系モデルやLLaMA等の大規模言語モデルで標準的に採用されている手法である。
Byte Pair Encoding(BPE)とは、テキスト中の最も頻出する連続バイト/文字ペアを反復的にマージすることで語彙を構築するサブワード分割アルゴリズムである。GPT系、Llama系、Qwen系など主要LLMの大半で採用されるトークナイザの中核技術。
Medusaを拡張した高度な投機的デコーディング手法。マルチヘッドデコードにドラフト検証の改良アルゴリズムを組み合わせ、Medusaの2〜3倍を上回る3〜4倍の推論高速化を単一モデルで実現。
Metaが2024年12月に発表したトークナイザーフリーのLLMアーキテクチャ。生バイト列を直接処理し、エントロピーベースの動的パッチングで計算効率を高める。
Hyperparameter Optimization。Optuna 4.x (TPE Sampler・Pruning)・Ray Tune 2.40 (Ray・Async)・W&B Sweeps (Bayesian/Grid)・Hyperopt 0.2.7・KerasTuner・SigOpt (Intel)・BoTorch (Meta・PyTorch Bayesian)・SMAC3 (Sequential Model-based)・NNI (Microsoft Maintenance)・Tune (Ray Native)・¥0 OSS-¥¥¥¥¥/月、2026年Optuna Industry Default。
Hyperparameter Tuningは、人工知能・機械学習分野における重要な概念・技術です。