OpenAI が開発した GPU カーネル記述用の Python ベース DSL であり、CUDA の低レベル知識なしに高性能な並列演算カーネルを記述できるコンパイラ言語。

Tritonとは？（トリトン）わかりやすく解説

Compute-Bound: BLOCK_SIZE を大きく（64〜256）して演算密度を上げる
Memory-Bound: BLOCK_SIZE を小さく（16〜64）してキャッシュヒット率を上げる
共有メモリ制約: SM あたりの共有メモリ容量（A100: 164KB, H100: 228KB）を超えない範囲で最大化

Tritonとは？（トリトン）意味・特徴をわかりやすく解説 | 自作.com | PC自作用語集 - 自作.com

メニュー