HPC Cluster Job Scheduler 2026。SchedMD Slurm Workload Manager (LLNL 2002・FOSS GPL・80% Top500市場・現代Default)+Slurm 24.05 + 25.05 LTS・PBS Professional Altair (Open Source 2016+Commercial Edition)+OpenPBS 23.06+TORQUE Adaptive Computing (廃止・PBS Professional移行)・IBM Spectrum LSF Suite Standard/HPC/Workgroup (旧 Platform Computing 2012買収・¥¥¥¥¥¥¥/Cluster)・Univa Grid Engine UGE (旧 Sun Grid Engine SGE→Altair買収 2020→Altair Grid Engine)・Open Grid Scheduler (旧 SGE FOSS継続)・Bright Cluster Manager (NVIDIA Bright・Slurm統合管理 GUI)・xCAT (FOSS IBM Bare Metal Provisioning)・Warewulf 4 (LANL Cluster Toolkit)・Apptainer (旧 Singularity・HPC Container)+Charliecloud+Shifter・SchedMD slurmctld+slurmd+slurmdbd+sbatch+srun+squeue+sacct・cgroup+Job Accounting+Fairshare+Reservation+Job Array・¥0 OSS-¥¥¥¥¥¥¥/Year License、2026年Slurm 24/25 LTS+PBS Pro+LSF Spectrum主流 (Slurm 80%+市場)。
HPCクラスタにおけるジョブスケジューラは、計算資源の割り当て、ジョブの優先順位付け、リソース監視などを統括する中枢システムです。2026年時点で主流となっている代表的なスケジューラは、SchedMD Slurm Workload Manager(v24.05、v25.05 LTS)、PBS Professional 2025、IBM Spectrum LSF Suite 2026、Univa Grid Engine 2025(旧Sun Grid Engine)です。これらはそれぞれオープンソースと商用ライセンスを組み合わせ、企業・研究機関で広く採用されています。
| スケジューラ | 主なアーキテクチャ | 主要機能 | ライセンス形態 |
|---|---|---|---|
| Slurm | クラスタ全体を管理する slurmctld とノード単位で動作する slurmd | 予約・フェアシェア・ジョブ配列・cgroup制御 | GPLv3(OSS)+商用サポート |
| PBS Professional | pbs_server と pbs_mom で構成 | 高可用性・ジョブ依存関係・リソースクォータ | 商用 |
| IBM Spectrum LSF | lsf デーモン群 | スケジューリングアルゴリズム多様化・GPUジョブ最適化 | 商用 |
| Univa Grid Engine | uge_master と uge_node | 旧SGEの機能を継承しつつクラウド統合 | 商用 |
squeue でリアルタイム確認、PBSは qstat、LSFは bjobs で表示。cgroup を利用し、ジョブ単位でリソース制御。fairshare、LSFは share、PBSは quota で実装。--array、PBSは #PBS -t、LSFは bsub -R "span[hosts=1]" で実現。| 製品名 | バージョン | 対応ハードウェア | 主な利用ケース | 価格帯 |
|---|---|---|---|---|
| Slurm Workload Manager | 25.05 LTS | 8,192 CPUコア / 32,768 GB RAM / 1,024 GPU | 大規模シミュレーション | 無料(商用サポートは¥1,200,000/年) |
| PBS Professional | 2025 | 4,096 CPUコア / 16,384 GB RAM / 512 GPU | バッチ解析・データベース | ¥1,800,000/年 |
| IBM Spectrum LSF Suite | 2026 | 16,384 CPUコア / 64,000 GB RAM / 2,048 GPU | HPC + AI ワークロード | ¥2,400,000/年 |
| Univa Grid Engine | 2025 | 2,048 CPUコア / 8,192 GB RAM | 中小規模クラスタ | ¥900,000/年 |
Slurm と PBS の主な違いは何ですか?
Slurm はオープンソースで柔軟性が高く、GPUジョブやコンテナジョブに強い。PBS は商用サポートが充実し、設定がシンプル。
GPUノードを追加したい場合、どのスケジューラが最適ですか?
LSF は GPU スケジューリングが組み込みで最適化されており、Slurm でも GPU 予約が可能だが、設定がやや複雑。
クラスタのアップグレード時にジョブが停止しないようにするには?
Rolling Update を採用し、ノード単位でスケジューラを停止・再起動。Slurm の scontrol update、PBS の pbsnodes -o でノードをオフラインにできます。
2026年のHPCジョブスケジューラ市場は、Slurm が 80% を占める一方、IBM Spectrum LSF と PBS Professional がそれぞれ 10% ずつを維持しています。各スケジューラは独自の機能とライセンスモデルを持ち、クラスタ規模・GPU利用頻度・管理者スキルに応じて選択が分かれます。長期サポート(LTS)やコンテナ統合(Apptainer、Charliecloud)といった最新動向を踏まえ、将来性と運用コストを総合的に評価することが重要です。
| Altair Grid Engine |
| 2025 |
| 1,024 CPUコア / 4,096 GB RAM |
| 科学計算 |
| ¥700,000/年 |
| Bright Cluster Manager | 2026 | Slurm統合GUI | NVIDIA GPUクラスタ | ¥1,500,000/年 |
| xCAT | 2026 | Bare Metal Provisioning | 新規クラスタ構築 | 無料(商用サポート可) |
| Warewulf 4.0 | 2026 | コンテナベースクラスタ | コンテナジョブ | 無料 |
| Apptainer 1.2 | 2026 | Singularity互換 | HPCコンテナ | 無料 |
| Charliecloud 1.3 | 2026 | コンテナ実行 | コンテナジョブ | 無料 |