Network Offload Engine 1990-2026 (差別化: 既存NIC比較ではなくCPU負荷削減HW Offload機能軸)。Checksum Offload (TCP/UDP/IP Checksum NIC計算・1990s後半・全NIC標準)・TSO TCP Segmentation Offload 1996 (Large Send・MTU 1500分割NIC側実行・CPU 30%削減)+UFO UDP Fragmentation+GSO Generic Segmentation Linux 2.6.18・LRO Large Receive Offload 2006 (受信側結合)+GRO Generic Receive Offload Linux 2.6.29 2009 (Herbert Xu・LRO代替・FQ_Codel互換)・RSS Receive Side Scaling Microsoft Vista 2007 (Toeplitz Hash・Multi-Queue NIC・SMP Multi-Core分散)・RPS Receive Packet Steering Linux 2.6.35 2010 (Tom Herbert Google・Software Hash分散)+RFS Receive Flow Steering 2010 (Application CPU親和)+aRFS Accelerated RFS NIC HW (Mellanox+Intel)・XPS Transmit Packet Steering Linux 2.6.38 2011・SR-IOV Network (Direct PCIe Passthrough・10/25/100GbE)・DPDK Data Plane Development Kit Intel 2010 (Userspace Bypass Kernel・Poll Mode Driver・Mpps級・Open vSwitch+VPP+Pktgen)・FD.io VPP+OVS-DPDK・SmartNIC Mellanox BlueField+NVIDIA DPU (DOCA)+Intel IPU+AMD Pensando・eBPF/XDP+AF_XDP (2018-)・TLS Offload (Mellanox ConnectX-6 2019)・¥0 NIC内蔵-¥¥¥¥¥¥¥/SmartNIC、2026年DPU+SmartNIC+DPDK/XDP併用主流。
ネットワークオフロードとは、CPU から TCP/UDP/IP スタックの一部を NIC や専用ハードウェアへ委譲し、パケット処理の負荷を軽減する技術群です。1990 年代後半にチェックサムオフロードが標準化され、2000 年代に TSO、LRO、GRO、RSS、RPS、RFS などが登場しました。近年は SR‑IOV、DPDK、XDP、eBPF、TLS オフロード、SmartNIC などが組み合わさり、2025–2026 年には DPU との統合が主流となっています。
| オフロード | 目的 | 実装位置 | 主なメリット |
|---|---|---|---|
| チェックサム | パケット検証 | NIC | CPU 30% 減 |
| TSO / GSO | 大きな送信データを分割 | NIC / OS | 送信レイテンシ低減 |
| LRO / GRO | 受信パケットの結合 | NIC / OS | 受信 CPU 低減 |
| RSS / RPS | パケットの分散 | NIC / OS | マルチスレッド処理 |
| RFS / aRFS | アプリケーションへフロー直結 | NIC / OS | スケジューリング最適化 |
| SR‑IOV | PCIe 仮想化 | NIC | 10/25/100GbE 直通 |
| DPDK / XDP / eBPF | ユーザースペース高速処理 | OS | 1Mpps 以上 |
| TLS / IPsec オフロード | 暗号化処理 | NIC / DPU | 低レイテンシ |
| SmartNIC / DPU | アプリケーションロジック実装 | NIC / DPU | CPU さらに削減 |
| 製品 | 型番 | 主なオフロード | 主要スペック |
|---|---|---|---|
| Mellanox ConnectX‑6 | CX-6 | TSO, LRO, RSS, RPS, TLS, SR‑IOV | 200Gbps, 1.5 TB/s, 10 ms 低レイテンシ |
| Intel X710 | X710 | TSO, LRO, RSS, RPS, SR‑IOV | 100Gbps, 1 TB/s, 2.5 ms |
| Broadcom BCM57414 | BCM57414 | TSO, LRO, RSS, RPS, XDP | 100Gbps, 1.2 TB/s, 3 ms |
| NVIDIA BlueField‑3 | BF‑3 | DPDK, XDP, TLS, IPU | 400Gbps, 2 TB/s, 1 ms |
| Intel IPU3 | IPU3 | DPDK, XDP, eBPF, SR‑IOV | 200Gbps, 1.5 TB/s, 2 ms |
| AMD Pensando P4 |
Q1. TSO と GSO の違いは?
A1. TSO は送信側で大きな TCP セグメントを NIC が分割する機能。GSO は Linux カーネルで実装され、送信データを大きくまとめて NIC に渡す。両者は同じ目的だが、実装位置と API が異なる。
Q2. LRO と GRO の併用は可能か?
A2. 可能だが、GRO は LRO を置き換える形で設計されている。Linux 2.6.29 以降は GRO がデフォルトで有効になり、LRO は非推奨。
Q3. 2025 年の DPU でのオフロードはどのように進化したか?
A3. DPU での TLS/IPsec オフロードが標準化され、DPDK との統合により 1 TB/s 以上のスループットを実現。eBPF/XDP も DPU で実行可能になり、CPU への負荷が 90% 以上削減されるケースが増えている。
1990 年代後半から 2026 年にかけて、ネットワークオフロードはチェックサムから TLS まで多岐にわたり進化しました。現行の主要 NIC(Mellanox ConnectX‑6、Intel X710、Broadcom BCM57414 等)は、TSO/LRO/GRO/RSS/RPS だけでなく、SR‑IOV、DPDK、XDP、eBPF、TLS オフロードを統合。2025–2026 年のトレンドは、DPU との深い統合と SmartNIC でのアプリケーションロジック実装です。選定時は帯域幅、オフロード機能、仮想化要件、レイテンシ、管理性を総合的に評価し、将来のスケーラビリティも見据えることが重要です。
| P4 |
| DPDK, XDP, TLS, SR‑IOV |
| 200Gbps, 1.8 TB/s, 1.5 ms |
| Cisco UCS NIC | UCS‑NIC | TSO, LRO, RSS, RPS, SR‑IOV | 100Gbps, 1 TB/s, 2 ms |