Apache Icebergとは？（アパッチアイスバーグ）わかりやすく解説

Q: Apache Icebergとは？

Netflix 2017年内部開発+2018年OSS化したテーブルフォーマット。データレイクACID+スキーマ進化+タイムトラベル対応。

概要

Apache Icebergは、Netflix Ryan Blue+Daniel Weeks等が2017年に内部開発+2018年11月にOSS化したテーブルフォーマット仕様で、データレイク（S3+ADLS+GCS等のクラウドオブジェクトストレージ上のParquet/ORC/Avro）に対するACIDトランザクション+スキーマ進化+タイムトラベル+Hidden Partitioning等のRDBMS級機能を提供する次世代Lakehouse基盤。Apache Foundationへ2020年5月寄贈+2024年Q4業界標準化進行中で、AWS Athena+Snowflake+Databricks+Google BigQuery+Trino+Presto+Apache Spark+Apache Flink等の主要データ分析プラットフォームすべてがApache Iceberg対応+Lakehouse Pattern標準化を進めている。主要技術: ①ACID Transactions（Snapshot Isolation+Optimistic Concurrency Control）+②Schema Evolution（カラム追加/削除/リネーム/型変更）+③Time Travel（過去スナップショット参照+データ復元）+④Hidden Partitioning（パーティション仕様変更でも履歴互換）+⑤Format-Agnostic（Parquet/ORC/Avro等任意ファイルフォーマット対応）+⑥Metadata Layer（manifests+manifest list+metadata.json階層）+⑦Compaction+Expire Snapshots（古いスナップショット削除）。主要採用: Netflix（自社最大利用）+Apple+LinkedIn+Stripe+Adobe+Adidas+Lyft+Twitter/X+各国Fortune 500企業のデータレイク+Lakehouse基盤で2020-2026年急速普及中。競合: Delta Lake（Databricks 2019年OSS化、本batch同時登録）+Apache Hudi（Uber 2017年OSS化）の3大Open Lakehouse Format戦争、2024年Q4時点でIceberg+Delta Lakeが業界主流+Apache Hudiは限定シェア。

主な特徴・仕組み

種類: Lakehouse テーブルフォーマット仕様
開発: Netflix Ryan Blue+Daniel Weeks
OSS化: 2018年11月
Apache Foundation: 2020年5月寄贈
主要機能: ACID+Schema Evolution+Time Travel+Hidden Partitioning
ファイルフォーマット: Parquet/ORC/Avro
主要採用: Netflix+Apple+Stripe+Snowflake+Databricks+AWS Athena
主要競合: Delta Lake（Databricks）+Apache Hudi（Uber）
業界主流: Iceberg+Delta Lake 2024-2026年

スペック比較表

項目	Apache Iceberg	Delta Lake	Apache Hudi
OSS化	2018/11	2019/04	2017
開発	Netflix	Databricks	Uber
ACID	あり	あり	あり

メニュー

Apache Iceberg（アパッチアイスバーグ）

メニュー

Apache Iceberg（アパッチアイスバーグ）

概要

主な特徴・仕組み

スペック比較表

この用語に関連するコンテンツ

具体例・対応製品

自作PCでの選び方・注意点

関連用語との違い

よくある質問（FAQ）

まとめ

関連用語