Apache HBase
ウィキペディアから無料の百科事典
開発元 | Apache Software Foundation |
---|---|
最新版 | 2.3.4 / 2021年1月22日[1] |
最新評価版 | 2.4.2 / 2021年3月17日[1] |
リポジトリ | |
プログラミング 言語 | Java |
対応OS | クロスプラットフォーム |
サポート状況 | Active |
種別 | 列指向データベース管理システム |
ライセンス | Apache License 2.0 |
公式サイト | https://hbase.apache.org/ |
Apache HBaseはオープンソースの、列指向、分散データベースであり、GoogleのBigTableをモデルとし、Javaにより書かれている。Apacheソフトウェア財団のHadoopプロジェクトの一部として開発され、HDFS (Hadoop Distributed File System)の上で実行され、Hadoopに対しBigtableのような機能を提供する。
HBaseはBigTable論文に従い圧縮、インメモリ処理の機能、および各列ごとにブルームフィルタを持っている。[2] HBaseにおけるテーブルはHadoop上のMapReduceジョブの入出力として機能し、Java APIのほか、REST、Avro、ThriftといったゲートウェイAPIを通じアクセスが可能である。
HBaseは、古典的なSQLデータベースを直接置き換えるものではないが、近年ではパフォーマンスが向上し、FacebookのMessaging Platformなど、データ駆動型のWebサイトでも使用されている。
歴史
[編集]HBaseはPowerset社において自然言語処理を行うため、大規模データの処理を行う必要があり、プロジェクトとして始まった。今はApacheのトップレベルプロジェクトであり、注目を集めている。[3]
参考文献
[編集]- ^ a b “Apache HBase – Apache HBase Downloads”. 2021年3月22日閲覧。
- ^ Chang, et al. (2006). Bigtable: A Distributed Storage System for Structured Data
- ^ Powerset Blog
関連項目
[編集]- BigTable
- Hypertable - C++実装 [1]