クラウド・データセンター用語集

用語集|Hive

Pig / SQL / データウェアハウス(DWH) / 分散処理

Hive(ハイブ)とは、オープンソースの大規模分散計算フレームワークHadoop上で動作するデータウェアハウス(DWH)向けのプロダクトです。

Hiveの特徴は、Hadoop上のMapReduce(大量のデータを高速に処理するための分散処理フレームワーク)の処理をSQL互換言語で操作を実行できることです。つまり、Hiveの問い合わせ言語である「HiveQL」は、RDBの「SQL」に似ています。

しかし、実際のHive処理の中身は、MapReduceの処理が動いています。「Select」文を実行すると裏でMapReduceの処理が走り、分散処理されて結果を得ることができます。

Hive

【Hive構文の例】
#Number of Accesses per Unique host
Select host, COUNT(1) FROM www_access GROUP BY host

用語集TOPへ戻る

このページの先頭へ このページの先頭へ