ビッグデータ初心者のためのデータ分析
まず何からはじめる?
ビジネスに新しい打ち手を導き出す手法として、近年ビッグデータに注目が集まっていますが、ビッグデータの活用によって、何が得られるのでしょうか。
あなたの会社にも存在している大量のデータ(サイトのアクセスログや会員情報、購入履歴など)を活用することで、新たな知見や洞察をもたらし、会社の“次の一手”となる意思決定・行動が得られます。たとえば、ビッグデータから“行動分析”や”トレンド分析”をすることで、キャンペーン施策や広告配信の最適化に役立てたり、サイト改善の意思決定を高速化させるなど様々なシーンで大きな価値を生み出すことにつながっています。
本コラムでは、ビッグデータ活用を何からはじめればいいのだろう?という初心者の方へ、ビッグデータ活用への第一歩となるデータ収集についてお話します。
社内にバラバラに存在するデータ
ビッグデータ分析を行うためには、これらのデータを一定のキーで“連携”させる必要があります。しかし前述のようにデータベースごとに設計や構造が異なっていて連携が困難、設計者がすでに退職してブラックボックス化している、あるいは技術者不足により対応できないなどの課題を抱えている企業も多いのではないでしょうか?

また、データ分析をはじめたいが、具体的に目的や検証内容が定まっていなかったり、今後の活用に備えて準備だけは進めておきたい、というケースもあるでしょう。
では、効率的にビッグデータ分析の準備を始めるには、いったい何からはじめたらよいのでしょうか?
■用語解説
まずはデータを一か所に集めるところからはじめよう
では、膨大なデータを一体どこに集めたらよいのでしょうか?
蓄積(保存)先となるサーバーやストレージの形態別に、その特徴を見ていきましょう。また、インフラの違いによって、今後ビッグデータ分析を行う際に必要となる分析基盤の構築方法も異なってくるので、その違いをまとめます。

データをクラウド型のサーバー/ストレージ上に一元的に蓄積することで、社内で開発リソースや資産を負担することなく、実際の分析時には効率的に作業できというメリットがあります。オンプレミス型よりも導入のハードルが低いため、初心者におすすめの方法といえるでしょう。
また、サーバー/ストレージと分析基盤とがパッケージになったクラウド型サービスも存在します。データを貯めておくだけでも良いですし、いざ分析となった場合は独自のテクノロジーで大量のデータを高速処理することができます。データベースやHadoopの専門家でなくとも利用できるとあって、マーケティング分野での導入が進んでいます。将来を見据えて、あらかじめこのようなクラウド型の分析基盤サービスを選択肢に加えるのもいいでしょう。
データ蓄積先となるサーバー/ストレージ
| オンプレミス型 | クラウド型 | |
|---|---|---|
| 導入 | サイジング、設計、機器購入、設定が必要 | サービス利用。プランを選択 |
| 管理・保守・運用 | 自社 | アウトソース |
| 拡張性 | サーバー/ストレージを追加購入 | プランの変更で対応 |
| 分析基盤の構築 | Hadoopなどを利用し、自社エンジニアが構築 | サービスの中から必要機能を選択して利用。エンジニア工数は少ない |
いままでとビッグの違いは大きい
「今までは、統計を学んだアナリストが経験を基に次の一手を考えていました。それが現在は、専門知識の無いマーケティングの担当部門でもデータを連携させて、次の一手を見つけやすくなっています」
経験ではなく、次から次へと発生する膨大なデータを連携させて分析し続けることで、最新の状況に沿った施策をぶつけ続けることができる。それがビッグデータを利用した分析のメリットです。データ収集、分析、判断、施策実行のサイクルを数多く繰り返し、データドリブンな意思決定を行うことによって、事業に成果をもたらすことができるのです。

