ビッグデータ初心者のためのデータ分析

まず何からはじめる?

ビジネスに新しい打ち手を導き出す手法として、近年ビッグデータに注目が集まっていますが、ビッグデータの活用によって、何が得られるのでしょうか。

あなたの会社にも存在している大量のデータ(サイトのアクセスログや会員情報、購入履歴など)を活用することで、新たな知見や洞察をもたらし、会社の“次の一手”となる意思決定・行動が得られます。たとえば、ビッグデータから“行動分析”や”トレンド分析”をすることで、キャンペーン施策や広告配信の最適化に役立てたり、サイト改善の意思決定を高速化させるなど様々なシーンで大きな価値を生み出すことにつながっています。

本コラムでは、ビッグデータ活用を何からはじめればいいのだろう?という初心者の方へ、ビッグデータ活用への第一歩となるデータ収集についてお話します。

社内にバラバラに存在するデータ

社内にばらばらに存在するデータのイメージ図

社内には、顧客情報、商品マスター、売上データ、ウェブサイトのアクセスログ、問い合わせ履歴など、さまざまなデータが存在します。そしてそれらは、各々の目的別に構築されたデータベースや、システムから書き出されたログファイルとして個別に保存されている場合がほとんどかと思います。

ビッグデータ分析を行うためには、これらのデータを一定のキーで“連携”させる必要があります。しかし前述のようにデータベースごとに設計や構造が異なっていて連携が困難、設計者がすでに退職してブラックボックス化している、あるいは技術者不足により対応できないなどの課題を抱えている企業も多いのではないでしょうか?

また、データ分析をはじめたいが、具体的に目的や検証内容が定まっていなかったり、今後の活用に備えて準備だけは進めておきたい、というケースもあるでしょう。

では、効率的にビッグデータ分析の準備を始めるには、いったい何からはじめたらよいのでしょうか?

■用語解説

まずはデータを一か所に集めるところからはじめよう

ビッグデータ分析へのファーストステップは、データの形式やテーブル構造などを気にせず、とにかくデータ(データベース)を一か所に集めて、貯めておくことです。生データの蓄積があれば、いつでも分析を開始できます。散在・休眠・肥大化するデータソースを一元管理することで、実際の分析作業効率を大幅アップすることができるのです。

では、膨大なデータを一体どこに集めたらよいのでしょうか?
蓄積(保存)先となるサーバーやストレージの形態別に、その特徴を見ていきましょう。また、インフラの違いによって、今後ビッグデータ分析を行う際に必要となる分析基盤の構築方法も異なってくるので、その違いをまとめます。

まずはデータを一か所に集めるところからはじめようのイメージ図

データ蓄積先となるサーバー/ストレージ

  オンプレミス型 クラウド型
導入 サイジング、設計、機器購入、設定が必要 サービス利用。プランを選択
管理・保守・運用 自社 アウトソース
拡張性 サーバー/ストレージを追加購入 プランの変更で対応
分析基盤の構築 Hadoopなどを利用し、自社エンジニアが構築 サービスの中から必要機能を選択して利用。エンジニア工数は少ない

データをクラウド型のサーバー/ストレージ上に一元的に蓄積することで、社内で開発リソースや資産を負担することなく、実際の分析時には効率的に作業できというメリットがあります。オンプレミス型よりも導入のハードルが低いため、初心者におすすめの方法といえるでしょう。

また、サーバー/ストレージと分析基盤とがパッケージになったクラウド型サービスも存在します。データを貯めておくだけでも良いですし、いざ分析となった場合は独自のテクノロジーで大量のデータを高速処理することができます。データベースやHadoopの専門家でなくとも利用できるとあって、マーケティング分野での導入が進んでいます。将来を見据えて、あらかじめこのようなクラウド型の分析基盤サービスを選択肢に加えるのもいいでしょう。

いままでとビッグの違いは大きい

ビッグデータは「今までのデータ」と何が違うのか。実際にビッグデータを活用しているある会社の担当者はこんなことを言っていました。

「今までは、統計を学んだアナリストが経験を基に次の一手を考えていました。それが現在は、専門知識の無いマーケティングの担当部門でもデータを連携させて、次の一手を見つけやすくなっています」

経験ではなく、次から次へと発生する膨大なデータを連携させて分析し続けることで、最新の状況に沿った施策をぶつけ続けることができる。それがビッグデータを利用した分析のメリットです。データ収集、分析、判断、施策実行のサイクルを数多く繰り返し、データドリブンな意思決定を行うことによって、事業に成果をもたらすことができるのです。

いままでとビッグの違いは大きいのイメージ図

まとめ

クラウド型のサーバーやストレージサービスを利用し、社内のデータを一カ所に集める。ビッグデータ分析はまずはここから。分析への一歩を効率的に踏み出しましょう!

ディープラーニングに欠かせない超高速パワープラットフォームならGPU

よく読まれているコラム・記事

IDCFクラウドを今すぐ体験しよう!

IDCFクラウドサービス群

1時間1円、1ヵ月500円から使えるIDCFクラウド。
1つのアカウントで、インフィニットLB・コンピューティング・CDN・DNSなど、すべてご利用いただけます。