ビッグデータとは
ビッグデータとは何か
総務省「制作 白書 24年版」より
http://www.soumu.go.jp/johotsusintokei/whitepaper/ja/h24/html/nc121410.html
ビッグデータとは
・事業に役立つ知見を導出するためのデータである
・量的側面と質的側面をもつ
ビックデータの量的側面
どれくらいのデータを「ビッグ」とするか
・典型的なデータベースソフトウェアが処理できる能力を超えたサイズのデータを指す
・数十テラバイトから数ペタバイト(意図的に主観的な定義である)
ビックデータの質的側面
1。データの構成
データの出所が多様である
例)ウェブサービス分野
・オンラインショッピングサイトの購入履歴
・ブログサイトのエントリー履歴
・音楽や動画等のマルチメディアデータ
・ソーシャルメディアのプロフィールやコメント等のソーシャルメディアデータ
今後活用が期待される分野の例では
・GPS
・ICカードやRFIDにおいて検知される、位置、乗車履歴、温度等のセンサーデータ
・CRMシステムにおいて管理されるダイレクトメールのデータ
・会員カードデータ等のカスタマーデータ
など
各データを連携させることでさらなる付加価値の創出も期待される
2。データの利用
ビッグデータは、利用目的からその対象が画定できる
ただしデータの利用者(ユーザー企業等)とそれを支援する者(ベンダー等)の観点からは異なる。
データ利用者の観点
「個別に、即時に、多面的な検討を踏まえた付加価値提供を行いたい」
求められる特徴
・高解像(事象を構成する個々の要素に分解し、把握・対応することを可能とするデータ)
・高頻度(リアルタイムデータ等、取得・生成頻度の時間的な解像度が高いデータ)
・多様性(各種センサーからのデータ等、非構造なものも含む多種多様なデータ)
これらの特徴を満たすために、結果的に「多量」のデータが必要となる。
サービスの提供者の観点
以上の「多量性」に加えて、同サービスが対応可能なデータの特徴
・多源性(複数のデータソースにも対応可能)
・高速度(ストリーミング処理が低いレイテンシーで対応可能)
・多種別(構造化データに加え、非構造化データにも対応可能)
が求められる。
ビッグデータの特徴
利用者、提供者に共通する特徴としては、多量性、多種性、リアルタイム性
技術の進展により、データの生成・収集・蓄積等されることが可能・容易になっており、今後
・異変の察知や近未来の予測
・利用者個々のニーズに即したサービスの提供
・業務運営の効率化
・新産業の創出
等が期待される。
追記
日立のサイトの紹介が分りやすかった。
http://www.hitachi.co.jp/products/it/bigdata/bigdata/
ビッグデータがもたらす3つの価値
1。 見えなかったものが見えてくる
2。新しい視点で価値を創造できる
3。「今」から「未来」を予測できる