データウェアハウス系の本は、意外と少ない。
ビッグデータだなんだと騒がれているけれど、意外と少ない。
で、知見のある人にオススメ聞くと結構昔の本ばかり。
これもそんなオススメ本の1冊なのだけど、
これからデータウェアハウスを構築して、分析環境を作っていくんだ!という人には
とってもオススメの1冊。
私は技術者ではないので、DBエンジニアとかには物足りないと思うけれど、
マネージャークラスの人とかもこういう概要書くらい読んでもらっても良いかも。
あと、概要書はあなどれなくて、初学者には本当に効率が良かったりする。
全体像をざっくりつかんでから細部を埋めてった方が学びの効率は良いんだよね。
よくわかるデータウェアハウス (入門マネジメント&ストラテジー)
- 作者: データウェアハウス研究会
- 出版社/メーカー: 日本実業出版社
- 発売日: 2000/08
- メディア: 単行本
- 購入: 2人 クリック: 1回
- この商品を含むブログを見る
4つの特徴
インモンが提唱したデータウェアハウスの4つの特徴。
・サブジェクト志向
→データの区分けが用途別、目的別になっている。正規化しない。
・統合性
→データが1つの場所に集める、という観点と、企業内で計算方法やフィールド名、
定義、意味などを統一することも意味している。
・時系列性
→過去のデータをストックし、振り返れる状態にしておくこと。
逆にリアルタイムで最新のデータがある必要はない。
・恒常性
→データウェアハウスのデータは一度書き込まれたら更新されないのが特徴。
日本ではこの4つを備えたデータウェアハウスをしっかり整備している企業は少ない。
これから構築する際には気をつけよう。
データマートの位置づけ
ビル・インモンはセントラル・データウェハウスへの統合を強く主張している。
要するに1つのデータウェアハウスにすべてを集めろ、という考え方。
データマートのデータの源泉は1つのデータウェアハウスであるべきだ、という考え。
それに対して、多次元モデルの提唱者、ラルフ・キンボールは、
データマートの集合体をデータウェアハウスと捉える緩い考え方。
データを分析する際の切り口やデータの定義が標準化されていることが重要で、
必ずしもデータの元は1カ所である必要はない、という考え方。
というわけで、データウェアハウス関連で良く名前の出てくる
ビル・インモンとラルフ・キンボールの基本的なスタンスの違いがわかった。
二人の著作はもちろん買ってあるので、これから二人の考え方の違いをふまえながら、
勉強していきたい。ちなみに現時点での私の考えはインモン寄り。
これから作るならまずはセントラル・データウェアハウスを志向した方が混乱も少なかろう。
スター・スキーマ
これはラルフ・キンボールが提唱するデータウェアハウスの形らしい。
別名、ディメンショナル・モデル。
考え方は、何を分析するのか、という志向に合ったファクトデータを集めたテーブルを用意し、
ファクトテーブルを中心に、周辺にそのデータの分析、集計の切り口(次元テーブル)を用意する、という考え方。
データウェアハウスは更新されない前提なので、
検索のパフォーマンス、操作性、検索頻度を中心に考えて、
意図的に非正規化した状態のスター・スキーマで設計する。
よくわかるデータウェアハウス (入門マネジメント&ストラテジー)
- 作者: データウェアハウス研究会
- 出版社/メーカー: 日本実業出版社
- 発売日: 2000/08
- メディア: 単行本
- 購入: 2人 クリック: 1回
- この商品を含むブログを見る