学びや思いつきを記録する、超要約ノート

国内MBA2013年入学、2015年無事卒業!読んだ本、記事、などの読書ノート。 忘れないために超要約整理。そんな記録。

基本的かつ実用的な本、ちゃんと言うとおりにやってみればなんかいいことあるかも。高橋威知郎/データ分析の教科書

データ分析のいろはをまとめた1冊。
どういう考え方で、どんな手順で進めていけばよいかが主眼。

まぁ、基本的かつ実用的ではあるのかもしれない。

ただ、データ分析のスキルって、こういう基本的な手順というよりも、
データを見た時に要因や変数の仮説を立てる力と検証する力、
その間の思考回路、だよね。
特に仮説作る力とか、それに対してどうすれば証明、
もしくは反証できるか、という設計が肝の力だと思う。

そこの思考回路をたどって追体験するような超ミクロな本が出たら面白いのにな。

14のフレームワークで考えるデータ分析の教科書

14のフレームワークで考えるデータ分析の教科書


現場感覚

現場感覚とかい離したデータ分析の結果が出た場合は要注意です。
革新的な大発見である可能性もありますが、間違ったデータ分析であったということがよくあります。
あり得ないような結果が出たら、「本当だろうか?」と疑い、慎重に調べることをおすすめします。
データ分析は、現場感覚にデータによる裏付けを与えるという面もあります。
P.36

これって本当に重要だと思うのだけど、
そもそも、現場感覚を掴めると非常に強い。
仕事をある程度理解していないと、問題意識や仮説の構築もずれがち。

先入観が無い方が新鮮な視点で見れるっていうメリットもあるとは思うのだけど、
経験的には的外れな議論になりがちなことの方が多い気がする。


データ分析のポイント

データの粒度の話。

「データの粒度」とは、データの細かさの度合いをいいます。
たとえば売上に関するデータでいえば、年間の売上データは粒度の粗いデータであり、月別の売上データは、年間売上データに比べて粒度が細かいといえます。
データの粒度を考える際に注意したいのは、「粒度の細かいデータから粒度の粗いデータを求めることはできるが、その逆はない」ということです。
月別の売上データ(粒度が細かい)があれば、年間の売上データ(粒度が粗い)は計算で導き出せますが、年間売上データから、月別の売上データを導き出すことはできません。
これがデータの粒度の問題です。
P.51

基本的な数字に関してはなるべく細かいデータを元に作っておいて、
気になったところをドリルダウンしていけるようにした方が二度手間にならなくて良い気がする。

データ分析におけるポイントのひとつは「最初から、細かい分析に入り込まない」ことです。
データ分析においては、まず森を見る、森を見てから木を見る、木を見てから葉や幹を見るというように、全体像を見てから細部を見るというのが基本です。
P.84

まったくおっしゃる通りだと思う。

本来の管理図は、製品の品質のばらつきなどを時系列で監視し、そのばらつきが突出した数値を示した場合に異常値と見なして、何らかの対策を講じることを目的として作成されます。折れ線グラフで表現され、異常値かどうかの判断は、管理限界線を越えているかどうかで判断します。上ブレする限界を「上方管理限界線」、下ブレする限界を「下方管理限界線」といいます。
売上データなどのデータ量が多い場合には、データから標準誤差を計算し、標準誤差を3倍したものを使います。EXCELで簡単に計算できます。
データ分析では、売上などの指標の推移を見るためのツールとして活用します。管理限界線を設定して、異常値かとうかを判断する目安とするのは、本来の管理図と同じです。
P.96 - P.97

時系列でデータの推移を見ていくときに、異常値を発見するやり方。
管理図のことはアビナッシュ・コーシックも書いてた。


特性要因図とは、結果(「結果」が特性です)と、原因(要因)がどのように関係しているか(影響を及ぼしているか)…という関係性を図で表現したものです。
図の形状が魚の骨に似ていることから、「フィツシュボーン・チャート」と呼ばれることがあります。
P.103

フィッシュボーンチャートってこういうのだったのね。
Xmindに入ってるんだけど、使ったことなかった。

14のフレームワークで考えるデータ分析の教科書

14のフレームワークで考えるデータ分析の教科書