2015年3月12日木曜日

ビジネスと統計: そのイノベーション

以前にも書いたが統計学の教科書は(大げさに言えば)戦後50年間ずっと同じだった。小生の亡父が生産管理に使ったはずの統計学と小生が勉強した統計学は基本的には同じ理論的枠組みに立っていて、その発想も同じだった。

具体的に言えば、記述統計学から確率論を学び、その後は推測統計学を勉強していくというその構成のことである。統計的推測が推定と検定の二つの柱からなるのも変わらない。基本が一巡したあとは回帰分析に進む点も同じだった。そして回帰係数の推定値が「有意」であるかどうかを議論する。それが統計学で勉強するべきことだった。ずっと……。

そんな統計学をビジネスで活用した成功例がQC(=品質管理)であることも周知のことだ。「QC七つ道具」とは以下の七つを指す(細谷克也『QC七つ道具』(日科技連)より)。

  1. パレート図
  2. 特性要因図(石川図)
  3. 各種グラフ(=目的に適したグラフ作り)
  4. チェックシート
  5. 散布図
  6. ヒストグラム
  7. 管理図

このうち、特性要因図は統計技術というより何についてデータ分析を行うかを見定めるための議論のツールである。チェックシートはデータの品質を守るための標準化に使う。

この七つ道具を順番に使っていくことで、ターゲットにするべき問題点が容易にわかり、誰でも科学的な品質管理を実行することが可能になった。マニュアル的でいかにもアメリカ的な香りがする勝利の方程式。これがQCであったのだね。

アメリカで生まれたこの手法をマスターした最優秀な弟子が、実は日本企業であったことも周知のことである。

★ ★ ★

統計学の授業は、一言でいえば、QCを基礎づける統計理論が主題だった。最も重要な概念は、したがって、無作為標本と統計量の標本分布、そして標準誤差である。標本分布を理解するのは、序盤のうちは至難の業であるはずだが、それが分からなければ「不偏性」も「標準誤差」も「信頼区間」も「有意性」も「検出力」も、その他諸々を含めすべての重要なキーワードが理解不能となる。そんな体系だったのだな。

QCとは無作為サンプルから得られた結果が『工程は正常な管理状態にある』を帰無仮説としたとき有意であるか否かを判定することにつきる。つまり統計的仮説検定である。

そんな精緻かつ厳密な概念理解を前提とせずとも、一定の順序で一定の手法をデータに適用していけば、異常も見つかるし、解決への手順、次のアクションも決まる。問題が、現場の担当者レベルのものか、企業経営に直結するものかも判別できる。QCというのはワンセットのデータ・オリエンテッドな問題発見・解決システムであったわけだ。

これが流行らないはずがない。

★ ★ ★

ずっとこの流儀で小生も授業をやってきた。しかし、もう限界なのだな。「つまらぬ」、「営業の役にはたたない」と、そう感じているのがヒシヒシと分かるのだ。

来年度から授業を一新する。新しい七つ道具は次のように再編成した。

-違いに気付く-
1.クロス表
-セグメンテーションとポジショニング-
2.主成分分析(←次元の縮約)
3.クラスタリング(←顧客細分化)
4.対応(コレスポンデンス)分析(←質的データの主成分分析)
5.自己組織化マップ(←対応分析で十分だとは思うが)
-意思決定とアクション-
6.相関と回帰分析(←量的データのクロス表)
7.重回帰分析
8.ロジスティック回帰分析(一般線形モデル)
9.意思決定木

最近は、「データマイニング」、「データサイエンス」という名称の方が通りがいいが、ビジネス現場で役立つ統計手法というテーマについては、大体、意見がまとまりつつあるようだ。

「七つ道具」ならぬ「九つ道具」になってしまったが、6から8を一般線形モデルで括れば、やはり「七つ道具」になりそうだ。

★ ★ ★

ツールは<R>を使う。

『もはや戦後ではない』をパクれば、『もはやエクセルではない』。

大学の学部統計教育のツールが<R>に置き換わった現状が決定的である。ずっと使い続ける統計ツールが<R>になってきたのは、それがフリーであるからではない-ま、フリーという点が最も重要だが。授業で使った<R>に慣れているからだ。何でもそうだが、人は同じ目的に道具を変えることを嫌がるものである。<R>でできない問題に直面しない限り、データ関係の仕事では<R>を使いたいと思うだろう。そんな現実があるから、新しい提案も<R>を前提にする。

だから(少なくとも統計分析という分野において)Rが主たるツールであるのは、もはや他の選択はなく、昔の状態に後戻りはできない所まで来た。そう思っている。

この線でいま授業ノートを作っている。教材も、以前なら読み下して分かりやすいベタ書きのテキストにしていた。が、今回はパワーポイントで作っている。統計は数学ではない。パワーポイントのほうが読みやすい・使いやすいと思うからだ。そもそも紙にプリントアウトして、本文を精読するという勉強法は、そうするより外に方法がないからそうしたわけで、色々な方法を選択できる現時点では時代遅れになりつつあるのかもしれない。資料はタブレットで読む。タブレットというメディアに向いたテキスト作りがいま始まりつつある。そんな風にも感じるのだな。

タブレットにAndoroidを選択したのは失敗だったか…"Surface Pro 3"ならWindows8.1だからRも走るはずだ。早まったかなあ……。

0 件のコメント: