2014年9月29日月曜日

マスメディアの「統計」感覚にはあきれることがある

御嶽山の「突然」の噴火には吃驚した。土曜日の昼頃、天気は快晴、紅葉は見頃。そのため多くの人が災難に巻き込まれた。

小生も若い頃に登山に凝っていた時期があり、北は吾妻連峰、南は北アの裏銀座コースまで色々と登った経験がある。残雪の仙丈ケ岳では数人前にいた一人が雪庇を踏んで斜面を滑落していった。どうなるかと思ったが、200メートル位から向こうは緩やかな上り斜面になっているので助かった。かと思うと、夏の北ア・船窪岳近くだったと記憶しているが、すぐ前を歩いていた先輩がぬかるみに滑り、左の断崖に落ちていった…と、路の端にあった木の根に偶然につかまり命拾いをしたものだ。その情景はまだ記憶、というかまざまざと眼前によみがえるようだ。

本当に山は危険にみちている。

地元・地方紙にはこんなことが社説に書かれている。
気象庁は「今回のような規模の噴火は予測できなかった」とする。ただ、兆候が全くなかったわけではない。
 今月中旬から火山性地震の頻発を観測したが、その後は減って警戒レベルは据え置いた。マグマの活動を示唆する火山性微動などは検知されず、噴火の「前兆」とまでは言えなかったからだという。
 技術的に予測が難しいのは分かる。だからこそ、人的被害を防ぐにはわずかな変化も前兆ととらえたい。一連の対応の検証と警戒レベルの基準の再検討が必要だ。
(出所)北海道新聞、2014年7月29日

 何も火山データ解析に限ったことではない。人間ドックで集められる検査データもそうだ。気にはなっていたが、その時には何も告げず、果たして数か月後に癌が見つかったとする。『なぜその時にはっきり伝えなかったのか』と、家族は抗議したいところだろう。こういう類のことは星の数ほどにあるのだ、な。

統計学でいえば<第1種の過誤>と<第2種の過誤>の話題に該当するわけであり、データ分析の基本中の基本とも言える箇所である。

上の地元紙編集部もそう思っているようだが、異変が近づいていれば測定データも異常を示すはずである。そう思い込んでいるのではないか。

もちろん間違いではない。あらゆるデータは「異常があれば、データも異常を示すはずである」と考えてデータを集めて分析するわけである。

もしデータが異常を示すのは、実際に異常がある時だけである、と。こう言えるのであれば
異常はわずかではあるが、データが異常を示している以上、実際に異常はある
こう断言しても何も問題はないわけである。しかし、このロジックが間違っているのだ。

× × ×

実際に異常がなくとも、データが異常を示すことがある。これは偶然原因によるノイズである。ノイズを全く含まないデータというのはありえない。健康であっても血圧が150を超えることは一過的現象としてありうるし、故に血圧が150を超えたからといって「高血圧ですね」とは即断できないわけである。

実際に異常はないにもかかわらず、データが異常を示したために「異常がある」と結論すれば、これは第1種の過誤に該当する。反対に、データは「異常(=有意)」とまでは言えないにもかかわらず、実際には異常がある。この場合は異常を見逃し、とるべきアクションがとれない結果になるので、今回の御嶽山は正にこれに該当するのだが、統計学では第2種の過誤と呼ばれている。

問題は、二つの過誤を同時に少なくすることは中々できないということだ — コストをかけてデータ情報を増やせば事情は変わる。「まあ、正常な範囲でしょう」と言いたいところを、「でもおかしいことは、おかしいよね」と異常宣言を出せば、異常を見逃す確率は小さくなる。これは間違いないのだが、実際には異常がないことが後日判明し、「また空振りか」と批判されるケースも同時に増えることになる。気象庁は、そんな「空振り」にどれだけ耐えられるのか。観光に依存している地元の人たちも数多いはずだ。そして、どちらかといえば、正常であるにもかかわらず、危なげに見えるデータが得られてしまうことの方が、案外、多いのだと推測される。新聞のいうように「わずかな変化も(噴火の)前兆ととらえ」てしまうのは、人間ドックで少しでもおかしな箇所があれば、片っ端から大規模病院で精密検査をすればいいのだ、と。そんな主張とどこか似かよっている。ことは人命にかかわるとなれば、コスト、ロジックは全く無視しても構わない。ここまで言えますか……。非合理は、やっぱり非合理であることに変わりはない。

× × ×

聞くところによると、御嶽山は1979年に突然噴火した。その後、1991年、2007年に小規模な噴火活動があったという。

そもそもいつ噴火してもおかしくはない火山だったのだろう。専門家の誰かが朝のワイドショーで話していたが、『近づかないのが危険を避ける近道です』。これが最も信頼できる格言だと(小生には)思われる。
生きること自体が危険なのです。
どこかのドラマでこんなセリフがあったが、活動中の火山に登ること自体、リスクを負担する行動である。こちらの方が本筋にかなっているのではないか。

データが正常なら、オカミは「異変が近づいている」とは言えない。しかし、データが正常であっても、それは異変が起こらないことの証明ではない。

これは、データが異常であっても、異変が必ず起きるとは言えない。その裏返しである。

0 件のコメント: