「経営と情報」に関するエッセイ (木暮 仁)

アクセスカウンタ

help RSS 事務系社員も統計やORの素養を(1)<組織・人<木暮仁

<<   作成日時 : 2009/09/09 09:08   >>

ブログ気持玉 0 / トラックバック 0 / コメント 0

[概要]
 統計やORなど経営への数学応用の分野は、半世紀前から認知されているのに、日常的なビジネス(特に販売・流通、経理など事務系の部門)では、その基礎的な概念すら理解されていない。統計やORは数学だというより、「ものの考え方」なのだ。事務系社員が、統計学やORを駆使することまでは望めないとしても、このような手法があることは知っておいてほしい。
 世の中に自動車があるのに、100kmの遠隔地に速く行こうと走るのは喜劇である。自動車の存在を知らないために、速く走る努力をするのは悲劇である。

[本文]
日常業務での必要性
 データを多様な観点で分析することは重要である。データウェアハウスやデータマイニングが普及してきた。パソコンでのプレゼンテーションツールもポピュラーになった。ところが、統計やORなどの素養がないと、不適切な利用、結果になっていることが多い。なかには、意思決定に誤った情報を提供することすらある。

●データの収集
 次のような場面は多くある。これらの原因は、報告する者が「全数調査は正しい」という迷信をもち、報告を受ける者に「集計の数値が定例的な他の資料での数値と異なるのは信頼性がない」と思っていることに起因する。すなわち、双方が「統計の基本を知らない」ためである。
 
・大量データ・シンドローム
 多様な切り口で分類し集計して試行錯誤するので、同じデータを多数回アクセスする。素人は、全数調査が正しいと信じている。そのため、発生比率が大きく、高い精度を必要としないものまで、大量のディテールデータをひっかきまわし、ターンアラウンドが遅いと文句をいう。データを少なくすれば、パソコンで処理できることに気付かない。
 層別サンプリングの方法を知っていれば、かなり少数のデータで分析できる。TV視聴率の調査標本は関東地区で600程度だそうである。
 20:80の法則(パレートの法則)により、例えば売上に関するデータでは、20%の商品や得意先が全体の80%を占める。20%以外を「その他」としてまとめるだけで、商品や得意先の個数が減り、処理が容易になる。

・ミソ・クソ混在シンドローム
 統計処理ではクリーニング(データを洗う)が必要なプロセスなのに、それを知らないために、役立つ情報が得られない場合もあるし、誤った結果になることがある。
 例えば流通費用の分析をするときに、たまたま顧客が取りに来たとか、安価な手段があったというように、データのなかには異常値がある。その異常状況を分析するのが目的でないならば、異常値が統計に与える影響を取り除くのが適切である。逆に、優劣の分析をするときに、大多数を占める「中程度」データにより中和されて、期待する結果が得られない。むしろ極端なデータだけを使うほうが明確になることもある。

●データの整理
 プレゼンテーションが重視されている。相手にわかりやすい報告が重要なのは当然である。ところが、それをグラフやイラストにすることだと曲解していることもある。ExcelやPowerPointの利用が、それに拍車をかけている。しかし、本来の目的である「適切な分析をする」ことを犠牲にしてはならない。

・精度シンドローム
 「7件中4件」なのに、「過半数」や「約6割」というようも「57.1%」というほうが正確なように思われる。しかも、それを件数表示のない円グラフにして報告する。元のデータの有効桁数より結果の有効桁数のほうが大きいのは、報告者の能力が疑われる。
 また、ある試験の合格率が全国平均20%だとして、「当塾での合格率は57.1%」といえばすごいと思われる。それに対抗して他の塾は66.7%だと宣伝した。3名のうち2名が合格しただけなのだが・・・。報告者に作為がなく、報告を受けた者が疑問をもたなかったとするならば、検定・推定の基礎も知らないことになる。

・井の中シンドローム
 例えば、IT投資の対売上高比率の調査をしたとする。業種、資本金、従業員数、府県など多様な項目があるとする。素人がこれを分析すると、業種別比率、資本金ランク別比率などのように、単純集計によるグラフを延々と並べるだけになりやすい。
 ところが、この比率は、金融業と情報サービス業は、他の業種と比較して非常に大であり、それを含むかどうかで全体の比率が大きく異なる。それを除いた規模別の比率を知りたいと思っても、この単純集計グラフからは得られないのである。
また、規模を示すのに売上高、資本金、従業員数など多様な尺度があるが、どれを代表と選ぶかの分析もない。特別な用途でなければ、回答企業を比較的少数のクラスタに分類するほうが適切であろう。
 別例として、身長と胸囲(腹囲)から体重を推定したい場合を考える。多変量分析を用いた分析をすれば適切な結果が得られるのに、体重と身長、体重と胸囲のグラフにしてしまう。クロス表も作成するだろうが「身長別の体重と胸囲」などのグラフを多様に掲げるだけである。素人が多変量分析を使えないのは仕方がないが、そのような方法があることを知っていれば、知識をもっている人に依頼できる。ところが、方法の存在すら知らないので、単純集計を繰り返しているのである。

第1回:日常業務での必要性
第2回:ものの考え方としてのOR
第3回:事務系社員と統計・OR

テーマ

注目テーマ 一覧

月別リンク

ブログ気持玉

クリックして気持ちを伝えよう!
ログインしてクリックすれば、自分のブログへのリンクが付きます。
→ログインへ

トラックバック(0件)

タイトル (本文) ブログ名/日時

トラックバック用URL help


自分のブログにトラックバック記事作成(会員用) help

タイトル
本 文

コメント(0件)

内 容 ニックネーム/日時

コメントする help

ニックネーム
本 文
事務系社員も統計やORの素養を(1)<組織・人<木暮仁 「経営と情報」に関するエッセイ (木暮 仁)/BIGLOBEウェブリブログ
[ ]