2008/08/24

有意差



数学的な世界の牛丼屋さんのできごと...

客: どう見ても、並盛と大盛って、ほとんど同じだぜ

店主: 間違いなく差があります。

客: じゃあ、サンプル調査しようぜ。10杯ずつ調べれば十分だろ。

店主: いえいえ、安定した差が出るには最低でも数百杯のサンプルが必要です。

客: 何で、そんなにいるのさ? そんなに使ったら、1σの揺らぎの範囲内だって見えちまうぜ。そんな差なんか、あってもなくても同じじゃん。

店主: いえいえ、正確を期すためですよ。250杯ずつ測定することにしましょう。

DistExample500.png

客: 何これ? ほとんど差がないぜ。統計値見ても、平均重量の差は3gしかないぞ。

------------------------------------
並盛 大盛
標本サイズ 250 250
平均重量(g) 301 304
標準偏差(g) 15 15
------------------------------------

店主: ちょっと待ってください。2標本問題の検定をしてみましょう。

==>2標本問題を復習中... (2008/01/13)

------------------------------------
t 2.234
------------------------------------
上側α 0.013
両側2α 0.026
------------------------------------

店主:ほら、大盛が並盛よりも重量が大きいのは、有意水準0.013で有意ですよ。

客: そりゃ、3gの差が母集団の差の基づくと言っているだけじゃん。平均の差(304-301 = 3g)は、標準偏差(15g)の20%だぞ。そんなもん誤差範囲内じゃん。

店主: 何を言っているのですか? ちゃんと有意差があるのですよ。有意水準0.013という高い信頼性のある有意差が。



たぶん、計算は間違ってないと思うけど...
ちなみに、標準偏差(14.96g)な牛丼屋では、25万個ずつサンプルすれば、平均差(300.58-300.48 = 0.1g )/標準偏差(14.96g) = 0.7% でも、有意水準0.02で有意になる。
DistExample500000.png

------------------------------------
並盛 大盛
標本サイズ 250,000 250,000
平均重量(g) 300.48 300.58
標準偏差(g) 14.96 14.96
------------------------------------
t 2.2348
------------------------------------
上側α 0.0193
------------------------------------



[2008/08/25 00:08 数 --> 標本サイズ に修正] To:ublftbo
[2008/08/25 11:40 危険度 % --> 有意水準 小数点に修正] To: kkobayashi
なお、一般には"危険度"という表現を使う場合もありますね。
 前回、2標本問題="Welchの検定"についてメモ書きしているので、今回は式変形省略。

[2008/08/26 01:50] To: kkobayashi
ネタばれな解説を書かせないでほしい。

何故、「安定した差が出るには最低でも数百杯のサンプルが必要です。」と店主が言ったのか? それは、有意水準0.05をクリアするため。標本数125x2なら、有意水準0.056になる。

そして、「統計的に有意差 ==> 有意味な差」という論理で「並盛と大盛にちゃんと差がある」と主張するため。

もちろん、「例えば5%→0.5%とかに下げませんか?」のように、標本数を増やしたら、有意水準の基準を下げるのが正しい。そして、「統計的に有意差 ==> 有意味な差」なわけはない。

でも「店主とかぶるあの人」はそう主張しているのですよ。「平均の差/標準偏差=0.2, 標本数250x2」という設定も「店主とかぶるあの人」の主張そのもの。



タグ:Blood type
posted by Kumicit at 2008/08/24 00:01 | Comment(2) | TrackBack(0) | Others | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
差が統計的に有意であれば”***と証明されるとむかしはそう思っていました。それはある程度統計にこだわるからそうなるので半分くらいはゆるせるのですがね(出せない人と比べて)。統計をだせの次の内容の吟味ですね。斜め読みしたデオドラおばさん(「ノーベル経済学者の大罪」)が経済学で同じ意味のことをいっています。
>「統計的に有意差 ==> 有意味な差」なわけはない。

そして標本数Nが一般に300から400必要なのがなんとなくわかりました。
Posted by 匿名希望 at 2008/08/27 16:56
訂正「ノーベル賞経済学者の大罪」
Posted by 匿名希望 at 2008/08/27 21:33
コメントを書く
お名前:

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

この記事へのトラックバックURL
http://blog.seesaa.jp/tb/105216733
※言及リンクのないトラックバックは受信されません。

この記事へのトラックバック