数学的な世界の牛丼屋さんのできごと...
客: どう見ても、並盛と大盛って、ほとんど同じだぜ
店主: 間違いなく差があります。
客: じゃあ、サンプル調査しようぜ。10杯ずつ調べれば十分だろ。
店主: いえいえ、安定した差が出るには最低でも数百杯のサンプルが必要です。
客: 何で、そんなにいるのさ? そんなに使ったら、1σの揺らぎの範囲内だって見えちまうぜ。そんな差なんか、あってもなくても同じじゃん。
店主: いえいえ、正確を期すためですよ。250杯ずつ測定することにしましょう。

客: 何これ? ほとんど差がないぜ。統計値見ても、平均重量の差は3gしかないぞ。
------------------------------------
並盛 大盛
標本サイズ 250 250
平均重量(g) 301 304
標準偏差(g) 15 15
------------------------------------
店主: ちょっと待ってください。2標本問題の検定をしてみましょう。
==>2標本問題を復習中... (2008/01/13)
------------------------------------
t 2.234
------------------------------------
上側α 0.013
両側2α 0.026
------------------------------------
店主:ほら、大盛が並盛よりも重量が大きいのは、有意水準0.013で有意ですよ。
客: そりゃ、3gの差が母集団の差の基づくと言っているだけじゃん。平均の差(304-301 = 3g)は、標準偏差(15g)の20%だぞ。そんなもん誤差範囲内じゃん。
店主: 何を言っているのですか? ちゃんと有意差があるのですよ。有意水準0.013という高い信頼性のある有意差が。
たぶん、計算は間違ってないと思うけど...
ちなみに、標準偏差(14.96g)な牛丼屋では、25万個ずつサンプルすれば、平均差(300.58-300.48 = 0.1g )/標準偏差(14.96g) = 0.7% でも、有意水準0.02で有意になる。

------------------------------------
並盛 大盛
標本サイズ 250,000 250,000
平均重量(g) 300.48 300.58
標準偏差(g) 14.96 14.96
------------------------------------
t 2.2348
------------------------------------
上側α 0.0193
------------------------------------
[2008/08/25 00:08 数 --> 標本サイズ に修正] To:ublftbo
[2008/08/25 11:40 危険度 % --> 有意水準 小数点に修正] To: kkobayashi
なお、一般には"危険度"という表現を使う場合もありますね。
前回、2標本問題="Welchの検定"についてメモ書きしているので、今回は式変形省略。
[2008/08/26 01:50] To: kkobayashi
ネタばれな解説を書かせないでほしい。
何故、「安定した差が出るには最低でも数百杯のサンプルが必要です。」と店主が言ったのか? それは、有意水準0.05をクリアするため。標本数125x2なら、有意水準0.056になる。
そして、「統計的に有意差 ==> 有意味な差」という論理で「並盛と大盛にちゃんと差がある」と主張するため。
もちろん、「例えば5%→0.5%とかに下げませんか?」のように、標本数を増やしたら、有意水準の基準を下げるのが正しい。そして、「統計的に有意差 ==> 有意味な差」なわけはない。
でも「店主とかぶるあの人」はそう主張しているのですよ。「平均の差/標準偏差=0.2, 標本数250x2」という設定も「店主とかぶるあの人」の主張そのもの。
タグ:Blood type
>「統計的に有意差 ==> 有意味な差」なわけはない。
そして標本数Nが一般に300から400必要なのがなんとなくわかりました。