経営統計入門 期末対策講座 検定編1

Ch9

仮説検定(Test)

未知のものに対して仮の答えを与え、それがあり得るのかを判断する

母平均・母確率・その差を知るには全ての値を調査するしかない

→実質不可能な場合も多い

(世界中の人の身長を調査する、販売された商品を全て調査する、etc.)

→仮の答えを用意し(あたりをつけ)、それはあり得そうなのかを見る

例 世界中の人の平均身長を知りたい 大体170cmぐらい?

10000人のサンプルの平均身長は168cmだった

→168cmという値は母集団の平均身長が170cmである時に出得る値なのか?

対立仮説と帰無仮説

仮説の真偽を確かめるための二つの仮説

ルール

  • 対立仮説 \(H_a\)と帰無仮説 \(H_0\)は逆の事象を示す

対立仮説 \(H_a\)

世界の平均身長は170cmではない

帰無仮説 \(H_0\)

世界の平均身長は170cmである

  • まずは帰無仮説が正しいという前提で話を進める

帰無仮説が正しい場合

帰無仮説が正しい

帰無仮説が間違っている場合

対立仮説が正しい

ルール

  • 帰無仮説には「\(=\)」の関係で表現できるものが来る

世界の平均身長\((\mu)\)は170cmである → \(H_0:\mu=170cm\), \(H_a:\mu\neq170cm\)

ある製品が壊れる確率\((p)\)は5%である → \(H_0: p=0.05\), \(H_a:p\neq0.05\)



→母平均を正しいとした場合のサンプル平均のz値を求め、それが発生する確率を使って正しいかを判断する

棄却域

標準偏差何個以上値が離れると間違っていると判断するかの基準

例 平均身長 \(H_0:\mu=170cm\), \(H_a:\mu\neq170cm\)

母集団の平均身長が170cmだとした時に、95%の確率でサンプル平均は140.7cmから199.3cmの間の値を取る

もしサンプル平均がこの範囲外の値(ex. 130cm, 200cm, etc.)をとったら

  • 5%の確率で起こる珍しい現象が起こった
  • そもそもの設定した平均が間違っている

→帰無仮説が間違っている=対立仮設が正しい

棄却域

観測されたサンプル平均のz値が棄却域の中に入る

→帰無仮説を棄却する(帰無仮説が間違っていると結論づける)

様々な棄却域の場所

対立仮説で求めたい場所によって棄却域の場所が異なる

\(H_a:\mu<170cm\)



\(H_a:\mu\neq170cm\)



\(H_a:\mu>170cm\)

p値(p-value)

観測した事象よりも珍しいことが起きる確率

例 あるテストの母平均得点を推定したい。

\(H_0:\mu=60\), \(H_a:\mu\neq60\)と設定する

50人のサンプルを取得したところ、平均が56点、標準偏差が18点であった

se <- 18/sqrt(50) # 2.545584
z <- (56-60)/se # -1.571348
p_half <- pnorm(-1.57) # 0.05820756
p_center <- 1-p_half*2 # 0.8835849

平均から標準偏差1.57個分離れている

→今回観測されたこの事象の発生確率は、平均から標準偏差が\(\pm1.57\)個分離れている範囲と等しい(0.9417)

p値: z値よりも離れた範囲の確率

→平均から標準偏差\(\pm1.57\)個よりも離れた値が観測される確率(0.1164)

検定の手順

状況に応じた仮説を設定する

→平均、標準偏差、標準誤差などを経て、z値を計算する

→仮説から信頼区間を計算する

→計算したz値が棄却域に入るかを見る

→結論を出す



この流れは検定をする上では変わらない

練習問題1

あるコンビニエンスストアでは、サンドイッチに70gの具材が入っていると宣伝している。このコンビニでサンドイッチを40個購入しその具材の重さを計測したところ、平均65g、標準偏差3gであった。

\(\alpha=0.05\)とした時に、このコンビニの宣伝は誤っているかどうかを検定せよ。

問題から

\(H_0: \mu=70\), \(H_a: \mu\neq70\)と仮説を設定する

また、\(n=40\), \(\bar{x}=65\), \(s=3\)

そこから

\(標準誤差se=\frac{s}{\sqrt{n}}=0.0697137\)

\(z=\frac{\bar{x}-\mu}{se}=-10.54093\)

とわかる

信頼係数を0.95としたときの棄却域は\(z<-1.96, z>1.96\)の時なので、帰無仮説が棄却される

よって、このコンビニはサンドイッチの具材の公式値に誤りがあると結論づけられる。

Code
# 母平均(仮説)
mu <- 70
# サンプルサイズ
n <- 40
# サンプル平均
xbar <- 65
# 標準偏差
sd <- 3

# 信頼係数
a <- 0.05

# 標準誤差
se <- sd/sqrt(n)
# z値
z <- (xbar-mu)/se
# 下側棄却域(Rejection Region) z値
rr_l <- qnorm(a/2)

z; rr_l
[1] -10.54093
[1] -1.959964

練習問題2

ある自動車メーカーでは新車の開発を進めている。その車は自動運転時の車線走行ミスの確率を0.1%未満にしたいと考えている。過去10000回の走行実験をしたところ、車線走行ミスが5回検出された。

信頼区間を90%とした時に、この車は目標の値を満たせているかを検定せよ。

問題から

\(H_0:p=0.001\), \(H_a:p<0.001\)と仮説を設定する

また、\(n=10000\), \(x=5\)

そこから

\(成功確率\hat{p}=\frac{x}{n}=0.0005\)

\(失敗確率\hat{q}=1-\hat{p}=0.9995\)

\(標準誤差se=\sqrt{\frac{\hat{p}\hat{q}}{n}}=0.0002235\)

\(z=\frac{\hat{p}-p}{se}=-2.236627\)

とわかる

信頼係数を0.9としたときの左側のみの棄却域は\(z<-1.28\)の範囲なので、帰無仮説が棄却される

よって、この車は自動運転時の車線走行ミスの確率を0.1%未満に抑えられていると考えられる

Code
# 母確率
p <- 0.001
# サンプルサイズ
n <- 10000
# 成功回数
x <- 5
# 信頼係数
a <- 0.1

# 成功確率
p_hat <- x/n
# 失敗確率
q_hat <- 1-p_hat
# 標準誤差
se <- sqrt(p_hat*q_hat/n)

# z値
z <- (p_hat-p)/se
# 棄却域 z値
rr_l <- qnorm(a)

z; rr_l
[1] -2.236627
[1] -1.281552

練習問題3

大学生の男女それぞれ234人と187人を対象に、1ヶ月の娯楽に使う金額について調査したところ、男子は平均24200円と標準偏差6830円、女子は平均25400円と標準偏差5920円であった。

\(\alpha=0.01\)とした時、男女の大学生の間で娯楽に使う金額に差があるかを検定せよ。

問題から

\(H_0:\mu_1-\mu_2=0\), \(H_a:\mu_1-\mu_2\neq0\)と仮説を設定する

また、

男子:\(\bar{x_1}=24200\), \(s_1=6830\), \(n_1=234\)

女子:\(\bar{x_2}=25400\), \(s_2=5920\), \(n_2=187\)

そこから

\(信頼係数\alpha=1-0.01=0.99\)

\(標準誤差se=\sqrt{\frac{s^2_1}{n_1}+\frac{s^2_2}{n_2}}=621.9069\)

\(z=\frac{(\bar{x_1}-\bar{x_2})-(\mu_1-\mu_2)}{se}=-1.929549\)

とわかる

信頼係数が0.99としたときの両側棄却域は\(z<-2.58, z>2.58\)の範囲なので、棄却されない

よって、男女の間に1ヶ月間の娯楽目的の消費金額の間に差はない

Code
### 男子
# サンプルサイズ
n_1 <- 234
# 平均
xbar_1 <- 24200
# 標準偏差
sd_1 <- 6830
### 女子
# サンプルサイズ
n_2 <- 187
# 平均
xbar_2 <- 25400
# 標準偏差
sd_2 <- 5920

# 信頼係数
a <- 0.01

# 標準誤差
se <- sqrt(sd_1^2/n_1+sd_2^2/n_2)
# z値
z <- (xbar_1-xbar_2)/se

# 信頼係数 z値 (負の値なので、-1をかけて正の値に変換する)
rr_l <- qnorm(a/2)*-1

z; rr_l
[1] -1.929549
[1] 2.575829

練習問題4

白黒歌合戦と大人のお使いという2つの番組は、夏を代表とする番組として同じぐらいの人気を誇っていることで知られている。それぞれ1000人を対象に番組ごとに独立した調査を行ったところ、白黒歌合戦は733人、大人のお使いは694人が視聴していることがわかった。

\(\alpha=0.05\)とした時に、この2つの番組の平均視聴率に差があるかを検定せよ。

問題から

\(H_0:p_1-p_2=0\), \(H_a:p_1-p_2\neq0\)と仮説を設定する

また、\(n_1=1000\), \(x_1=733\), \(n_2=1000\), \(x_2=694\)

そこから

歌合戦: \(成功確率\hat{p_1}=\frac{x_1}{n_1}=0.733\), \(失敗確率\hat{q}=1-\hat{p}=0.267\)

お使い: \(成功確率\hat{p_2}=\frac{x_2}{n_2}=0.694\), \(失敗確率\hat{q_2}=1-\hat{p_2}=0.306\)

\(標準誤差se=\sqrt{\frac{\hat{p_1}\hat{q_1}}{n_1}+\frac{\hat{p_2}\hat{q_2}}{n_2}}=0.02020087\)

\(z=\frac{\hat{p}-p}{se}=1.93061\)

とわかる

信頼係数を0.95としたときの棄却域は\(z<-1.96, z>1.96\)の範囲なので、帰無仮説は棄却されない

よって、この2つの番組の平均視聴率の間には差がなく、同じぐらい人気であると考えられる

(教科書では\(\hat{p}=\frac{x_1+x_2}{n_1+n_2}\)を用いた別の解き方も紹介されているのでそちらも確認)

Code
### 白黒歌合戦
# サンプルサイズ
n_1 <- 1000
# 成功回数
x_1 <- 733
### 大人のお使い
# サンプルサイズ
n_2 <- 1000
# 成功回数
x_2 <- 694

# 信頼係数
a <- 0.05

### 白黒歌合戦
# 成功確率
p_hat_1 <- x_1/n_1
# 失敗確率
q_hat_1 <- 1-p_hat_1
### 大人のお使い
# 成功確率
p_hat_2 <- x_2/n_2
# 失敗確率
q_hat_2 <- 1-p_hat_2
# 標準誤差
se <- sqrt(p_hat_1*q_hat_1/n_1+p_hat_2*q_hat_2/n_2)

# z値
z <- (p_hat_1-p_hat_2)/se
# 棄却域 z値
rr_l <- qnorm(a/2)

z; rr_l
[1] 1.93061
[1] -1.959964

Ch10

t検定

サンプル数が少ない時でも正しく検定を行えるようにする

サンプルが少ないとサンプル平均の分布は…

  • サンプル平均はおおよそ正しい
  • 標準誤差の精度が落ちている

10人の平均身長を「サンプル数」分取得した際の分布

実際の標準誤差: 7.9229727

z値の計算にも影響が出る

自由度(Degrees of Freedom)

どれだけ余裕を持たせるか

\(自由度df=n-1\)

サンプル数が少ないと標準誤差の精度が落ちる

信頼区間の範囲を広げることで、下がった精度を補う

(棄却域を平均から離すことで、帰無仮説を棄却されにくくする

例 Google先生によると、大学までの所要時間は30分

初めての通学時(n = 1): 20分余裕を持たせ、50分前に家を出る

(Googleで調べることですでに30分かかるという情報を一度得ているため、n=1)

現在(n = たくさん): 30分前に家を出る

←サンプルサイズが小さいとデータの信頼性が低いため、少し余裕を持たせて使う

t分布

t分布表は自由度に応じて形が変わる

→自由度に応じて信頼区間/棄却域の範囲が変わる

右図もdfが小さい時ほど棄却域が狭く、大きくなるほど中心に近づき、棄却域が広くなっている

(上図は95%信頼区間としたときの、棄却域の動き)

dfが大きくなるにつれて、t分布表は標準正規分布に近づく(\(n\geq30\)では標準正規分布と同一とみなされる)

t値

サンプル数の数に応じて余裕を持たせたz値

t分布の確率(probability)を求めたい

pt(t値, 自由度)



t分布上でのt値/横軸(quantile)を求めたい

qt(確率, 自由度)

t値の求め方はz値と変わらず、\(t=\frac{\bar{x}-\mu}{se}\) で求められる

t検定で変わるのは、信頼区間の計算だけ

(t値を計算し、棄却域に入るかを判定する流れであることに変わり無い)

練習問題

ある学校では日本人と世界の平均身長を比較しようと、日本人8人の身長を計測した。その結果平均身長は166.67cmで、標準偏差は8cmであった。世界の平均身長は172.9cmである。

信頼区間を95%とした際に、日本と世界の平均身長が異なっているかを検定せよ。

問題より日本人の平均身長を\(\mu\)とし、

\(H_0:\mu=172.9\), \(H_a:\mu\neq172.9\)と仮説を設定する

また、\(n=8\), \(\bar{x}=166.67\), \(s=8\)

そこから、

\(標準誤差se=\frac{s}{\sqrt{n}}=2.828427\)

\(t=\frac{\bar{x}-\mu}{se}=-2.202638\)

\(自由度df=n-1=7\)

とわかる

自由度が7で、信頼係数を0.95としたときのt分布における棄却域は\(t<-2.364624, t>2.364624\)の時なので、帰無仮設は棄却されない

よって、日本人と世界の平均身長は等しいと考えられる

Code
# 母平均(仮説)
mu <- 172.9
# サンプルサイズ
n <- 8
# サンプル平均
xbar <- 166.67
# サンプル標準偏差
sd <- 8

# 信頼係数
a <- 0.05

# 標準誤差
se <- sd/sqrt(n)
# t値
t <- (xbar-mu)/se
# 自由度
df <- n-1

# 下側棄却域
rr_l <- qt(a/2, df)

t; rr_l
[1] -2.202638
[1] -2.364624

問題より日本人の平均身長を\(\mu\)とし、

\(H_0:\mu=172.9\), \(H_a:\mu\neq172.9\)と仮説を設定する

また、\(n=8\), \(\bar{x}=166.67\), \(s=8\)

そこから、

\(標準誤差se=\frac{s}{\sqrt{n}}=2.828427\)

\(z=\frac{\bar{x}-\mu}{se}=-2.202638\)

とわかる

信頼係数を0.95としたときのt分布における棄却域は\(z<-1.959964, z>1.959964\)の時なので、帰無仮設は棄却される

よって、日本人と世界の平均身長は異なると考えらえる

Code
# 母平均(仮説)
mu <- 172.9
# サンプルサイズ
n <- 8
# サンプル平均
xbar <- 166.67
# サンプル標準偏差
sd <- 8

# 信頼係数
a <- 0.05

# 標準誤差
se <- sd/sqrt(n)
# z値
z <- (xbar-mu)/se

# 下側棄却域
rr_l <- qnorm(a/2)

z; rr_l
[1] -2.202638
[1] -1.959964

対応のあるサンプルの比較

対応のあるサンプル

  • 同じ母集団に対して、処理を加える前後の平均値の差を検定する

仮説を

\(H_0:\mu_1-\mu_2=0\)

\(H_0:\mu_1-\mu_2\neq0\) と設定し、

棄却された場合

2つのサンプル平均の間に差があることになるので、与えた処理がサンプルに影響を与えたことがわかる

棄却されなかった場合

2つのサンプル平均の間に差がないことになるので、与えた処理は影響がなかったことがわかる

対応のあるサンプルの比較

2つのサンプルの差を検定を行うのに必要な要素に当てはめていく

\(\bar{d}=\bar{x_1}-\bar{x_2}\)

\(s_d=s_1-s_2\)

\(se=\frac{s_d}{\sqrt{n}}\)

\(t=\frac{\bar{d}-\mu_d}{se}\)

を求めて検定を行う

(dはDifferenceの頭文字)

練習問題

18人の生徒がいるあるクラスにおいて試験を行ったところ、平均点が57点と標準偏差が17点だった。試験後にフォローアップの授業を行ったのち同様の試験を行ったところ、平均点が69点と標準偏差が9点となった。

\(\alpha=0.01\)とした時、フォローアップの授業によって試験の特典が上昇したことを検定せよ

問題より

\(H_0:\mu_1-\mu_2=0\), \(H_a:\mu_1-\mu_2<0\)と仮説を設定する

また、\(n=18\), \(\bar{x_1}=57\), \(s_1=17\), \(\bar{x_2}=69\), \(s_2=9\)

そこから

\(自由度df=n-1=17\)

\(サンプルの差の平均\bar{d}=\bar{x_1}-\bar{x_2}=-12\)

\(サンプルの差の標準偏差s_d=s_1-s_2=8\)

\(標準誤差se=\frac{s_d}{\sqrt{n}}=1.885618\)

\(t=\frac{\bar{d}-\mu_d}{se}=-6.363961\)

とわかる

信頼係数を0.99としたときの左側棄却域は\(t<-2.566934\)なので、帰無仮説が棄却される

よって、フォローアップ授業はテストの成績に影響を与えたことがわかる

Code
# 母平均の差(仮説)
mu <- 0
# サンプルサイズ
n <- 18
# 授業前のサンプル平均
xbar_1 <- 57
# 授業前のサンプル標準偏差
sd_1 <- 17
# 授業後のサンプル平均
xbar_2 <- 69
# 授業後のサンプル標準偏差
sd_2 <- 9

# 信頼係数
a <- 0.01

# 自由度
df <- n-1
# サンプルの差の平均
dbar <- xbar_1-xbar_2
# サンプルの差の標準誤差
sd_d <- sd_1-sd_2

# 標準誤差
se <- sd_d/sqrt(n)
# t値
t <- (dbar-mu)/se

# 左側棄却域
rr_l <- qt(a, df)

t; rr_l
[1] -6.363961
[1] -2.566934

カイ二乗検定

母分散について検定を行う

母集団の分散に対して仮説を立て、取得したデータからその仮説があり得るのかを検定する

\(\chi^2=\frac{(n-1)s^2}{\sigma^2}\)(今までのz値やt値にあたる)

\(df=n-1\)

つまり、仮説の分散に対してデータの分散がどれくらい離れているのかの値\(\chi^2\)を計算し、\(\chi^2\)分布の信頼区間から検定を行う

カイ二乗分布

カイ二乗分布(chi-square distribution)の確率(probability)を求めたい

→pchisq(確率, df)

正規分布とは異なり左右非対称なので、両側検定の場合は左右両方の棄却域を求めなければならない

練習問題

\(n=24\), \(\bar{x}=126.2\), \(s^2=21.5\), \(H_a:\sigma^2>15\), \(\alpha=0.05\)

以上の条件下で、\(H_0:\sigma^2=\sigma_0^2\)を検定せよ

問題より

\(自由度df=n-1=23\)

\(\chi^2=\frac{(n-1)s^2}{\sigma^2}=32.96667\)

とわかる

信頼係数を0.95としたときのカイ二乗分布での右側棄却域は\(\chi^2>35.17246\)なので、帰無仮説は棄却されない

よって、母分散は帰無仮説通り15であると考えられる

Code
# 母分散(仮説)
var_0 <- 15
# サンプルサイズ
n <- 24
# サンプル平均
xbar <- 126.2
# サンプル分散
var <- 21.5

# 信頼係数
a <- 0.05

# 自由度
df <- n-1
# カイ二乗
chi_sq <- (n-1)*var/var_0

# 右側信頼区間
rr_r <- qchisq(1-a, df)

chi_sq; rr_r
[1] 32.96667
[1] 35.17246

F検定

2つの母分散の差の検定

2つのサンプルの比較なので、サンプル数も2つ存在する

→自由度も2つ用意し、F値を計算する

\(df_1=n_1-1\), \(df_2=n_2-1\)

F分布もカイ二乗分布と同様に左右非対称なので、棄却域の計算は左右両方行う必要がある

また、片側検定は右側しか行わない

練習問題

\(n_1=7\), \(n_2=9\), \(\alpha=0.05\)としたときのF値を計算せよ

問題より

\(df_1=n_1-1=6\)

\(df_2=n_2-1=8\)

この2つの自由度を当てはめると、F値は3.58058とわかる

Code
# サンプルサイズ1
n_1 <- 7
# サンプルサイズ2
n_2 <- 9
# 信頼係数
a <- 0.05

# 自由度1
df_1 <- n_1-1
# 自由度2
df_2 <- n_2-1

# F値
f <- qf(1-a, df_1, df_2)

f
[1] 3.58058