統計學(二) 筆記 - 第九章 假說檢定(hypothesis testing)

筆記說明

此筆記用途在於台北科技大學資訊與財金管理系大二下統計學重點整理
並非所有人都適用,部分對我而言稍加容易的內容並不會寫在此內。
這是觀看影片心得後的筆記,老師上課可能不太適用會忘記抄到

假說檢定(hypothesis testing) 介紹

決定一個數值透過母體參數產生的是否可以信任。

信任就是對立假設,反之虛無假設。

  • 虛無假設 null hypothesis
    表示這個人是亂猜的,就是虛無假設,透過 \(H_0\) 表示。
  • 拒絕虛無假設 reject null hypothesis
    通常拒絕虛無假設以機率來進行計算,常見的有 \(1 \%\)、\(5 \%\)、\(10 \%\),也就是當虛無假設機率低於一定值時就是對立假設。
  • 對立假設 alternative hypothesis
    透過 boolean 來想虛無假設是 false,對立假設就是 true,透過 \(H_1 \) or \(H_A \) 表示。

在 Probability Distribution APP 上計算 z 值的方法

  • 在母體平均值已知的情況下打開 APP,點 normal
    • 算出 z 後,將 z 的值放入 x
    • 決定左尾、右尾、雙尾,在紅色格子的 \(P(X>x)\) 這邊可以選擇,第一個是右尾、第二左尾、第三雙尾
    • 圖片說明

  • 在母體平均值已知的情況下打開 APP,點 t
    • 算出 z 後,將 z 的值放入 x
    • t 為樣本數量 -1
    • 決定左尾、右尾、雙尾,在紅色格子的 \(P(X>x)\) 這邊可以選擇,第一個是右尾、第二左尾、第三雙尾
    • 圖片說明

如何決定虛無假設與對立假設

  • 對立假設就是我們研究論點
    也就是決定好甚麼是 TRUE 甚麼是 FALSE,通常對立假設就是我們研究論點,透過對立假設來證明我們的論點是對的,先設定 \(H_1\) 在設定 \(H_0 \)。
    • 舉例:九點上課會不會讓學生有精神?
      • \(H_1 \) 九點上課比較好
      • \(H_0\) 九點上課並不會讓學生比較好。
  • 用假設檢定挑戰別人的論點
    此時我們的目標是讓別人的論點 false,以否定別人論點為目標,因此先設定 \(H_0\) 在設定 \(H_1 \)
    • 舉例:當前政策內車道禁行機車會比較好嗎?
      • \(H_0 \) 不會比較好
      • \(H_1\) 是好的沒錯
  • 統整,使用方法
    • 利用樣本統計量驗證的假設 \(H_1\)
    • 他人主張 \(H_0\)
    • 會造成負面結果的 \(H_0\),正面放 \(H_1\)
    • 反面主張 \(H_0\),
    • 通常正面放 \(H_1\),反面 \(H_0\)

母體平均數假設檢定 Summary of Forms for Null and Alternative Hypotheses about a Population Mean

使用此檢定時,有一定義如果母體平均數相等時,則永遠都表示虛無假設,因為如果驗證一樣時,那就並不是我們研究的論點所支持,還是他人的論點相同,無法推翻。

在此檢定中用來判斷假設的標準通常是者幾種

  • Lower-tail 左尾
    • \(H_0 = \mu \geq u_0 \)
    • \(H_1 = \mu < u_0 \)
  • Upper-tail 右尾
    • \(H_0 = \mu \leq u_0 \)
    • \(H_1 = \mu < u_0 \)
  • Two-tailed 兩尾
    • \(H_0 = \mu = u_0 \)
    • \(H_1 = \mu != u_0 \)

舉例:某一城市有 20 個醫療人員,平均只需要 12 分鐘就可以服務,決定虛無假設與對立假設,如果沒有達到 12 分鐘就要進行改善。

這邊我們要判斷是否達到目標,沒有則要進行改善,因此這邊我們認為是需要改善所以對立假設就會是 \(H_1 = \mu > 12 \)
虛無假設就是 \(H_0 = \mu \leq 12 \)
對立假設就是 \(H_1 = \mu > 12 \)

要特別注意我們的檢定資料是使用母體還是抽測樣本

型一錯誤 Type1 Error or 顯著性檢定 significance tests

我們認為 \(H_0\) 是錯誤的,但其實是對的。

透過樣本資料推出的假設檢定是對的,但是樣本資料明顯與母體資料偏差。

型一錯誤 Type1 Error 也稱為 顯著性檢定 significance tests

型二錯誤 Type2 Error

我們認為 \(H_0\) 是對的,但其實並不是正確的。

由於這種錯誤通常沒有辦法發現,需要等到再次驗證時才有機率發現(類似於 bug),因此為了避免一開始說錯的風險,所以會用比較保守的說法,我們不反對 \(H_0\),而不是我們相信 \(H_0\)

通常在沒有足夠信心時使用。

統整

p-Value Approach to One-Tailed Hypothesis Testing p 值法單尾假設檢定

p 本身的意思是 probability 也就是要找機率(可能性),根據樣本結果可以支持虛無假設的機率是多少?

如果 p-value 越小且小於顯著姓測試 \(\alpha \),我們就可以拒絕虛無假設。

因此公式就是:拒絕 \(H_0 \) if the \(p-value \leq \alpha \)

透過標準差 z,我們去設定顯著性測試的 \(z_a\),與結果的 z 來判斷是否支持虛無假設

Lower-Tailed Test About a Population Mean 左尾 p-value 檢定法

透過常態分配的方法,只要我們的 z 值小於顯著性測試的 \(z_a\) 值時我們就可以拒絕此虛無假設

Upper-Tailed Test About a Population Mean 右尾 p-value 檢定法

與上方類似,只要我們的 z 值大於顯著性測試的 \(z_a\) 值時我們就可以拒絕此虛無假設

Critical Value Approach to One-Tailed Hypothesis Testing 臨界值檢定法

一樣透過標準常態機率分配的 \(z_a\) 值來判斷,設定一個面積,只要我們的檢測值落在 \(z_a\) 面積上就可以拒絕此假設

  • Lower tail: Reject \(H_0\) if \(z \leq - z_a\)
  • Upper tail: Reject \(H_0\) if \(z \geq - z_a\)

Lower-Tailed Test About a Population Mean 左尾臨界值檢定法

設定 \(z_a\) 的值,以下圖來看如果檢測結果 z 值落在藍色面積,就拒絕,沒有就不拒絕

Upper-Tailed Test About a Population Mean 右尾臨界值檢定法

設定 \(z_a\) 的值,以下圖來看如果檢測結果 z 值落在藍色面積,就拒絕,沒有就不拒絕

Steps of Hypoththesis Testing 假設檢定的步驟,母體平均數已知的情況

  • 建立虛無假設與對立假設
  • 設定顯著性測試
  • 收集樣本資料,計算 z
  • 使用方法
    • p-Value Approach
      • 計算 p-value
      • 根據 p-value 判斷是否拒絕虛無假設
    • Critical Value Approach
      • 設定顯著型測試的區間
      • 根據樣本的 z 值判斷是否落在拒絕區間
  • 透過這兩種方法檢測答案都必須相同

舉例 - 抽取 40 筆樣本資料,平均回應緊急時間為 13.25 min,母體標準差為 3.2,做一假設檢定,0.05 的顯著性測試,能不能在 12 分鐘以內回應緊急事件,不行則進行改善

  • 建立虛無假設與對立假設
    • \(H_0: \mu \leq 12 \)
    • \(H_1: \mu > 12\),由於我們的觀點是想要進行改善,因此設定 \(H_1: \mu > 12\)
  • 設定顯著性測試 0.5
  • 收集樣本,計算 z
    \(z = \frac{\bar{x} - \mu_0}{\sigma / \sqrt{n}} = \frac{13.25 - 12}{3.2 / \sqrt{40}} = 2.47\)
  • 使用方法
    • p-Value Approach
      • 計算 p-value
        \(z = 2.47\),算出 0.9932,\(p-value = 1 - 0.9932 = 0.0068\)
      • 根據 p-value 判斷是否拒絕虛無假設
        \(\alpha = 0.05 \geq 0.0068 = p-value\),因此拒絕 \(H_0\)。因此我們沒有辦法在 12 分鐘內緊急回應
    • Critical Value Approach
      • 設定顯著型測試的區間
        \(\alpha = 0.05, z_{0.05} = 1.645\),因此拒絕 \(H_0 \geq 1.645\)
      • 根據樣本的 z 值判斷是否落在拒絕區間
        \(z = 2.47 > 1.645 \)落在拒絕區間,因此拒絕 \(H_0\)。因此我們沒有辦法在 12 分鐘內緊急回應

Two-Tailed Hypothesis 雙尾假設檢定

p-Value Approach to Two-Tailed Hypothesis Testing p 值法雙尾假設檢定

  • 計算標準常態分配的 z 值
  • 計算 z 的機率
  • 將機率乘二
  • Reject \(H_0\) if the \(p-value \leq \alpha\)

Critival Value Approach to Two-Tailed Hypothesis Testing 臨界值法雙尾假設檢定

透過標準常態機率分配找出 \(z_{a/2}\) 的面積

因此 Reject \(H_0\) if the \(z \leq -z_{a/2}\) or \(z \geq z_{a/2}\)

舉例: 牙膏平均重量是 6oz,進行假設檢定,如果大於或小於 6oz 就改善,抽 30 隻牙膏為樣本資料,樣本平均值是 6.1oz,標準差是 0.2oz,顯著性測試為 0.03

  • 建立虛無假設與對立假設
    • \(H_0: \mu = 6\)
    • \(H_1: \mu <> 6 \)
  • 設定顯著性測試 0.03
  • 收集樣本,計算 z
    \(z = \frac{\bar{x} - \mu_0}{\sigma / \sqrt{n}} = \frac{6.1 - 6}{0.2 / \sqrt{30}} = 2.74\)
  • 使用方法
    • p-Value Approach
      • 計算 p-value
        \(z = 2.74\),算出 0.9969,\(p-value = 2(1 - 0.9932) = 0.0062\)
      • 根據 p-value 判斷是否拒絕虛無假設
        \(\alpha = 0.03 \geq 0.0062 = p-value\),因此拒絕 \(H_0\)。因此需要進行改善
      • 用圖進行解釋

    • Critical Value Approach
      • 設定顯著型測試的區間
        \(\alpha / 2 = 0.03 / 2 = 0.015 , z_{0.015} = 2.17\),因此拒絕 \(H_0 \geq 2.17\)
      • 根據樣本的 z 值判斷是否落在拒絕區間
        \(z = 2.47 > 2.17 \)落在拒絕區間,因此拒絕 \(H_0\)。因此我們沒有辦法在 12 分鐘內緊急回應

Confidence Interval Approach to Two-Tailed Hypothesis Testing 信賴區間法雙尾假設檢定

計算信賴區間的公式為 \(\bar{x} \pm z_{a/2} \frac{\sigma}{\sqrt{n}}\),如果假設檢定的值在信賴區間內時我們就不拒絕零 (to reject),但如果在等於的情況時必須拒絕

透過剛剛舉例算信賴區間法雙尾假設檢定法

顯著性測試為 0.03,因此有百分之 97 的信賴區間,因此 \(\mu \) 要是 \(\bar{x} \pm z_{a/2} \frac{\sigma}{\sqrt{n}} = 6.1 \pm 2.17(0.2 / \sqrt{30}) = 6.1 \pm 0.07924\),也就是 6.02076 to 6.17924,因此 \( \mu_0 = 6 \) 不再此區間,因此拒絕 \(H_0\)。

Steps of Hypoththesis Testing 假設檢定的步驟,母體平均數未知的情況

這時候就需要用到 t 了XD,公式為 \(t = \frac{\bar{x} - \mu_0}{s / \sqrt{n}}\),其中 \(n - 1\) 就是自由度

  • p-Value Approach
    Reject \(H_0\) if \(\alpha \geq p-value\)
  • Critical Value Approach
    • \(H_0: \mu \geq \mu_0 \) Reject \(H_0\) if \(t \leq -t_{a}\)
    • \(H_0: \mu \leq \mu_0 \) Reject \(H_0\) if \(t \geq t_{a}\)
    • \(H_0: \mu = \mu_0\) Reject \(H_0\) if \(t \leq -t_{a/2} \ or t \geq t_{a/2} \ \)
  • p-Value and the t Distribution
    如果用統計書的附錄算 t 值,大多不太精準,因此盡量使用軟體上的來計算。

舉例:高速公路常常會超速,因此我們要設測速照相機,測速的速度我們想假設為 65,進行假設檢定,在 64 筆的樣本資料,平均速度是 66.2,標準差 4.2,顯著性測試為 0.05

  • 建立虛無假設與對立假設
    • \(H_0: \mu \leq 65 \)
    • \(H_1: \mu > 65 \)
  • 設定顯著性測試 0.05
  • 收集樣本,計算 z
    \(z = \frac{\bar{x} - \mu_0}{\sigma / \sqrt{n}} = \frac{66.2 - 65}{4.2 / \sqrt{64}} = 2.286\)
    • p-Value Approach
      • 計算 p-value
        \(t = 2.286\),算出 0.01281
      • 根據 p-value 判斷是否拒絕虛無假設
        \(\alpha = 0.05 \geq 0.01281 = p-value\),因此拒絕 \(H_0\)。因此大部分這邊人都會超速,可以設測速照相
    • Critical Value Approach
      • 設定顯著型測試的區間
        \(\alpha = 0.05 , d.f. = 64 - 1 = 63, t_{0.005} = 1.669\),因此 reject \(h_0\) if \(t \geq 1.669\)
      • 根據樣本的 z 值判斷是否落在拒絕區間
        \(t = 2.286 > 1.669 \)落在拒絕區間,因此拒絕 \(H_0\)。因此大部分這邊人都會超速,可以設測速照相
  • 圖片解釋

A Summary of Forms for Null and Alternaitve Hypotheses About a Population Proportion 母體參數假設檢定

  • 等號永遠都在 \(H_0\)
  • 以 p 表示母體比例
  • \(p_0\) 就是虛無假設
  • Lower-tail 左尾
    • \(H_0 = p \geq p_0 \)
    • \(H_1 = p < p_0 \)
  • Upper-tail 右尾
    • \(H_0 = p \leq p_0 \)
    • \(H_1 = p < p_0 \)
  • Two-tailed 兩尾
    • \(H_0 = p = p_0 \)
    • \(H_1 = p != p_0 \)

計算會用到的數值

  • z 的公式為 \(z = \frac{\bar{p} - p_0}{\sigma_\bar{p}}\),用到的 p 為假設檢定所設定 \(H_0\)的 p 值
  • \(\sigma_\bar{p}\) 為 \(\sigma_\bar{p} = \frac{\sqrt{p_0(1-p_0)}}{n}\)
  • 其中在使用 z 公式時,\(np \geq 5\) and \(n(1-p) \geq 5\)

P-Value Approach and Critical Value Approach Rejection Rule p 值法與臨界值法拒絕法則

  • p-value
    Reject \( H_0\) if \(p-value \leq \alpha\)
  • Critical Value
    • \(H_0: p \leq p_0\) Reject \(H_0 \) if \(z \leq z_a\)
    • \(H_0: p \geq p_0\) Reject \(H_0 \) if \(z \geq z_a\)
    • \(H_0: p = p_0\) Reject \(H_0 \) if \(z \leq -z_{a/2} \ or \ z \geq z_{a/2}\)

舉例: 在新年期間中,國道車禍有 500 人死亡,其中有 50 % 是酒駕造成,樣本資料中 120 筆有 67 筆是酒駕,使用假設檢定,並且顯著性測試為 0.05,我們想要推翻其推論

  • 設定假設
    • \(H_0: p = 0.5 \)
    • \(H_1: p != 0.5 \)
  • 設定顯著性測試 0.05
  • 收集樣本,計算 z and \(\sigma_\bar{p}\),其中下面的 \(p_0\) 就是 \(H_0: p\),也就是 0.5
    • \(\sigma_{\bar{p}} = \sqrt{\frac{p_0 (1-p_0)}{n}} = \frac{0.5(1-0.5)}{120} = 0.045644\),注意是要用 \(H_0\) 的值
    • \(z = \frac{\bar{p} - p_0 }{\sigma_\bar{p}} = \frac{(67/120)-0.5}{0.045644} = 1.28\)
  • 兩方法計算
    • p-Value Approach
      • \(z = 1.28, p = 0.8997\),\(1-p-value = 2(1 - 0.8997) = 0.2006\)
      • 因為 \(p-value = 0.2006 > \alpha = 0.05\),因此我們不能拒絕 \(H_0\)
    • Critical Value Approach
      • \(a / 2 = 0.05/2 = 0.025, z_{0.025} = 1.96\),因此 Reject \(H_0\) if \(z \leq -1.96 \ or \ z \geq 1.96 \)
      • 1.278 介於 -1.96 與 1.96 之間,因此我們不能拒絕 \(H_0\)

Hypothesis Testing and Decision Making 假設檢定的決策

  • 如果答案是拒絕 \(H_0\),就必須修改決策
  • 如果答案是不拒絕 \(H_0\),就不用修改決策

Calculating the Probability of a Type 2 Error in Hypothesis Tests About a Population Mean 母體平均值計算 Type 2 Error

  • 列出 \(H_0\) and \(H_1\)
  • 使用 Critical Value Approach 與顯著型測試,確認是否符合拒絕法則(Reject \(H_0\))
  • 找出 z 在甚麼情況會接受 \(H_0\),我們將此定義為 \(\bar{x}\)
  • 給定 \(\mu \) 是大於顯著型測試的範圍,

舉例: EMS 隨機抽取 40 筆資料,平均數 13.25 分鐘,母體標準差是 3.2 分鐘,顯著性測試為 0.05,我們想知道緊急服務抵達會不會小於 12 分鐘,不會就改善。

  • 設定假設
    • \(H_0: mu \leq 12 \)
    • \(H_1: \mu > 12 \)
  • Reject rule is: Reject \(H_0\) if \(z \geq 1.645\)
  • 計算樣本平均值拒絕的區域
    • \(z = \frac{\bar{x}-12}{3.2 / \sqrt{40}} \geq 1.645\)
    • \(\bar{x} \geq 12 + 1.645 (\frac{3.2}{\sqrt{40}}) = 12.8323\)
  • 因此我們接受 \(H_0\) 必須在 \(\bar{x} < 12.8323\)
  • 計算 Type2 Error
    • 我們先假設一個值,此值要是符合 \(H_1\),這裡假設為 14,因此 \(\mu = 14\)
    • 計算樣本標準差 \(\sigma_\bar{x} = \frac{3.2}{\sqrt{40}} = 0.5060 \)
    • 計算 z 值為 \(z = \frac{\bar{x} - \mu}{\sigma / \sqrt{n}} = \frac{12.8323 - 14}{3.2 / \sqrt{40}} = -2.31 \)
    • 再來我們找出 \(z = -2.31 \) 的機率為 0.0104,就是 \(\beta \)
    • 圖片解釋

    • 算出每個 value of mu 的 beta 係數,其中的 \(1-\beta\) 的值就是正確率,如果離 \(H_0\) 越近有很高機率會做出錯誤判斷

Power of the Test 假設檢定正確率

就是剛剛舉例中的 \(1-\beta\),越大表示我們的正確率越高。

透過剛剛的例子畫成圖表表示

在一個單尾(左尾)舉例

  • 題目一些資訊,\( \sigma = 12, n = 36, \mu = 120\)
  • 設定假設
    • \(H_0: \mu \geq 120 \)
    • \(H_1: \mu < 120 \)
  • Reject rule is: Reject \(H_0\) if \(z \leq -1.645\)
  • 計算樣本平均值拒絕的區域
    • \(z = \frac{\bar{x}-120}{12 / \sqrt{36}} \leq -1.645\)
    • \(\bar{x} \leq - 1.645 (\frac{12}{\sqrt{36}} ) = 116.71\)
  • 因此我們接受 \(H_0\) 必須在 \(\bar{x} > 116.71\)
  • 計算 Type2 Error
    • 我們先假設一個值,此值要是符合 \(H_1\),這裡假設為 112,因此 \(\mu = 112\)
    • 計算樣本標準差 \(\sigma_\bar{x} = \frac{12}{\sqrt{36}} = 2 \)
    • 計算 z 值為 \(z = \frac{\bar{x} - \mu}{\sigma / \sqrt{n}} = \frac{116.71 - 112}{12 / \sqrt{36}} = 2.36 \)
    • 再來我們找出 \(z = 2.36 \) 的機率為 0.0091,就是 \(\beta \)
    • 圖片解釋

    • 算出每個 value of mu 的 beta 係數,其中的 \(1-\beta\) 的值就是正確率,如果離 \(H_0\) 越近有很高機率會做出錯誤判斷

    • 畫成圖表則是

Determining the Sample Suze for a Hypothesis Test About a Population Mean 確認樣本大小來進行母體平均值假設測試

我們先設定好型一誤差與型二誤差後,找出適合的樣本大小數量來進行假設測試

用圖來進行說明,我們說些重點

  • 在這張圖中,是右尾檢定,因為 \(\mu > \mu_0\)
  • 左邊是 Type1 Error,右邊是 Type2 Error,c 是臨界值,兩張圖藍色的部分就是誤差區
  • 因此我們可以知道兩張圖的 C 是相同

再來我們將公式進行合併,公式計算如下

因此我們可以知道當我們要設定 n 的大小時的公式為 \(n = \frac{(z_a + z_b )^2 \sigma^2}{(\mu_0 - \mu_a)^2}\)

  • \(z_a\) 是 z value 提供 \(\alpha\) 的面積
  • \(z_b\) 是 z value 提供 \(\beta\) 的面積
  • \(\sigma\) 是母體標準差
  • \(\mu_0\) 是\(H_0\)母體平均值
  • \(\mu_a\) 是母體平均值,再用於檢測 Type2 Error 的值
  • 在雙尾時,\(z_{a/2} \) 而不是使用 \(z_a \)

舉例: 平均回應緊急時間為 13.25 min,母體標準差為 3.2,期望能在 12 分鐘內回應,那 Type1 Error = 0.05,如果超過 0.75 分鐘的機率不可以大於 0.1,也就是 Type2 Error = 0.1,求樣本大小

因此我們這邊可以先統整資訊

  • \(\alpha = 0.05 \)
  • \(\beta = 0.1\)
  • \(z_a = 1.645\),\(a = 0.05\)
  • \(z_b = 1.28\),\(b = 0.1\)
  • \(\mu_0 = 12, \mu_1 = 12.75\)
  • \(\sigma = 3.2\)

計算 \(n = \frac{(z_a + z_b )^2 \sigma^2}{(\mu_0 - \mu_a)^2} = \frac{(1.645+1.28)^2 (3.2)^2}{(12-12.75)^2} = 155.75 \),約等於 156。如果數字有小數點時必須 +1,樣本沒辦法分割所以就直接加一

一旦我們有了 \(\alpha, \beta, n\),其中兩項,我們就可以算出另一項,透過公式我們可以提出一些重點。

  • 當 n 固定時,\(\alpha\) 變小,則 \(\beta\)變大,反之亦同。

謝謝大家的努力拉

  • 版權聲明: 本部落格所有文章除有特別聲明外,均採用 Apache License 2.0 許可協議。轉載請註明出處!
  • © 2020-2024 John Doe
  • Powered by Hexo Theme Ayer
  • PV: UV: