統計學(二) 筆記 - 第十一章 推論母體變異數(Inference About Population Variances)

筆記說明

此筆記用途在於台北科技大學資訊與財金管理系大二下統計學重點整理
並非所有人都適用,部分對我而言稍加容易的內容並不會寫在此內。
這是觀看影片心得後的筆記,老師上課可能不太適用會忘記抄到

推論一組母體變異數(Inference About a Population Variances)

前一章我們對母體參數與平均數進行推論,但還需要判斷變異數是否有過大的問題,如果變異數最大有可能表示其實分布很廣,在某些情況下不太可能夠接受變異數過大的問題,例如大量製造的螺絲釘寬度假如時太大、太小,但平均數出來的值卻是剛剛好,但實際上這樣是不可行的。

因此要用變異數來判斷資料分布是否會過廣。

卡方分配 Chi-Square Distribution

是標準常態隨機變數次方的總和值。

我們可以用簡單抽樣的方式來找出變異數,變異數公式如右 \((n-1) s^2 / \sigma^2\),其中 \((n-1)\) 就是自由度。
之後我們再利用變異數(卡方分配得出)跟區間估計來做假設檢定。

自由度的卡方分配,越左越小

Interval Estimation of \(\sigma^2 \)

區間估計的示意圖

  • 下面所有的 \(X^2\) 指的都是方分配的變異數
  • 因此我們會有 \(1-a\) 的機率 \(X^2\) 的值會落在 \(X^2_{1-a/2} \leq X^2 \leq X^2_{a/2}\)
  • 再來我們把變異數公式 \((n-1) s^2 / \sigma^2\) 帶入 \(X^2\) 就變成 \(X^2_{1-a/2} \leq \frac{(n-1) s^2}{\sigma^2} \leq X^2_{a/2}\)
  • 稍微移項(倒數)後就變成 \(\frac{(n-1) s^2}{X^2_{a/2}} \leq \sigma^2 \leq \frac{(n-1) s^2}{X^2_{1-a/2}} \)
  • 因此母體變異數區間估計就是 \(\frac{(n-1) s^2}{X^2_{a/2}} \leq \sigma^2 \leq \frac{(n-1) s^2}{X^2_{1-a/2}} \),其中\(n-1\)就是自由度

那如果我們要找出母體標準差的區間估計呢?
就將剛剛的最後的式子開根號即可 \(\sqrt{\frac{(n-1) s^2}{X^2_{a/2}}} \leq \sigma \leq \sqrt{\frac{(n-1) s^2}{X^2_{1-a/2}}} \)

舉例:我們想要購買 A 廠商的恆溫器,我們在一個調查中得知,當在一個房間裡面設定 68度F 時,10 個恆溫器的實際數值如下,我們想要知道在百分之 95% 的信心水準中母體變異數的區間估計是多少?

資料如下

因此我們的自由度是 \(n-1=10-1=9, a = 0.05\)

  • 查表如下,注意是從右尾開始算

  • 用手機 Probability Distribution App 查找如下,注意是從右尾開始算

  • 因此我們可以得出 \(X^{0.975}\) 值是 2.700,再來我們要找 \(X^{0.025}\) 的值,下面用圖表示

  • 跟上面用的方法一樣,用手機 Probability Distribution App 查找\(X^{0.025}\) 的值是 19.023
  • 用圖表來所示

  • 再來我們算樣本標準差平方 \(s^2=\frac{\sum (x_i - \bar{x})^2}{n-1} = \frac{6.3}{9} = 0.70\)
  • 接著我們把算好的卡方值拿出來用,因此在 95% 的信賴區間中 \(\frac{(10-1) 0.70}{19.023} \leq \sigma^2 \leq \frac{(10-1) 0.70}{2.700}\),也就是 \(0.33 \leq \sigma^2 \leq 2.33\)

Hypothesis Testing

  • 定義對立假設與虛無假設
    • 左尾
      • \(H_0: \sigma^2 \geq \sigma_0^2\)
      • \(H_1: \sigma^2 < \sigma_0^2\)
      • 其中 \(\sigma_0^2\) 是我們假設檢定中假設的母體變異數
    • 右尾
      • \(H_0: \sigma^2 \leq \sigma_0^2\)
      • \(H_1: \sigma^2 > \sigma_0^2\)
      • 其中 \(\sigma_0^2\) 是我們假設檢定中假設的母體變異數
    • 雙尾
      • \(H_0: \sigma^2 = \sigma_0^2\)
      • \(H_1: \sigma^2 != \sigma_0^2\)
      • 其中 \(\sigma_0^2\) 是我們假設檢定中假設的母體變異數
  • T 檢定的公式為 \(X^2 = \frac{(n-1)s^2}{\sigma_0^2}\)
  • 拒絕法則 Rejection Rule
    • 左尾
      • p-value approach
        Reject \(H_0\) if \(p-value \leq a\)
      • Critical Value approach
        Reject \(H_0\) if \(X^2 \leq X_{1-a}^2\)
    • 右尾
      • p-value approach
        Reject \(H_0\) if \(p-value \leq a\)
      • Critical Value approach
        Reject \(H_0\) if \(X^2 \leq X_{a}^2\)
    • 雙尾
      • p-value approach
        Reject \(H_0\) if \(p-value \leq a\)
      • Critical Value approach
        Reject \(H_0\) if \(X^2 \leq X_{1-a/2}^2\) or \(X^2 \geq X_{a}^2\)

舉例:我們想要購買 A 廠商的恆溫器,我們在一個調查中得知,當在一個房間裡面設定 68度F 時,10 個恆溫器的實際數值如下,我們想要知道在百分之 90% 的信心水準中母體變異數要小於等於 0.5(題目設定,但沒有在圖片說)

圖片所示

其中 Buyer’s Digest 為 A 廠商

  • 因此定義對立假設與虛無假設

    • \(H_0: \sigma^2 \leq 0.5\)
    • \(H_1: \sigma^2 > 0.5\)
  • 右尾檢定,透過 Probability Distribution App 查找,\(v=9, P(X>x) =0.1 \) 時,\(X_{1-a}^2 = 14.864\),因此值要大於 \(X^2 \geq 14.864\),才能證明 \(H_1\) 是對的。

  • 計算 t 檢定的公式 \(X^2 = \frac{(n-1)s^2}{\sigma_0^2} =\frac{9(0.7)}{0.5} = 12.6\)

  • 用圖表來表示

  • p-Value Approach
    卡方值的 12.6 機率為 0.18156,比我們的顯著性水準 0.1 還高,因此沒有證據顯示他們的恆溫器有變異數過大的問題。

  • Critical Value Approach
    根據前一個舉例我們有計算過的樣本變異數 \(s^2 =0.7\),\(X^2=\frac{9(0.7)}{5} = 12.6\)
    \(12.6 \leq 14.864\),因此我們拒絕 \(H_0\),因此我們沒有證據顯示他們的恆溫器有變異數過大的問題。

推論兩組母體變異數(Inference About Two Population Variances)

蒐集兩個獨立母體的樣本,透過這兩個母體樣本就可以對這兩個母體進行推論。

  • 左尾的假設檢定
    • \(H_0: \sigma_1^2 \geq \sigma_2^2\)
    • \(H_1: \sigma_1^2 < \sigma_2^2\)
    • 通常會將比較大的樣本變異數設定為 population1
  • 右尾的假設檢定
    • \(H_0: \sigma_1^2 \leq \sigma_2^2\)
    • \(H_1: \sigma_1^2 > \sigma_2^2\)
    • 通常會將比較大的樣本變異數設定為 population1
  • 雙尾的假設檢定
    • \(H_0: \sigma_1^2 = \sigma_2^2\)
    • \(H_1: \sigma_1^2 != \sigma_2^2\)
    • 通常會將比較大的樣本變異數設定為 population1
  • F 檢定公式為 \(F = \frac{s_1^2}{s_2^2}\)
    此公式會有兩個自由度,因為有兩個母體。第一個母體為分子\(s_1\)、第二個母體為分母\(s_2\)。
  • 拒絕法則 Rejection Rule
    • 左尾
      • p-value approach
        Reject \(H_0\) if \(p-value \leq a\)
      • Critical Value approach
        Reject \(H_0\) if \(F \geq F_a\)
    • 右尾
      • p-value approach
        Reject \(H_0\) if \(p-value \leq a\)
      • Critical Value approach
        Reject \(H_0\) if \(F \geq F_a\)
    • 雙尾
      • p-value approach
        Reject \(H_0\) if \(p-value \leq a\)
      • Critical Value approach
        Reject \(H_0\) if \(F \geq F_{a/2}\)

舉例:我們想要購買恆溫器,有 A、B 公司兩家,在顯著性水準為 0.1 時,我們想要知道他們的變異數是不是一樣,資料在下方

圖片所示

其中 thermoRite 為 B 公司、TempKing 為 A 公司,因為 B 公司的樣本變異數比較大(1.768),A 公司約 0.7

  • 因此定義對立假設與虛無假設
    • \(H_0: \sigma_1^2 = \sigma_2^2\)
    • \(H_1: \sigma_1^2 != \sigma_2^2\)
  • 拒絕法則 Rejection Rule
    • 由於是雙尾,因此 顯著性水準為 \(0.1 / 2 = 0.05\),兩個都是 9 自由度。
    • 用 Probability Distribution App 計算如下

    • 用查表的方式

    • 第一個是 A 公司的自由度,第二是 B 公司的自由度,p 的機率是 0.05,我們可以得出\(F_{0.05} = 3.18\),因此如果要 reject \(H_0\) if \(F \geq 3.18 \)
  • t 檢定公式為 \(F = \frac{s_1^2}{s_2^2}\),其中 A 公司的數值為 1.768,B 公司的數值為 0.7,因此 \(F = 1.768 / 0.7 = 2.53\)
  • p-value Approach
    • 透過 Probability Distribution App 計算 \(F=2.53 \) 時機率為 0.09,但因為是雙尾,因此我們要將機率乘二變為 0.18,\(a = 0.05 < p-value = 0.18\),因此我們不拒絕 \(H_0\)
    • 因此我們沒有辦法證明兩家公司恆溫器的變異數是不同的。
  • Critical Value Approach
    • 因此我們不可以拒絕 \(H_0\),因為 \(F=2.53 < F_{0.05} = 3.18\)
    • 因此我們沒有辦法證明兩家公司恆溫器的變異數是不同的。
  • 版權聲明: 本部落格所有文章除有特別聲明外,均採用 Apache License 2.0 許可協議。轉載請註明出處!
  • © 2020-2024 John Doe
  • Powered by Hexo Theme Ayer
  • PV: UV: