統計學(一) 筆記 - 第三章B

筆記說明

此筆記用途在於台北科技大學資訊與財金管理系大二上統計學重點整理
並非所有人都適用,部分對我而言稍加容易的內容並不會寫在此內。
這是觀看影片心得後的筆記,老師上課可能不太適用會忘記抄到

3B 介紹 - Descriptive Statistics: Numerical Measures(數值方式)

敘述統計,too。

Measures of Distribution Shape 分配形狀度量

Skewness 偏態

公式如下:

如果圖片剛好是具有左右對稱性則 \(Skewness = 0 \),往右偏則 \(Skewness > 0 \) ,往左偏則是 \(Skewness < 0 \),負數表如下圖:

  • Highly Skewed Right
    右偏 > 1,通常平均數會比中位數來的更高。
  • 關於 Skewness 的平均數、中位數的比較如下:

QUESTION: 左偏的意思是甚麼?

就是左邊的資料比較少,重心在右邊則叫左偏。

Z-Scores Z 分數

某一數值離母體平均值差幾個標準差,標準差公式如下:

  • Z-Score > 0 表示數值比平均數大,Z-Score 則代表離幾個標準差遠
  • Z-Score < 0 表示數值比平均數小,Z-Score 則代表離幾個標準差遠

Chebyshev’s Theorem 柴比雪夫定理

用於知道資料分布位置,用心看圖片裡面文字XD

Chebyshev’s Theorem 舉例

可以得知 Chebyshev’s Theorem 預估有 509 ~ 673 裡面有百分之 56% 的資料,但事實上有 86% 的資料在 509 ~ 673 之間,Chebyshev’s Theorem 屬於比較保守的知道資料分布位置。

Empirical Rule 經驗法則

當資料大約是鐘型分布時可以用 Empirical Rule 來查看有有多少資料分布在某個特定的標準差裡面,此原理是用常態分配推算出。

看圖說故事拉XD

Detecting Outliers 離群值

找出極端數值使用離群值,也可用於找出資料錯誤,看圖說明:

Five-Number Summary and Box Plox 五數彙整 和 箱型圖

QUESTION: Five-Number Summary 哪五數?
  • Smallest Value 最小值
  • First Quartile 第一分位(25%)
  • Median 中位數
  • Thrid Quartile 第三分位(75%)
  • Larget Value 最大值
Box Plox 箱型圖

基礎是 Five-Number Summary,也可看出離群值的圖。
箱型圖怎麼畫,在這裡!

Measures of Association Between Two Variables 兩個變數的關係

把散佈圖切成4塊,如果散佈圖數值集中在一、三象限代表有線性關係,二、四象限也是,如果數值散步則代表沒有線性關系。

Covariance 共變異數

當共變異數為負時表示當一方正成長另一方則會反向成長,反之亦同。

公式如下:

舉例如下:

Correlation Coefficient 相關係數

只能說兩變數有相關性,不可以說哪個變數影響誰。
公式如下:

Correlation Coefficient 介於 1 與 -1 之間,越接近 -1 代表有很強烈的負相關、接近 1 代表有強烈的正相關,如果是 0 代表沒關係,與我無關

舉例:


Data Dashboards 資料儀表板

把圖表或是數值分析放在同一塊螢幕上。

  • 版權聲明: 本部落格所有文章除有特別聲明外,均採用 Apache License 2.0 許可協議。轉載請註明出處!
  • © 2020-2024 John Doe
  • Powered by Hexo Theme Ayer
  • PV: UV: