統計學(一) 筆記 - 第三章A

筆記說明

此筆記用途在於台北科技大學資訊與財金管理系大二上統計學重點整理
並非所有人都適用,部分對我而言稍加容易的內容並不會寫在此內。
這是觀看影片心得後的筆記,老師上課可能不太適用會忘記抄到

3A 介紹 - Descriptive Statistics: Numerical Measures(數值方式)

敘述統計。

名詞解釋

sample statistics 從資料中找出的某些資料
population parameters 母體參數,從母體的資料取得
point estimator 點估計量

Measures of Location 位置量數如何

  • mean 平均數
    平均數為資料中央量數,如果是樣本平均數則符號為 \(\bar{x}\),母體平均數用 \(μ\)

    但如果有極端值時,平均數不適用。

    • trimmed mean
      刪掉極端值的平均數,常用方法,將最小 \(5\% \) 與最大 \(5\% \)去掉後算平均數。
    • 標準差會變小
  • median 中位數
    如果資料裡有極端值時試用 median,例如白鳥麗次、中川圭一
    如果資料量是偶數就將最中間兩個數字加起來除以二

  • mode 眾數
    眾數不一定只有一個,可以有很多的

  • Weighted Mean 加權平均數
    根據重要性來加權重,例如根據學分數來判斷權重
    加權平均公式


  • Geometric Mean 幾何平均數
    算法

通常用在算財務報表成長率

舉例:

  • Percentiles 百分位數
    通常用第 p 的百分位數表示,至少有 p percent 比你差,其他比你好。
    公式:\(L_{p} = (p/100)(n+1)\)
    如果出來的數值是有小數點則將左右兩邊數字相減乘以小數位數即可

  • Quartiles 四分位數
    用百分位數表示就是分成 25% , 50% , 75% 來區分公式一樣用百分位數公式,如果出來的數值有小數點也是如此。

Measures of Variability 變異程度

  • Range
    \( \text{Range} = \text{Largest Value} - \text{Smallest Value} \),對極端值敏感

  • Interquartile Range (四分位距)
    用 75% 的值與 25% 的值設為範圍,對極端值不敏感

  • Variance (變異數)
    數字大代表變異大,數字小代表變異小。公式如下:

    • Degrees of Freedom 自由度 縮寫 df
      如果是等比數列或是等差數列自由度為零。
      樣本變數 \(n-1\)
      母體變數 \(n\)

  • Standard Deviation 標準差
    標準差越小離散程度越小,標準差越大離散程度越大
    把變異數開根號,所以值一定為正

  • Coefficient of Variation (變異系數)
    標準差相較於平均數差距多大

  • Mean Absolute error 平均絕對誤差 MAE
    數字越大代表離平均數遠,如果不是就離平均數近。公式如下

統整練習

  • 版權聲明: 本部落格所有文章除有特別聲明外,均採用 Apache License 2.0 許可協議。轉載請註明出處!
  • © 2020-2024 John Doe
  • Powered by Hexo Theme Ayer
  • PV: UV: