統計學(一) 筆記 - 第二章B

筆記說明

此筆記用途在於台北科技大學資訊與財金管理系大二上統計學重點整理
並非所有人都適用,部分對我而言稍加容易的內容並不會寫在此內。
這是觀看影片心得後的筆記,老師上課可能不太適用會忘記抄到

2B 介紹

著重在兩個變數關係。

Crosstabulation 交叉表

可以用交叉表來看兩個變數的關係。
不管是數值型資料或是類別型資料都可以用交叉表來表示。

名詞解釋

aggregated crosstabulation 已彙整的表
simpsons’s Paradox 辛普森悖論
aggregated 收集
Scatter Diagram and Trendline 散佈圖

simpsons’s Paradox 辛普森悖論

在分組比較中都佔優勢的一方,在總評(全部一起考量)有時會是劣勢的一方。
為了避免此勃論則需要斟酌各分組權重,並乘以一定係數消除分組數據差造成的影響

Scatter Diagram and Trendline 散佈圖

散佈圖的 x,y 都必須是數值變數
假如 x 變動很大但趨勢線卻沒有變動表示 x 與 y 沒有甚麼關係。如下圖:

Side-by-Side Bar Chart 長條圖

可同時比較很多 Elements

Stacked Bar Chart 堆疊長條圖

將要比較的變數全部堆疊在一起,所以長度都會達到 100%,如下圖:
通常是要查看同個 elements 的 variables 誰比較高

Data Visualization 資料視覺化

  • 明確標題
  • 簡潔表單
  • 清楚標示 x,y 軸
  • 顏色要明確,不可過度模糊。假如是黑白報表的話,建議使用符號來表示

建議圖表

QEUSTION: 想要兩個變數之間比較

Side-by-Side Bar Chart or Stacked Bar Chart

QEUSTION: 想要看兩個變數之間的關係

solution A: Scatter Diagram 散佈圖

但請記住,變數只能是數值變數

solution B: Trendline 趨勢線

來看在散佈圖上面的關聯行如何

Data Dashboards 資料儀表板

通常查看 KPI(關鍵績效指標),能讓使用者方便閱讀了解。

tips

  • 盡量讓圖不要下拉或上移,可以完整呈現
  • 減少不必要的視覺效果
  • 圖要有明顯邊界
    如下圖:
  • 版權聲明: 本部落格所有文章除有特別聲明外,均採用 Apache License 2.0 許可協議。轉載請註明出處!
  • © 2020-2024 John Doe
  • Powered by Hexo Theme Ayer
  • PV: UV: