R character 與 factor 比較

內容說明

說明 R 語言中 factor 跟 character 他們彼此有甚麼好處又有甚麼不一樣。

character 介紹

基本上它就是 string,並不是 C 語言的 char,如果他是 C 語言的 char 那就很難用了www。
是 R 語言中最好用也是最基礎的型態之一。

字串的用法,相信只要 google 就好,我來講的話或許有點太失字串面子了。

factor 介紹

我對於 factor 比較不熟,如果沒有介紹的很晚整抱歉 QQ。
factor 用一句話來表示就是專門給文字用的 vector,且他還帶有層級(Levels) 的 vector。

factor 比起 vectior 多兩個要素:

ordered

  • 決定要不要有排序,如果沒有指定順序方式,則會使用字母順序來排序。
    levels
  • 決定排序的方式

舉例:

1
2
3
temperatures <- c("warm", "hot", "cold")
temp_factors <- factor(temperatures, ordered = TRUE, levels = c("cold", "warm", "hot"))
temp_factors
1
2
## [1] warm hot  cold
## Levels: cold < warm < hot

參考連結

10 多樣的資料結構:向量與因素向量

心得

為甚麼會突然寫一篇關於 factor 與 character 的差別呢,因為在 linux 上我遇到的第一個將程式移植到 linux 的錯誤上就是關於這個,也讓我認識到 factor,雖然我想不懂為甚麼再將程式移植時會遇到此問題,但是有問題就是要解決,於是在這裡紀錄經驗,不讓我忘記也希望其他人可以盡快解決此 bug。

  • 版權聲明: 本部落格所有文章除有特別聲明外,均採用 Apache License 2.0 許可協議。轉載請註明出處!
  • © 2020-2024 John Doe
  • Powered by Hexo Theme Ayer
  • PV: UV: