重新編碼

最后更新于:2022-04-01 02:44:25

# 重新編碼 分析資料前常常需要再次整理資料,方便日後做分析,整理資料第一步往往是將資料的調整值經過一些調整,以下介紹幾種重新編碼的方法。 - 透過邏輯判斷式 - 利用 cut 函數 ~~~ > data <- iris # 使用 R 內建的資料。 > data$Sepal.Length <- ifelse(data$Sepal.Length > 5, 1,2) # Sepal.Length 如果大於 5 會變成 1,不會就會變成 2 > data$Species <- ifelse(data$Species %in% c(setosa), "IsSetosa","Notsetosa") # %in% 代表有包含到的概念 > x <- c(1, 5, 12, 18, 19, 21, 25, 31) > cut(x, c(0, 10, 20, 30, 40), c(5, 15, 25, 35)) # cut 函數是透過切割點,重新賦予資料新的數值,本範例的切割的範圍是 0 ~ 10、10 ~ 20、20 ~ 30、30 ~ 40,0 ~ 10 範圍的賦予新的值是 5。 [1] 5 5 15 15 15 25 25 35 Levels: 5 15 25 35 ~~~
';