三分钟带你学会序列插值——优雅的imputeTS方法


1.library(imputeTS)2.# 创建一个带有缺失值的短时间序列示例3.x <- ts(c(1, 2, 3, 4, 5, 6, 7, 8, NA, NA, 11, 12))
1.# 使用na.mean插补缺失值2.na.mean(x)3.[1] 1.0 2.0 3.0 4.0 5.0 6.0 7.0 8.0 5.9 5.9 11.0 12.0
1.# 使用na.mean插补缺失值,选项为median2.na.mean(x, option="median")3.[1] 1.0 2.0 3.0 4.0 5.0 6.0 7.0 8.0 5.5 5.5 11.0 12.0
虽然na.interpolation和所有其他插补函数的用法相同,但产生的结果可能不同。如下所示,对于这个数据,线性插值提供了更合理的结果。1.# 使用na.interpolation插补缺失值2.na.interpolation(x)3.[1] 1 2 3 4 5 6 7 8 9 10 11 12
1.# 使用na.kalman插补缺失值2.#(tsAirgap是imputeTS包提供的示例时间序列)3.data("tsAirgap")4.imp <- na.kalman(tsAirgap)5.# 可视化代码6.ggplot_na_imputations(tsAirgap, imp, tsAirgapComplete)

ggplot_na_distribution(可视化缺失值分布):
1.# 示例代码 'ggplot_na_distribution'2.#(tsAirgap是imputeTS包提供的示例时间序列)3.# 可视化此时间序列中的缺失值4.ggplot_na_distribution(tsAirgap)

ggplot_na_distribution2(可视化缺失值分布的条形图):
1.#(tsHeating是imputeTS包提供的示例时间序列)2.# 可视化此时间序列中的缺失值3. ggplot_na_distribution2(tsHeating,number_intervals = 20)

ggplot_na_gapsize(可视化不同NA间隙的频率):
1.#(tsNH4是imputeTS包提供的示例时间序列)2.# 可视化前NAs大小 / 连续的NA3.ggplot_na_gapsize(tsNH4)

分布的摘要统计信息
statsNA 函数在 imputeTS 包中提供了关于单变量时间序列中缺失值分布的摘要统计信息。以下是它提供的信息的解释:statsNA 函数的示例代码,请跟着小果一起练习哦:1.# 示例代码 'statsNA'2.#(tsNH4 是 imputeTS 包提供的示例时间序列)3.# 打印关于缺失数据的统计信息4.statsNA(tsNH4)


往期推荐