Matlab 数据补全方法
fillmissing
填充缺失值
F = fillmissing(A,method) % 插值填充
案例如下:
x = [-4*pi:0.1:0, 0.1:0.2:4*pi]; % 定义非均匀采样点向量,并计算这些点上的正弦函数。 A = sin(x); A(A < 0.75 & A > 0.5) = NaN; % 将 NaN 值插入 A 中。 % 使用线性插值填充缺失数据,并返回填充的向量 F 和逻辑向量 TF。TF 项中的值 1 (true) 对应于 F 中的填充值。 [F,TF] = fillmissing(A,'linear','SamplePoints',x); plot(x,A,'.', x(TF),F(TF),'o') % 绘制原始数据和填充的数据。 xlabel('x'); ylabel('sin(x)') legend('Original Data','Filled Missing Data')
填充方法还包括:
方法 | 说明 |
---|---|
'previous' |
上一个非缺失值 |
'next' |
下一个非缺失值 |
'nearest' |
距离最近的非缺失值 |
'linear' |
相邻非缺失值的线性插值(仅限数值、duration 和 datetime 数据类型) |
'spline' |
分段三次样条插值(仅限数值、duration 和 datetime 数据类型) |
'pchip' |
保形分段三次样条插值(仅限数值、duration 和 datetime 数据类型) |
'makima' |
修正 Akima 三次 Hermite 插值(仅限数值、duration 和 datetime 数据类型) |
F = fillmissing(A,movmethod,window) % 滑动填充
案例如下:
% 创建样本点向量 x 和包含缺失值的数据向量 A。 x = linspace(0,10,200); A = sin(x) + 0.5*(rand(size(x))-0.5); A([1:10 randi([1 length(x)],1,50)]) = NaN; % 使用窗口长度为 10 的移动中位数替换 A 中的 NaN 值,并绘制原始数据和填充的数据。 F = fillmissing(A,'movmedian',10); plot(x,F,'r.-',x,A,'b.-') legend('Filled Missing Data','Original Data')
注意:当使用'movmedian'方法填充数据时,窗口长度为2并不能有效填充数据,原始数据中的NaN将被保留
填充方法还包括:
方法 | 说明 |
---|---|
'movmean' |
窗口长度为 window 的移动均值(仅限数值数据类型) |
'movmedian' |
窗口长度为 window 的移动中位数(仅限数值数据类型) |
特别感谢:
李果(大凉茶)
参考文献: