Yesterday is history, tomorrow is a mystery, but today is gift. That's why we called it the present. >>>>>>> 点此联系我

[Matlab]一个数据集的处理

昨天帮同学用matlab 处理一个数据,一开始提了需求感觉很好实现啊但上手一弄弄了俩小时,很是蛋疼

1.数据集

有以下数据,以矩阵形式存放在matlab中:

可以看出第七列中间缺了一些数,而且每个数是第七列最大能达到50,然后循环往复,一桶油76000+行数据

2.需求

需求就是在顺序空缺处加入一个除第七列以外的全零列,如下:

使其变得顺序完整

3.思路

一开始想着直接在原矩阵上动手,发现逻辑有点复杂。1-50中间还好说,但再加上一个50到1的判断着实有些烧脑,所以分批处理吧。将大矩阵分成每个序号都是由小到大的排列的小矩阵放入一个CELL中然后挨个处理,最后再合并这个CELL。

4.实现

load dataCondence
clearvars -except DATA_Original

BatchMat  = [];

kk = 1;
ll = 1;
%矩阵拆分
while 1

    while DATA_Original(kk+1,7)-DATA_Original(kk,7)>=0
        if kk<(size(DATA_Original,1)-1)
            BatchMat = [BatchMat;DATA_Original(kk,:)];
            kk = kk + 1;
        else 
            break;
        end
    end
    
    BatchMat = [BatchMat;DATA_Original(kk,:)];
    CellMat{ll} = BatchMat;
    BatchMat = [];
    ll = ll+1;

    kk = kk+1;
    if kk==(size(DATA_Original,1))
        break;
    end

end
%处理小矩阵
for nCycle = 1:numel(CellMat)
    DATA = CellMat{nCycle};
    iterMat  = [];
    orderMat = [];
    curOrder = 0;
    %处理开头序列
    if DATA(1,7) ~= 1
        for j=1:DATA(1,7)-1
            orderMat = [orderMat;curOrder+1];
            curOrder = curOrder + 1;
        end
        curOrder = 0;
        iterMat = [iterMat;[zeros(DATA(1,7)-1,6),orderMat,zeros(DATA(1,7)-1,6)]];
        orderMat = [];
    end
    %处理中间数据
    for i = 1:size(DATA,1)-1
        iterMat = [iterMat;DATA(i,:)];
        if DATA(i+1,7)-DATA(i,7) > 1
            diff = DATA(i+1,7)-DATA(i,7)-1;
            curOrder = DATA(i,7);
            if diff~=0
                for j=1:diff
                    orderMat = [orderMat;curOrder+1];
                    curOrder = curOrder + 1;
                end
                curOrder = 0;
                iterMat = [iterMat;[zeros(diff,6),orderMat,zeros(diff,6)]];
                orderMat = [];
            end
        end

    end
    iterMat = [iterMat;DATA(i+1,:)];
    CellMat_NEW{nCycle} = iterMat;
end
%合并矩阵
CombMat = [];
for i = 1:numel(CellMat_NEW)
    CombMat = [CombMat;CellMat_NEW{i}];
end

5.问题

在处理过程中,发现开头和结尾的判断实在有些绕,而且以前很多程序在边界处都是最容易出错的,有时间得总结一下这类数据的边界处理问题。

 

posted @ 2018-05-10 09:48  virter  阅读(5880)  评论(0编辑  收藏  举报