摘要:
一个df,如果将两列的数据合并为一列( 比如第一列是省份,第二列是城市,我们想要省市)直接相加即可,但是如果第一列是ID,每个ID对应有多行,其中某列是一个list,我们想要根据ID去合并这一列的list,比如: 那么就得这样处理 t[['reportno','data_list']].groupb 阅读全文
摘要:
vstack、hstack和dstack都用于把几个小数组合并成一个大数组。它们的差别是小数组的元素在大数组中的排列顺序有所不同 一、vstack vstack实现了轴0合并。vstack的字母v表示vertical的意思,相当是追加的意思 numpy.vstack(tup) tup:两个数组,除第 阅读全文
摘要:
有时候,我们需要根据某列的分成多列,那么,有些列就需要重复多次,比如说: newvalues=np.dstack((np.repeat(t.reportno.values,list(map(len,t.data_list.values))),np.concatenate(t.data_list.va 阅读全文
摘要:
一、拆分 如果是拆分,那么那一列的值应该是list类型,比如: 我们需要根据data_list列去拆分,至于我怎么只挑了一个ID列和待分裂列,那是方便操作,剩余的我们可以使用merge,我就不赘述了 newvalues=np.dstack((np.repeat(t.reportno.values,l 阅读全文
摘要:
比如说用户有多笔贷款,每个贷款都有开始和结束时间,那么我们需要计算用户需要还款的总的月份(年份)(或者说贷款持续时间),如: 我们需要计算用户需要还款的月份数,以便于后面计算平均月供,由于有些日期是重合的,我们就不能计算多次。还有一些是跳跃的,也不能多计算,不能直接使用最大最小时间去计算差值 有两种 阅读全文