随笔档案「2020年12月25日」：np.concatenate()用来合并list（根据ID去合... - 小小喽啰

2020年12月25日

np.concatenate()用来合并list（根据ID去合并这一列的list）

摘要：一个df，如果将两列的数据合并为一列（比如第一列是省份，第二列是城市，我们想要省市）直接相加即可，但是如果第一列是ID，每个ID对应有多行，其中某列是一个list，我们想要根据ID去合并这一列的list，比如：那么就得这样处理 t[['reportno','data_list']].groupb 阅读全文

posted @ 2020-12-25 16:09 小小喽啰阅读(913) 评论(0) 推荐(0)

numpy函数hstack，vstack，dstack把几个小数组合并成一个大数组

摘要： vstack、hstack和dstack都用于把几个小数组合并成一个大数组。它们的差别是小数组的元素在大数组中的排列顺序有所不同一、vstack vstack实现了轴0合并。vstack的字母v表示vertical的意思，相当是追加的意思 numpy.vstack(tup) tup：两个数组，除第阅读全文

posted @ 2020-12-25 15:51 小小喽啰阅读(1056) 评论(0) 推荐(0)

numpy.repeat 重复数组的元素(可用于数组的广播）

摘要：有时候，我们需要根据某列的分成多列，那么，有些列就需要重复多次，比如说： newvalues=np.dstack((np.repeat(t.reportno.values,list(map(len,t.data_list.values))),np.concatenate(t.data_list.va 阅读全文

posted @ 2020-12-25 14:50 小小喽啰阅读(5221) 评论(0) 推荐(0)

df 根据某列去拆分或者合并

摘要：一、拆分如果是拆分，那么那一列的值应该是list类型，比如：我们需要根据data_list列去拆分，至于我怎么只挑了一个ID列和待分裂列，那是方便操作，剩余的我们可以使用merge，我就不赘述了 newvalues=np.dstack((np.repeat(t.reportno.values,l 阅读全文

posted @ 2020-12-25 11:37 小小喽啰阅读(1362) 评论(0) 推荐(0)

计算有多个开始结束日期的总历时月份或者年份

摘要：比如说用户有多笔贷款，每个贷款都有开始和结束时间，那么我们需要计算用户需要还款的总的月份（年份）（或者说贷款持续时间），如：我们需要计算用户需要还款的月份数，以便于后面计算平均月供，由于有些日期是重合的，我们就不能计算多次。还有一些是跳跃的，也不能多计算，不能直接使用最大最小时间去计算差值有两种阅读全文

posted @ 2020-12-25 10:01 小小喽啰阅读(317) 评论(0) 推荐(0)