摘要: 18.11.15更新,因为代码用set的话集群跑不了,所以更改为一直用dataframe进行操作,发现Pandas和spark中对dataframe的操作不同,所以增加了pandas的group操作 最近进行关联规则算法的学习,使用的是tpch里的数据,取了customer和part两行数据如图 而 阅读全文
posted @ 2018-11-13 15:08 forthlss 阅读(1783) 评论(0) 推荐(0) 编辑