摘要: 环境:虚拟机hive+本地spark+python(pyspark)数据:商品订单数据+商品种类数据步骤:将数据上传到hdfs后,在python中完成hive表的创建,数据处理,关联规则挖掘,数据可视化实现功能:对商品订单中的信息进行挖掘,得到商品组合之间的关联关系(本文只对order进行了处理,没 阅读全文
posted @ 2022-12-23 17:52 脑袋凉凉 阅读(226) 评论(0) 推荐(0) 编辑