摘要: 一、理论 https://www.jianshu.com/p/114100d0517f https://www.imooc.com/article/46843 二、代码 1、准备数据 2、数据分成 train和test进行测试:用train的数据训练(fit)出的model带入(transform) 阅读全文
posted @ 2020-10-25 17:56 PEAR2020 阅读(472) 评论(0) 推荐(0) 编辑
摘要: 一、读取配置 driver.properties #mysql driver=com.mysql.jdbc.Driver url=jdbc:mysql://192.168.56.111:3306/myshops2 user=root password=root #hadoop hadoop_url= 阅读全文
posted @ 2020-10-25 17:01 PEAR2020 阅读(525) 评论(0) 推荐(0) 编辑
摘要: 一、整体流程 二、具体召回流程 三、代码实现 0、过滤已下架的/成人用品/烟酒等 package com.njbdqn.filter import com.njbdqn.util.{HDFSConnection, MYSQLConnection} import org.apache.spark.sq 阅读全文
posted @ 2020-10-25 16:10 PEAR2020 阅读(615) 评论(0) 推荐(0) 编辑
摘要: 一、整体思路 图1 图2 二、代码分析 1)LR数据准备: 1、合并数据。用户见过的商品,根据用户行为,区分喜欢0-不喜欢1;用户没见过的商品,标记为2 // 判断用户是否喜欢商品 假设用户下单或存放购物车 就喜欢 否则不喜欢 val isLove: UserDefinedFunction = ud 阅读全文
posted @ 2020-10-25 14:13 PEAR2020 阅读(492) 评论(0) 推荐(1) 编辑