上一页 1 ··· 28 29 30 31 32 33 34 35 36 ··· 82 下一页
摘要: 参考:https://blog.csdn.net/hellozhxy/article/details/80523499?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-1.nonecas 阅读全文
posted @ 2020-05-09 22:53 lshan 阅读(463) 评论(0) 推荐(0) 编辑
摘要: cankao :https://blog.csdn.net/weixin_44112790/article/details/95387314 git doc: 然后是DataFrame的手册,可以在里面查找更多的方法,其实都和pandas的差不多。http://cardillo.github.io/ 阅读全文
posted @ 2020-05-09 11:01 lshan 阅读(7786) 评论(0) 推荐(1) 编辑
该文被密码保护。 阅读全文
posted @ 2020-05-08 16:55 lshan 阅读(6) 评论(0) 推荐(0) 编辑
该文被密码保护。 阅读全文
posted @ 2020-05-08 01:50 lshan 阅读(0) 评论(0) 推荐(0) 编辑
摘要: 如果是大表, 会出现OOM 原本是这样,直接写Table名称,就会读整张Table .option("dbtable", "test_table")可以改写成:.option("dbtable", "(select * from test_table where dt >= '2017-05-01' 阅读全文
posted @ 2020-05-07 23:39 lshan 阅读(811) 评论(0) 推荐(0) 编辑
摘要: 1.下载hadoop-common-2.2.0-bin并解压到某个目录 https://github.com/srccodes/hadoop-common-2.2.0-bin 2.设置hadoop.home.dir System.setProperty("hadoop.home.dir", "D:\ 阅读全文
posted @ 2020-05-07 21:26 lshan 阅读(310) 评论(0) 推荐(0) 编辑
摘要: 参考:https://my.oschina.net/woter/blog/1843755 依赖: <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instan 阅读全文
posted @ 2020-05-07 13:38 lshan 阅读(4679) 评论(1) 推荐(0) 编辑
摘要: 原文:https://www.cnblogs.com/920913cheng/p/10240219.html 1. match处理Integer集合 package lambda.stream; /** * @author 作者:cb * @version 创建时间:2019年1月4日 下午2:35 阅读全文
posted @ 2020-05-06 17:18 lshan 阅读(209) 评论(0) 推荐(0) 编辑
摘要: ALS算法参数: // ALS关键代码 val model =ALS.train(训练集,rank,循环次数iter,lambda) 那是怎么想到要这样设置的呢?那就要在了解算法的基础上来设置此参数; 1、训练集,数据格式:(用户id 物品id 评分(0-1) ) 2、rank,根据数据的分散情况测 阅读全文
posted @ 2020-05-06 10:43 lshan 阅读(1090) 评论(0) 推荐(1) 编辑
该文被密码保护。 阅读全文
posted @ 2020-04-28 14:54 lshan 阅读(131) 评论(0) 推荐(0) 编辑
上一页 1 ··· 28 29 30 31 32 33 34 35 36 ··· 82 下一页