摘要: 阅读全文
posted @ 2020-05-22 20:27 zwtzz 阅读(176) 评论(0) 推荐(0) 编辑
摘要: 假设有数据量T级名为data的RDD,需要做一些列动作,一般需要使用map-reduce,其中map阶段可以使用def函数或者lambda形式,返回新的RDD,reduce可以起到累加作用,例: 1 from pyspark import SparkConf 2 conf = SparkConf() 阅读全文
posted @ 2020-05-22 14:49 zwtzz 阅读(1489) 评论(0) 推荐(0) 编辑
摘要: https://www.cnblogs.com/jin-zhe/p/9773081.html 阅读全文
posted @ 2020-03-03 19:55 zwtzz 阅读(282) 评论(0) 推荐(0) 编辑
摘要: https://blog.csdn.net/weixin_42451919/article/details/81381294 阅读全文
posted @ 2020-01-13 15:16 zwtzz 阅读(115) 评论(0) 推荐(0) 编辑
摘要: 环境Python3.7.5,tensorflow、tensorboard均为1.14.0 首先,读取meta文件,ckpt文件夹内含有以下文件: 读取代码如下:(ckpt路径需要对应,本例中meta文件分为model.ckpt-0.meta及model.ckpt-7425.meta两组文件,ckpt 阅读全文
posted @ 2020-01-06 15:18 zwtzz 阅读(2606) 评论(0) 推荐(0) 编辑
摘要: DeepFM就是FM模型结合DNN的产物,模型结构及原理详见:https://mp.weixin.qq.com/s/Hb6tKk1sw9pZ7qysO765nw,代码逻辑:Hive取数➡️生成onehot编码字典➡️转换数据➡️输入以训练模型 模型代码见github:https://github.c 阅读全文
posted @ 2020-01-06 15:00 zwtzz 阅读(1013) 评论(0) 推荐(0) 编辑
摘要: https://blog.csdn.net/itplus/article/details/40534923 阅读全文
posted @ 2019-11-27 09:36 zwtzz 阅读(216) 评论(0) 推荐(0) 编辑
摘要: https://www.jianshu.com/p/90106243d231 阅读全文
posted @ 2019-11-22 09:19 zwtzz 阅读(1892) 评论(0) 推荐(0) 编辑
摘要: indptr = np.array([0, 2, 3, 6]) #6代表非零元素总个数为6 indices = np.array([0, 2, 2, 0, 1, 2]) data = np.array([1, 2, 3, 4, 5, 6]) csr_matrix((data, indices, in 阅读全文
posted @ 2019-11-12 14:32 zwtzz 阅读(273) 评论(0) 推荐(0) 编辑
摘要: 数学与统计学最大的区别在于数学研究的是变量,而统计学研究的是随机变量 频率学派把未知参数看作普通变量(固定值),把样本看作随机变量;而贝叶斯学派把一切变量看作随机变量 贝叶斯论善于利用过去的知识和抽样数据,而频率论仅仅利用抽样数据。因此贝叶斯推论中前一次得到的后验概率分布可以作为后一次的先验概率 频 阅读全文
posted @ 2019-09-08 10:49 zwtzz 阅读(267) 评论(0) 推荐(0) 编辑