zwtzz - 博客园

2020年5月22日

摘要：阅读全文

posted @ 2020-05-22 20:27 zwtzz 阅读(181) 评论(0) 推荐(0)

摘要：假设有数据量T级名为data的RDD，需要做一些列动作，一般需要使用map-reduce，其中map阶段可以使用def函数或者lambda形式，返回新的RDD，reduce可以起到累加作用，例： 1 from pyspark import SparkConf 2 conf = SparkConf() 阅读全文

posted @ 2020-05-22 14:49 zwtzz 阅读(1525) 评论(0) 推荐(0)

2020年3月3日

正则表达式中全部符号作用及解释

摘要： https://www.cnblogs.com/jin-zhe/p/9773081.html 阅读全文

posted @ 2020-03-03 19:55 zwtzz 阅读(366) 评论(0) 推荐(0)

2020年1月13日

CNN

摘要： https://blog.csdn.net/weixin_42451919/article/details/81381294 阅读全文

posted @ 2020-01-13 15:16 zwtzz 阅读(121) 评论(0) 推荐(0)

2020年1月6日

tensorboard使用及tensorflow各层权重系数输出

摘要：环境Python3.7.5，tensorflow、tensorboard均为1.14.0 首先，读取meta文件，ckpt文件夹内含有以下文件：读取代码如下：（ckpt路径需要对应，本例中meta文件分为model.ckpt-0.meta及model.ckpt-7425.meta两组文件，ckpt 阅读全文

posted @ 2020-01-06 15:18 zwtzz 阅读(2685) 评论(0) 推荐(0)

DeepFM tensorflow实现

摘要： DeepFM就是FM模型结合DNN的产物，模型结构及原理详见：https://mp.weixin.qq.com/s/Hb6tKk1sw9pZ7qysO765nw，代码逻辑：Hive取数➡️生成onehot编码字典➡️转换数据➡️输入以训练模型模型代码见github：https://github.c 阅读全文

posted @ 2020-01-06 15:00 zwtzz 阅读(1048) 评论(0) 推荐(0)

2019年11月27日

FM详解

摘要： https://blog.csdn.net/itplus/article/details/40534923 阅读全文

posted @ 2019-11-27 09:36 zwtzz 阅读(231) 评论(0) 推荐(0)

2019年11月22日

sklearn计算auc需要注意的点

摘要： https://www.jianshu.com/p/90106243d231 阅读全文

posted @ 2019-11-22 09:19 zwtzz 阅读(1902) 评论(0) 推荐(0)

2019年11月12日

矩阵压缩存储（可用于FM算法中的稀疏矩阵存储）

摘要： indptr = np.array([0, 2, 3, 6]) #6代表非零元素总个数为6 indices = np.array([0, 2, 2, 0, 1, 2]) data = np.array([1, 2, 3, 4, 5, 6]) csr_matrix((data, indices, in 阅读全文

posted @ 2019-11-12 14:32 zwtzz 阅读(289) 评论(0) 推荐(0)

2019年9月8日

Frequentist PK Bayesian

摘要：数学与统计学最大的区别在于数学研究的是变量，而统计学研究的是随机变量频率学派把未知参数看作普通变量（固定值），把样本看作随机变量；而贝叶斯学派把一切变量看作随机变量贝叶斯论善于利用过去的知识和抽样数据，而频率论仅仅利用抽样数据。因此贝叶斯推论中前一次得到的后验概率分布可以作为后一次的先验概率频阅读全文

posted @ 2019-09-08 10:49 zwtzz 阅读(291) 评论(0) 推荐(0)

zwtgyh

I wish you could keep your hope forever, and your faith.