2018 年 5月 3 日随笔档案 - 迷茫的计算机呆

2018年5月3日

摘要：自己包含了很多数据集也提供了函数来生成虚拟数据。 normalize(),scale()等函数除非特别指定，输入将被转换为 float64 模型持久化使用 LabelBinarizer 将目标向量 y 转化成二值化后的二维数组阅读全文

posted @ 2018-05-03 20:59 迷茫的计算机呆阅读(135) 评论(0) 推荐(0) 编辑

python3 的zip（）函数

摘要：重点 https://blog.csdn.net/qq826364410/article/details/78259796 为啥会出现几个两个空列表？？？？阅读全文

posted @ 2018-05-03 19:51 迷茫的计算机呆阅读(115) 评论(0) 推荐(0) 编辑

random_projection 随机投影

摘要： 111 阅读全文

posted @ 2018-05-03 19:19 迷茫的计算机呆阅读(1079) 评论(0) 推荐(0) 编辑

标准化、归一化、正则化

摘要：转载 https://www.cnblogs.com/chaosimple/p/4153167.html 一、标准化（Z-Score），或者去除均值和方差缩放公式为：(X-mean)/std 计算时对每个属性/每列分别进行。将数据按期属性（按列进行）减去其均值，并处以其方差。得到的结果是，对于每阅读全文

posted @ 2018-05-03 15:56 迷茫的计算机呆阅读(1645) 评论(0) 推荐(0) 编辑

sklearn

摘要：阅读全文

posted @ 2018-05-03 15:20 迷茫的计算机呆阅读(93) 评论(0) 推荐(0) 编辑

随机数发生器

摘要：只要种子一样，则产生的随机数也一样。 numpy.random.seed()和numpy.random.RandomState两种方法都可以设置随机数种子 numpy.random.seed()不是线程安全的阅读全文

posted @ 2018-05-03 15:05 迷茫的计算机呆阅读(312) 评论(0) 推荐(0) 编辑

用户画像，知乎Live总结

摘要： ttps://www.zhihu.com/lives/889189116527403008/messages 用户画像两层含义：单个标签；用户的分布标签体系要与时俱进，如果标签被下游强依赖，则不轻易更改。一般用树状结构来构建用户画像。快速建模，建模细致个体内的可比性：一个人之间的比较垂类内阅读全文

posted @ 2018-05-03 09:45 迷茫的计算机呆阅读(827) 评论(0) 推荐(0) 编辑

迷茫的计算机呆

公告