摘要: 自己包含了很多数据集 也提供了函数来生成虚拟数据。 normalize(),scale()等函数 除非特别指定,输入将被转换为 float64 模型持久化 使用 LabelBinarizer 将目标向量 y 转化成二值化后的二维数组 阅读全文
posted @ 2018-05-03 20:59 迷茫的计算机呆 阅读(135) 评论(0) 推荐(0) 编辑
摘要: 重点 https://blog.csdn.net/qq826364410/article/details/78259796 为啥会出现几个两个空列表???? 阅读全文
posted @ 2018-05-03 19:51 迷茫的计算机呆 阅读(115) 评论(0) 推荐(0) 编辑
摘要: 111 阅读全文
posted @ 2018-05-03 19:19 迷茫的计算机呆 阅读(1079) 评论(0) 推荐(0) 编辑
摘要: 转载 https://www.cnblogs.com/chaosimple/p/4153167.html 一、标准化(Z-Score),或者去除均值和方差缩放 公式为:(X-mean)/std 计算时对每个属性/每列分别进行。 将数据按期属性(按列进行)减去其均值,并处以其方差。得到的结果是,对于每 阅读全文
posted @ 2018-05-03 15:56 迷茫的计算机呆 阅读(1645) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2018-05-03 15:20 迷茫的计算机呆 阅读(93) 评论(0) 推荐(0) 编辑
摘要: 只要种子一样,则产生的随机数也一样。 numpy.random.seed()和numpy.random.RandomState两种方法都可以设置随机数种子 numpy.random.seed()不是线程安全的 阅读全文
posted @ 2018-05-03 15:05 迷茫的计算机呆 阅读(312) 评论(0) 推荐(0) 编辑
摘要: ttps://www.zhihu.com/lives/889189116527403008/messages 用户画像两层含义:单个标签;用户的分布 标签体系要与时俱进,如果标签被下游强依赖,则不轻易更改。 一般用树状结构来构建用户画像。 快速建模,建模细致 个体内的可比性:一个人之间的比较 垂类内 阅读全文
posted @ 2018-05-03 09:45 迷茫的计算机呆 阅读(827) 评论(0) 推荐(0) 编辑