摘要:
自己包含了很多数据集 也提供了函数来生成虚拟数据。 normalize(),scale()等函数 除非特别指定,输入将被转换为 float64 模型持久化 使用 LabelBinarizer 将目标向量 y 转化成二值化后的二维数组 阅读全文
摘要:
重点 https://blog.csdn.net/qq826364410/article/details/78259796 为啥会出现几个两个空列表???? 阅读全文
摘要:
111 阅读全文
摘要:
转载 https://www.cnblogs.com/chaosimple/p/4153167.html 一、标准化(Z-Score),或者去除均值和方差缩放 公式为:(X-mean)/std 计算时对每个属性/每列分别进行。 将数据按期属性(按列进行)减去其均值,并处以其方差。得到的结果是,对于每 阅读全文
摘要:
阅读全文
摘要:
只要种子一样,则产生的随机数也一样。 numpy.random.seed()和numpy.random.RandomState两种方法都可以设置随机数种子 numpy.random.seed()不是线程安全的 阅读全文
摘要:
ttps://www.zhihu.com/lives/889189116527403008/messages 用户画像两层含义:单个标签;用户的分布 标签体系要与时俱进,如果标签被下游强依赖,则不轻易更改。 一般用树状结构来构建用户画像。 快速建模,建模细致 个体内的可比性:一个人之间的比较 垂类内 阅读全文