摘要: 一、R语言 Bartlett球形检验: library(psych) cortest.bartlett(cor(dataframe), n=sample_size) 或 cortest.bartlett(dataframe) KMO检验: https://stat.ethz.ch/pipermail 阅读全文
posted @ 2020-09-17 10:17 pumpkin_J 阅读(4417) 评论(0) 推荐(0) 编辑
摘要: 参考链接:https://www.cnblogs.com/Allen-rg/p/12573149.html LogisticRegression回归算法 LogisticRegression回归模型在Sklearn.linear_model子类下,调用sklearn逻辑回归算法步骤比较简单,即: ( 阅读全文
posted @ 2020-09-11 16:14 pumpkin_J 阅读(2372) 评论(0) 推荐(0) 编辑
摘要: sklearn有六大模块+数据导入: Classification(分类)、Regression(回归)、Clustering(聚类)、Dimensionality Reduction(降维)、Model Selection(模型选择)、Preprocessing(预处理) 以及datasets(数 阅读全文
posted @ 2020-09-09 18:50 pumpkin_J 阅读(732) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2020-07-20 15:18 pumpkin_J 阅读(98) 评论(0) 推荐(0) 编辑
摘要: pipeline管道机制使用方法: 流水线的输入为一连串的数据挖掘步骤,其中最后一步必须是估计器(Estimator),可理解成分类器前几步是转换器(Transformer)。输入的数据集经过转换器的处理后,输出的结果作为下一步的输入。 最后,用位于流水线最后一步的估计器对数据进行分类。 #codi 阅读全文
posted @ 2020-06-28 09:26 pumpkin_J 阅读(1419) 评论(0) 推荐(0) 编辑
摘要: 一、复习 # 序列化模块 # 数据类型转化成字符串的过程就是序列化 # 为了方便存储和网络传输 # json # dumps # loads # dump 和文件有关 # load load不能load多次 # import json # data = {'username':['李华','二愣子' 阅读全文
posted @ 2019-03-29 17:46 pumpkin_J 阅读(39) 评论(0) 推荐(0) 编辑
摘要: 一、序列化 序列————字符串 序列化————转成一个字符串数据类型 从数据类型转成字符串类型————序列化 从字符串转成数据类型————反序列化 二、序列化方法 1、json (1)dumps,loads (2)dump, load 导入中文 一行一行读 2、pickle 3、shelve 阅读全文
posted @ 2019-03-17 11:42 pumpkin_J 阅读(80) 评论(0) 推荐(0) 编辑
摘要: 复习 一、time模块 1、时间戳与结构化l时间的转化 2、格式化时间与结构化时间的转化 二、random模块 三、os模块——与操作系统交互的窗口 四、sys模块——是与Python解释器交互的一个接口 阅读全文
posted @ 2019-03-16 20:22 pumpkin_J 阅读(50) 评论(0) 推荐(0) 编辑
摘要: 一、复习 # 超过最大递归限制的报错# 只要写递归函数,必须要有结束条件。# 返回值# 不要只看到return就认为已经返回了。要看返回操作是在递归到第几层的时候发生的,然后返回给了谁。# 如果不是返回给最外层函数,调用者就接收不到。# 需要再分析,看如何把结果返回回来。 # 斐波那契 # 问第n个 阅读全文
posted @ 2019-03-15 22:16 pumpkin_J 阅读(68) 评论(0) 推荐(0) 编辑
摘要: 二、初始算法 第二版:参数end有问题,没有返回值,找不到怎么办 第三版:解决了参数end的问题, 第四版 最终版: 阅读全文
posted @ 2019-03-14 21:21 pumpkin_J 阅读(82) 评论(0) 推荐(0) 编辑
摘要: 复习: 数据类型: int, float, bool,complex 数据结构:dict, tuple,list,set,str 一、内置函数 reversed: 保留原列表,返回一个反向的迭代器 slice:切片 format: bytes: memoryview: ord:字符按照Unicode 阅读全文
posted @ 2019-03-14 13:10 pumpkin_J 阅读(89) 评论(0) 推荐(0) 编辑
摘要: 昨日内容回顾 一、作业讲解及生成器面试题讲解 例1 .处理文件,用户指定要查找的文件和内容,将文件中包含要查找内容的每一行都输出到屏幕 例2 写生成器,从文件中读取内容,在每一次读取到的内容之前加上‘***’之后再返回给用户。 面试题一 面试题2 二、内置函数 1.作用域相关 字符串类型代码的执行 阅读全文
posted @ 2019-03-13 16:40 pumpkin_J 阅读(89) 评论(0) 推荐(0) 编辑
摘要: 一、send 昨天的例子 二、生成器函数进阶实例 1. 2.获取移动平均值 3.预激生成器的装饰器 4.Python3 中新功能 yield from 总结: 四、生成器表达式 列表表达式与生成器表达式的比较: 五、各种推导式 [每一个元素或者是和元素相关的操作 for 元素 in 可迭代数据类型] 阅读全文
posted @ 2019-03-12 22:16 pumpkin_J 阅读(111) 评论(0) 推荐(0) 编辑
摘要: 一、numpy简介 Numpy是高性能科学计算和数据分析的基础包,机器学习三剑客之一。Numpy库中最核心的部分是ndarray 对象,它封装了同构数据类型的n维数组。部分功能如下: ndarray, 具有矢量算术运算和复杂广播能力的快速且节省空间的多维数组。 用于对整组数据进行快速运算的标准数学函 阅读全文
posted @ 2019-03-12 21:01 pumpkin_J 阅读(404) 评论(0) 推荐(0) 编辑
摘要: 一、双下方法 yield 与 return 的区别: return是结束一个函数,yield不会结束函数 二、监听文件输入的例子 阅读全文
posted @ 2019-03-10 17:21 pumpkin_J 阅读(60) 评论(0) 推荐(0) 编辑