摘要: 概念 监督学习(Supervised Learning) 从给定标注的训练数据集中学习出一个函数,根据这个函数为新函数进行标注 无监督学习(Unsupervised Learning) 从给定无标注的训练数据中学习出一个函数,根据这个函数为所有数据标注 分类(Classification) 监督学习 阅读全文
posted @ 2018-10-04 23:25 我不要被你记住 阅读(1400) 评论(0) 推荐(0) 编辑
摘要: 概念: 神经网络:全称为人工神经网络,是一种模仿生物神经网络(动物的中枢神经系统,特别是大脑)的结构和功能的数学模型或计算模型 生物神经网络:神经细胞是构成神经系统的基本单元,称为生物神经元,简称神经元 一般采用三到五层 首先导入自变量和因变量 1 import pandas; 2 from pan 阅读全文
posted @ 2018-10-04 20:03 我不要被你记住 阅读(2351) 评论(0) 推荐(0) 编辑
摘要: 概念 针对因变量为分类变量而进行回归分析的一种统计方法,属于概率型非线性回归 优点:算法易于实现和部署,执行效率和准确度高 缺点:离散型的自变量数据需要通过生成虚拟变量的方式来使用 在线性回归中,因变量是连续性变量,那么线性回归能根据因变量和自变量存在的线性关系来构造回归方程,因变量变成分类变量后就 阅读全文
posted @ 2018-10-04 17:53 我不要被你记住 阅读(2413) 评论(0) 推荐(0) 编辑
摘要: 1、使用scatter_matrix判断个特征的数据分布及其关系 散步矩阵(scatter_matrix) Pandas中散步矩阵的函数原理 参数如下: frame:(DataFrame),DataFrame对象 alpha:(float,可选),图像透明度,一般取(0,1] figsize:((f 阅读全文
posted @ 2018-10-04 11:45 我不要被你记住 阅读(5394) 评论(0) 推荐(0) 编辑