随笔分类 - Python
摘要:1、机器学习算法的整体使用步骤如下: (1)从scikitlearn库中调用相应的机器学习算法模块;(2)输入相应的算法参数定义一个新的算法;(3)输入基础训练数据集利用scaler对其进行数据归一化处理 (4)对于归一化的数据集进行机器学习算法的训练fit过程;(5)输入测试数据集对其结果进行预测
阅读全文
摘要:机器学习算法参数的网格搜索实现: //2019.08.031、scikitlearn库中调用网格搜索的方法为:Grid search,它的搜索方式比较统一简单,其对于算法批判的标准比较复杂,是一种复合交叉批判方式,不仅仅是准确率。其具体的实现方式如下(以KNN算法的三大常用超参数为例):#使用sci
阅读全文
摘要://2019.08.02下午#机器学习算法中的超参数与模型参数1、超参数:是指机器学习算法运行之前需要指定的参数,是指对于不同机器学习算法属性的决定参数。通常来说,人们所说的调参就是指调节超参数。2、模型参数:是指算法在使用过程中需要学习得到的参数,即输入与输出之间映射函数中的参数,它需要通过对于训
阅读全文
摘要:1、k近邻算法可以说是唯一一个没有训练过程的机器学习算法,它含有训练基础数据集,但是是一种没有模型的算法,为了将其和其他算法进行统一,我们把它的训练数据集当做它的模型本身。2、在scikitlearn中调用KNN算法的操作步骤如下(利用实际例子举例如下):#1导入相应的数据可视化模块import n
阅读全文
摘要:sklearn之train_test_split()函数各参数含义(非常全) 在机器学习中,我们通常将原始数据按照比例分割为“测试集”和“训练集”,从 sklearn.model_selection 中调用train_test_split 函数 简单用法如下: X_train,X_test, y_t
阅读全文
摘要://2019.08.01下午机器学习算法1——k近邻算法1、k近邻算法是学习机器学习算法最为经典和简单的算法,它是机器学习算法入门最好的算法之一,可以非常好并且快速地理解机器学习的算法的框架与应用。2、kNN机器学习算法具有以下的特点:(1)思想极度简单(2)应用的数学知识非常少(3)解决相关问题的
阅读全文
摘要://2019.08.01机器学习基础入门1-21、半监督学习的数据特征在于其数据集一部分带有一定的"标记"和或者"答案",而另一部分数据没有特定的标记,而更常见的半监督学习数据集产生的原因是各种原因引起的数据缺失。2、半监督学习的数据集处理方式大多采用:先用无监督学习算法对数据进行相关的处理,再利用
阅读全文
摘要:机器学习入门介绍(非常易懂) //2019.07.31早上机器学习基本概念介绍1、机器学习的含义在于让机器去学习,其核心在于学习。 2、最早的机器学习应用是在垃圾邮件的分辨,它开启了机器学习的领域和时代 3、机器学习的典型应用主要体现在以下几个方面:(1)图像识别(2)语音识别(3)数字识别(4).
阅读全文
摘要://2019.07.29-301、Keras 是提供一些高度可用神经网络框架的 Python API ,能帮助你快速的构建和训练自己的深度学习模型,它的后端是 TensorFlow 或者 Theano 。 2、Keras 被认为是构建神经网络的未来,以下是一些它流行的原因:(1)轻量级和快速开发:K
阅读全文
摘要:Python Sklearn.metrics 简介及应用示例 利用Python进行各种机器学习算法的实现时,经常会用到sklearn(scikit-learn)这个模块/库。 无论利用机器学习算法进行回归、分类或者聚类时,评价指标,即检验机器学习模型效果的定量指标,都是一个不可避免且十分重要的问题。
阅读全文
摘要://2019.07.26#scikit-learn数据挖掘工具包1、Scikit learn是基于python的数据挖掘和机器学习的工具包,方便实现数据的数据分析与高级操作,是数据分析里面非常重要的工具包。2、Scikit Learn是数据挖掘重要的工具包,其官网为http://scikit-lea
阅读全文
摘要:metrics.png wiki.png 机器学习度量指标 分类评估指标 TN TP FN FP TP:预测为正向(P),实际上预测正确(T),即判断为正向的正确率 TN:预测为负向(N),实际上预测正确(T),即判断为负向的正确率 FP:预测为正向(P),实际上预测错误(F),误报率,即把负向判断
阅读全文
摘要://2019.07.23 1、箱形图,又称为盒式图,一般可以很好地反映出数据分布的特征,也可以进行多项数据之间分布特征的比较,它主要包含五个基础数据:中位数,两个上下分位数以及上下边缘线数据 其中的一些参数具体含义及其计算过程如下: 2、双轴图的绘制代码:import numpy as npimpo
阅读全文
摘要://2019.07.22pyhton中matplotlib模块的应用pyhton中matplotlib是可视化图像库的第三方库,它可以实现图像的可视化,输出不同形式的图形1、可视化图形的输出和展示需要调用matplotlib第三方库的函数plt.show(),它的功能类似于print,相当于打印出自
阅读全文
摘要:一、groupby 能做什么? python中groupby函数主要的作用是进行数据的分组以及分组后地组内运算! 对于数据的分组和分组运算主要是指groupby函数的应用,具体函数的规则如下: df[](指输出数据的结果属性名称).groupby([df[属性],df[属性])(指分类的属性,数据的
阅读全文
摘要://2019.07.19/20 python中pandas数据分析基础(数据重塑与轴向转化、数据分组与分组运算、离散化处理、多数据文件合并操作) 3.1 数据重塑与轴向转换1、层次化索引使得一个轴上拥有多个索引2、series多层次索引:(1)series的层次化索引:主要可以通过s[索引第1层:索
阅读全文
摘要://2019.07.18pyhton中pandas数据分析学习——第二部分2.1 数据格式转换1、查看与转换表格某一列的数据格式:(1)查看数据类型:某一列的数据格式:df["列属性名称"].dtype(2)数据类型转换:某一列的数据类型转换需要用到数据转换函数:df[列属性名称]=df[列属性名称
阅读全文
摘要://2019.07.18 pandas是python提供的非常好用的数据分析模块,但是在使用pandas进行数据分析时,有时候需要查看打印的结果,当dataframe行数或者列数比较多的时候,打印结果总是有一些省略号,不能完整的看到数据的大致分布,比如最大值,最小值,等等,了解数据分布的区间有助于进
阅读全文
摘要://2019.07.17 pyhton中pandas数据分析基础入门(一文看懂pandas), 教你迅速入门pandas数据分析模块(后面附有入门完整代码,可以直接拷贝运行,含有详细的代码注释,可以轻松帮助你入门理解) 1.1 pandas模块简介 首先,使用pandas相应的操作之前都需要导入pa
阅读全文
摘要://2019.07.16python中pandas模块应用1、pandas是python进行数据分析的数据分析库,它提供了对于大量数据进行分析的函数库和各种方法,它的官网是http://pandas.pydata.org/; 2、对于pandas数据分析模块的应用主要包括:数据结构的定义,对于数据表
阅读全文