摘要:
sklearn之train_test_split()函数各参数含义(非常全) 在机器学习中,我们通常将原始数据按照比例分割为“测试集”和“训练集”,从 sklearn.model_selection 中调用train_test_split 函数 简单用法如下: X_train,X_test, y_t 阅读全文
摘要:
//2019.08.01下午机器学习算法1——k近邻算法1、k近邻算法是学习机器学习算法最为经典和简单的算法,它是机器学习算法入门最好的算法之一,可以非常好并且快速地理解机器学习的算法的框架与应用。2、kNN机器学习算法具有以下的特点:(1)思想极度简单(2)应用的数学知识非常少(3)解决相关问题的 阅读全文
摘要:
//2019.08.01机器学习基础入门1-21、半监督学习的数据特征在于其数据集一部分带有一定的"标记"和或者"答案",而另一部分数据没有特定的标记,而更常见的半监督学习数据集产生的原因是各种原因引起的数据缺失。2、半监督学习的数据集处理方式大多采用:先用无监督学习算法对数据进行相关的处理,再利用 阅读全文
摘要:
机器学习入门介绍(非常易懂) //2019.07.31早上机器学习基本概念介绍1、机器学习的含义在于让机器去学习,其核心在于学习。 2、最早的机器学习应用是在垃圾邮件的分辨,它开启了机器学习的领域和时代 3、机器学习的典型应用主要体现在以下几个方面:(1)图像识别(2)语音识别(3)数字识别(4). 阅读全文
摘要:
//2019.07.29-301、Keras 是提供一些高度可用神经网络框架的 Python API ,能帮助你快速的构建和训练自己的深度学习模型,它的后端是 TensorFlow 或者 Theano 。 2、Keras 被认为是构建神经网络的未来,以下是一些它流行的原因:(1)轻量级和快速开发:K 阅读全文
摘要:
Python Sklearn.metrics 简介及应用示例 利用Python进行各种机器学习算法的实现时,经常会用到sklearn(scikit-learn)这个模块/库。 无论利用机器学习算法进行回归、分类或者聚类时,评价指标,即检验机器学习模型效果的定量指标,都是一个不可避免且十分重要的问题。 阅读全文
摘要:
//2019.07.26#scikit-learn数据挖掘工具包1、Scikit learn是基于python的数据挖掘和机器学习的工具包,方便实现数据的数据分析与高级操作,是数据分析里面非常重要的工具包。2、Scikit Learn是数据挖掘重要的工具包,其官网为http://scikit-lea 阅读全文
摘要:
metrics.png wiki.png 机器学习度量指标 分类评估指标 TN TP FN FP TP:预测为正向(P),实际上预测正确(T),即判断为正向的正确率 TN:预测为负向(N),实际上预测正确(T),即判断为负向的正确率 FP:预测为正向(P),实际上预测错误(F),误报率,即把负向判断 阅读全文
摘要:
//2019.07.23 1、箱形图,又称为盒式图,一般可以很好地反映出数据分布的特征,也可以进行多项数据之间分布特征的比较,它主要包含五个基础数据:中位数,两个上下分位数以及上下边缘线数据 其中的一些参数具体含义及其计算过程如下: 2、双轴图的绘制代码:import numpy as npimpo 阅读全文
摘要:
//2019.07.22pyhton中matplotlib模块的应用pyhton中matplotlib是可视化图像库的第三方库,它可以实现图像的可视化,输出不同形式的图形1、可视化图形的输出和展示需要调用matplotlib第三方库的函数plt.show(),它的功能类似于print,相当于打印出自 阅读全文