3D 散点图的绘制
摘要:一般情况下,我们用到最多的是axes3d() 中的axes3d.Axes3D()类,AxesD() 类下面存在散点图,线性图,柱状图,曲线图等各种制图方式。 采用matplotlib 生成散点图。 一, 首先必须要导入包 二,读取数据 data = pd.read_excel('D:/pythond
阅读全文
关系数据库和非关系型数据
摘要:一、关系型数据库 关系型数据库最典型的数据结构是表,由二维表及其之间的联系所组成的一个数据组织优点:1、易于维护:都是使用表结构,格式一致;2、使用方便:SQL语言通用,可用于复杂查询;3、复杂操作:支持SQL,可用于一个表以及多个表之间非常复杂的查询。缺点:1、读写性能比较差,尤其是海量数据的高效
阅读全文
figure 的使用
摘要:1.figure语法及操作(1)figure语法说明 figure(num=None, figsize=None, dpi=None, facecolor=None, edgecolor=None, frameon=True) num:图像编号或名称,数字为编号 ,字符串为名称figsize:指定f
阅读全文
机器学习--模型分类--贝叶斯
摘要:朴素贝叶斯的“朴素”,并不是简单的意思,而是指样本的特征之间是相互独立的。在所有的机器学习分类算法中, 朴素贝叶斯和其他绝大部分分类算法都不同,其他分类算法基本都是判别方法,即直接学习出特征输出Y和特征向 量X之间的关系,要么是决策函数Y=f(X),要么是条件分布P(Y|X),但是朴素贝叶斯却是生成
阅读全文
机器学习中---分类模型--决策树模型
摘要:决策树模型 决策树(DecisionTree, DT)是一种常见的用于分类和回归的非参数监督学习方法,目标是创建一个模型,通过从数 据特性中推导出简单的决策规则来预测目标变量的值。决策树模型的优点在于:1,简单容易理解,数据结构可以可视化表达。2,需要很少的数据准备,其他技术通常需 要数据标准化,需
阅读全文
分类模型的评估
摘要:在 机器学习岭回归器的构建和模型评估 中,讲解了回归模型的评估方法,主要有均方误差MSE, 解释方差分,R方得分等指标。同样的,对于分类模型,也有很多评估指标来判断该分类模型是否达到我们的要求,这几个评估指标主要是指: 准 确率(accuracy),精确率(precision),召回率(recall
阅读全文
导数
摘要:导数是用来找到“线性近似”的数学工具 在机器学习算法中,我们运用到了导数,下来我们来看看导数的变化... 在我学习微积分的过程中,我对导数的认知经历了三次变化: 导数是变化率、是切线的斜率、是速度、是加速度 导数是用来找到“线性近似”的数学工具 导数是线性变换 我们认为,导数是曲线的变化率、是瞬时速
阅读全文
贝叶斯--- 高斯贝叶斯//多项式贝叶斯//伯努利贝叶斯
摘要:贝叶斯:高斯贝叶斯,多项式贝叶斯,伯努利贝叶斯 高斯贝叶斯:先验为高斯分布的朴素贝叶斯 多项式贝叶斯;先验为多项式的分布的朴素贝叶斯 伯努利贝叶斯:先验为伯努利分布的朴素贝叶斯,适用于样本很稀松的二元离散值或很稀松的多元离散值情况
阅读全文
matplotlib 中的柱状图
摘要:def drawBar(): pyplot.bar(range(5),[100,200,300,400,400]) pyplot.xticks(range(5),['A','B','C','D','E']) #设置横坐标 pyplot.xlabel(u'横坐标文字说明') pyplot.ylabel
阅读全文
使用 wordcloud 构建词云图
摘要:from wordcloud import WordCloudfrom matplotlib import pyplot as pltfrom PIL import Imageimport numpy as np# 1.准备数据content = open('豆瓣舌尖中国.txt','rb').re
阅读全文