随笔分类 -  【机器学习】 科学计算与可视化

摘要:简介第七章详细介绍了三种概率分布及其应用,而我们则将进行程序编写,来计算这三种概率分布.几何分布scipy几何分布原文地址 下面是书中一些重要公式的代码实现,此处我们直接调用scipy的类库,不再自己编写。首先当然是滑雪问题,固执的查德先生明明只有百分之二十... 阅读全文
posted @ 2018-07-12 12:48 FontTian 阅读(499) 评论(0) 推荐(0) 编辑
摘要:量度两类量度:(1) 集中趋势的量度—>平均值,中位数,众数(2) 分散性与变异性的亮度—>全距(极值),四分位数(扩展:箱型图),方差与标准差,标准分获取数据import pandas as pdimport numpy as npimport matplotlib... 阅读全文
posted @ 2018-06-07 13:37 FontTian 阅读(320) 评论(0) 推荐(0) 编辑
摘要:之前在比赛的时候需要用Python实现灰色关联分析,从网上搜了下只有实现两个列之间的,于是我把它改写成了直接想Pandas中的计算工具直接计算person系数那样的形式,可以对整个矩阵进行运算,并给出了可视化效果,效果请见实现灰色关联分析法对于两个系统之间的因素,其随... 阅读全文
posted @ 2018-06-07 13:22 FontTian 阅读(14297) 评论(1) 推荐(0) 编辑
摘要:序言在深入浅出统计学的第一张中一共出现了4类图像: 1. 比较基本比例—>饼图 2. 比较数值的高低条形图(基本条形图,堆积条形图,分段条形图) 3. 连续数据的对比(等距直方图—>频数,非等距直方图—>频数密度) 4. 截止到某时间点的累计总量—>累积频数图... 阅读全文
posted @ 2018-06-04 21:38 FontTian 阅读(819) 评论(0) 推荐(0) 编辑
摘要:简介对于数据科学而言,我们要做的第一件事情,必然是了解我们的数据.而在数据探索期间,pandas和matplotlib 则是我们进行数据探索的利器.本文主要分为三个部分,第一部分是利用pandas进行一些基础的数据分析,第二部分是利用pandas自身功能进行一些有用的... 阅读全文
posted @ 2017-10-10 07:42 FontTian 阅读(207) 评论(0) 推荐(0) 编辑
摘要:问题出现与解决Pandas进行数据处理之后,假如想将其转化为json,会出现一个bug,就是中文文字是以乱码存储的,也就是\uXXXXXX的形式,翻了翻官网文档,查了源码的参数,(多谢网友提醒)需要设置js001 = df1.to_json(force_ascii=F... 阅读全文
posted @ 2017-07-16 22:44 FontTian 阅读(1237) 评论(0) 推荐(0) 编辑
摘要:如何快速入门pandas是python的一个出色的统计类库,同时也是python的科学计算与可视化生态系统中不可或缺的一环,但是如此出色的pandas却十分的简单易上手而且拥有出色的官方文档,假如你想快速的掌握pandas的使用的话,那么官方文档必是首选.建议直接访问... 阅读全文
posted @ 2017-07-14 21:27 FontTian 阅读(490) 评论(0) 推荐(0) 编辑
摘要:Pandas 无法显示中文问题 解决方案Pandas在绘图时,会显示中文为方块,主要原因有二:matplotlib 字体问题seaborn 字体问题只需要在文件开始动态设置字体配置就可以了,但是要注意,字体设置可能需要尝试多次,比如我一开始设置的win10中的’Sam... 阅读全文
posted @ 2017-07-13 00:41 FontTian 阅读(442) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示