摘要:
介绍matplotlib图片展示和保存的方法 阅读全文
摘要:
结合matplotlib代码实例总结介绍饼图和箱线图的绘制 阅读全文
摘要:
本篇博客将介绍matplotlib中柱状图和直方图的作图方法。 阅读全文
摘要:
对于折线图的绘制,在之前博客的示例中都有使用,在面向对象绘图方法中,一般是创建axes实例后调用plot()方法实现折线图绘制,并通过传递各种参数实现对图像的设置。 散点图的绘制通过axes实例的scatter()方法来实现。scatter()方法的参数和参数取值与绘制折线图的plot()方法基本一致,所以本文将两种图放在一起进行介绍。 阅读全文
摘要:
在一幅图表中,文本、坐标轴和图像的是信息传递的核心,对着三者的设置是作图这最为关心的内容,在上一篇博客中虽然列举了一些设置方法,但没有进行深入介绍,本文以围绕如何对文本和坐标轴进行设置展开(对图像的设置在后续介绍到各种图绘制时介绍)。 阅读全文
摘要:
本篇博客继续上一节的内容,展开介绍三大容器元素创建即通过三大容器可以完成的常用设置。 阅读全文
摘要:
Matplotlib是Python科学计算中使用最多的一个可视化库,功能丰富,提供了非常多的可视化方案,基本能够满足各种场景下的数据可视化需求。但功能丰富从另一方面来说也意味着概念、方法、参数繁多,让许多新手望而却步。 阅读全文
摘要:
从18年6月毕业至今已有一年半的时间,但直到19年年初的时候才从学校的项目中抽离出来,来到女朋友生活的城市,靠自己的能力去工作、生活,所19年对我来说是比较特殊的一年,算是工作元年吧。对于这个元年,一直都想写一篇年终总结来作为一个收尾,也对自己这一年有个交代,可惜年末那段时间一直各种忙碌占据。借着疫情导致春节假期延长的这个空隙,来完成这份总结吧。 阅读全文
摘要:
梯度提升树算法(Gradient Boosting Decision Tree,GBDT)是一个非常经典的机器学习算法,和我们前面介绍过的Adaboost算法一样,都是提升学习系列算法中的一员。从“梯度提升树”这个算法名称中我们也可以看出,这又是一个决策树的集成算法,更进一步地说,这个算法是以CART决策树算法作为基学习算法的一种集成算法。对于CART决策树算法,在之前的博客中已经有详细的介绍,在阅读本文之前请务必先理解CART决策树算法。接下来,本文将会从提升树开始,逐渐深入的介绍GBDT算法。 阅读全文
摘要:
在展开数据分析工作时,我们经常会面临两种困境,一种是原始数据中特征属性太少,“巧妇难为无米之炊”,很难挖掘出潜在的规律,对于这种情况,我们只能在收集这一环节上多下功夫;另一种困境刚好相反,那就是特征属性太多,这真是一种幸福得烦恼,因为特征属性多就意味着信息量大,可挖掘的价值就大,但另一方面也可能造成过拟合和计算量的急剧增大,对于这一问题,最好的方法就是在预处理阶段对数据进行降维。 阅读全文