Fork me on GitHub

随笔分类 -  数据分析

摘要:seaborn绘制多子图可视化 阅读全文
posted @ 2022-02-23 09:45 奥辰 阅读(17507) 评论(0) 推荐(1) 编辑
摘要:继续介绍seaborn绘制箱型图和小提琴图,探索数据分布。 阅读全文
posted @ 2022-02-23 09:41 奥辰 阅读(5783) 评论(0) 推荐(0) 编辑
摘要:在过去很长一段时间,我一直分不清直方图和条形图,或者说一直认为两者是一样的,直到看到histplot()和barplot()两个绘图方法,前者是绘制直方图,后者是绘制条形图。通过仔细对比两者各项功能后,我得出结论,两者十分相似,但有些许不同:直方图侧重于统计数据在数轴上各个位置的分布情况,统计的对象往往是连续型数值数据的,根据数值的大小分区间进行分组统计,例如有100个学生的身高,需要统计100个学生在各个身高段的分布情况;条形图不同,条形图分组往往是针对离散型数据或者说定性的分类数据,例如对比男生的平均身高和女生的平均身高。不知道我这么理解对不对,欢迎留言讨论。 阅读全文
posted @ 2022-02-23 09:37 奥辰 阅读(10192) 评论(0) 推荐(0) 编辑
摘要:接着上篇,继续介绍seaborn作图,本篇对seaborn绘制散点图(scatterplot)、线图(lineplot)展开说明。 阅读全文
posted @ 2022-02-23 09:29 奥辰 阅读(4025) 评论(0) 推荐(0) 编辑
摘要:jupyter lab是科学计算的一个十分便捷工具,但其安装配置稍有些繁琐,本文针对jupyter lab安装配置全过程进行记录总结,可使读者少走很多弯路。 阅读全文
posted @ 2020-08-24 09:02 奥辰 阅读(10773) 评论(0) 推荐(0) 编辑
摘要:介绍matplotlib图片展示和保存的方法 阅读全文
posted @ 2020-03-15 18:22 奥辰 阅读(14051) 评论(0) 推荐(1) 编辑
摘要:结合matplotlib代码实例总结介绍饼图和箱线图的绘制 阅读全文
posted @ 2020-03-13 09:45 奥辰 阅读(2272) 评论(0) 推荐(0) 编辑
摘要:本篇博客将介绍matplotlib中柱状图和直方图的作图方法。 阅读全文
posted @ 2020-03-11 15:15 奥辰 阅读(8610) 评论(0) 推荐(0) 编辑
摘要:对于折线图的绘制,在之前博客的示例中都有使用,在面向对象绘图方法中,一般是创建axes实例后调用plot()方法实现折线图绘制,并通过传递各种参数实现对图像的设置。 散点图的绘制通过axes实例的scatter()方法来实现。scatter()方法的参数和参数取值与绘制折线图的plot()方法基本一致,所以本文将两种图放在一起进行介绍。 阅读全文
posted @ 2020-03-05 09:15 奥辰 阅读(6579) 评论(1) 推荐(0) 编辑
摘要:本篇博客继续上一节的内容,展开介绍三大容器元素创建即通过三大容器可以完成的常用设置。 阅读全文
posted @ 2020-02-27 09:18 奥辰 阅读(3962) 评论(0) 推荐(3) 编辑
摘要:Matplotlib是Python科学计算中使用最多的一个可视化库,功能丰富,提供了非常多的可视化方案,基本能够满足各种场景下的数据可视化需求。但功能丰富从另一方面来说也意味着概念、方法、参数繁多,让许多新手望而却步。 阅读全文
posted @ 2020-02-23 12:01 奥辰 阅读(1663) 评论(0) 推荐(0) 编辑
摘要:预处理操作是机器学习整个周期中必不可少的一个过程,也是最能快速改善模型性能的一个过程,往往稍微转换一下特征属性的形态,就能得到性能的极大提升。当然,数据预处理绝对也是耗时最长的一个过程,这一过程不仅要求洞悉整个数据集结构分布,还要探查每一个特征属性细节情况,并作出应对处理,使数据以最适合的状态传输给模型。 针对预处理操作,sklearn中提供了许多模块工具,灵活使用工具可以让数据预处理轻松很多。 本文简要介绍数据预处理中的一些主要方法,并结合sklearn中提供的模块进行实践。 阅读全文
posted @ 2019-12-17 07:51 奥辰 阅读(1937) 评论(0) 推荐(2) 编辑
摘要:TensorBoard是TensorFlow中的又一神器级工具,想用户提供了模型可视化的功能。我们都知道,在构建神经网络模型时,只要模型开始训练,很多细节对外界来说都是不可见的,参数如何变化,准确率怎么样了,loss还在减小吗,这些问题都很难弄明白。但是,TensorBoard通过结合web应用为我们提供了这一功能,它将模型训练过程的细节以图表的形式通过浏览器可视化得展现在我们眼前,通过这种方式我们可以清晰感知weight、bias、accuracy的变化,把握训练的趋势。 阅读全文
posted @ 2019-10-25 08:15 奥辰 阅读(12273) 评论(0) 推荐(3) 编辑
摘要:本文总结TensorFlow2.0中均方差损失函数和交叉熵损失函数。 阅读全文
posted @ 2019-10-23 16:48 奥辰 阅读(5044) 评论(0) 推荐(0) 编辑
摘要:激活函数是深度学习,亦或者说人工神经网络中一个十分重要的组成部分,它可以对神经元的接收信息进行非线性变换,将变换后的信息输出到下一层神经元。 阅读全文
posted @ 2019-10-21 08:03 奥辰 阅读(2854) 评论(0) 推荐(0) 编辑
摘要:在整个机器学习过程中,除了训练模型外,应该就属数据预处理过程消耗的精力最多,数据预处理过程需要完成的任务包括数据读取、过滤、转换等等。为了将用户从繁杂的预处理操作中解放处理,更多地将精力放在算法建模上,TensorFlow中提供了data模块,这一模块以多种方式提供了数据读取、数据处理、数据保存等功能。本文重点是data模块中的Dataset对象。 阅读全文
posted @ 2019-10-14 08:13 奥辰 阅读(16325) 评论(4) 推荐(4) 编辑
摘要:总结TensorFlow2.0中实现张量限幅功能的多个api,包括 maxmium()、minmium()、clip_by_value()、relu()、cli_by_norm()、clip_by_global_norm() 阅读全文
posted @ 2019-10-08 22:02 奥辰 阅读(1418) 评论(0) 推荐(1) 编辑
摘要:总结TensorFlow2.0中几个填充复制功能的api。 阅读全文
posted @ 2019-10-07 16:54 奥辰 阅读(4537) 评论(0) 推荐(1) 编辑
摘要:总结TensorFlow2.0中排序,求最大值、最小值、平均值等方法,涉及sort()、argsort()、reduce_min()、reduce_max()、redece_mean()、argmin()、argmax()等方法。 阅读全文
posted @ 2019-10-02 16:22 奥辰 阅读(5385) 评论(0) 推荐(0) 编辑
摘要:TensorFlow2.0张量数学运算,包括加(+)、减(-)、点乘(*)、除(/)、地板除法(//)、取余(%)、指数运算、对数运算、矩阵相乘、范数等。 阅读全文
posted @ 2019-09-26 20:33 奥辰 阅读(4597) 评论(1) 推荐(3) 编辑

点击右上角即可分享
微信分享提示