随笔 - 383  文章 - 0  评论 - 0  阅读 - 35125 
03 2019 档案
自动机器学习框架之一_Auto-Sklearn
摘要:当我们做完了特征工程之后,就可以代入模型训练和预测,对于模型的选择及调参,主要根据分析者的经验。在具体使用时,经常遇到同一批数据,同一种模型,不同的分析者得出的结果相差很多。 前面学习了几种常用的机器学习方法原理以及适用场景,对于完全没有经验的开发者,只要... 阅读全文
posted @ 2019-03-30 14:12 xieyan0811 阅读(66) 评论(0) 推荐(0) 编辑
TableOne数据分析工具
摘要:前面学习了统计描述和统计假设的Python方法,分析数据表时,需要先确定因变量Y,然后对自变量X逐一分析,最后将结果组织成数据表作为输出,还是比较麻烦,使用TableOne工具可以简化这一过程。 TableOne是生成统计表的工具,常用于生成论文中的表格,... 阅读全文
posted @ 2019-03-23 21:24 xieyan0811 阅读(116) 评论(0) 推荐(0) 编辑
Stata中常用的数据分析命令
摘要:1. 常用的数据分析工具 Stata、SPSS、SAS、R、Python,甚至Excel都可以做数据分析工作。R和Python是程序员的首选,可以通过编写程序实现成整体的数据清洗、分析、挖掘,还可以增加扩展支持,把一套代码应用于类似的数据分析场景中。对于专业... 阅读全文
posted @ 2019-03-17 18:17 xieyan0811 阅读(303) 评论(0) 推荐(0) 编辑
Python写日志文件
摘要:日志文件是记录程序操作及事件的记录文件或记录文件的集合。一般由程序开发人员编写,开发、运维人员共同使用,开发人员可以通过日志调试程序,运维人员通过日志检查程序近期是否正常运行,如果出现异常,则可通过日志快速定位问题。因此,用日志记录程序流程,事件,以及异常时... 阅读全文
posted @ 2019-03-09 19:52 xieyan0811 阅读(97) 评论(0) 推荐(0) 编辑
Seaborn多图组合
摘要:1. jointplot 两变量图 数据分析中常用做图的方式实现相关性分析,即X轴设置为变量A,Y轴设置为变量B,做散点图,由于散点图中点的叠加显示,往往还需要关注每个变量自身的分布情况,jointplot把描述变量的分布图和变量相关的散点图组合在一起,是相... 阅读全文
posted @ 2019-03-02 13:05 xieyan0811 阅读(204) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示