随笔分类 - 统计分析
统计知识
网站分析
Python图形化数据分析库汇总
摘要:说明 使用python进行数据分析时,有很多工作使用的代码具有重复性和固定性的特点,比如:数据清洗、模板式数据可视化。尤其是在数据探索阶段,使用具有图形化界面(GUI)的数据分析工具可以事半功倍,似乎此类工具也被称为autoEDA: Automated exploratory data analys
阅读全文
R语言中 fitted()和predict()的区别
摘要:fitted是拟合值,predict是预测值。模型是基于给定样本的值建立的,在这些给定样本上做预测就是拟合。在新样本上做预测就是预测。你可以找一组数据试试,结果如何。fit<-lm(weight~height,data=women)fitted(fit) predict(fit,newdata=da...
阅读全文
统计学中z分布、t分布、F分布及χ^2分布
摘要:统计学中z分布、t分布、F分布及χ^2分布
阅读全文
数据挖掘读书笔记 -- 常见数据处理技巧
摘要:数据挖掘读书笔记 -- 常见数据处理技巧
阅读全文
数据挖掘算法链接
摘要:数据挖掘分类算法之决策树(http://blog.sina.com.cn/s/blog_5fc375650100jf6b.html)什么是信息增益(InformationGain)?(http://blog.sina.com.cn/s/blog_5fc375650100jgxg.html)
阅读全文
数据分析师的品质与思维模式
摘要:信念:相信数据背后存在值得挖掘的规律、警示和结论;信心:相信自己以及团队的分析能力;数据分析基本方法论:做假设、定标准、作比较、看趋势、观全局、辨真伪、下结论。
阅读全文
Google AdWords 广告排名首选项
摘要:Google AdWords 广告排名首选项
阅读全文
Analysis Guidelines
摘要:This section describes some best practices for analysis. These practices come from experience of analysts in the Data Mining Team. We list a few things you should do (or at least consider doing) and some pitfalls to avoid. We provide a list of issues to keep in mind that could affect the the quality
阅读全文