利用python进行数据分析
利用python进行数据分析,需要了解一些基本的方法,比如掌握回归分析的方法,通过线性回归和逻辑回归,其实你就可以对大多数的数据进行回归分析,并得出相对精确地结论。这部分需要掌握的知识点如下:
回归分析:线性回归、逻辑回归
基本的分类算法:决策树、随机森林、朴素贝叶斯……
基本的聚类算法:k-means……
特征工程基础:如何用特征选择优化模型
Python 数据分析包:scipy、numpy、scikit-learn等
在这里,我们需要重点掌握的就是回归分析,利用描述性的统计分析和回归分析就可以对大多数分析问题得到不错的结果。
另外,最好知道面对不同类型的问题的时候更适合用哪种算法模型,对于模型的优化,你需要去学习如何通过特征提取、参数调节来提升预测的精度。这有点像是数据挖掘和机器学习。
剩下的就是去实战积累经验了。
1、利用提到的公开数据集,可以找一些自己感兴趣的方向的数据,尝试从不同的角度来分析,看看能够得到哪些有价值的结论。
2、从生活、工作中去发现一些可用于分析的问题,比如上面说到的电商、招聘、社交等平台等数据中都有着很多可以挖掘的问题。
invictus maneo!