大数据学习相关知识点

Anaconda:一个开源的Python发行版本

Spyder:Python(x,y)的作者为它开发的一个简单的集成开发环境

MATLAB:美国MathWorks公司出品的商业数学软件,用于算法开发、数据可视化、数据分析以及数值计算的高级技术计算语言和交互式环境,主要包括MATLAB和Simulink两大部分。

https://matplotlib.org/

K-means算法是硬聚类算法

F1分数(F1 Score),是统计学中用来衡量二分类模型精确度的一种指标。

逻辑回归模型

SVM(Support Vector Machine)指的是支持向量机,是常见的一种判别方法。在机器学习领域,是一个有监督的学习模型,通常用来进行模式识别、分类以及回归分析。

决策树之CART(分类回归树)

基尼系数

随机森林指的是利用多棵树对样本进行训练并预测的一种分类器

过拟合/欠拟合

Bagging和Boosting

GBDT 

https://www.netcraft.com/ 可查询各网站所使用的技术及服务端OS等信息

虚拟机 在BIOS中可设置,设置后虚拟机效果会更好

posted @ 2018-11-02 09:34  大海胸懷  阅读(214)  评论(0编辑  收藏  举报