Loading

摘要: Martrices and Vectors 主要介绍矩阵和向量的概念。 Martrices 矩阵:矩形的数字阵列,通常用大写字母表示。 Matrix: Rectangular array of numbers. 矩阵的维数:行数 \(\times\) 列数 Dimension of matrix: 阅读全文
posted @ 2021-12-28 12:11 活用数据 阅读(317) 评论(0) 推荐(0) 编辑
摘要: Model Representation 主要介绍单变量线性回归算法,以及监督学习的流程。 假如我们想要预测房价,那么,我们需要做的一件事就是构建一个模型,也许是一条直线,这样我们就能够通过房子的大小来预测对应的房价。 在监督学习中我们有一个数据集,这个数据集被称为训练集(Training Set) 阅读全文
posted @ 2021-12-28 12:09 活用数据 阅读(157) 评论(0) 推荐(0) 编辑
摘要: Welcome 简单介绍了什么是机器学习,以及机器学习能做什么。 Machine Learning AI的一个领域 计算机的一种新能力 Examples: Database mining 由于自动化程序以及Web的发展,产生了大量的数据,所以需要机器学习从中挖掘出重要的信息。 Application 阅读全文
posted @ 2021-12-28 12:08 活用数据 阅读(55) 评论(0) 推荐(0) 编辑
摘要: 用神经网络解决分类问题 神经网络也称为人工神经网络(Artificial Neural Network, ANN)。 神经网络的4个概念: 神经元 兴奋传递 激活函数 反向传播机制 用圆圈表示神经元,箭头表示数据流向,一个神经元如图所示: 上图表示的是从一个方向获取数据,经过神经元处理后,将结果数据 阅读全文
posted @ 2021-12-25 19:10 活用数据 阅读(512) 评论(0) 推荐(0) 编辑
摘要: 在机器学习算法的实际应用中,更值得我们关注的其实是如何提高预测结果的准确率。选择不同的模型,调节模型的各种参数,是最容易想到的方法,但目前业界使用更多的其实是集成学习方法。集成学习方法是关注的不是模型的内部结构,而是不同模型之间的组织关系。 集成学习方法:三个臭皮匠胜过诸葛亮 **集成学习(Ense 阅读全文
posted @ 2021-12-25 19:08 活用数据 阅读(314) 评论(0) 推荐(0) 编辑
摘要: 本章讲解无监督学习中最为经典的问题——聚类问题。 用投票表决实现“物以类聚” 标注数据不足始终是监督学习的一大问题,因此业界逐渐开始探索将监督学习和无监督学习结合在一起,首先通过聚类等无监督学习的算法处理数据,通过各种假设和结合聚类结果来给数据打标签,然后再把这些数据喂入监督学习算法进行建模训练,使 阅读全文
posted @ 2021-12-25 08:57 活用数据 阅读(251) 评论(0) 推荐(0) 编辑
摘要: SVM:线性分类器的“王者” 支持向量机兼具形式优美和高效好用,受到学术界和工业界的一致好评。 支持向量机中的三个重要概念: 最大间隔 高维映射 核方法 距离是不同类别的天然间隔 在分类的时候,为了提高鲁棒性,我们需要给正负类两边都多留点空间,使得分割线距离两边都达到最大间隔。 何为“支持向量” 支 阅读全文
posted @ 2021-12-25 08:56 活用数据 阅读(552) 评论(0) 推荐(0) 编辑
摘要: 决策树分类:用if-else进行选择 目前数据竞赛中排名靠前的算法除了深度学习系列之外,机器学习算法基本上都是选用XGBoost或Lightgbm算法,而这两者的基石都是决策树分类算法。 决策树的简单来说就是if-else层层相套的判断结构,同时也是数据结构中典型的树形结构。决策树这一类算法,基本原 阅读全文
posted @ 2021-12-25 08:55 活用数据 阅读(261) 评论(0) 推荐(0) 编辑
摘要: 朴素贝叶斯分类算法应该是统计学味道最浓的一款算法。统计学有两大学派,分别是频率学派和贝叶斯学派。 朴素贝叶斯分类算法的核心要义正是贝叶斯学派中的贝叶斯公式。 朴素贝叶斯:用骰子选择 贝叶斯公式的4个重要概念: 条件概率 先验概率 后验概率 似然度 朴素贝叶斯(Naive Bayes)由两部分组成,” 阅读全文
posted @ 2021-12-25 08:54 活用数据 阅读(217) 评论(0) 推荐(0) 编辑
摘要: 参考资料: 数据科学中常见的9种距离度量方法,内含欧氏距离、切比雪夫距离等 KNN分类算法相对另类,不太依赖数学。 KNN分类算法:用多数表决进行分类 KNN算法中最重要的两个概念: 多数表决 距离 以鸢尾花样本为例,随机选取了两个特征,用不同颜色表示不同的鸢尾花类别: import matplot 阅读全文
posted @ 2021-12-25 08:53 活用数据 阅读(307) 评论(0) 推荐(0) 编辑