paulonetwo

机器学习工程师 - Udacity 独立成分分析

摘要：我们将使用独立成分分析方法从三个观察结果中提取信号，每个观察结果都包含不同的原始混音信号。数据集首先看看手头的数据集。我们有三个 WAVE 文件，正如我们之前提到的，每个文件都是混音形式。如果你之前没有在 python 中处理过音频文件，没关系，它们实际上就是浮点数列表。首先加载第一个音频文件阅读全文

posted @ 2018-11-22 20:28 paulonetwo 阅读(369) 评论(0) 推荐(0) 编辑

机器学习工程师 - Udacity 使用特征脸方法和 SVM 进行脸部识别

摘要：在此示例中使用的数据集来自“Labeled Faces in the Wild”，亦称为 LFW_ Download (233MB) 并经过预处理。这是原始数据。加载数据集 Total dataset size:n_samples: 1288n_features: 1850n_classes: 7 阅读全文

posted @ 2018-11-22 13:39 paulonetwo 阅读(343) 评论(0) 推荐(0) 编辑

机器学习工程师 - Udacity 非监督学习 Part Two

摘要：四、特征缩放1.特征缩放的优点：Andrew在他的机器学习课程里强调，在进行学习之前要进行特征缩放，目的是保证这些特征都具有相近的尺度，这将帮助梯度下降算法更快地收敛。python里常用的是preprocessing.StandardScaler()，公式为：(X-mean)/std，得到的结果是，阅读全文

posted @ 2018-11-22 13:18 paulonetwo 阅读(323) 评论(0) 推荐(0) 编辑

机器学习工程师 - Udacity 非监督学习 Part One

摘要：一、聚类 1.k-means首先随意给出聚类中心，然后进行分配和优化。初始位置非常重要，不同的初始位置可能会使最后的聚类结果完全不一样。并且可能会使结果陷入局部最优： 2.sklearn中的k-means最重要的三个参数：n_cluster：聚类数量，默认为8；max_iter：最大迭代次数，默认为阅读全文

posted @ 2018-11-17 18:16 paulonetwo 阅读(634) 评论(0) 推荐(0) 编辑

机器学习工程师 - Udacity 项目2: 为CharityML寻找捐献者

摘要：开始在这个项目中，你将使用1994年美国人口普查收集的数据，选用几个监督学习算法以准确地建模被调查者的收入。然后，你将根据初步结果从中选择出最佳的候选算法，并进一步优化该算法以最好地建模这些数据。你的目标是建立一个能够准确地预测被调查者年收入是否超过50000美元的模型。这种类型的任务会出现在那些依阅读全文

posted @ 2018-11-16 19:01 paulonetwo 阅读(789) 评论(0) 推荐(0) 编辑

机器学习工程师 - Udacity SVM边际误差计算

摘要：计算边际误差即计算 SVM 中两个间隔之间的距离。三条线方程如下：Wx+b=1Wx+b=0Wx+b=-1由于这三条线为等距平行线，要想确定第一条线和第三条线之间的距离，我们只需要计算前两条线之间的距离，接着将这个数字乘以二。这也就是说我们需要确定图 1 中前两条线之间的距离。图1 请注意，由于我们阅读全文

posted @ 2018-11-16 19:00 paulonetwo 阅读(532) 评论(0) 推荐(0) 编辑

机器学习工程师 - Udacity 监督学习

摘要：一、线性回归1.线性回归：一种用于预测数值数据的非常有效的算法。假设直线为y=w1x+w2；点为(p,q)。调整直线的技巧：1)绝对值技巧：如果点在直线上方，y=(w1+pɑ)x+(w2+ɑ)，其中ɑ为学习速率。点在直线下方，y=(w1-pɑ)x+(w2-ɑ)。p存在的原因：a.如果点不在y轴的右阅读全文

posted @ 2018-11-14 21:10 paulonetwo 阅读(502) 评论(0) 推荐(0) 编辑

机器学习工程师 - Udacity 项目 1: 预测波士顿房价

摘要：第一步. 导入数据在这个项目中，你将利用马萨诸塞州波士顿郊区的房屋信息数据训练和测试一个模型，并对模型的性能和预测能力进行测试。通过该数据训练后的好的模型可以被用来对房屋做特定预测尤其是对房屋的价值。对于房地产经纪等人的日常工作来说，这样的预测模型被证明非常有价值。此项目的数据集来自UCI机器阅读全文

posted @ 2018-11-10 17:42 paulonetwo 阅读(1460) 评论(0) 推荐(0) 编辑

机器学习工程师 - Udacity 项目 0: 预测你的下一道世界料理

摘要：第一步. 下载并导入数据 1.1 数据集：https://www.kaggle.com/c/whats-cooking/data 1.2 加载数据菜名数据集一共包含 39774 训练数据和 9944 测试样例。数据成功载入！ 1.3 数据预览为了查看我们的数据集的分布和菜品总共的种类，我们打印出阅读全文

posted @ 2018-11-08 21:06 paulonetwo 阅读(1230) 评论(0) 推荐(0) 编辑

机器学习工程师 - Udacity 机器学习基础

摘要：一、评估指标 1.混淆矩阵： 2.准确率(accuracy)：正确分类的点占总点数的比例。在sklearn中很容易计算：准确率不适用偏斜严重的数据集。3.精度(precision)：所有预测为阳性的点中，真阳性的点的占比；召回率(recall)：所有标记为阳性的点中，正确预测为阳性的占比；4.F1 阅读全文

posted @ 2018-11-07 20:20 paulonetwo 阅读(650) 评论(0) 推荐(0) 编辑