摘要: pip 批量导出包含环境中所有组件的requirements.txt文件 pip 批量安装requirements.txt文件中包含的组件依赖 pip 导出的requirements.txt文件格式 conda 批量导出包含环境中所有组件的requirements.txt文件 conda 批量安装r 阅读全文
posted @ 2019-03-27 10:36 马小豆包 阅读(10501) 评论(0) 推荐(1) 编辑
摘要: pydev 官网 安装手册 PyDev requires Java 8 and Eclipse 4.6 (Neon) in order to run and only supports Python 2.6 onwards. I.e.: Python (2.6 or newer) Jython (2 阅读全文
posted @ 2019-03-14 20:12 马小豆包 阅读(600) 评论(0) 推荐(0) 编辑
摘要: Keras 2.2.4版本和 tensorflow1.2.1 版本不兼容导致的错误。降低Keras 为2.1.2版本 阅读全文
posted @ 2019-02-22 22:55 马小豆包 阅读(948) 评论(0) 推荐(0) 编辑
摘要: The Beatles 乐队的 Midi文件下载地址 puppeteer官方github地址 midi文件爬取示例代码github地址 1、安装npm 参考:安装npm及cnpm(Windows) 修改参数 npm install 的时候总是为sill状态,修改为淘宝URL源 2、安装puppete 阅读全文
posted @ 2019-02-12 19:23 马小豆包 阅读(852) 评论(0) 推荐(0) 编辑
摘要: 一、安装JDK,配置Java环境变量 1.下载JDK,Java SE 8的官方网址是http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html 根据自己的系统版本来选择是要使用32位版还是64 阅读全文
posted @ 2019-01-07 14:30 马小豆包 阅读(652) 评论(0) 推荐(0) 编辑
摘要: Lecture 18—Photo OCR 应用实例:图片文字识别 18.1 问题描述和流程图 Problem Description and Pipeline 图像文字识别需要如下步骤: 1.文字侦测(Text detection)——将图片上的文字与其他环境对象分离开来2.字符切分(Charact 阅读全文
posted @ 2019-01-04 20:51 马小豆包 阅读(1314) 评论(0) 推荐(0) 编辑
摘要: Lecture17 Large Scale Machine Learning大规模机器学习 17.1 大型数据集的学习 Learning With Large Datasets 如果有一个低方差的模型, 通常通过增加数据集的规模,可以获得更好的结果。 但是如果数据集特别大,则首先应该检查这么大规模是 阅读全文
posted @ 2019-01-04 19:59 马小豆包 阅读(1235) 评论(1) 推荐(0) 编辑
摘要: Lecture 16 Recommender Systems 推荐系统 16.1 问题形式化 Problem Formulation 在机器学习领域,对于一些问题存在一些算法, 能试图自动地替你学习到一组优良的特征。通过推荐系统(recommender systems),将领略一小部分特征学习的思想 阅读全文
posted @ 2019-01-04 18:30 马小豆包 阅读(1767) 评论(1) 推荐(0) 编辑
摘要: Lecture 15 Anomaly Detection 异常检测 15.1 异常检测问题的动机 Problem Motivation 异常检测(Anomaly detection)问题是机器学习算法的一个常见应用。这种算法虽然主要用于无监督学习问题,但从某些角度看,它又类似于一些监督学习问题。举例 阅读全文
posted @ 2019-01-04 15:47 马小豆包 阅读(1836) 评论(1) 推荐(0) 编辑
摘要: Lecture 14 Dimensionality Reduction 降维 14.1 降维的动机一:数据压缩 Data Compression 现在讨论第二种无监督学习问题:降维。 降维的一个作用是数据压缩,允许我们使用较少的内存或磁盘空间,也加快算法速度。 举例: 假设用两个特征描述同一个物品的 阅读全文
posted @ 2019-01-04 00:03 马小豆包 阅读(1983) 评论(0) 推荐(0) 编辑
摘要: Lecture 13 聚类 Clustering 13.1 无监督学习简介 Unsupervised Learning Introduction 现在开始学习第一个无监督学习算法:聚类。我们的数据没有附带任何标签,拿到的数据就是这样的: 例子: (注:这里有考题,问哪些可以使用聚类算法) 13.2 阅读全文
posted @ 2019-01-03 18:32 马小豆包 阅读(1489) 评论(0) 推荐(0) 编辑
摘要: Lecture 12 支持向量机 Support Vector Machines 12.1 优化目标 Optimization Objective 支持向量机(Support Vector Machine) 是一个更加强大的算法,广泛应用于工业界和学术界。与逻辑回归和神经网络相比, SVM在学习复杂 阅读全文
posted @ 2019-01-03 12:42 马小豆包 阅读(3089) 评论(0) 推荐(1) 编辑
摘要: 之前看过的机器学习课程。本文是相关课程笔记、习题答案、作业源码的电梯。 1 Coursera 斯坦福机器学习课程,Andrew Ng 1.1 说明 课程地址和软件下载 Coursera连接不上(视频无法播放),修改hosts文件 机器学习工具Octave安装(Win10环境) 1.2 课程笔记 We 阅读全文
posted @ 2018-12-27 13:23 马小豆包 阅读(55237) 评论(2) 推荐(9) 编辑
摘要: 【1】机器学习管道 【2】滑动窗口 Answer:C ((200-20)/4)2 = 2025 【3】人工数据 【4】标记数据 Answer:B (10000-1000)*10 /(8*60*60) = 3.125 【5】上限分析 测验 Answer:D 忽略窗口的宽度,只考虑step: (1000 阅读全文
posted @ 2018-12-27 13:09 马小豆包 阅读(1189) 评论(0) 推荐(0) 编辑
摘要: 【1】大规模数据 【2】随机梯度下降 【3】小批量梯度下降 【4】随机梯度下降的收敛 Answer:BD A 错误。学习率太小,算法容易很慢 B 正确。学习率小,效果更好 C 错误。应该是确定阈值吧 D 正确。曲线不下降,说明学习率选的太大 【5】在线学习 【6】 Answer:BC A 错误。随机 阅读全文
posted @ 2018-12-26 23:52 马小豆包 阅读(1165) 评论(0) 推荐(0) 编辑
摘要: 【1】异常检测 【2】高斯分布 【3】高斯分布 【4】 异常检测 【5】特征选择 【6】 【7】多变量高斯分布 Answer: ACD B 错误。需要矩阵Σ可逆,则要求m>n 测验1 Answer:AB Answer: A p(x) < ε ,漏掉的比较多,说明应该增大ε Answer:A x1 应 阅读全文
posted @ 2018-12-26 16:53 马小豆包 阅读(1561) 评论(0) 推荐(0) 编辑
摘要: 【1】无监督算法 【2】聚类 【3】代价函数 【4】 【5】K的选择 【6】降维 Answer:本来是 n 维,降维之后变成 k 维(k ≤ n) 【7】 【8】 Answer: 斜率-1 【9】 Answer: x 是一个向量 【10】PCA 降维 【11】 【12】PCA 的作用 测验1 Ans 阅读全文
posted @ 2018-12-23 10:09 马小豆包 阅读(1663) 评论(0) 推荐(0) 编辑
摘要: 【1】 【2】 Answer: B。 即 x1=3这条垂直线。 【3】 Answer: B 因为要尽可能小。对B,右侧红叉,有1/2 * 2 = 1 ≥ 1,左侧圆圈,有1/2 * -2 = -1 ≤ -1。 A太小不满足不等式 【4】 参考课件: 测验 Answer:B。 Answer: B An 阅读全文
posted @ 2018-12-22 10:50 马小豆包 阅读(1928) 评论(0) 推荐(0) 编辑
摘要: Lecture 11—Machine Learning System Design 11.1 垃圾邮件分类 本章中用一个实际例子: 垃圾邮件Spam的分类 来描述机器学习系统设计方法。首先来看两封邮件,左边是一封垃圾邮件Spam,右边是一封非垃圾邮件Non-Spam:垃圾邮件有很多features。 阅读全文
posted @ 2018-12-20 19:19 马小豆包 阅读(1963) 评论(0) 推荐(0) 编辑
摘要: 课程笔记 Coursera—Andrew Ng机器学习—课程笔记 Lecture 9_Neural Networks learning 作业说明 Exercise 4,Week 5,实现反向传播 backpropagation神经网络算法, 对图片中手写数字 0-9 进行识别。 数据集 :ex4da 阅读全文
posted @ 2018-12-20 14:22 马小豆包 阅读(3390) 评论(0) 推荐(0) 编辑
摘要: 【1】 诊断的作用 【2】过拟合 【3】 【4】 高偏差bias,欠拟合underfitting 高方差variance,过拟合overfitting 【5】参数λ Answer: λ太大,则参数都被惩罚,导致欠拟合,两个J都大。 λ太小,则欠拟合,Jtrain 小,Jcv大。 【6】 Answer 阅读全文
posted @ 2018-12-18 15:47 马小豆包 阅读(2228) 评论(0) 推荐(0) 编辑
摘要: 视频问题 如果Coursera网站连接不上,或者视频加载不出来。可以通过如下方式进行配置: 一、找到hosts文件 Windows 系统, hosts文件位于: [C:\Windows\System32\drivers\etc\hosts] Linux 系统,通过 gedit 修改hosts文件: 阅读全文
posted @ 2018-12-18 10:04 马小豆包 阅读(4798) 评论(0) 推荐(0) 编辑
摘要: Lecture 10—Advice for applying machine learning 10.1 如何调试一个机器学习算法? 有多种方案: 1、获得更多训练数据;2、尝试更少特征;3、尝试更多特征;4、尝试添加多项式特征;5、减小 λ;6、增大 λ 为了避免一个方案一个方案的尝试,可以通过评 阅读全文
posted @ 2018-12-06 13:02 马小豆包 阅读(2437) 评论(0) 推荐(0) 编辑
摘要: 神经网络的学习(Neural Networks: Learning) 9.1 代价函数 Cost Function 参考视频: 9 - 1 - Cost Function (7 min).mkv 假设神经网络的训练样本有𝑚个,每个包含一组输入 𝑥 和一组输出信号 𝑦,𝐿 表示神经网络层数,� 阅读全文
posted @ 2018-12-03 15:46 马小豆包 阅读(4791) 评论(0) 推荐(0) 编辑
摘要: 课上习题 【1】代价函数 【2】代价函数计算 【3】 【4】矩阵的向量化 【5】梯度校验 Answer:(1.013 -0.993) / 0.02 = 3.001 【6】梯度校验 Answer:学习的时候要去掉梯度校验,不然会特别慢 【7】随机初始化 Answer:对于神经网络这种复杂模型来说,初始 阅读全文
posted @ 2018-11-29 10:08 马小豆包 阅读(1976) 评论(1) 推荐(0) 编辑