上一页 1 2 3 4 5 6 7 ··· 11 下一页
摘要: GitHub代码练习地址:https://github.com/Neo-ML/PythonPractice/blob/master/SpiderPrac09_ProxyHandler.pyProxyHandler处理(代理服务器) 使用代理IP,是爬虫的常用手段提供代理服务器的地址有很多,例如: w 阅读全文
posted @ 2019-03-15 04:33 NeoML 阅读(501) 评论(0) 推荐(0) 编辑
摘要: GitHub代码练习地址:https://github.com/Neo-ML/PythonPractice/blob/master/SpiderPrac08_useragent.py 阅读全文
posted @ 2019-03-15 00:27 NeoML 阅读(584) 评论(0) 推荐(0) 编辑
摘要: 一、开发与评价一个异常检测系统 异常检测算法是一个非监督学习算法,意味着我们无法根据结果变量 𝑦 的值来告诉我们数据是否真的是异常的。我们需要另一种方法来帮助检验算法是否有效。当我们开发一个异常检测系统时,我们从带标记(异常或正常)的数据着手,我们从其中选择一部分正常数据用于构建训练集,然后用剩下 阅读全文
posted @ 2019-03-14 23:57 NeoML 阅读(335) 评论(0) 推荐(0) 编辑
摘要: 如何应用高斯分布开发异常检测算法呢? 异常检测算法: 对于给定的数据集 𝑥(1), 𝑥(2), . . . , 𝑥(𝑚),我们要针对每一个特征计算 𝜇 和 𝜎2 的估计值。 一旦我们获得了平均值和方差的估计值,给定新的一个训练实例,根据模型计算 𝑝(𝑥): 当𝑝(𝑥) < 𝜀时 阅读全文
posted @ 2019-03-14 15:58 NeoML 阅读(745) 评论(0) 推荐(0) 编辑
摘要: 一、问题动机 异常检测(Anomaly detection)问题是机器学习算法的一个常见应用。这种算法的一个有趣之处在于:它虽然主要用于非监督学习问题,但从某些角度看,它又类似于一些监督学习问题。 给定数据集 𝑥(1), 𝑥(2), . . , 𝑥(𝑚),我们假使数据集是正常的,我们希望知道 阅读全文
posted @ 2019-03-14 08:28 NeoML 阅读(380) 评论(0) 推荐(0) 编辑
摘要: GitHub代码练习地址:URLError:https://github.com/Neo-ML/PythonPractice/blob/master/SpiderPrac06_URLError.py HTTPError:https://github.com/Neo-ML/PythonPractice 阅读全文
posted @ 2019-03-14 06:16 NeoML 阅读(1277) 评论(0) 推荐(0) 编辑
摘要: GitHub代码练习地址:①利用parse模拟post请求:https://github.com/Neo-ML/PythonPractice/blob/master/SpiderPrac04_parse-post.py ②parse功能简单应用:https://github.com/Neo-ML/P 阅读全文
posted @ 2019-03-13 14:06 NeoML 阅读(580) 评论(0) 推荐(0) 编辑
摘要: 一、初始值重建的压缩表示 在PCA算法里我们可能需要把1000 维的数据压缩100 维特征,或具有三维数据压缩到一二维表示。所以,如果这是一个压缩算法,应该能回到这个压缩表示,回到原有的高维数据的一种近似。 所以,给定的𝑧(𝑖),这可能100 维,怎么回到你原来的表示𝑥(𝑖),这可能是100 阅读全文
posted @ 2019-03-13 06:03 NeoML 阅读(540) 评论(0) 推荐(0) 编辑
摘要: PCA 减少𝑛维到𝑘维步骤: 第一步是均值归一化。我们需要计算出所有特征的均值,然后令 𝑥𝑗 = 𝑥𝑗 − 𝜇𝑗。如果特征是在不同的数量级上,我们还需要将其除以标准差 𝜎2。 第二步是计算协方差矩阵(covariance matrix) (求和上面的n错了,应该是m) 第三步是计算 阅读全文
posted @ 2019-03-13 03:49 NeoML 阅读(816) 评论(0) 推荐(0) 编辑
摘要: 主成分分析(PCA)是最常见的降维算法。 在PCA 中,我们要做的是找到一个方向向量(Vector direction),当我们把所有的数据都投射到该向量上时,我们希望投射平均均方误差能尽可能地小。方向向量是一个经过原点的向量,而投射误差是从特征向量向该方向向量作垂线的长度。 下面给出主成分分析问题 阅读全文
posted @ 2019-03-12 18:55 NeoML 阅读(456) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 ··· 11 下一页