上一页 1 2 3 4 5 6 ··· 11 下一页
摘要: GitHub代码练习地址:用lxml解析HTML,文件读取,etree和XPath的配合使用:https://github.com/Neo-ML/PythonPractice/blob/master/SpiderPrac17_xpath%26lxml.py XML- XML(EXtensibleMa 阅读全文
posted @ 2019-03-20 04:56 chalee3 阅读(433) 评论(0) 推荐(0) 编辑
摘要: GitHub代码练习地址:正则1:https://github.com/Neo-ML/PythonPractice/blob/master/SpiderPrac15_RE1.py 正则2:match、search、findall函数的使用案例:https://github.com/Neo-ML/Py 阅读全文
posted @ 2019-03-19 05:21 chalee3 阅读(486) 评论(0) 推荐(1) 编辑
摘要: GitHub代码练习地址:1.两种简单get请求方法:https://github.com/Neo-ML/PythonPractice/blob/master/SpiderPrac13_requests1.py 2.带请求头与参数的get请求:https://github.com/Neo-ML/Py 阅读全文
posted @ 2019-03-18 07:33 chalee3 阅读(2424) 评论(0) 推荐(0) 编辑
摘要: GitHub代码练习地址:https://github.com/Neo-ML/PythonPractice/blob/master/SpiderPrac12_ajax.py 了解ajax 是一种异步请求 一定会有url,请求方法,可能有数据 一般使用json格式 案例,爬取部分豆瓣电影排行榜, 代码 阅读全文
posted @ 2019-03-18 04:12 chalee3 阅读(347) 评论(0) 推荐(0) 编辑
摘要: 一、向量化:低秩矩阵分解 之前我们介绍了协同过滤算法,本节介绍该算法的向量化实现,以及说说有关该算法可以做的其他事情。 举例:1.当给出一件产品时,你能否找到与之相关的其它产品。2.一位用户最近看上一件产品,有没有其它相关的产品,你可以推荐给他。 我们将要做的是:实现一种选择的方法,写出协同过滤算法 阅读全文
posted @ 2019-03-17 18:02 chalee3 阅读(1189) 评论(0) 推荐(0) 编辑
摘要: 在之前的基于内容的推荐系统中,对于每一部电影,我们都掌握了可用的特征,使用这些特征训练出了每一个用户的参数。相反地,如果我们拥有用户的参数,我们可以学习得出电影的特征。 但是如果我们既没有用户的参数,也没有电影的特征,这两种方法都不可行了。协同过滤算法可以同时学习这两者。 我们的优化目标便改为同时针 阅读全文
posted @ 2019-03-17 10:44 chalee3 阅读(1081) 评论(0) 推荐(0) 编辑
摘要: 假使我们是一个电影供应商,我们有 5 部电影和 4 个用户,我们要求用户为电影打分。 前三部电影是爱情片,后两部则是动作片,我们可以看出Alice 和Bob 似乎更倾向与爱情片, 而 Carol 和 Dave 似乎更倾向与动作片。并且没有一个用户给所有的电影都打过分。我们希望构建一个算法来预测他们每 阅读全文
posted @ 2019-03-17 03:19 chalee3 阅读(674) 评论(0) 推荐(0) 编辑
摘要: 一、多元高斯分布简介 假使我们有两个相关的特征,而且这两个特征的值域范围比较宽,这种情况下,一般的高斯分布模型可能不能很好地识别异常数据。其原因在于,一般的高斯分布模型尝试的是去同时抓住两个特征的偏差,因此创造出一个比较大的判定边界。 下图中是两个相关特征,洋红色的线(根据ε 的不同其范围可大可小) 阅读全文
posted @ 2019-03-15 16:44 chalee3 阅读(757) 评论(0) 推荐(0) 编辑
摘要: 对于异常检测算法,使用特征是至关重要的,下面谈谈如何选择特征: 异常检测假设特征符合高斯分布,如果数据的分布不是高斯分布,异常检测算法也能够工作,但是最好还是将数据转换成高斯分布,例如使用对数函数:𝑥 = 𝑙𝑜𝑔(𝑥 + 𝑐),其中 𝑐为非负常数; 或者 𝑥 = 𝑥^𝑐,𝑐为 阅读全文
posted @ 2019-03-15 12:18 chalee3 阅读(696) 评论(0) 推荐(0) 编辑
摘要: GitHub代码练习地址:1.手动利用cookie访问网页:https://github.com/Neo-ML/PythonPractice/blob/master/SpiderPrac10_cookie1.py 2.自动利用cookie访问人人主页:https://github.com/Neo-M 阅读全文
posted @ 2019-03-15 10:28 chalee3 阅读(333) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 ··· 11 下一页