1 4
摘要: 最大熵原理:学习概率模型时,在所有可能的概率模型中,熵最大的模型是最好的模型。 熵:表示随机变量不确定性的度量。假设X是一个取有限个值的离散随机变量,其概率分布为 P(X = x_{i}) = p_{i} 阅读全文
posted @ 2018-07-16 21:29 韦木三 阅读(104) 评论(0) 推荐(0) 编辑
摘要: Tag有两个重要的属性:name和attrs; 2、NavigableString:BeautifulSoup用NavigableString类来包装tag中的字符串 3、BeautifulSoup:表示的是一个文档的全部内容。大部分时候,可以把它当作Tag对象。 4、Comment:是一个特殊类型 阅读全文
posted @ 2018-07-07 23:27 韦木三 阅读(170) 评论(0) 推荐(0) 编辑
摘要: 1、参数url:可以是字符串也可以是Request对象。 (1)、url参数为字符串 (2)、url为Request对象 req = request.Request('http://www.baidu.com') response = request.urlopen(req) # url参数为req 阅读全文
posted @ 2018-07-04 23:10 韦木三 阅读(148) 评论(0) 推荐(0) 编辑
摘要: 一、重新索引 二、丢弃指定轴上的项: 三、索引、选取和过滤 Series的索引的工作方式类似于Numpy数组的索引,只不过Series的索引值不只是整数。 利用标签的切片运算与普通的Python切片运算不同,其末端是包含的,即封闭区间: DataFrame索引:对DataFrame进行索引就是获取一 阅读全文
posted @ 2017-09-26 23:27 韦木三 阅读(341) 评论(0) 推荐(0) 编辑
摘要: pandas是基于Numpy构建的。 pandas的两个主要数据结构:Series和DataFrame。 Series和DataFrame用的次数非常多,将其导入本地命名空间会更方便: 一、Series Series是一种类似于一维数组的对象,由数据和数据标签(索引)组成,创建Series: Ser 阅读全文
posted @ 2017-09-25 22:44 韦木三 阅读(279) 评论(0) 推荐(0) 编辑
摘要: Python有很多可视化工具,matplotlib是其中重要的一个。 matplotlib API函数都位于matplotlib.pyplot模块中,其通常的引入约定是: matplotlib的图像都位于Figure对象中,创建新的Figure方法为: fig = plt.figure() 绘图不能 阅读全文
posted @ 2017-09-24 22:24 韦木三 阅读(844) 评论(0) 推荐(0) 编辑
摘要: 最近用pip3安装SciPy包的时候(mac系统),出现超时timed out报错,网上找了相关信息后换源安装成功: pip3 install --index-url https://pypi.douban.com/simple scipy 用pip(pip3)安装依赖包时默认访问https://p 阅读全文
posted @ 2017-09-14 21:31 韦木三 阅读(1700) 评论(0) 推荐(0) 编辑
摘要: 聚类是一种无监督的学习,它将相似的对象归到同一个簇中。 这篇文章介绍一种称为K-均值的聚类算法,之所以称为K-均值是因为它可以发现k个不同的簇,且每个簇的中心采用簇中所含值的均值计算而成。 聚类分析视图将相似对象归入同一簇,将不相似对象归到不同簇。 下面用Python简单演示该算法实现的原理: 函数 阅读全文
posted @ 2017-09-10 00:52 韦木三 阅读(1713) 评论(0) 推荐(0) 编辑
摘要: 这边文章主要介绍线性回归算法,回归也属于监督算法的范畴,其目标变量是连续数值型,目的是预测数值型的目标值,直观理解就是依据输入写出一个目标值的计算公式,该公式叫为回归方程,而求回归系数的过程就是回归。线性回归是回归算法中最常见的一种。 假设输入数据为$f(x) = w_{1}x_{1}+w_{2}x 阅读全文
posted @ 2017-09-10 00:27 韦木三 阅读(321) 评论(0) 推荐(0) 编辑
摘要: Adaboost为一种集成算法,是对其他算法进行组合的一种方式。 本文将通过单层决策树分类器建立一个Adaboost优化算法,即利用多个弱分类器构建一个强分类器。 弱分类器:分类器性能比随机猜测要略好,但是也不会好太多。 强分类器:分类器性能比随机猜测好很多。 下面结合代码说明Adaboost算法原 阅读全文
posted @ 2017-09-09 21:34 韦木三 阅读(980) 评论(0) 推荐(0) 编辑