2017年8月29日

使用Apriori进行关联分析(二)

摘要: 大型超市有海量交易数据,我们可以通过聚类算法寻找购买相似物品的人群,从而为特定人群提供更具个性化的服务。但是对于超市来讲,更有价值的是如何找出商品的隐藏关联,从而打包促销,以增加营业收入。其中最经典的案例就是关于尿不湿和啤酒的故事。怎样在繁杂的数据中寻找到数据之间的隐藏关系?当然可以使用穷举法,但代价高昂,所以需要使用更加智能的方法在合理时间内找到答案。Apriori就是其中的一种关联分析算法。本文是Apriori的第二篇,介绍如何在频繁项集的基础上挖掘关联规则。 阅读全文

posted @ 2017-08-29 22:32 我是8位的 阅读(4446) 评论(1) 推荐(1) 编辑

2017年8月28日

单变量微积分笔记2——导数2(求导法则和高阶导数)

摘要: 本文是数学笔记(导数)的第二篇,主要介绍导数的和、差、积、商的求导法则,复合函数求导法则,高阶导数 阅读全文

posted @ 2017-08-28 22:12 我是8位的 阅读(8988) 评论(3) 推荐(0) 编辑

2017年8月27日

单变量微积分笔记1——导数1(导数的基本概念)

摘要: 本文是数学笔记(导数)的第一篇,介绍了导数的基本概念,1/x,x^n, sinx, cosx的导数公式,并给出它们的推导过程 阅读全文

posted @ 2017-08-27 21:31 我是8位的 阅读(5119) 评论(3) 推荐(1) 编辑

2017年8月23日

使用Apriori进行关联分析(一)

摘要: 大型超市有海量交易数据,我们可以通过聚类算法寻找购买相似物品的人群,从而为特定人群提供更具个性化的服务。但是对于超市来讲,更有价值的是如何找出商品的隐藏关联,从而打包促销,以增加营业收入。其中最经典的案例就是关于尿不湿和啤酒的故事。怎样在繁杂的数据中寻找到数据之间的隐藏关系?当然可以使用穷举法,但代价高昂,所以需要使用更加智能的方法在合理时间内找到答案。Apriori就是其中的一种关联分析算法。本文是Apriori的第一篇。 阅读全文

posted @ 2017-08-23 22:29 我是8位的 阅读(31578) 评论(1) 推荐(3) 编辑

2017年8月18日

k最邻近算法——加权kNN

摘要: 上篇文章中提到为每个点的距离增加一个权重,使得距离近的点可以得到更大的权重,本文介绍了如何使用反函数和高斯函数进行加权,以及加权后的计算过程 阅读全文

posted @ 2017-08-18 22:34 我是8位的 阅读(19296) 评论(1) 推荐(2) 编辑

2017年8月15日

k最邻近算法——使用kNN进行手写识别

摘要: 上篇文章中提到了使用pillow对手写文字进行预处理,本文介绍如何使用kNN算法对文字进行识别。k最邻近算法(k-Nearest Neighbor, KNN),是机器学习分类算法中最简单的一类。假设一个样本空间被分为几类,然后给定一个待分类的特征数据,通过计算距离该数据的最近的k个样本来判断这个数据属于哪一类。如果距离待分类属性最近的k个类大多数都属于某一个特定的类,那么这个待分类的数据也就属于这个类。 阅读全文

posted @ 2017-08-15 22:58 我是8位的 阅读(5264) 评论(0) 推荐(0) 编辑

2017年8月14日

图像识别的前期工作——使用pillow进行图像处理

摘要: 本文主要介绍使用pillow对图像进行简单处理,进而引出图像处理与手写识别的关系。 阅读全文

posted @ 2017-08-14 22:27 我是8位的 阅读(4132) 评论(0) 推荐(1) 编辑

2017年8月9日

朴素贝叶斯

摘要: 朴素贝叶斯分类是基于贝叶斯概率的思想,假设属性之间相互独立,求得各特征的概率,最后取较大的一个作为预测结果(为了消弱罕见特征对最终结果的影响,通常会为概率加入权重,在比较时加入阈值)。 阅读全文

posted @ 2017-08-09 23:06 我是8位的 阅读(908) 评论(0) 推荐(0) 编辑

2017年8月5日

后缀表达式

摘要: 表格曾是我们在JSP页面常用的布局方式,碰到合并单元格时会不停的使用collspan和rowspan。为了简化操作,我规划了一个布局管理器,用一个字符串代替表格布局。大概长这个样子: layout="3;C2(bop1, bop2),C3(bop3, bop4)" ,layout是自定义标签属性,bop对应布局中的一个细粒度组件,3表示默认3列布局,C2和C3分别表示合并2个和3个单元格。连起来的意思就是,当前容器默认3列布局,其中bop1和bop2需要占两列,bop3和bop4需要占3列,其余组件占1列。还可以进行行合并:layout="3;R2(C2(bop1, bop2)),C3(bop3, bop4)",表示bop1, bop2合并两列后再合并两行。当然,你可以写的更加随意,只要有意义即可,如:layout="3;R2(C2(bop1)),R2(C2(bop2)),C3(bop3, bop4)",layout="4;C2(bop1),C2(bop2),C3(bop3)"。 阅读全文

posted @ 2017-08-05 23:39 我是8位的 阅读(3682) 评论(0) 推荐(0) 编辑

2017年8月3日

集成学习之AdaBoost

摘要: AdbBoost是adaptive boosting的缩写,是众多Boosting算法中较为流行的一种。 AdaBoost算法针对不同的训练集训练同一个(使用相同算法)基本分类器(弱分类器),然后把这些在不同训练集上得到的分类器集合起来,构成一个更强的最终的分类器(强分类器)。理论证明,只要每个弱分类器分类能力比随机猜测要好,当其个数趋向于无穷个数时,强分类器的错误率将趋向于零。这点可以用直观感觉判断,只要每个分类器的正确率比错误率稍高一点点,当分类器足够多的时候,正确的数量就会压倒错误的数量。 阅读全文

posted @ 2017-08-03 21:01 我是8位的 阅读(1162) 评论(0) 推荐(0) 编辑

导航