我是8位的

使用Apriori进行关联分析（二）

摘要：

大型超市有海量交易数据，我们可以通过聚类算法寻找购买相似物品的人群，从而为特定人群提供更具个性化的服务。但是对于超市来讲，更有价值的是如何找出商品的隐藏关联，从而打包促销，以增加营业收入。其中最经典的案例就是关于尿不湿和啤酒的故事。怎样在繁杂的数据中寻找到数据之间的隐藏关系？当然可以使用穷举法，但代价高昂，所以需要使用更加智能的方法在合理时间内找到答案。Apriori就是其中的一种关联分析算法。本文是Apriori的第二篇，介绍如何在频繁项集的基础上挖掘关联规则。阅读全文

posted @ 2017-08-29 22:32 我是8位的阅读(4650) 评论(1) 推荐(1)

单变量微积分笔记2——导数2(求导法则和高阶导数)

摘要：本文是数学笔记（导数）的第二篇，主要介绍导数的和、差、积、商的求导法则，复合函数求导法则，高阶导数阅读全文

posted @ 2017-08-28 22:12 我是8位的阅读(9380) 评论(3) 推荐(0)

单变量微积分笔记1——导数1(导数的基本概念)

摘要：本文是数学笔记（导数）的第一篇，介绍了导数的基本概念，1/x，x^n, sinx, cosx的导数公式，并给出它们的推导过程阅读全文

posted @ 2017-08-27 21:31 我是8位的阅读(5619) 评论(3) 推荐(1)

使用Apriori进行关联分析（一）

摘要：

大型超市有海量交易数据，我们可以通过聚类算法寻找购买相似物品的人群，从而为特定人群提供更具个性化的服务。但是对于超市来讲，更有价值的是如何找出商品的隐藏关联，从而打包促销，以增加营业收入。其中最经典的案例就是关于尿不湿和啤酒的故事。怎样在繁杂的数据中寻找到数据之间的隐藏关系？当然可以使用穷举法，但代价高昂，所以需要使用更加智能的方法在合理时间内找到答案。Apriori就是其中的一种关联分析算法。本文是Apriori的第一篇。阅读全文

posted @ 2017-08-23 22:29 我是8位的阅读(31977) 评论(1) 推荐(3)

k最邻近算法——加权kNN

摘要：

上篇文章中提到为每个点的距离增加一个权重，使得距离近的点可以得到更大的权重，本文介绍了如何使用反函数和高斯函数进行加权，以及加权后的计算过程阅读全文

posted @ 2017-08-18 22:34 我是8位的阅读(19922) 评论(1) 推荐(2)

k最邻近算法——使用kNN进行手写识别

摘要：

上篇文章中提到了使用pillow对手写文字进行预处理，本文介绍如何使用kNN算法对文字进行识别。k最邻近算法（k-Nearest Neighbor, KNN），是机器学习分类算法中最简单的一类。假设一个样本空间被分为几类，然后给定一个待分类的特征数据，通过计算距离该数据的最近的k个样本来判断这个数据属于哪一类。如果距离待分类属性最近的k个类大多数都属于某一个特定的类，那么这个待分类的数据也就属于这个类。阅读全文

posted @ 2017-08-15 22:58 我是8位的阅读(5341) 评论(0) 推荐(0)

图像识别的前期工作——使用pillow进行图像处理

摘要：

本文主要介绍使用pillow对图像进行简单处理，进而引出图像处理与手写识别的关系。阅读全文

posted @ 2017-08-14 22:27 我是8位的阅读(4196) 评论(0) 推荐(1)

朴素贝叶斯

摘要：

朴素贝叶斯分类是基于贝叶斯概率的思想，假设属性之间相互独立，求得各特征的概率，最后取较大的一个作为预测结果（为了消弱罕见特征对最终结果的影响，通常会为概率加入权重，在比较时加入阈值）。阅读全文

posted @ 2017-08-09 23:06 我是8位的阅读(950) 评论(0) 推荐(0)

后缀表达式

摘要：表格曾是我们在JSP页面常用的布局方式，碰到合并单元格时会不停的使用collspan和rowspan。为了简化操作，我规划了一个布局管理器，用一个字符串代替表格布局。大概长这个样子： layout="3;C2(bop1, bop2),C3(bop3, bop4)" ，layout是自定义标签属性，bop对应布局中的一个细粒度组件，3表示默认3列布局，C2和C3分别表示合并2个和3个单元格。连起来的意思就是，当前容器默认3列布局，其中bop1和bop2需要占两列，bop3和bop4需要占3列，其余组件占1列。还可以进行行合并：layout="3;R2(C2(bop1, bop2)),C3(bop3, bop4)"，表示bop1, bop2合并两列后再合并两行。当然，你可以写的更加随意，只要有意义即可，如：layout="3;R2(C2(bop1)),R2(C2(bop2)),C3(bop3, bop4)"，layout="4;C2(bop1),C2(bop2),C3(bop3)"。阅读全文

posted @ 2017-08-05 23:39 我是8位的阅读(3716) 评论(0) 推荐(0)

集成学习之AdaBoost

摘要：

AdbBoost是adaptive boosting的缩写，是众多Boosting算法中较为流行的一种。 AdaBoost算法针对不同的训练集训练同一个（使用相同算法）基本分类器（弱分类器），然后把这些在不同训练集上得到的分类器集合起来，构成一个更强的最终的分类器（强分类器）。理论证明，只要每个弱分类器分类能力比随机猜测要好，当其个数趋向于无穷个数时，强分类器的错误率将趋向于零。这点可以用直观感觉判断，只要每个分类器的正确率比错误率稍高一点点，当分类器足够多的时候，正确的数量就会压倒错误的数量。阅读全文

posted @ 2017-08-03 21:01 我是8位的阅读(1211) 评论(0) 推荐(0)