whatyouknow123

2017年9月16日

摘要： description: Given a string s consists of upper/lower-case alphabets and empty space characters ' ', return the length of last word in the string. If 阅读全文

posted @ 2017-09-16 16:01 whatyouknow123 阅读(255) 评论(0) 推荐(0) 编辑

L1正则化比L2正则化更易获得稀疏解的原因

摘要：我们知道L1正则化和L2正则化都可以用于降低过拟合的风险，但是L1正则化还会带来一个额外的好处：它比L2正则化更容易获得稀疏解，也就是说它求得的w权重向量具有更少的非零分量。为了理解这一点我们看一个直观的例子：假定x有两个属性，于是无论是采用L1正则化还是采用L2正则化，它们解出的w权重向量都具有阅读全文

posted @ 2017-09-16 09:45 whatyouknow123 阅读(5082) 评论(0) 推荐(1) 编辑

2017年9月15日

大数据与Mapreduce

摘要：第十五章大数据与Maprudece 一．引言实际生活中的数据量是非常庞大的，采用单机运行的方式可能需要若干天才能出结果，这显然不符合我们的预期，为了尽快的获得结果，我们将采用分布式的方式，将计算分布到不同的机器上。Mapreduce就是一个典型的分布式框架，Hadoop则是用java编写的一个M 阅读全文

posted @ 2017-09-15 14:43 whatyouknow123 阅读(509) 评论(0) 推荐(0) 编辑

Next Permutation

摘要： description: Implement next permutation, which rearranges numbers into the lexicographically next greater permutation of numbers. If such arrangement 阅读全文

posted @ 2017-09-15 09:39 whatyouknow123 阅读(137) 评论(0) 推荐(0) 编辑

2017年9月13日

SVD的概念以及应用

摘要：第十四章利用SVD简化数据一．引言 SVD的全称是奇异值分解，SVD的作用是它能够将高维的数据空间映射到低维的数据空间，实现数据约减和去除噪声的功能。 SVD的特点主要有以下几个方面： 1.它的优点：去除噪声，简化数据，提高算法的结果 2.它的缺点：数据的转化难以理解 3.它适用的数据：数值型数阅读全文

posted @ 2017-09-13 15:30 whatyouknow123 阅读(1975) 评论(0) 推荐(0) 编辑

2017年9月12日

Search in rotated array two

摘要： description: Follow up for "Search in Rotated Sorted Array":What if duplicates are allowed? Would this affect the run-time complexity? How and why? Su 阅读全文

posted @ 2017-09-12 14:24 whatyouknow123 阅读(125) 评论(0) 推荐(0) 编辑

2017年9月11日

PermutationTwo

摘要： Description: Given a collection of numbers that might contain duplicates, return all possible unique permutations. For example,[1,1,2] have the follow 阅读全文

posted @ 2017-09-11 10:51 whatyouknow123 阅读(168) 评论(0) 推荐(0) 编辑

2017年9月10日

PCA算法和python实现

摘要：第十三章利用PCA来简化数据一．降维技术当数据的特征很多的时候，我们把一个特征看做是一维的话，我们数据就有很高的维度。高维数据会带来计算困难等一系列的问题，因此我们需要进行降维。降维的好处有很多，比如：降低算法开销，让数据更加便于使用，去燥，数据更易于显示等等。目前的降维技术主要有三种：第一阅读全文

posted @ 2017-09-10 21:31 whatyouknow123 阅读(495) 评论(0) 推荐(0) 编辑

kmeans算法思想及其python实现

摘要：第十章利用k-均值聚类算法对未标注的数据进行分组一．导语聚类算法可以看做是一种无监督的分类方法，之所以这么说的原因是它和分类方法的结果相同，区别它的类别没有预先的定义。簇识别是聚类算法中经常使用的一个概念，使用这个概念是为了对聚类的结果进行定义。聚类算法几乎可以用于所有的对象，并且簇内的对象阅读全文

posted @ 2017-09-10 16:50 whatyouknow123 阅读(5604) 评论(0) 推荐(0) 编辑

FP-growth算法思想和其python实现

摘要：第十二章使用FP-growth算法高效的发现频繁项集一．导语 FP-growth算法是用于发现频繁项集的算法，它不能够用于发现关联规则。FP-growth算法的特殊之处在于它是通过构建一棵Fp树，然后从FP树上发现频繁项集。 FP-growth算法它比Apriori算法的速度更快，一般能够提高两阅读全文

posted @ 2017-09-10 16:48 whatyouknow123 阅读(5511) 评论(0) 推荐(0) 编辑

公告