上一页 1 ··· 3 4 5 6 7 8 9 10 11 12 下一页
摘要: description: Given a string s consists of upper/lower-case alphabets and empty space characters ' ', return the length of last word in the string. If 阅读全文
posted @ 2017-09-16 16:01 whatyouknow123 阅读(254) 评论(0) 推荐(0) 编辑
摘要: 我们知道L1正则化和L2正则化都可以用于降低过拟合的风险,但是L1正则化还会带来一个额外的好处:它比L2正则化更容易获得稀疏解,也就是说它求得的w权重向量具有更少的非零分量。 为了理解这一点我们看一个直观的例子:假定x有两个属性,于是无论是采用L1正则化还是采用L2正则化,它们解出的w权重向量都具有 阅读全文
posted @ 2017-09-16 09:45 whatyouknow123 阅读(5050) 评论(0) 推荐(1) 编辑
摘要: 第十五章 大数据与Maprudece 一.引言 实际生活中的数据量是非常庞大的,采用单机运行的方式可能需要若干天才能出结果,这显然不符合我们的预期,为了尽快的获得结果,我们将采用分布式的方式,将计算分布到不同的机器上。Mapreduce就是一个典型的分布式框架,Hadoop则是用java编写的一个M 阅读全文
posted @ 2017-09-15 14:43 whatyouknow123 阅读(507) 评论(0) 推荐(0) 编辑
摘要: description: Implement next permutation, which rearranges numbers into the lexicographically next greater permutation of numbers. If such arrangement 阅读全文
posted @ 2017-09-15 09:39 whatyouknow123 阅读(134) 评论(0) 推荐(0) 编辑
摘要: 第十四章 利用SVD简化数据 一.引言 SVD的全称是奇异值分解,SVD的作用是它能够将高维的数据空间映射到低维的数据空间,实现数据约减和去除噪声的功能。 SVD的特点主要有以下几个方面: 1.它的优点:去除噪声,简化数据,提高算法的结果 2.它的缺点:数据的转化难以理解 3.它适用的数据:数值型数 阅读全文
posted @ 2017-09-13 15:30 whatyouknow123 阅读(1936) 评论(0) 推荐(0) 编辑
摘要: description: Follow up for "Search in Rotated Sorted Array":What if duplicates are allowed? Would this affect the run-time complexity? How and why? Su 阅读全文
posted @ 2017-09-12 14:24 whatyouknow123 阅读(123) 评论(0) 推荐(0) 编辑
摘要: Description: Given a collection of numbers that might contain duplicates, return all possible unique permutations. For example,[1,1,2] have the follow 阅读全文
posted @ 2017-09-11 10:51 whatyouknow123 阅读(168) 评论(0) 推荐(0) 编辑
摘要: 第十三章 利用PCA来简化数据 一.降维技术 当数据的特征很多的时候,我们把一个特征看做是一维的话,我们数据就有很高的维度。高维数据会带来计算困难等一系列的问题,因此我们需要进行降维。降维的好处有很多,比如:降低算法开销,让数据更加便于使用,去燥,数据更易于显示等等。 目前的降维技术主要有三种:第一 阅读全文
posted @ 2017-09-10 21:31 whatyouknow123 阅读(492) 评论(0) 推荐(0) 编辑
摘要: 第十章 利用k-均值聚类算法对未标注的数据进行分组 一.导语 聚类算法可以看做是一种无监督的分类方法,之所以这么说的原因是它和分类方法的结果相同,区别它的类别没有预先的定义。簇识别是聚类算法中经常使用的一个概念,使用这个概念是为了对聚类的结果进行定义。 聚类算法几乎可以用于所有的对象,并且簇内的对象 阅读全文
posted @ 2017-09-10 16:50 whatyouknow123 阅读(5591) 评论(0) 推荐(0) 编辑
摘要: 第十二章 使用FP-growth算法高效的发现频繁项集 一.导语 FP-growth算法是用于发现频繁项集的算法,它不能够用于发现关联规则。FP-growth算法的特殊之处在于它是通过构建一棵Fp树,然后从FP树上发现频繁项集。 FP-growth算法它比Apriori算法的速度更快,一般能够提高两 阅读全文
posted @ 2017-09-10 16:48 whatyouknow123 阅读(5485) 评论(0) 推荐(0) 编辑
上一页 1 ··· 3 4 5 6 7 8 9 10 11 12 下一页