摘要:
一、ID3算法简单介绍最早起源于《罗斯昆ID3在悉尼大学。他第一次提出的ID3 1975年在一本书、机器学习、研究所硕士论文。ID3是建立了概念学习系统(CLS)算法。ID3算法是一种基于决策树的算法。决策树由决策结点、分支和叶子组成。决策树中最上面的结点为根节点,每个分支是一个新的决策结点,或者是... 阅读全文
摘要:
从数据分析角度出发,数据挖掘可以分为两种类型:描述型数据挖掘和预测性数据挖掘。前者是以简洁概述的方式表达数据中的存在一些有意义的性质;而后者则通过对所提供数据集应用特定的方法分析所获得的一个或一组数据模型,并将该模型用于预测未来新数据的有关性质。描述型数据挖掘又称为概念描述(concept desc... 阅读全文
摘要:
在项目中,经常需要使用加密来保障数据的安全性,虽然可以通过在后台加密再传给前台,但这样无疑会增加后台的服务器的压力。所以在js中使用加密算法也就应运而生了。一、base64加密需要引入base64.js文件。html代码如下: 1 2 3 4 5 base64加密 6 7 15 16 ... 阅读全文
摘要:
在Java Web开发中,我们经常需要使用到验证码功能,一般情况下,我们可以将产生的验证码保存到服务器端中的session中,这种方式中,是使用服务器来保证验证码的功能。另外,我们也可以采用js产生验证码。一、服务器产生验证码后台服务器产生一个验证码的二进制数据流,直接代码如下: 1 import... 阅读全文
摘要:
相比于速度较慢的简单排序---冒泡排序、插入排序和选择排序,在之前也介绍了一种使用递归算法的归并排序(速度虽快,但空间消耗大,需要数组大小的辅助空间)。希尔排序和快速排序是我们常用的两种高级排序算法,其中希尔排序的时间复杂度为O(N*(logN)2),快速排序的时间复杂度为O(N*logN),而且和... 阅读全文
摘要:
HDFS作为Hadoop的核心技术之一,HDFS(Hadoop Distributed File System, Hadoop分布式文件系统)是分布式计算中数据存储管理的基础。具有高容错高可靠性、高可扩展性、高可获得性、高吞吐率等特性。为超大数据集的应用提供了便利。一、设计的前提和目的HDFS是Go... 阅读全文
摘要:
1、下载maven的安装包,下载地址http://maven.apache.org/download.cgi ,在这个页面中,你可以选择要下载的最新版本的maven gz包。我下载的是maven3.1.1版本。2、直接解压,并将解压后的文件夹移动到你要安装maven的目录下。我这里是:D:\bigd... 阅读全文
摘要:
hadoop的安装分为三种方式,第一种单机安装,一般用于调试(其实一般都不用)。第二种,伪分布式安装,一般程序员开发会使用这种方式。第三种,分布式安装,在实际环境中应用。今天在这里记下的是第二种,即伪分布式安装。相比于伪分布式安装,分布式安装的区别主要是复制因子dfs.replication以及sl... 阅读全文
摘要:
第一种、使用vim来search内容 /regex_word,从上到下匹配 ?regex_word,从下到上匹配 n是获取下一个匹配字符串,N是获取上一个匹配字符串。第二种、使用grep命令 grep -i pattern files :不区分大小写地搜索。默认情况区分大小写, grep... 阅读全文