摘要:
对于大数据相关的面试题,往往没有固定的答案,题目往往都是给定大规模数据,固定的内存空间(往往会很小),主要考察的就是把大规模数据进行化简,大问题分解成小问题,用内存开销非常小的代价得出结果。以下比较经典的解题方法:原文链接:http://www.cnblogs.com/CheeseZH/p/5283... 阅读全文
摘要:
数据挖掘和机器学习近年来被大多数人所听说,这两个词近年来因为大数据的听上去高大上的词汇,其实在我们的生活中到处存在,往往是计算机知识中融入了数学(统计方面的知识)。数据挖掘往往和机器学习一起出现在各种地方,要用到数据挖掘的地方必有机器学习,在数据量小的时候,他们可能不会有依赖关系,往往通过人工的处理... 阅读全文
摘要:
weka提供了几种处理数据的方式,其中分类和回归是平时用到最多的,也是非常容易理解的,分类就是在已有的数据基础上学习出一个分类函数或者构造出一个分类模型。这个函数或模型能够把数据集中地映射到某个给定的类别上,从而进行数据的预测。就是通过一系列的算法,将看起来本来分散的数据,给划分成一个个不同的类,我... 阅读全文
摘要:
一、HashMap介绍集合中的Map集合有两个实现类分别是HashMap和TreeMap,这里先说HashMap,TreeMap在以后的文章讲。HashMap,既然前面带了Hash,那么他一定用到了hash算法,HashMap的结构就是一个hash表,注意在HashMap中可以添加一个键为null和... 阅读全文
摘要:
在开发java web项目的时候我们经常需要在servlet和jsp之间进行传值,之前介绍了传值的几种方式,详见:jsp与Servlet之间传值有时候我们在jsp和Servlet之间传值的时候,需要在Servlet中创建对象传值,但是在jsp页面中不需要创建对象,因为在jsp页面中,已经内... 阅读全文
摘要:
在java集合中有一种集合Set(集),他有两个实现类,分别是HashSet,TreeSet。下面仔细分析HashSet源码。看了HashSet的源码就会发现HashSet的底层实现是利用HashMap,所以对于HashSet的一些操作都是利用HasgMap的操作实现的。生命类一个HashMap成员... 阅读全文
摘要:
在一个类的里面再定义的类,叫做内部类,也可以叫做寄生类,在平时的编程中很少用到内部类,而且显的特别乱。但是内部类也是有很大作用的:提供了更好的封装,把类隐藏在外部类中,这样其他的类不能调到。内部类可以使用外部类的所有数据,包括private修饰的。在jdk中哟哟很多地方都用到了内部类,在集合的源码中... 阅读全文
摘要:
对于数组我们应该很熟悉,一个数组在内存中总是一块连续的存储空间,数组的创建使用new关键字,数组是引用类型的数据,一旦第一个元素的位置确定,那么后面的元素位置也就确定了,数组有一个最大的局限就是数组一旦创建,他的长度就是固定的,不可以进行更改,如果数组空间不够大,唯一的方法就是再创建一个大的数组,把... 阅读全文
摘要:
迭代器模式是一种应用很广泛的设计模式,提供了一种方法顺序的访问一个集合中的元素,但是还不暴露该对象的内部细节。提供了一种方法遍历访问整个聚合的对象,这个聚合的对象一般是一个集合。把元素间的移动交给迭代器,不需要聚合对象的操作,就可以实现整个聚合对象的遍历。源码分析:在java中就有迭代器模式的实现,... 阅读全文
摘要:
由于java是一种面向对象的语言,万事万物皆对象,用户定义一个类,这是一个广泛的定义,需要用户具体化,实例化这个广泛的类,确定这个具体的对象。在java程序中,对象可以被显式创建和隐式创建,主要说一下显式的创建对象的方式。在之前被问过创建对象有几种方式,当时就回答了有一种,用new关键字创建,这是最... 阅读全文