摘要: 概述 继承Collection接口,是Collection的子类 存储顺序一致,有对应的索引值,元素可以重复 可以通过索引来操作元素,如set(1,"AA")就是通过1索引来修改数据 元素允许重复元素因此可以用equals方法来比较,自定义对象话我们要重写hashCode和equals方法 常用方法 阅读全文
posted @ 2018-08-14 17:15 205李华秋 阅读(21202) 评论(0) 推荐(0) 编辑
摘要: 概述 Map是一个接口.只要实现了该接口的类都是双列集合,Map集合每次都要存两个元素(键值对) 通俗一点就是Collection(单列集合)就是单身狗只能存一个元素,Map就像出双入对的情侣不能分开 通过键能找到对应的值 键必须是唯一的,但是值可以重复 创建 集合只能放包装类,所以int类型要放对 阅读全文
posted @ 2018-08-13 16:47 205李华秋 阅读(528) 评论(0) 推荐(0) 编辑
摘要: 迭代器 迭代访问==遍历,实现了Iterator接口用来遍历集合的方法 我们知道有序的List集合遍历可以用for循环来实现,但对于无序的Set集合不可用,这时我们就可以使用迭代器来遍历,对外提供了统一的遍历方法 迭代器的使用注意事项: 增强for JDK1.5新增加的特性,专门用来遍历数组和集合的 阅读全文
posted @ 2018-08-12 21:19 205李华秋 阅读(110) 评论(0) 推荐(0) 编辑
摘要: 在定义方法的同时定义了泛型变量的方法 定义一个方法接受一个任意类型的参数,返回值类型与实际参数类型一致 注意事项: 泛型变量的具体数据类型不能使基本数据类型,如果要使用基本数据类型要使用相对应的包装类类型 泛型变量的具体数据类型时由调用者调用方法时传参决定,如果没有指定,默认是Object类型 阅读全文
posted @ 2018-08-07 01:39 205李华秋 阅读(85) 评论(0) 推荐(0) 编辑
只有注册用户登录后才能阅读该文。 阅读全文
posted @ 2018-08-07 01:12 205李华秋 阅读(0) 评论(0) 推荐(0) 编辑
摘要: 1.用Hive对爬虫大作业产生的文本文件(或者英文词频统计下载的英文长篇小说)进行词频统计。 在网上下载英文小说,下载到本地home/hadoop/wc 启动dfs: 在user/hadoop/上创建文件夹lihuqiu: 上传下载文档到user/hadoop/lihuaqiu文件中: 在hive数 阅读全文
posted @ 2018-05-25 15:41 205李华秋 阅读(91) 评论(0) 推荐(0) 编辑
摘要: 通过hadoop上的hive完成WordCount 启动hadoop 1 start-all.sh 1 start-all.sh 1 start-all.sh 1 start-all.sh start-all.sh Hdfs上创建文件夹 1 2 hdfs dfs -mkdir songinput h 阅读全文
posted @ 2018-05-16 19:29 205李华秋 阅读(123) 评论(0) 推荐(0) 编辑
摘要: 用Python编写WordCount程序任务 程序 WordCount 输入 一个包含大量单词的文本文件 输出 文件中每个单词及其出现次数(频数),并按照单词字母顺序排序,每个单词和其频数占一行,单词和频数之间有间隔 (1)首先创建一个文件夹 mkdir wc (2)编写两个mapper函数 2、将 阅读全文
posted @ 2018-05-11 21:59 205李华秋 阅读(77) 评论(0) 推荐(0) 编辑
摘要: 1. 以下关系型数据库中的表和数据,要求将其转换为适合于HBase存储的表并插入数据: 学生表(Student)(不包括最后一列) 学号(S_No) 姓名(S_Name) 性别(S_Sex) 年龄(S_Age) 课程(course) 2015001 Zhangsan male 23 2015003 阅读全文
posted @ 2018-05-09 10:39 205李华秋 阅读(84) 评论(0) 推荐(0) 编辑
只有注册用户登录后才能阅读该文。 阅读全文
posted @ 2018-04-28 13:51 205李华秋 阅读(40) 评论(0) 推荐(0) 编辑