摘要: 匿名内部类方式使用多线程: 格式: new 类名或者接口名(){}; 本质:是该类或者接口子类对象 定时器 定时器是一个应用十分广泛的线程工具,可以用于调度多个定时任务以后台的方式执行,在java中,可以通过Timer和timerTask类来定义调度的功能 构造方法: Timer()创建一个新定时器 阅读全文
posted @ 2020-12-29 10:50 小荣儿 阅读(35) 评论(0) 推荐(0) 编辑
摘要: 选择题(答案在最下面) 1.java属于下列哪种语言( ) A.机器语言 B.c语言 C.低级语言 D.高级语言 2.在Collections类中以下哪个方法用来使非线程安全的集合变成线程安全的( ) A.sort B.replaceAll C.synchronizedList D.以上都不正确 3 阅读全文
posted @ 2020-12-29 10:40 小荣儿 阅读(466) 评论(0) 推荐(0) 编辑
摘要: Hadoop 小文件优化方法 1 Hadoop小文件弊端 HDFS上每个文件都要在NameNode中都有对应的元数据,这个元数据的大小约为150byte,这样当小文件比较多的时候,一方面会大量占用NameNode的内存空间,另一方面就是元数据过多的情况查找速度变慢。 小文件过多,在进行MR计算时,会 阅读全文
posted @ 2020-12-29 10:10 小荣儿 阅读(257) 评论(0) 推荐(0) 编辑
摘要: 数据清洗:过滤脏数据,解析字段结构化,数据加上一些默认值,给数据添加某些字段,把数据分类,给数据脱敏,给数据加密,修改数据的存储结构... 可以用什么技术? mr hive(udf) spark core 如何选择 ? mr 好处稳定性高,如果数据量非常的大,考虑用mr做清洗 hive 的udf 就 阅读全文
posted @ 2020-12-29 09:59 小荣儿 阅读(223) 评论(0) 推荐(0) 编辑
摘要: 1.什么进程? * 值得就是正在运行的程序,是系统进行资源分配和调用的独立单位 * 每一个进程都有它自己的内存空间和系统资源 特征: 1、独立性:进程是系统中独立存在的实体,它可以拥有自己独立的资源,每一个进程都拥有自己私有的地址空间。在没有经过进程本身允许的情况下,一个用户进程不可以直接访问其他进 阅读全文
posted @ 2020-12-29 09:42 小荣儿 阅读(67) 评论(0) 推荐(0) 编辑