摘要: 本文知识点:1潜在畸形页面使用htmlTreeParse函数2startElement的用法3闭包4handler函数的命令和函数体主要写法5节点的丢弃,取出,取出标签名称、属性、属性值、内容6修改树中节点的属性、节点计数、存储节点7匿名函数写法8xmlHashTree函数和xmlRoot函数和trun参数(此条存疑)9编码10try和trycatch,中断11xinclude 原书中虽然主要是关... 阅读全文
posted @ 2016-12-31 20:58 旅鼠 阅读(1271) 评论(0) 推荐(0) 编辑
摘要: 包含以下几个小的知识点1htmlTreeParse函数源码和一些参数2hander的写法3关于missing函数4关于if-else语句中else语句的花括号问题5关于checkHandlerNames(handlers, "DOM")函数6关于GeneralHandlerNames属性7关于match函数8关于inherits函数9关于on.exit函数=====================... 阅读全文
posted @ 2016-12-30 21:53 旅鼠 阅读(1592) 评论(0) 推荐(0) 编辑
摘要: 《List of World Heritage in Danger》导包library(stringr)library(XML)library(maps)heritage_parsed <- htmlParse("http://en.wikipedia.org/wiki/List_of_World_Heritage_in_Danger",encoding = "UTF-8")出现错误Error: ... 阅读全文
posted @ 2016-12-24 19:51 旅鼠 阅读(4605) 评论(0) 推荐(0) 编辑
摘要: 好久没发点新的作品了.......也许...... Que sera, seraWhatever will be, will be 阅读全文
posted @ 2016-12-03 20:12 旅鼠 阅读(4562) 评论(0) 推荐(0) 编辑
摘要: MapTask类 在MapTask类中找到run函数 if(useNewApi){ runNewMapper(job, splitMetaInfo, umbilical, reporter); } 再找到runNewMapper @SuppressWarnings("unchecked") priv 阅读全文
posted @ 2016-08-08 17:50 旅鼠 阅读(1564) 评论(0) 推荐(0) 编辑
摘要: Job类 /** * Define the comparator that controls which keys are grouped together * for a single call to * {@link Reducer#reduce(Object, Iterable, * org. 阅读全文
posted @ 2016-08-08 10:55 旅鼠 阅读(1576) 评论(0) 推荐(0) 编辑
摘要: Job类 /** * Define the comparator that controls * how the keys are sorted before they * are passed to the {@link Reducer}. * @param cls the raw compara 阅读全文
posted @ 2016-08-08 09:43 旅鼠 阅读(1224) 评论(0) 推荐(0) 编辑
摘要: MRJobConfig public static fina COMBINE_CLASS_ATTR 属性COMBINE_CLASS_ATTR = "mapreduce.job.combine.class" ————子接口(F4) JobContent 方法getCombinerClass ————子 阅读全文
posted @ 2016-08-06 17:03 旅鼠 阅读(2004) 评论(0) 推荐(0) 编辑
摘要: 强迫症必治: WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable 为了去掉这个警告! 这个本 阅读全文
posted @ 2016-08-01 20:29 旅鼠 阅读(1007) 评论(0) 推荐(0) 编辑
摘要: 啊,notepad++贴过来怎么对齐格式这么糟糕呢? #root用户 $普通用户 linux命令 清屏clear翻页清屏 CRT中ctrl+L reset"清空 CRT中不起作用" 创建用户useradd a创建用户名为a的用户 设置密码passwd a设置用户a的密码(输入密码时内容显示) 切换用 阅读全文
posted @ 2016-07-30 16:47 旅鼠 阅读(762) 评论(0) 推荐(0) 编辑