11 2014 档案
摘要:使用Git时,在pull、merge、rebase的过程中,经常会遇到conflict的情况。遇到conflict时,以上处理过程会终端,并且命令行中显示(xxx|MERGING)的状态(Windows下Git Bash中显示的状态)。命令行下解决冲突的方法为:使用任意的文本编辑工具编辑有冲突的文件...
阅读全文
摘要:## 关于PhantomJS[PhantomJS](http://phantomjs.org/) 是一个基于WebKit的服务器端 JavaScript API。它全面支持web而不需浏览器支持,其快速,原生支持各种Web标准: DOM 处理, CSS 选择器, JSON, Canvas, 和 SV...
阅读全文
摘要:最近折腾爬虫,后端使用jQuery进行数据采集,一般都是先从浏览器中将采集代码调试好后直接放到后端跑了。有些网址没有引用jQuery,那调试起来就不方便了,可以用以下代码动态添加script标签,将jQuery引用到页面中。```var scriptBlock = document.createEl...
阅读全文
摘要:运行Spark服务,需要在每个节点上部署Spark。可以先从主节点上将配置修改好,然后把Spark直接scp到其他目录。## 关键配置修改`conf/spark-env.sh`文件:```export JAVA_HOME=/usr/java/latestexport HADOOP_CONF_DIR=...
阅读全文
摘要:## 配置文件:/etc/profile```export JAVA_HOME=/usr/java/latestexport HADOOP_PREFIX=/opt/hadoop-2.4.1export HADOOP_COMMON_LIB_NATIVE_DIR=${HADOOP_PREFIX}/lib...
阅读全文