摘要:
1:ps aux|grep Spider4Test.jar查看端口2: lsof -p [端口号]在爬虫运行期间如果看到 大量的TIME_WAIT WAIT_CLOSE 说明请求关闭阻塞【采用httpclient默认方法 ,其实没有关闭掉,需要跑等3分钟 才会关闭】 大量并发时 会有阻塞3: 解决... 阅读全文
摘要:
0:传输 .jar 等文件有问题 是 添加 sz -bye 以二进制流方式传输 1:安装 homebrew 2: brew install lrzsz 3:搜索 iterm2-recv-zmodem.sh iterm2-send-zmodem.sh 文件 copy至 /usr/local/bin 下 阅读全文
摘要:
【需求场景】:一个10000w行的文件处理 ,多进程处理 比如启动100个进程同时处理。【方法】:拆分文件(split) ,制作shell脚本 执行后台进程【demo】:假设处理程序为 test.php , 需要接收参数 处理数据文件路径 加 传入参数 eg:part_01 1 【第二个... 阅读全文
摘要:
简述: javac时指定 编码 UTF-8 【 javac -encoding UTF-8 Test.java】,运行时 java 指定编码 UTF-8 这样就不会出现乱码问题【javac -Dencoding=UTF-8 Test】maven ant 自己指定编码 ,eclipse导出时 指定编... 阅读全文
摘要:
echo $LANG显示编码 : en_US.UTF-8 英文urf8有时显示程序输出是?解决方法:vim ~/.bashrc最后一行追加:export LANG=zh_CN.UTF-8然后使用户配置生效source ~/.bashrc 阅读全文
摘要:
awk -F'\t' '{if($3 !~ /^<img/){print $0}}' latex500.db|wc -l 阅读全文
摘要:
若是只要site地址:http://subclipse.tigris.org/update_1.6.x,下边可以忽略一、给Eclipse安装SVN,最常见的有两种方式:手动方式和使用安装向导方式。具体步骤如下:方式一:手动安装1、从官网下载site-1.6.9.zip文件,网址是:subclipse... 阅读全文
摘要:
1、vim ~/.vimrc 进入配置文件如果不知道vimrc文件在哪,可使用 :scriptnames 来查看set nu #行号set tabstop=4 #一个tab为4个空格长度set ai #设置自动缩进syntax on #高亮2、基本空格键 向右移动一格x 删除后面的字符 ... 阅读全文
摘要:
function decodeUnicode($str) {return preg_replace_callback('/\\\\u([0-9a-f]{4})/i', 'convert', $str);}function convert($matches){return mb_convert_enc... 阅读全文
摘要:
目标 替换 test.data文件中的原正则:(\d{4}[^)]*?)sed不支持 \d 改为0-9测试 :head test.data| sed -r "s/([0-9]{4}[^)]+)//g"grep测试:grep -P "(\\d{4}[^)]*?)" test.data替换:sed -i... 阅读全文