摘要: 应用场景: 3kw行url+\t+html记录 【网站混合】 需要:按照网站来源分桶输出执行shellcat */*pack.html|awk -F '\t' '{ split($1,arr,"/"); site=arr[3]; print $0 > site }' 阅读全文
posted @ 2016-01-18 17:40 cphmvp 阅读(158) 评论(0) 推荐(0) 编辑
该文被密码保护。 阅读全文
posted @ 2016-01-18 14:26 cphmvp 阅读(2) 评论(0) 推荐(0) 编辑
爬虫在线测试小工具: http://tool.haoshuju.cn/