摘要: # 取出所有的连接# coding: utf-8import sys, os, random, time, datetimeimport urllib, rereload(sys)sys.setdefaultencoding('utf-8')text = urllib.urlopen("http://www.qq.com").read()regex = r'''(]*?href="([^"]+)"[^>]*?>)|(]*?href='([^']+)'[^>]*?& 阅读全文
posted @ 2013-10-09 11:24 飞雪飘鸿 阅读(214) 评论(0) 推荐(0) 编辑
摘要: 1 echo 和 @回显命令@ #关闭单行回显echo off #从下一行开始关闭回显@echo off #从本行开始关闭回显。一般批处理第一行都是这个echo on #从下一行开始打开回显echo #显示当前是 echo off 状态还是 echo on 状态echo. #输出一个”回车换行”,空白行 #(同echo, echo; echo+ echo[ echo] echo/ echo)2 errorlevelecho %errorlevel%每个命令运行结束,可以用这个命令行格式查看返回码默认值为0,一般命令执行出错会设 errorlevel 为13 dir显示文件夹内容dir #显示当 阅读全文
posted @ 2013-10-09 10:59 飞雪飘鸿 阅读(4723) 评论(0) 推荐(0) 编辑
摘要: 一、 Scrapy简介 Scrapy is a fast high-level screen scraping and web crawling framework, used to crawl websites and extract structured data from their page 阅读全文
posted @ 2013-10-09 10:48 飞雪飘鸿 阅读(218) 评论(0) 推荐(0) 编辑
https://damo.alibaba.com/ https://tianchi.aliyun.com/course?spm=5176.21206777.J_3941670930.5.87dc17c9BZNvLL