随笔分类 -  python爬虫

摘要:1importxlwt23#创建一个workbook4workbook=xlwt.Workbook(encoding='utf-8')5style_head=xlwt.easyxf('font:boldon')67#增加一个sheet页8worksheet=workbook.add_sheet(sh... 阅读全文
posted @ 2016-01-18 18:02 acvc 阅读(227) 评论(0) 推荐(0) 编辑
摘要:1#思路:利用beautiful省去了正则这个麻烦事,把页面搞出来然后提取js,css,img,提取命令使用getopt很方便,使用前需要确保已经安装了beautiful soup,如没有安#装请 到http://www.crummy.com/software/BeautifulSoup/ 下载2... 阅读全文
posted @ 2015-10-27 20:21 acvc 阅读(1417) 评论(0) 推荐(0) 编辑
摘要:1 几种简单的正则:. 匹配任意字符(换行符除外)* 匹配前一个字符0次或者无限次?匹配前一个字符0次或1次.*贪婪算法.*?非贪婪算法() 将括号的内容返回2. 重用方法:findall 匹配所有满足规律的内容,并返回一个列表seach 匹配并提取第一个符合规律的内容并返回一个正则表达式的对象su... 阅读全文
posted @ 2015-05-21 16:04 acvc 阅读(181) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示