随笔分类 - python爬虫
摘要:1importxlwt23#创建一个workbook4workbook=xlwt.Workbook(encoding='utf-8')5style_head=xlwt.easyxf('font:boldon')67#增加一个sheet页8worksheet=workbook.add_sheet(sh...
阅读全文
摘要:1#思路:利用beautiful省去了正则这个麻烦事,把页面搞出来然后提取js,css,img,提取命令使用getopt很方便,使用前需要确保已经安装了beautiful soup,如没有安#装请 到http://www.crummy.com/software/BeautifulSoup/ 下载2...
阅读全文
摘要:1 几种简单的正则:. 匹配任意字符(换行符除外)* 匹配前一个字符0次或者无限次?匹配前一个字符0次或1次.*贪婪算法.*?非贪婪算法() 将括号的内容返回2. 重用方法:findall 匹配所有满足规律的内容,并返回一个列表seach 匹配并提取第一个符合规律的内容并返回一个正则表达式的对象su...
阅读全文