摘要: python 爬虫 Advanced HTML Parsing 1. 通过属性查找标签:基本上在每一个网站上都有stylesheets,针对于不同的标签会有不同的css类于之向对应在我们看到的标签可能是像下面这样的 <span class="green" ></span> <span class=" 阅读全文
posted @ 2016-12-28 16:10 someOneHan 阅读(210) 评论(0) 推荐(0) 编辑
摘要: 1. os path module 1. os.path.abspath(path):根据操作系统的不同返回地址的绝对路径。 2. os.path.basename(path):返回给定路径的最后的名称(无论是文件名称还是文件夹名称),这个值是split()方法返回的第二个值 3. os.path. 阅读全文
posted @ 2016-12-28 11:06 someOneHan 阅读(397) 评论(0) 推荐(0) 编辑