03 2017 档案
摘要:抓取时光网的电影列表并生成网页 源码 https://github.com/YouXianMing/BeautifulSoup4-WebCralwer 分析 利用BeautifulSoup进行分析网页并抓取数据,并利用正则表达式替换模板生成网页. 效果
阅读全文
摘要:[Python] 糗事百科文本数据的抓取 源码 https://github.com/YouXianMing/QiuShiBaiKeText 细节 1. 抓取 http://www.qiushibaike.com/text/ 所有35个页面的文本数据 2. 抓取的数据写进数据库,数据库用的是sqli
阅读全文
摘要:文件扫描 下载 https://github.com/YouXianMing/FileManager 细节 1. 基于Python 3.60,其他版本未测试 2. 支持扫描深度,不设置则扫描全部,设置了值,则扫描具体的层级 源码 使用
阅读全文
摘要:根据博客园用户名抓取其所有文章的标题及其链接 下载地址: https://github.com/YouXianMing/cnblogsTitleGetter -使用前须知- (1) 网络库使用的是 requests (https://github.com/kennethreitz/requests)
阅读全文