https://github.com/YouXianMing

03 2017 档案

摘要:抓取时光网的电影列表并生成网页 源码 https://github.com/YouXianMing/BeautifulSoup4-WebCralwer 分析 利用BeautifulSoup进行分析网页并抓取数据,并利用正则表达式替换模板生成网页. 效果 阅读全文
posted @ 2017-03-22 16:31 YouXianMing 阅读(866) 评论(0) 推荐(0) 编辑
摘要:[Python] 糗事百科文本数据的抓取 源码 https://github.com/YouXianMing/QiuShiBaiKeText 细节 1. 抓取 http://www.qiushibaike.com/text/ 所有35个页面的文本数据 2. 抓取的数据写进数据库,数据库用的是sqli 阅读全文
posted @ 2017-03-13 15:47 YouXianMing 阅读(692) 评论(0) 推荐(0) 编辑
摘要:文件扫描 下载 https://github.com/YouXianMing/FileManager 细节 1. 基于Python 3.60,其他版本未测试 2. 支持扫描深度,不设置则扫描全部,设置了值,则扫描具体的层级 源码 使用 阅读全文
posted @ 2017-03-13 09:20 YouXianMing 阅读(1123) 评论(0) 推荐(0) 编辑
摘要:根据博客园用户名抓取其所有文章的标题及其链接 下载地址: https://github.com/YouXianMing/cnblogsTitleGetter -使用前须知- (1) 网络库使用的是 requests (https://github.com/kennethreitz/requests) 阅读全文
posted @ 2017-03-10 17:33 YouXianMing 阅读(973) 评论(1) 推荐(0) 编辑

点击右上角即可分享
微信分享提示