摘要: 功能:爬取某网站部分新闻列表和对应的详细内容。 列表页面http://www.zaobao.com/special/report/politic/fincrisis 实现代码: 运行方法: scrapy runspider zao.py -o ac.csv #-o 输出为文件,保存格式为csv格式 阅读全文
posted @ 2016-12-26 21:12 cui0x01 阅读(169) 评论(0) 推荐(0) 编辑
摘要: 纪念我曾今热爱的数通(^o^)。 物理层 一句话概述: OSI的第一层,它虽然处于最底层,却是整个开放系统的基础。物理层为设备之间的数据通信提供传输媒体及互连设备,为数据传输提供可靠的环境。 常见设备: 网线,中继器(增加传输距离),调制解调器(家用的猫),光纤,同轴电缆。 使用协议: EIA/TI 阅读全文
posted @ 2016-12-23 10:07 cui0x01 阅读(602) 评论(0) 推荐(0) 编辑
摘要: 将该导航网站搜索出结果的页面http://www.dmoz.org/Computers/Programming/Languages/Python/Books/里面标题,及标题的超链接和描述爬下来。 使用scrapy抓取一个网站一共需要四个步骤。 创建一个scrapy项目 定义item容器 编写爬虫 阅读全文
posted @ 2016-12-22 22:37 cui0x01 阅读(266) 评论(0) 推荐(0) 编辑
摘要: Scrapy介绍 Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架。 可以应用在包括数据挖掘,信息处理或存储历史数据等一系列的程序中。所谓网络爬虫,就是一个在网上到处或定向抓取数据的程序,当然,这种说法不够专业,更专业的描述就是,抓取特定网站网页的HTML数据。抓取网页的一般方法是 阅读全文
posted @ 2016-12-21 23:52 cui0x01 阅读(238) 评论(0) 推荐(0) 编辑
摘要: 最近在提高自己编程能力,拿一些实用的小工具练下。该脚本为python语言,主要涉及模块zipfile,threadings模块。 功能:暴力猜解zip解压密码 阅读全文
posted @ 2016-12-21 00:09 cui0x01 阅读(2031) 评论(0) 推荐(0) 编辑
摘要: 1.什么是异常 程序出现了错误(在编译或者执行过程中) >>> aTraceback (most recent call last): File "<pyshell#0>", line 1, in <module> aNameError: name 'a' is not defined NameEr 阅读全文
posted @ 2016-12-20 09:54 cui0x01 阅读(2624) 评论(0) 推荐(0) 编辑
摘要: 纪念我曾今热爱的数通(^o^)。 1.osi参考模型 2.数据的封装和解封装 3.主机和主机间通信 阅读全文
posted @ 2016-12-18 22:34 cui0x01 阅读(172) 评论(0) 推荐(0) 编辑
摘要: 最近在提高自己编程能力,拿一些实用的小工具练下。该脚本为python语言,主要涉及模块urllib,json,os模块。 功能:调用ZoomEye API获取信息 阅读全文
posted @ 2016-12-14 23:28 cui0x01 阅读(3120) 评论(0) 推荐(0) 编辑
摘要: 最近在提高自己编程能力,拿一些实用的小工具练下。该脚本为python语言,主要涉及模块urllib,re。 功能:验证CmsEasy5.5爆账号密码 实验用源码:http://pan.baidu.com/s/1i4lAwBF 搭建环境:phpstudy 试了IIs+php没爆出来最好用phpstud 阅读全文
posted @ 2016-12-13 15:22 cui0x01 阅读(3106) 评论(0) 推荐(0) 编辑
摘要: 最近在提高自己编程能力,拿一些现实的小脚本练下。该脚本为python语言,主要涉及模块os。 功能:将控制台输入文字逐行保存,和读取。 阅读全文
posted @ 2016-12-12 22:27 cui0x01 阅读(162) 评论(0) 推荐(0) 编辑