摘要: 最近在学习Python,自然接触到了爬虫,写了一个小型爬虫软件,从初始Url解析网页,使用正则获取待爬取链接,使用beautifulsoup解析获取文本,使用自己写的输出器可以将文本输出保存,具体代码如下: Spider_main.py url_manager.py html_parser.py h 阅读全文
posted @ 2018-06-12 23:24 筱峰学长 阅读(4794) 评论(1) 推荐(1) 编辑
摘要: 项目主进程接收报警后,将alarm msg 发送给代理, 并将其分发: 代理将其分发后GUI接收此alarm, 并且将其在独立窗口显示: 独立窗口代码如此,并且点击窗口上的confirm按钮,可以将其输出文件保存: 阅读全文
posted @ 2018-06-10 21:03 筱峰学长 阅读(488) 评论(0) 推荐(0) 编辑
摘要: 前段时间发现项目中的上传FTP软件有可能会在从服务器申请断连时Crash, 所以加了一个Timer。 由于项目代码行数过大, 此处上传部分代码片段。 在此进程发出MesUPLOADTimeout 信息之后, 项目主进程会从代理Proxy中接受此信息并进行处理。 主进程重启上传软件,从而跳过断连。 阅读全文
posted @ 2018-06-09 23:24 筱峰学长 阅读(279) 评论(0) 推荐(0) 编辑