摘要: [html] view plain copy 最近总是要爬取一些东西,索性就把Python爬虫的相关内容都总结起来了,自己多动手还是好。 (1)普通的内容爬取(2)保存爬取的图片/视频和文件和网页(3)普通模拟登录(4)处理验证码登录(5)爬取js网站(6)全网爬虫(7)某个网站的站内所有目录爬虫( 阅读全文
posted @ 2018-04-06 05:47 中国人醒来了 阅读(494) 评论(0) 推荐(0) 编辑
摘要: 转载 Git 是一个很强大的分布式版本管理工具,它不但适用于管理大型开源软件的源代码(如:linux kernel),管理私人的文档和源代码也有很多优势(如:wsi-lgame-pro) Git 的更多介绍,请参考我的上一篇博客:Git 版本管理工具 一、 Git 命令初识 在正式介绍Git命令之前 阅读全文
posted @ 2018-04-06 05:45 中国人醒来了 阅读(251) 评论(0) 推荐(0) 编辑
摘要: 一般来说,所有能被整合或导入到其他Python脚本中的代码,都可以称为扩展。你可以用纯Python来写扩展,也可以用C/C++之类的编译型语言来写扩展,甚至可以用java,C都可以来写 python扩展。Python的一大特点是,扩展和解释器之间的交互方式域普通的Python模块完全一样,Pytho 阅读全文
posted @ 2018-04-06 05:32 中国人醒来了 阅读(602) 评论(0) 推荐(0) 编辑
摘要: 一般通过使用cyphton方式优化python执行速度后的模块,再次打包安装python模块包会安装在 当前解析器的site-packages目录下,使用后这些模块如果不需要怎样清理呢? 我们使用 python setup.py install 来安装python包,但是如何卸载呢? 只能手动删除安 阅读全文
posted @ 2018-04-06 05:28 中国人醒来了 阅读(3814) 评论(0) 推荐(0) 编辑