摘要: SEO要是和python数据分析联合在一起,可谓是很好的方法,没事的时候尝试写的分析网站被百度收录的网址和标题。 首先得引入两个py模块,分别是:Beautiful Souprequests 没有下载这两个模块的可以用以下命令下载: pip install BeautifulSoup pip ins 阅读全文
posted @ 2018-07-11 16:22 圆柱模板 阅读(1046) 评论(0) 推荐(0) 编辑
摘要: 网站被镜像的危害 通俗的讲,恶意镜像者意图利用自己有一定权重的域名进行威压,通过某些手段复制了你的站点,除了域名不一样之外,其他内容一模一样,用户或许根本无法分辨。甚至对于一些新的站点,搜索引擎都会迷惑到底哪个是真的站点,那么就有可能正牌的网站被删除收录,而盗版的却被搜索引擎青睐。 虽然目前我们还不 阅读全文
posted @ 2018-07-11 15:22 圆柱模板 阅读(473) 评论(0) 推荐(0) 编辑
摘要: 这是晚上没事无聊写的python爬虫小程序,专门爬取妹子图的,养眼用的,嘻嘻!身为程序狗只会这个了! 废话不多说,代码附上,仅供参考学习! 阅读全文
posted @ 2018-07-11 15:03 圆柱模板 阅读(1742) 评论(0) 推荐(0) 编辑
摘要: 代码挺简单的,但是实用!可以看看,如果有哪些不足和意见可以和我一起探讨! 阅读全文
posted @ 2018-07-11 14:55 圆柱模板 阅读(335) 评论(0) 推荐(0) 编辑
摘要: 这个扫描是概率问题,是需要字典的,以下代码是作为参考,字典可以去网上下载,我就不提供,我提供的是思路! 阅读全文
posted @ 2018-07-11 14:48 圆柱模板 阅读(731) 评论(0) 推荐(0) 编辑
摘要: 我拿这个站点作为案例:https://91mjw.com/ 其他站点方法都是差不多的。 第一步:获得整站所有的视频连接 第二步 :是进入选择的电影的页面 去获得视频的链接 第三步 构造下载视频用到的参数第四步 下载视频 保存到本地 直接上实现代码 使用的多线程 加信号量实现 默认开启5条线程开始操作 阅读全文
posted @ 2018-07-11 14:43 圆柱模板 阅读(2877) 评论(0) 推荐(0) 编辑
摘要: 以下笔记,作为参考借鉴,如有疑问可以联系我进行交流探讨! 代码思路很简单,简单概括为: 首先利用requests的get方法获取页面的html文件,之后对得到的html文件进行相对应的正则处理,然后把爬取到的数据保存到本地。 阅读全文
posted @ 2018-07-11 14:37 圆柱模板 阅读(310) 评论(0) 推荐(0) 编辑
摘要: 这是我的之前写的代码,今天发布到博客园上,说不定以后需要用。 开始: 然后连接数据库进行解析,数据库中包含图文消息html代码等信息。 附带极限词列表,进行过滤使用 阅读全文
posted @ 2018-07-11 14:33 圆柱模板 阅读(933) 评论(0) 推荐(0) 编辑
摘要: 近期搞项目中遇到Bencode解码的问题,就用Py写了个Bencode解码的代码。作为笔记保存参考。 BEncoding是BitTorrent用在传输数据结构的编码方式,这种编码方式支持四种类型的数据:string, int, Dictionary<string, object>, List<obj 阅读全文
posted @ 2018-07-11 14:29 圆柱模板 阅读(1911) 评论(0) 推荐(0) 编辑