随笔分类 - python
requests 获取百度推广信息
摘要:2019年的第一篇博客,恩,好久没写过博客了,恩,忘了,哈哈,实在是太懒了 今天写一个爬取百度推广数据的爬虫,当然我写的肯定不是那么的完美,但是能用,大哭 注意:有的时候,get或post方法获取数据是会报ssl等错误,网站要验证啥的,没搞懂,网上搜索,都是设置 verify=False,我也懒得去
阅读全文
flask下载文件---文件流
摘要:html: <a name="downloadbtn" class="btn btn-success pull-right" href="/downloadfile/?filename=/root/allfile/123.txt">下载</a> py:@app.route('/downloadfil
阅读全文
爬虫----scrapy账号登录豆瓣,并且重定向到电影界面,获取界面信息
摘要:Request:这是url重定向FormRequest:这是表单提交,就是登录界面时,输入账号、密码,点击登陆的过程 # -*- coding: utf-8 -*-import scrapyfrom scrapy.http import Request, FormRequestclass Login
阅读全文
爬虫-----爬取所有国家的首都、面积 ,并保存到txt文件中
摘要:# -*- coding:utf-8 -*-import urllib2import lxml.htmlfrom lxml import etreedef main(): file = open('./countrys.txt', 'w+') file.close() countrys = [] u
阅读全文
python-爬虫(3)---lxml匹配css
摘要:百度首页 部分代码 <div class="s_tab_inner"> <b>网页</b> <a href="//www.baidu.com/s?rtt=1&bsst=1&cl=2&tn=news&word=" wdfield="word" onmousedown="return c({'fm':'
阅读全文
python 判断两个ip是不是处于同一网段
摘要:a_ip:10.10.15.100b_ip:10.10.15.101c_ip:10.10.10.100netmask:255.255.255.0def numtobinary(num): binary = '' a = int(num) while 1: if a == 0 or a == 1: b
阅读全文