摘要:
1 from selenium import webdriver 2 from selenium.webdriver import ActionChains 3 4 #1.打开登陆页面 5 wd = webdriver.Chrome() 6 wd.implicitly_wait(10) 7 wd.get('https://mail.qq.com/') 8 9 #2.切换到账... 阅读全文
摘要:
环境:python3 pycharm 模块:requests,xlwt,urllib.request,re 正常三步走: 1.获取源代码 2.匹配源代码,获得目标数据 3.存储到文件中 直接上代码,列举两种获取源代码的方式,存储3中文件的方式。自由选择即可。 第一个标红部分引号里面的是网站url,太 阅读全文
摘要:
环境:python 3.6 pycharm 模块:requests,json 一、将爬取到的内容存放到txt文件中 1 import requests 2 import json 3 4 #请求头 5 headers = { 6 'Accept' : '*/*', 7 'Accept-Encodin 阅读全文
摘要:
代理的作用参考https://wenda.so.com/q/1361531401066511?src=140 免费代理很多,但也有很多不可用,所以我们可以用程序对其进行筛选。以能否访问百度为例。 1.获取网页内容。 对于一般网站像这样获取源代码就可以了,不过,这个网站有反爬机制,所以得用如下代码。 阅读全文
摘要:
使用工具:python3.6, pycharm 使用模块: tkinter模块:("Tk 接口")是Python的标准Tk GUI工具包的接口,位Python的内置模块,直接import tkinter即可使用 time模块:用于时间显示 注:关于tkinter模块可以参考http://www.cn 阅读全文
摘要:
装饰器:本质就是函数,功能是为其他函数添加附加功能 原则: 1.不修改被修饰函数的源代码 2.不修改被修饰函数的调用方式 装饰器的知识储备: 装饰器=高阶函数+函数嵌套+闭包 高阶函数: 1.函数接收的参数是一个函数名 2.函数的返回值是一个函数名 3.满足上述条件任意一个,都可称之为高阶函数 以下 阅读全文
摘要:
准备工作: 安装itchat:安装命令pip install itchat 1.导入itchat模块,给文件传输助手发一句话 运行代码,扫二维码,也就是登陆网页版微信,会自动将"你好,文件传输助手"传输到手机上。 itchat.send()是发送消息,“”里面是想要发送的内容,toUserName是 阅读全文
摘要:
工具:python3.6 pycharm 库:bs4 + urllib 第一步:读取html源码 第二步:获取内容和标题 第三步:在当前目录下新建一个lesson的文件夹,将文件存储在此文件夹下 数据爬取完毕。 注:以上完成一个页面的抓取,若想多抓取页面的话,可用以下代码: 阅读全文