随笔分类 - python
这是一个神奇的世界
摘要:Scrapy入门教程 在本篇教程中,我已经安装好Scrapy 本篇教程中将带您完成下列任务: 创建项目 在开始爬取之前,您必须创建一个新的Scrapy项目。 进入您打算存储代码的目录中,运行下列命令: 这些文件分别是: scrapy.cfg: 项目的配置文件 tutorial/: 该项目的pytho
阅读全文
摘要:from selenium import webdriver from selenium.webdriver.common.by import By from selenium.webdriver.support.ui import WebDriverWait as Wait from selenium.webdriver.support import expected_conditions a...
阅读全文
摘要:from selenium import webdriver import os driver = webdriver.Chrome() driver.get("http://cn.bing.com") driver.find_element_by_xpath("//input[@id='sb_form_q']").send_keys("李晓鹏") driver.find_element_b...
阅读全文
摘要:第一步,下载chromeDrive:http://npm.taobao.org/mirrors/chromedriver(我下载的是2.43版本的chromedriver_win32.zip) 下载之后,把chromedriver.exe 解压到安装JetBrains PyCharm 2018.2.
阅读全文
摘要:""" 使用Requests库完成Post表单操作 """ #_*_codingn:utf8 _*_ import requests from bs4 import BeautifulSoup ''' 设置请求头,让程序发出的请求更像来源于浏览器 ''' headers = { "User-Agen
阅读全文
摘要:第一步:点击File->Settings 第二步:选择Project:workplace-->Project Interpreter,然后再点击右上角的"+"按钮进入下一步。 第三步:在输入框中输入要安装的库,如"bs4", 收搜出来,点击下面的Install Package 然后会有一个安装成功的
阅读全文
摘要:import urllib.request import re #解析html的内容 def getHtml(url): page=urllib.request.urlopen(url) html=page.read() return html #从html获取想要的图片信息 def getImg(
阅读全文