随笔分类 - Python学习
摘要:from urllib import request from bs4 import BeautifulSoup as bs import re import codecs import jieba #分词包 import numpy #numpy计算包 import pandas as pd #分词用到 import matplotlib.pyplot as plt #绘图包 imp...
阅读全文
摘要:from urllib import request from bs4 import BeautifulSoup as bs import re import codecs import jieba #分词包 import numpy #numpy计算包 import pandas as pd #分词用到 import matplotlib.pyplot as plt #绘图包 imp...
阅读全文
摘要:from urllib import request from bs4 import BeautifulSoup as bs #爬取豆瓣最受关注图书榜 resp = request.urlopen('https://book.douban.com/chart?subcat=I') html_data = resp.read().decode('utf-8') #转化为BeautifulSou...
阅读全文
摘要:from urllib import request from bs4 import BeautifulSoup as bs #爬取豆瓣最受关注图书榜 resp = request.urlopen('https://book.douban.com/chart?subcat=I') html_data = resp.read().decode('utf-8') #转化为BeautifulSou...
阅读全文
摘要:import requests #requests模块用于HTTP请求 import codecs #codecs模块用于文件操作 from bs4 import BeautifulSoup #beautifulSoup库用于对html代码进行解析 #要爬取的地址 URL="https://book.douban.com/top250" #user-agent,模仿浏览器,防止被目...
阅读全文
摘要:import requests #requests模块用于发送HTTP请求 import json #json模块用于对JSON数据进行编解码 #新建数组用于存放多个电影数据 movielist=[] #浏览器演示json crawlSite="https://api.douban.com/v2/movie/in_theaters" #像豆瓣发送请求并得到响应 res ...
阅读全文
摘要:例题一:猜数游戏。在程序中预设一个0~9之间的整数,让用户通过键盘输入所猜的数,如果大于预设的数,显示“遗憾,太大了”;小于预设的数,显示“遗憾,太小了”,如此循环,直至猜中该数,显示“预测N次,你猜中了!”,其中N是用户输入数字的次数。 例题二:改编例一,让计算机能够随机产生一个预设数字,范围在0
阅读全文
摘要:用Python从一篇文章中提取关键信息,涉及到不少知识。其中正则表达式这方面的内容很重要,所以我简单整理了下,方便以后的学习。 首先,正则表达式是什么? 正则表达式,又称规则表达式。(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。
阅读全文
摘要:在使用Pycharm编写程序时,我们时常需要调用某些模块,但有些模块事先是没有的,我们需要把模块添加上去。 最近在学习爬虫,写了下面几行代码: 结果出现错误 错误ModuleNotFoundError: No module named 'bs4'的意思是未找到名为bs4的模块,我们就需要pychar
阅读全文
摘要:刚刚接触到Python,直接在计算机上编译时不能正确的运行,所以将一些有关编译环境调试的知识总结了一下。 环境搭建: Python在 windows系统上编译的时候可能会出现一些编译无法运行的情况,我们要掌握一些简单有效的方法。 一、在Python官网中下载Python。 官网网址:https://
阅读全文