03 2019 档案

摘要:1. 简单说明爬虫原理 使用python的requests模块模拟浏览器向服务器发送http请求,服务器接收到请求后向爬虫返回html数据,爬虫将返回的html数据保存下来,并利用bs4进行分析,将需要的数据截取下来并保存。 2. 理解爬虫开发过程 1).简要说明浏览器工作原理 在浏览器的地址栏输入 阅读全文
posted @ 2019-03-31 22:01 Trojans 阅读(164) 评论(0) 推荐(0)
摘要:1. 下载一长篇中文小说 此处下载的长篇中文小说是:三体 2. 从文件读取待分析文本 1 text = open("C:三体.txt", "r", encoding="UTF-8").read() # 读取文本 3. 安装并使用jieba进行中文分词 通过命令行,使用命令:pip install j 阅读全文
posted @ 2019-03-25 03:07 Trojans 阅读(1066) 评论(0) 推荐(0)
摘要:一、列表,元组,字典,集合的增、删、改、查以及遍历。 1.列表 1 pi = ['3', '.', '1', '4', '1', '5', '9', '2', '6', '5', '3', '5'] # 初始化 pi 列表 2 add = ['7', '9'] # 初始化 add 列表 3 4 # 阅读全文
posted @ 2019-03-23 01:06 Trojans 阅读(192) 评论(0) 推荐(0)
摘要:一、字符串操作 解析身份证号:生日、性别、出生地等。 1 provinces = {'11': '北京市', '12': '天津市', '13': '河北省', '14': '山西省', '15': '内蒙古自治区', '21': '辽宁省',\ 2 '22': '吉林省', '23': '黑龙江省 阅读全文
posted @ 2019-03-11 21:44 Trojans 阅读(146) 评论(0) 推荐(0)
摘要:1.浏览2019春节各种大数据分析报告,例如: 这世间,再无第二个国家有能力承载如此庞大的人流量。http://www.sohu.com/a/290025769_313993 春节人口迁徙大数据报告!http://www.sohu.com/a/293854116_679156 春节大数据:消费首破万 阅读全文
posted @ 2019-03-03 17:37 Trojans 阅读(161) 评论(0) 推荐(0)

/*代码高亮显示*/ /* 返回顶部 */ /* 返回顶部 */