摘要: 本次作业的要求来自:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/3363 前言 本次作业是在《爬虫大作业》的基础上进行的,在《爬虫大作业》中,我主要对拉勾网python岗位的招聘信息进行的数据爬取,最终得到了18813条数据存在一个 阅读全文
posted @ 2019-06-20 21:20 TILY 阅读(260) 评论(0) 推荐(0) 编辑
摘要: 作业来源:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/3223 1.安装Linux,MySql 将相关的文件更改配置后,进行首次的格式化并进行启动: 执行Namenode的格式化 启动Hadoop: 通过命令jps可以查看各个节点所 阅读全文
posted @ 2019-05-17 15:03 TILY 阅读(125) 评论(0) 推荐(0) 编辑
摘要: 作业来源:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/3002 0.从新闻url获取点击次数,并整理成函数 newsUrl newsId(re.search()) clickUrl(str.format()) requests.ge 阅读全文
posted @ 2019-04-15 17:07 TILY 阅读(143) 评论(0) 推荐(0) 编辑
摘要: 1. 简单说明爬虫原理 爬虫:请求网站并提取数据的自动化程序 百科:网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。 2. 理解爬虫开发过程 1 阅读全文
posted @ 2019-04-02 10:16 TILY 阅读(309) 评论(0) 推荐(0) 编辑
摘要: 作业要求来自于:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/2753 1.列表,元组,字典,集合分别如何增删改查及遍历。 列表: 增: 1)append()增加到最后 2)insert()方法:在列表指定的位置上增加一个元素 3)e 阅读全文
posted @ 2019-03-25 17:06 TILY 阅读(219) 评论(0) 推荐(0) 编辑
摘要: 1.字符串操作: 解析身份证号:生日、性别、出生地等。 代码: 运行结果: 凯撒密码编码与解码 代码: 运行结果: 网址观察与批量生成 代码: 运行结果: 2.英文词频统计预处理 下载一首英文的歌词或文章或小说。 将所有大写转换为小写 将所有其他做分隔符(,.?!)替换为空格 分隔出一个一个的单词 阅读全文
posted @ 2019-03-11 16:28 TILY 阅读(212) 评论(0) 推荐(0) 编辑
摘要: 这个作业的要求来自于:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/2639 1.浏览2019春节各种大数据分析报告,例如: 这世间,再无第二个国家有能力承载如此庞大的人流量。http://www.sohu.com/a/2900257 阅读全文
posted @ 2019-03-01 17:14 TILY 阅读(226) 评论(0) 推荐(0) 编辑
摘要: 作业要求:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/2213 GitHub远程地址:https://github.com/Tily288/Tily 一、基本要求 从个人项目出发,将程序改造成一个单机带用户界面(不是控制台)的程序, 阅读全文
posted @ 2018-10-24 21:37 TILY 阅读(254) 评论(0) 推荐(0) 编辑
摘要: 作业要求地址:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/2166 Github地址:https://github.com/Tily288/Tily 一、时间计划与实际使用时间 二、题目要求 任何编程语言都可以,命令行程序接受一个数 阅读全文
posted @ 2018-10-11 15:10 TILY 阅读(296) 评论(1) 推荐(0) 编辑
摘要: 作业来源:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/2103 1.下载安装配置用户名和邮箱。 配置用户名和邮箱 查看用户名和邮箱地址 2. 创建工作目录并通过git init命令把这个目录变成Git可以管理的仓库。 3. 在工作目 阅读全文
posted @ 2018-09-17 18:42 TILY 阅读(153) 评论(1) 推荐(0) 编辑