2019年6月16日

摘要: 作业要求:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE2/homework/3339 1.将爬虫大作业产生的csv文件上传到HDFS 在HDFS中创建/bigdatacase/dataset/a , /bigdatacase/dataset/bs文件夹 阅读全文

posted @ 2019-06-16 00:17 lawnlawn 阅读(185) 评论(0) 推荐(0) 编辑

2019年5月31日

摘要: 作业要求:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/3310 利用Shell命令与HDFS进行交互 1.目录操作 在HDFS中为hadoop用户创建一个用户目录(hadoop用户) 在用户目录下创建一个input目录 在HDFS的 阅读全文

posted @ 2019-05-31 17:03 lawnlawn 阅读(112) 评论(0) 推荐(0) 编辑

2019年5月16日

摘要: 作业要求:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/3223 1.安装Linux,MySql 安装mysql成功 mysql启动成功 2.windows 与 虚拟机互传文件 于windows新建一个共享文件夹share 虚拟机设置 阅读全文

posted @ 2019-05-16 10:22 lawnlawn 阅读(133) 评论(0) 推荐(0) 编辑

2019年5月6日

摘要: 最近《妇联4·终局之战》火爆全球,此部电影最早的首映是在...没有错就是我们的大中国,中国大陆首次早于北美,成为全球最早上映的国家地区之一。这一次,终于轮到我们给外国网友剧透了。因此我国还吸引了不少的国外漫威迷到中国来看首映,可想而知,这部电影是有多么的震撼!!! 妇联4的讨论热区莫过于我们的B站了 阅读全文

posted @ 2019-05-06 23:10 lawnlawn 阅读(686) 评论(0) 推荐(0) 编辑

2019年4月12日

摘要: 作业要求:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/3002 0.从新闻url获取点击次数,并整理成函数 newsUrl newsId(re.search()) clickUrl(str.format()) requests.ge 阅读全文

posted @ 2019-04-12 17:43 lawnlawn 阅读(149) 评论(0) 推荐(0) 编辑

2019年4月1日

摘要: 作业要求: 1. 简单说明爬虫原理 爬虫的原理 : 通过程序模拟浏览器请求站点,把站点返回的HTML代码、JSON数据、等爬到本地机器,从获取的数据中进行分析提取自己需要的数据,存放起来使用。 爬虫的流程: 2. 理解爬虫开发过程 1).简要说明浏览器工作原理; 浏览器工作原理的实质就是实现http 阅读全文

posted @ 2019-04-01 08:39 lawnlawn 阅读(165) 评论(0) 推荐(0) 编辑

2019年3月24日

摘要: 作业要求:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/2822 1. 下载一长篇中文小说。 下载的小说为村上春树的《且听风吟》 2. 从文件读取待分析文本。 3.安装并使用jieba进行中文分词。 4.更新词库,加入所分析对象的专业 阅读全文

posted @ 2019-03-24 22:13 lawnlawn 阅读(225) 评论(0) 推荐(0) 编辑

2019年3月18日

摘要: 作业要求: 1.列表,元组,字典,集合分别如何增删改查及遍历? 1)列表 增: append() :在列表末尾增加一个元素 append() :在列表末尾增加一个元素 insert() : 在指定的列表位置添加一个元素 insert() : 在指定的列表位置添加一个元素 extand() : 在列表 阅读全文

posted @ 2019-03-18 21:42 lawnlawn 阅读(176) 评论(0) 推荐(0) 编辑

2019年3月8日

摘要: 作业要求:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/2684 1.字符串操作: 解析身份证号:生日、性别、出生地等。 详细代码: 运行截图 凯撒密码编码与解码 详细代码: 运行截图: 网址观察与批量生成 详细代码: 运行截图: 2 阅读全文

posted @ 2019-03-08 18:08 lawnlawn 阅读(245) 评论(0) 推荐(0) 编辑

2019年3月1日

摘要: 作业要求:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/2639 这些分析所采用数据的来源是什么? 从2019年春节各大数据分析报告中可以看出其分析胡数据来源有:关于春运时用户的购票信息数据;城市迁移量的数据来源于平时该城市中人们使用 阅读全文

posted @ 2019-03-01 17:19 lawnlawn 阅读(174) 评论(0) 推荐(0) 编辑