Kingvin_Shao - 博客园

2019年6月19日

摘要：本次作业来源于：https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/3363 一、课程评分标准：分数组成：考勤 10 平时作业 30 爬虫大作业 25 Hadoop生态安装与配置 10 分布式文件系统HDFS 分布式并行计算MapRed 阅读全文

posted @ 2019-06-19 23:05 Kingvin_Shao 阅读(220) 评论(0) 推荐(0)

2019年6月3日

分布式文件系统HDFS 练习

摘要：本次作业来源于：https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/3310 利用Shell命令与HDFS进行交互以”./bin/dfs dfs”开头的Shell命令方式 1.目录操作在HDFS中为hadoop用户创建一个用户目录（ha 阅读全文

posted @ 2019-06-03 00:51 Kingvin_Shao 阅读(136) 评论(0) 推荐(0)

2019年5月15日

安装Hadoop

摘要：本次作业来源于：https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/3223 1.安装Linux，MySql 2.windows 与虚拟机互传文件 3.安装Hadoop 还不能从windows复制文件的，可在虚拟机里用浏览器下载安装文件，阅读全文

posted @ 2019-05-15 11:34 Kingvin_Shao 阅读(178) 评论(0) 推荐(0)

2019年4月26日

爬虫综合大作业

摘要：本次作业来源于：https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/3159 一、安装wxpy pip install wxpy 二、微信登录机器人 Bot 对象可被理解为一个 Web 微信客户端。Bot在初始化时便会执行登陆操作，需要手阅读全文

posted @ 2019-04-26 15:39 Kingvin_Shao 阅读(295) 评论(0) 推荐(0)

0426

摘要： import re import jieba as jieba import pandas as pd from wxpy import * #初始化，扫码登录 bot = Bot() #获取好友 my_friends = bot.friends() print(type(my_friends)) # 使用一个字典统计好友男性和女性的数量 sex_dict = {'male': 0... 阅读全文

posted @ 2019-04-26 15:00 Kingvin_Shao 阅读(293) 评论(0) 推荐(0)

2019年4月14日

爬取全部的校园新闻

摘要：本次作业来源于：https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/3002 读入包： 0.从新闻url获取点击次数，并整理成函数 newsUrl newsId(re.search()) clickUrl(str.format()) req 阅读全文

posted @ 2019-04-14 12:32 Kingvin_Shao 阅读(126) 评论(0) 推荐(0)

2019年3月29日

理解爬虫原理

摘要：本次作业来源于：https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/2881 1. 简单说明爬虫原理爬虫原理就是爬取网页。 2. 理解爬虫开发过程 1).简要说明浏览器工作原理；浏览器的主要功能是向服务器发出请求，在浏览器中展示选择的网阅读全文

posted @ 2019-03-29 17:49 Kingvin_Shao 阅读(197) 评论(0) 推荐(0)

爬虫

摘要：安装 request beautifulsoup4安装阅读全文

posted @ 2019-03-29 15:17 Kingvin_Shao 阅读(97) 评论(0) 推荐(0)

2019年3月22日

中文词频统计与词云生成

摘要：本次作业来源于：https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/2822 中文词频统计 1. 下载一长篇中文小说。下载长篇小说《西游记》本次作业小说保存在txt文档：xyj.txt 2. 从文件读取待分析文本。 3. 安装并使用ji 阅读全文

posted @ 2019-03-22 15:44 Kingvin_Shao 阅读(458) 评论(0) 推荐(0)

2019年3月15日

复合数据类型，英文词频统计

摘要：作业博客要求：文字作业要求言简意骇，用自己的话说明清楚。编码作业要求放上代码，加好注释，并附上运行结果截图。 1.列表，元组，字典，集合分别如何增删改查及遍历。（1）列表通过[]来创建列表，可通过索引（index）来获取列表中的元素和修改元素；append() 方法向列表的最后添加一个元素，阅读全文

posted @ 2019-03-15 16:21 Kingvin_Shao 阅读(218) 评论(0) 推荐(0)

*警文

公告