摘要:
本次作业来源于:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/3363 一、课程评分标准: 分数组成: 考勤 10 平时作业 30 爬虫大作业 25 Hadoop生态安装与配置 10 分布式文件系统HDFS 分布式并行计算MapRed 阅读全文
摘要:
本次作业来源于:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/3310 利用Shell命令与HDFS进行交互 以”./bin/dfs dfs”开头的Shell命令方式 1.目录操作 在HDFS中为hadoop用户创建一个用户目录(ha 阅读全文
摘要:
本次作业来源于:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/3223 1.安装Linux,MySql 2.windows 与 虚拟机互传文件 3.安装Hadoop 还不能从windows复制文件的,可在虚拟机里用浏览器下载安装文件, 阅读全文
摘要:
本次作业来源于:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/3159 一、安装wxpy pip install wxpy 二、微信登录 机器人 Bot 对象可被理解为一个 Web 微信客户端。Bot在初始化时便会执行登陆操作,需要手 阅读全文
摘要:
import re import jieba as jieba import pandas as pd from wxpy import * #初始化,扫码登录 bot = Bot() #获取好友 my_friends = bot.friends() print(type(my_friends)) # 使用一个字典统计好友男性和女性的数量 sex_dict = {'male': 0... 阅读全文
摘要:
本次作业来源于:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/3002 读入包: 0.从新闻url获取点击次数,并整理成函数 newsUrl newsId(re.search()) clickUrl(str.format()) req 阅读全文
摘要:
本次作业来源于:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/2881 1. 简单说明爬虫原理 爬虫原理就是爬取网页。 2. 理解爬虫开发过程 1).简要说明浏览器工作原理; 浏览器的主要功能是向服务器发出请求,在浏览器中展示选择的网 阅读全文
摘要:
安装 request beautifulsoup4安装 阅读全文
摘要:
本次作业来源于:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/2822 中文词频统计 1. 下载一长篇中文小说。 下载长篇小说《西游记》 本次作业小说保存在txt文档:xyj.txt 2. 从文件读取待分析文本。 3. 安装并使用ji 阅读全文
摘要:
作业博客要求: 文字作业要求言简意骇,用自己的话说明清楚。 编码作业要求放上代码,加好注释,并附上运行结果截图。 1.列表,元组,字典,集合分别如何增删改查及遍历。 (1)列表 通过[]来创建列表,可通过索引(index)来获取列表中的元素和修改元素;append() 方法向列表的最后添加一个元素, 阅读全文