摘要: 自我总结: 这个学期....emm做的很差,一开始还是有股冲劲的,但是随着时间推移和项目堆积,我也逐渐的退而求其次,降低作业完成的质量,虽然最后勉强完成了大作业,但是也只是面对单个文件的处理,并不是“智能”处理平台,总的来说,这个学期的状态很差。从一开始干劲十足变得越来越佛系,躺平。好在王建民老师将 阅读全文
posted @ 2021-12-17 21:32 晨enough 阅读(57) 评论(0) 推荐(0) 编辑
摘要: 王 S 聪想要在海外开拓万 D 电影的市场, 这次他在考虑: 怎么拍商业电影才 能赚钱?毕竟一些制作成本超过 1 亿美元的大型电影也会失败。这个问题对电影 业来说比以往任何时候都更加重要。 所以,他就请来了你(数据分析师)来帮 他解决问题, 给出一些建议, 根据数据分析一下商业电影的成功是否存在统一 阅读全文
posted @ 2021-12-17 20:36 晨enough 阅读(315) 评论(0) 推荐(0) 编辑
摘要: 1树形结构 2文章统计 3文章分词和词云图展示 阅读全文
posted @ 2021-12-17 20:24 晨enough 阅读(70) 评论(0) 推荐(0) 编辑
摘要: (1)用MongoDB Shell设计出student集合; (2)用find()方法输出两个学生的信息; (3)用find()方法查询zhangsan的所有成绩(只显示score列); (4)修改lisi的Math成绩,改为95。 阅读全文
posted @ 2021-12-17 20:16 晨enough 阅读(93) 评论(0) 推荐(0) 编辑
摘要: 1、导入表 load data local inpath '/home/data03.csv' overwrite into table qingxi03; load data local inpath '/home/area03.csv' overwrite into table area03; 阅读全文
posted @ 2021-12-17 20:13 晨enough 阅读(34) 评论(0) 推荐(0) 编辑
摘要: 1、数据导入 直接将源数据导入mysql数据库结果如下: 2、文章统计 使用SQL语句查看各个行业的新闻条数 3、文章分词 使用python进行文章分词,统计词频并存储为csv文件,然后在PHP中转换为json数据进行词云图绘制 阅读全文
posted @ 2021-12-17 20:12 晨enough 阅读(23) 评论(0) 推荐(0) 编辑
摘要: 1导入数据 2数据分析 3入库 4可视化展示 阅读全文
posted @ 2021-12-17 20:09 晨enough 阅读(36) 评论(0) 推荐(0) 编辑
摘要: 驱动类 import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.Path;import org.apache.hadoop.io.NullWritable;import org.apache.hadoop.io. 阅读全文
posted @ 2021-12-17 19:38 晨enough 阅读(289) 评论(0) 推荐(0) 编辑
摘要: 1安装jdk 2配置免密登录 sudo apt-get install ssh 3下载Hadoop安装包 wgethttp://apache.mirrors.tds.net//hadoop/common/hadoop-0.20.203.0/hadoop-0.20.203.0rc1.tar.gz 4配 阅读全文
posted @ 2021-12-17 19:36 晨enough 阅读(22) 评论(0) 推荐(0) 编辑