摘要: 1.数据准备 2.把CSV添加到/bigdatacase/dataset中 3.检查前5行并删除第一行 4.将csv文件导入hadoop并检查前10行数据情况 5.数据文件导入hive 6.在Hive中查看并分析数据 统计出用户所找小区数量最多的10个小区 可见未来世界花园小区深受人们居住的首选 7 阅读全文
posted @ 2019-06-17 17:29 黄泽丰 阅读(266) 评论(0) 推荐(0) 编辑
摘要: 作业来自:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE2/homework/2894 给定一篇新闻的链接newsUrl,获取该新闻的全部信息 标题、作者、发布单位、审核、来源 发布时间:转换成datetime类型 点击: newsUrl newsId(使 阅读全文
posted @ 2019-04-02 11:06 黄泽丰 阅读(154) 评论(0) 推荐(0) 编辑
摘要: 1. 下载一长篇中文小说。 2. 从文件读取待分析文本。 3. 安装并使用jieba进行中文分词。 pip install jieba import jieba ljieba.lcut(text) 4. 更新词库,加入所分析对象的专业词汇。 jieba.add_word('天罡北斗阵') #逐个添加 阅读全文
posted @ 2019-03-18 17:24 黄泽丰 阅读(302) 评论(0) 推荐(0) 编辑
摘要: 1.列表,元组,字典,集合分别如何增删改查及遍历。 列表: 元组: 字典: dict={'bob':85,'nacy':70,'mary':90} #字典 #增 dict['jack']=60 #将元素添加在最后面 print(dict) #删 del (dict['mary']) #删除key为' 阅读全文
posted @ 2019-03-14 09:53 黄泽丰 阅读(176) 评论(0) 推荐(0) 编辑
只有注册用户登录后才能阅读该文。 阅读全文
posted @ 2019-03-07 11:29 黄泽丰 阅读(14) 评论(0) 推荐(1) 编辑
摘要: 作业要求来源:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/2166 GitHub地址:https://github.com/13178840342/Black 1、小学生四则运算程序需求:可供选择加减乘除简单运算,有题目参考练习,可 阅读全文
posted @ 2018-10-15 13:16 黄泽丰 阅读(208) 评论(2) 推荐(0) 编辑
只有注册用户登录后才能阅读该文。 阅读全文
posted @ 2018-10-08 09:09 黄泽丰 阅读(10) 评论(2) 推荐(0) 编辑
摘要: 作业要求来自于:A. https://book.douban.com/subject/4006425/discussion/22803733/ 执行力,效率, 不管做什么都非常需要的,文中所提到的将事情分为四种不同紧张程度的等级,无疑是可以提高做事效率,使人不再拖拉。大一很开心,无忧无虑,参加着各种 阅读全文
posted @ 2018-09-09 18:20 黄泽丰 阅读(174) 评论(1) 推荐(0) 编辑