摘要:
1.数据准备 2.把CSV添加到/bigdatacase/dataset中 3.检查前5行并删除第一行 4.将csv文件导入hadoop并检查前10行数据情况 5.数据文件导入hive 6.在Hive中查看并分析数据 统计出用户所找小区数量最多的10个小区 可见未来世界花园小区深受人们居住的首选 7 阅读全文
摘要:
作业来自:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE2/homework/2894 给定一篇新闻的链接newsUrl,获取该新闻的全部信息 标题、作者、发布单位、审核、来源 发布时间:转换成datetime类型 点击: newsUrl newsId(使 阅读全文
摘要:
1. 下载一长篇中文小说。 2. 从文件读取待分析文本。 3. 安装并使用jieba进行中文分词。 pip install jieba import jieba ljieba.lcut(text) 4. 更新词库,加入所分析对象的专业词汇。 jieba.add_word('天罡北斗阵') #逐个添加 阅读全文
摘要:
1.列表,元组,字典,集合分别如何增删改查及遍历。 列表: 元组: 字典: dict={'bob':85,'nacy':70,'mary':90} #字典 #增 dict['jack']=60 #将元素添加在最后面 print(dict) #删 del (dict['mary']) #删除key为' 阅读全文
摘要:
作业要求来源:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/2166 GitHub地址:https://github.com/13178840342/Black 1、小学生四则运算程序需求:可供选择加减乘除简单运算,有题目参考练习,可 阅读全文
只有注册用户登录后才能阅读该文。 阅读全文