222wan

导航

随笔分类 -  Hadoop

mapreduce单词统计
摘要:首先打开虚拟机,启动好finallshell, 然后启动zookeeper,启动hadoop集群 然后打开本机上的hadoop文件 根据下面这个目录找到MapReduce 找到MapReduce中的sources 找到这个文件解压 根据这个路径名找到wordcount.java hadoop-map 阅读全文

posted @ 2023-11-13 23:20 角落的蘑菇 阅读(18) 评论(0) 推荐(0) 编辑

大数据分析案例--日志分析
摘要:具体操作和上次课堂测试类似,可视化代码更是比上次简单 这里只展示datagrip里的sql语句 这里不包括日期的清洗,日期的清洗有些困难,请教同学后知道怎样清洗,具体写在下一节 create table `past`( `ip` string, `Date` string, `day` string 阅读全文

posted @ 2023-10-14 01:04 角落的蘑菇 阅读(60) 评论(0) 推荐(0) 编辑

hive清洗数据sql语句报错
摘要:在本次的测试中sql语句清洗数据时下面,同时观察第一个语句中Date为啥要加这个单引号,原因是Date是sql语句里的可以说是一个关键字的存在,所以必须要单独引用起来以示区别 insert overwrite table article select ip as ip ,`Date` as `Dat 阅读全文

posted @ 2023-10-13 22:38 角落的蘑菇 阅读(21) 评论(0) 推荐(0) 编辑

datagrip链接hive
摘要:首先在官网下载datagrip直接点击安装选择30天免费试用 直接进项下一步,进去之后,新建project 起个名字完成即可: 右上角或左边有一个database点击 】 点击加号 选择Apache hive 点击上图的红框 1.点击加号 2.选择Custom JARs..... 3.需要下载3中的 阅读全文

posted @ 2023-09-22 15:41 角落的蘑菇 阅读(327) 评论(0) 推荐(0) 编辑

数据分析与企业数据分析方向
摘要:数据是指对客观事物进行记录并可以鉴别的符号,是对客观事物性质,转台以及相互关系等进行记载的物理符号,不仅仅指的是狭义上的数字,还可以是具有一定意义的文字字母等等。 数据必须同过观察事物的计量和统计 需要数据的原因:把隐藏在数据背后的信息集中和提炼出来,总结处内在规律。 数据分析在企业日常经营分析中主 阅读全文

posted @ 2023-09-04 23:06 角落的蘑菇 阅读(40) 评论(0) 推荐(0) 编辑