12 2020 档案

摘要:操作过程 2.1 数据准备 A.1sudo mkdir usr/local/bigdatacase A.2sudo chown -R hadoop:hadoop ./bigdatacase A.3mkdir usr/local/bigdatacase/dataset A.4 A.5 B.1sed - 阅读全文
posted @ 2020-12-25 19:04 starrysky~ocean 阅读(565) 评论(0) 推荐(0)
摘要:使用sqoop进行将Hive 词频统计的结果数据传输到Mysql中。 1.mysql准备接受数据的数据库与表 命令如下: 创建使用数据库dblab,创建wxj表: 结果: 2. hive准备待传输的数据 命令如下: 使用hive数据库,进行表wxj的建立: 结果: 3.sqoop进行数据传输 命令如 阅读全文
posted @ 2020-12-12 19:33 starrysky~ocean 阅读(88) 评论(0) 推荐(0)
摘要:一、hive用本地文件进行词频统计 1.准备本地txt文件 2.启动hadoop,启动hive 3.创建数据库,创建文本表 4.映射本地文件的数据到文本表中 5.hql语句进行词频统计交将结果保存到结果表中。 6.查看统计结果 二、hive用HDFS上的文件进行词频统计 1.准备电子书或其它大的文本 阅读全文
posted @ 2020-12-03 16:32 starrysky~ocean 阅读(105) 评论(0) 推荐(0)