2020 年 3月随笔档案 - 那山的狐狸

编写java程序压缩Linux本地目录

摘要：注：图片如果损坏，点击文章链接：https://www.toutiao.com/i6809285459722633736/ 创建工程使用maven工程勾选，然后下一步填写基本信息注意改一下编码和JDK pom配置（附在文档后面）引入jar(这个包一直不能下载，所以另外导入) 创建运行类编阅读全文

posted @ 2020-03-29 00:01 那山的狐狸阅读(463) 评论(0) 推荐(0) 编辑

SpringBoot学习笔记五之管理员后台维护

摘要：注：图片如果损坏，点击文章链接：https://www.toutiao.com/i6803544440112677379/ 首先完成分页引入PageHelper(之前已经添加过了) 在spring-persist-mybatis.xml配置PageHelper插件找到AdminMapper.xm 阅读全文

posted @ 2020-03-26 21:54 那山的狐狸阅读(456) 评论(0) 推荐(0) 编辑

SpringBoot学习笔记四之后台登录页面的实现

摘要：注：图片如果损坏，点击文章链接： https://www.toutiao.com/i6803542216150090252/ 继续之前完成的内容，首先创建一个常量类常量类的内容服务器端渲染前后端分离完成后台管理登录页面进入前端静态资源创建后台管理员登录页面admin-login.jsp 阅读全文

posted @ 2020-03-25 21:47 那山的狐狸阅读(981) 评论(0) 推荐(0) 编辑

SpringBoot学习笔记三之表述层

摘要：注：图片如果损坏，点击文章链接：https://www.toutiao.com/i6803355920697917965/ 首先配置learn-admin-webui中的web.xml文件配置ContextLoaderListener ContextLoaderListener的作用：加载 Spr 阅读全文

posted @ 2020-03-24 23:20 那山的狐狸阅读(323) 评论(0) 推荐(0) 编辑

自定义Nginx日志格式获取IP地址的省市份信息

摘要：注：图片如果损坏，点击文章链接：https://www.toutiao.com/i6806672112477012493/ 在linux中nginx日志产生的格式是下面的配置： $remote_addr^A$msec^A$http_host^A$request_uri 然后准备好了获取的日志数据创阅读全文

posted @ 2020-03-21 22:53 那山的狐狸阅读(541) 评论(0) 推荐(0) 编辑

SpringBoot学习笔记二之Spring整合Mybatis

摘要：原文链接： https://www.toutiao.com/i6803235766274097678/ 在learn-admin-component子工程中加入搭建环境所需要的具体依赖（因为比较长配置信息放到文档后面）在learn-admin-webui配置jdbc.propertis 配置内容阅读全文

posted @ 2020-03-21 00:12 那山的狐狸阅读(239) 评论(0) 推荐(0) 编辑

SpringBoot学习笔记一之本地环境基础搭建

摘要：原文链接： https://www.toutiao.com/i6802935050196222471/ 工程创建 Maven创建工程搜索maven找到project的创建创建simple project 填写group和artifact 项目继续创建Module 选择Module 填写信息选阅读全文

posted @ 2020-03-21 00:01 那山的狐狸阅读(491) 评论(0) 推荐(0) 编辑

Hive实现网站PV分析

摘要：原文链接： https://www.toutiao.com/i6773241257528394248/ 之前我们做过《java mapreduce实现网站PV分析》，这次我们可以用hive分析一些需求指标提出需求：统计分析24小时各个时段的pv和uv 分析：（1） pv统计总的浏览量 count 阅读全文

posted @ 2020-03-20 23:43 那山的狐狸阅读(374) 评论(0) 推荐(0) 编辑

win10中查看开关机时间及查看admin的RID的方法

摘要：原文链接： https://www.toutiao.com/i6772133439593251339/ 打开系统的注册表键盘输入win+r组合键出现运行窗口命令输入regedit 按回车键，进入注册表编辑器依次展开"HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\W 阅读全文

posted @ 2020-03-20 23:39 那山的狐狸阅读(933) 评论(0) 推荐(0) 编辑

sqoop的使用之import导入到HDFS

摘要：原文链接： https://www.toutiao.com/i6772128429614563843/ 首先我们已经安装好sqoop了，如果没有安装好参考文档《快速搭建CDH-Hadoop-Hive-Zoopkeeper-Sqoop环境进入Sqoop学习环境》准备一些基本的认识 1、sqoop分为阅读全文

posted @ 2020-03-20 23:32 那山的狐狸阅读(914) 评论(0) 推荐(0) 编辑

快速搭建Hadoop-Hive-Zoopkeeper-Sqoop环境进入Sqoop学习环境

摘要：原文链接： https://www.toutiao.com/i6771763211927552523/ CDH简单了解 CDH: C：cloudera(公司) D：distribute H：Hadoop 解决了大数据Hadoop 2.x生态系统中各个框架的版本兼容问题，不用自己编译, CDH适合商用阅读全文

posted @ 2020-03-20 23:26 那山的狐狸阅读(262) 评论(0) 推荐(0) 编辑

Hive的连接和运行模式

摘要：原文链接： https://www.toutiao.com/i6771018203687551495/ Hive的连接启动hadoop的时候将history也启动，如果出问题，可以方便我们后续定位首先将Hive变成对外开放启动hiveserver2 我们查看下如果杀掉需要用kill -9 P 阅读全文

posted @ 2020-03-20 23:22 那山的狐狸阅读(379) 评论(0) 推荐(0) 编辑

Hive与MapReduce相关排序及自定义UDF函数

摘要：原文链接： https://www.toutiao.com/i6770870821809291788/ Hive和mapreduce相关的排序和运行的参数 1.设置每个reduce处理的数据量（单位是字节）我们在hive中查看下配置文件hive-site.xml.template 我们打开配置文阅读全文

posted @ 2020-03-20 23:09 那山的狐狸阅读(516) 评论(0) 推荐(0) 编辑

Hive的导入导出和常用过滤语句的学习

摘要：原文： https://www.toutiao.com/i6769166601871688196/?group_id=6769166601871688196 数据的导入 load data [local] 创建数据表加载数据 load data local inpath '/data/hivete 阅读全文

posted @ 2020-03-20 00:29 那山的狐狸阅读(351) 评论(0) 推荐(0) 编辑

Hive的分析函数的使用

摘要：原文： https://www.toutiao.com/i6769120000578945544/?group_id=6769120000578945544 我们先准备数据库、表和数据开窗分析函数相对于mysql中的聚合函数区别是：分析函数是基于某个组多个数据进行计算聚合，而聚合函数是每个组返回一阅读全文

posted @ 2020-03-20 00:28 那山的狐狸阅读(228) 评论(0) 推荐(0) 编辑

Hive分区表和桶表的使用

摘要：原文链接： https://www.toutiao.com/i6766897068138037763/?group_id=6766897068138037763 我们看官网文档中这个地方我们先创建好数据库，以供练习使用数据库我们创建数据表我们创建分区表，选取的字段不能是表中存在的字段元数据阅读全文

posted @ 2020-03-20 00:26 那山的狐狸阅读(269) 评论(0) 推荐(0) 编辑

Hive建表和内外部表的使用

摘要：原文链接： https://www.toutiao.com/i6766784274965201415 一、普通建表方式 create table stu_info( id int, name string )ROW FORMAT DELIMITED FIELDS TERMINATED BY ' ' 阅读全文

posted @ 2020-03-20 00:24 那山的狐狸阅读(650) 评论(0) 推荐(0) 编辑

Hive的基本概念和常用命令

摘要：原文链接： https://www.toutiao.com/i6766571623727235595/?group_id=6766571623727235595 一、概念： 1、结构化和非结构化数据结构化数据：固有的键值对非结构数据：没有固定的键值对，没有明确的映射关系所以就可以理解下面这句话阅读全文

posted @ 2020-03-20 00:23 那山的狐狸阅读(485) 评论(0) 推荐(0) 编辑

java mapreduce二次排序

摘要：原文链接： https://www.toutiao.com/i6765808056191156748/ 目的：二次排序就是有下面的数据 a 3 a 1 a 100 c 1 b 2 如果只按照abc排序就会变成 a 3 a 1 a 100 b 2 c 1 我们希望是第二列也参与排序 a 1 a 3 阅读全文

posted @ 2020-03-20 00:09 那山的狐狸阅读(282) 评论(0) 推荐(0) 编辑

java mapreduce实现网站PV分析

摘要：原文链接： https://www.toutiao.com/i6765677128022229517/ PV 是Page Views的缩写，即页面浏览量，用户每一次对网站中的每个网页访问均被记录一次。注意，访客每刷新一次页面，pv就增加一次。我们目前的数据是：其中的数据我们会得到标注根据标注我阅读全文

posted @ 2020-03-20 00:07 那山的狐狸阅读(243) 评论(0) 推荐(0) 编辑

mapreduce实现数据去重

摘要：原文链接： https://www.toutiao.com/i6764933201203823107/ 概念："数据去重"主要是为了掌握和利用并行化思想来对数据进行有意义的筛选。统计大数据集上的数据种类个数、从网站日志中计算访问地等这些看似庞杂的任务都会涉及数据去重。数据去重的最终目标是让原始数据阅读全文

posted @ 2020-03-20 00:06 那山的狐狸阅读(697) 评论(0) 推荐(0) 编辑

Hadoop的Shuffle阶段

摘要：原文： https://www.toutiao.com/i6764683672772674062/ 在进入Map之前，首先会将数据从HDFS中读取，进行处理，按照字节偏移量这种之前说的形式处理为K,V对的形式，进入Map阶段。其中InputFormat可以认为是一种类的继承关系，最终通过调用rea 阅读全文

posted @ 2020-03-20 00:04 那山的狐狸阅读(207) 评论(0) 推荐(0) 编辑

Java实现单词统计

摘要：原文链接： https://www.toutiao.com/i6764296608705151496/ 单词统计的是统计一个文件中单词出现的次数，比如下面的数据源其中,最终出现的次数结果应该是下面的显示那么在MapReduce中该如何编写代码并出现最终结果？首先我们把文件上传到HDFS中(hd 阅读全文

posted @ 2020-03-20 00:03 那山的狐狸阅读(1253) 评论(0) 推荐(0) 编辑

SpringBoot学习笔记

摘要：笔记总结链接：SpringBoot学习笔记合集阅读全文

posted @ 2020-03-19 14:46 那山的狐狸阅读(144) 评论(0) 推荐(0) 编辑

03 2020 档案