摘要:
修改Linux Operating System的时间与时区 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任。 有的小伙伴可能会遇到安装了linux系统后,尽管时区选择正确,也会发现系统时间不对。这是由于安装系统时采用了UTC,那么什么是UTC呢,简单的说UTC就是0时区的时间,是国 阅读全文
摘要:
版本控制工具Git工具快速入门-Linux篇 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任。 一.版本管理系统的介绍 1>.版本管理系统的特点 1.1>.自动生成备份: 在同一个目录中,如果我们想要备份一个文件,可能就拷贝一份,然后修改拷贝后的版本,当你对该文件修改的次数超过一定频 阅读全文
摘要:
Hadoop生态圈-Oozie实战之调度shell脚本 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任。 本篇博客展示案例:使用Oozie调度Shell脚本。 1>.解压官方案例模板 2>. 创建工作目录 3>.拷贝任务模板到oozie-apps/目录 4>. 随意编写一个脚本yin 阅读全文
摘要:
Hadoop生态圈-Oozie实战之逻辑调度执行多个Job 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任。 1>.启动hadoop集群 [root@yinzhengjie hadoop-2.5.0-cdh5.3.6]# sbin/start-all.sh This script i 阅读全文
摘要:
JavaScript基础知识-相等运算符 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任。 一.JavaScript源代码 二.浏览器打开以上代码渲染结果 阅读全文
摘要:
Hadoop生态圈-Oozie部署实战 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任。 一.Oozie简介 1>.什么是Oozie Oozie英文翻译为:驯象人。一个基于工作流引擎的开源框架,由Cloudera公司贡献给Apache,提供对Hadoop Mapreduce、Pig 阅读全文
摘要:
Tomcat定义虚拟主机案例 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任。 一.准备环境 1>.创建web程序的根目录 2>.编辑根目录的首页信息 3>.windows的hosts配置信息如下: 4>.tomcat服务器的配置信息如下 二.编辑Server.xml配置文件 1>. 阅读全文
摘要:
Tomcat的配置文件详解 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任。 一.Tomcat的配置文件 Tomcat的配置文件默认存放在$CATALINA_HOME/conf目录中,主要有以下几个:1>.server.xml: Tomcat的主配置文件,包含Service, Con 阅读全文
摘要:
Tomcat部署实战 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任。 一.登录官网下载tomcat软件包(http://tomcat.apache.org/) 1>.在安装tomcat之前需要安装jdk环境 2>.选择你需要的版本点击download 3>.选择相应的版本 二.部署 阅读全文
摘要:
Hadoop生态圈-离线方式部署Cloudera Manager5.15.1 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任。 到目前位置,Cloudera Manager和CDH最新版本是cdh5.15.1版本,发布日期是2018-8-17,我们可以在本篇博客的截图中可以看到具体信 阅读全文
摘要:
ELK部署实战 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任。 简单的来说ELK是日志收集,存储,可视化的一套组件。如果你看过我之前分享关于大数据生态圈的Flume组件。Flume也是一款日志收集工具,它处理的是非铭感日志数据,换句话说,大数据日志收集工具Flume一般处理不重要的 阅读全文
摘要:
使用vmware workstation创建虚拟机教程 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任。 一.下载应用软件 1>.安装虚拟化产品 2>.下载镜像文件 二.创建一个CentOS 7.6的虚拟机(硬件选择) 1>.进入"新建虚拟机" 2>.选择自定义 3>.点击下一步 4 阅读全文
摘要:
Linux集群部署自定义时间同步服务器(ntpd) 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任。 身为一名运维人员,在搭建集群的时候,第一步需要做的就是同步每个机器的时间,尤其是在部署类似VPN这种服务,你不同步时间是会遇到坑的,我之前在部署openVPN是就遇到过类似的问题,我 阅读全文
摘要:
Hadoop基础-完全分布式模式部署yarn日志聚集功能 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任。 其实我们不用配置也可以在服务器后台通过命令行的形式查看相应的日志,但为了更方便查看日志,我们可以将其配置成通过webUI的形式访问日志,本篇博客会手把手的教你如何实操。如果你的 阅读全文
摘要:
Hadoop基础-配置历史服务器 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任。 Hadoop自带了一个历史服务器,可以通过历史服务器查看已经运行完的Mapreduce作业记录,比如用了多少个Map、用了多少个Reduce、作业提交时间、作业启动时间、作业完成时间等信息。默认情况下 阅读全文
摘要:
JavaScript基础知识-Unicode编码表 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任。 Unicode的编码表也被称为万国码,里面包含了各种字符编码(https://www.unicode.org/charts/)。 一.JavaScript源代码 二.浏览器打开以上代 阅读全文
摘要:
Spark进阶之路-Standalone模式搭建 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任。 一.Spark的集群的准备环境 1>.master节点信息(s101) 2>.worker节点信息(s102) 3>.worker节点信息(s103) 4>.worker节点信息(s1 阅读全文
摘要:
Hadoop生态圈-大数据生态体系快速入门篇 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任。 一.大数据概念 1>.什么是大数据 大数据(big data):是指无法在一定时间范围内用常规软件进行捕捉,管理和处理的数据集合,是需要新处理模式才能具有更强的决策力,洞察发现力和流程优化 阅读全文
摘要:
Hadoop生态圈-HUE环境部署 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任。 一.HUE简介 1>.HUE的由来 HUE全称是HadoopUser Experience,看这名字就知道怎么回事了吧。没错,直白来说就是Hadoop用户体验,是一个开源的Apache Hadoop 阅读全文
摘要:
idea集成python插件 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任。 在继承安装Python插件时,请确认你是否安装Python解释器(Python官网:https://www.python.org/),不管你使用的是哪个版本,安装方式都是一样的,关于安装Python的笔记 阅读全文
摘要:
项目实战-友盟项目介绍以及环境搭建 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任。 一.项目架构介绍 二.环境搭建 1>.搭建Nginx反向代理 参考笔记:https://www.cnblogs.com/yinzhengjie/p/9428404.html 2>.启动hadoop集 阅读全文
摘要:
Nginx插件之openresty反向代理和日志滚动配置案例 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任。 一.openresty介绍 1>.Nginx介绍 Nginx是一款高性能web服务器和反向代理服务器,在互联网项目中使用非常频繁,尤其其出色的性能以及轻量级进程占用,已经超 阅读全文
摘要:
Spark进阶之路-Spark HA配置 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任。 集群部署完了,但是有一个很大的问题,那就是Master节点存在单点故障,要解决此问题,就要借助zookeeper,并且启动至少两个Master节点来实现高可靠,配置方式比较简单。本篇博客的搭建 阅读全文
摘要:
Spark进阶之路-日志服务器的配置 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任。 如果你还在纠结如果配置Spark独立模式(Standalone)集群,可以参考我之前分享的笔记:https://www.cnblogs.com/yinzhengjie/p/9379045.html 阅读全文
摘要:
Scala进阶之路-Scala中的枚举用法案例展示 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任。 Scala中的枚举值和Java中的枚举值有点差别,不过使用起来也都差大同小异,我这里分别写了一个Java定义枚举类型和Scala定义枚举类型的案例。 一.Java中定义枚举类型案例展 阅读全文
摘要:
Scala进阶之路-Scala中的高级类型 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任。 一.类型(Type)与类(Class)的区别 在Java里,一直到jdk1.5之前,我们说一个对象的类型(type),都与它的class是一一映射的,通过获取它们的class对象,比如 St 阅读全文
摘要:
Scala进阶之路-Scala中的Ordered--Ordering 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任。 说道对象的比较,在Java中大家最熟悉不过的就是实现类本身实现Comparable接口或者是调用者自己实现Comparator接口均可以实现对象之间的比较。在Sca 阅读全文
摘要:
Spark集群之yarn提交作业优化案例 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任。 一.启动Hadoop集群 1>.自定义批量管理脚本 [yinzhengjie@s101 ~]$ more `which xzk.sh` #!/bin/bash #@author :yinzhe 阅读全文
摘要:
Scala进阶之路-反射(reflect)技术详解 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任。 Scala中的反射技术和Java反射用法类似,我这里就不一一介绍反射是啥了,如果对Java的反射感兴趣的话可以参考我之前分享的笔记:https://www.cnblogs.com/y 阅读全文
摘要:
Scala进阶之路-正则表达式案例 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任。 废话不多说,正则大家都很清楚,那在Scala如何使用正则了?我们直接上个案例,如下: 以上代码输出几个如下: 阅读全文
摘要:
Scala进阶之路-进程控制之执行shell脚本 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任。 废话不多说,我这里直接放一个案例。 以上代码执行结果如下: 阅读全文
摘要:
Scala进阶之路-Spark独立模式(Standalone)集群部署 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任。 我们知道Hadoop解决了大数据的存储和计算,存储使用HDFS分布式文件系统存储,而计算采用MapReduce框架进行计算,当你在学习MapReduce的操作时, 阅读全文
摘要:
Scala进阶之路-idea下进行spark编程 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任。 1>.创建新模块并添加maven依赖 2>.编写scala代码(使用类型推断) 3>.scala编程(定义具体类型) 4>.编写java版 wordcount 阅读全文
摘要:
Scala进阶之路-Spark本地模式搭建 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任。 一.Spark简介 1>.Spark的产生背景 传统式的Hadoop缺点主要有以下两点: 第一.迭代式计算效率低(一个MapReduce依赖上一个MapReduce的结果); 第二.交互式数 阅读全文
摘要:
Scala进阶之路-Spark底层通信小案例 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任。 一.Spark Master和worker通信过程简介 1>.Worker会向master注册自己; 2>.Master收到worker的注册信息之后,会告诉你已经注册成功,并给worke 阅读全文
摘要:
Scala进阶之路-Scala高级语法之隐式(implicit)详解 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任。 我们调用别人的框架,发现少了一些方法,需要添加,但是让别人为你一个人添加是不现实的,因此很多很多时候需要我们自己动手。掌握implicit的用法是阅读Spark源码 阅读全文
摘要:
Scala进阶之路-并发编程模型Akka入门篇 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任。 一.Akka Actor介绍 1>.Akka介绍 写并发程序很难。程序员不得不处理线程、锁和竞态条件等等,这个过程很容易出错,而且会导致程序代码难以阅读、测试和维护。Akka 是 JVM 阅读全文
摘要:
Scala进阶之路-统计商家id的标签数以及TopN示例案例分析 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任。 一.项目需求 将“temptags.txt”中的数据进行分析,统计出商家id的评论标签数量,由于博客园无法上传大文件的文本,因此我把该文本的内容放在博客园的另一个链接了 阅读全文
摘要:
Scala进阶之路-Scala中的泛型介绍 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任。 通俗的讲,比如需要定义一个函数,函数的参数可以接受任意类型。我们不可能一一列举所有的参数类型重载函数。那么程序引入了一个称之为泛型的东西,这个类型可以代表任意的数据类型。说白了泛型就是对数据 阅读全文
摘要:
Scala进阶之路-尾递归优化 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任。 递归调用有时候能被转换成循环,这样能节约栈空间。在函数式编程中,这是很重要的,我们通常会使用递归方法来遍历集合。而不是所有的递归都能被优化。递归之所有能被优化是在指在函数的最后一行为递归调用(即尾递归) 阅读全文