摘要: Maven是什么 Maven的常用命令 1.清除命令:mvn clean 2.编译命令:mvn compile 3.打包命令:mvn package 4.跳过单元测试:mvn clean package Dmaven.test.skip=true Maven在windows下的安装 1.直接官网下载 阅读全文
posted @ 2018-10-31 14:59 liuge36 阅读(176) 评论(1) 推荐(0) 编辑
摘要: 步骤如下: 1. 下载安装配置JDK(注意配置环境变量JAVA_HOME Path CLASSPATH) 2. 从官网下载Android Studio(可以下载带有SDK版本的) 3. 安装Android Studio,这里,推荐如果电脑配置不是很高就不要安装AVD和HAXM了,再就是可选择安装SD 阅读全文
posted @ 2018-10-31 14:58 liuge36 阅读(160) 评论(0) 推荐(0) 编辑
摘要: 这里我们以Post方式请求Serclet为例 1.找到 中的URL地址 2.在同一个标签中有对应的. 3.对应到web.xml文件中的元素中的 4.对应到web.xml文件中的元素中的中的类 5.找到相应的类之后,就可以调用类的doPost()方法来处理数据。 6.doPost()方法中主要就是实例 阅读全文
posted @ 2018-10-31 14:58 liuge36 阅读(118) 评论(0) 推荐(0) 编辑
摘要: 【推荐】 "virtualenv的安装与使用" 问题描述:centos6及其以下的python版本一般是比较低的,使得不符合我们的配置环境!!!故可以考虑更换版本 解决步骤: 1.查看自己当前的系统版本 2.到官网下载自己需要的python版本 或者3.5+版本的 3.解压并编译安装 tar zxv 阅读全文
posted @ 2018-10-31 14:57 liuge36 阅读(7555) 评论(0) 推荐(0) 编辑
摘要: Flume架构介绍和安装 ================ 写在前面 在学习一门新的技术之前,我们得知道了解这个东西有什么用?我们可以使用它来做些什么呢?简单来说,flume是大数据日志分析中不能缺少的一个组件,既可以使用在流处理中,也可以使用在数据的批处理中。 1.流处理: 2.离线批处理: 分析 阅读全文
posted @ 2018-10-31 14:44 liuge36 阅读(303) 评论(0) 推荐(0) 编辑
摘要: Kafka部署与使用 写在前面 从上一篇Kafka的架构介绍和安装中,可能,你还一直很蒙,kafka到底该怎么使用呢?接下来,我们就来介绍Kafka的部署与使用。上篇文章中我们说到,Kafka的几个重要组成是:1.producer 2.consumer 3.broker 4.topic .因此我们就 阅读全文
posted @ 2018-10-31 14:43 liuge36 阅读(221) 评论(0) 推荐(0) 编辑
摘要: Kafka架构介绍和安装 写在前面 还是那句话,当你学习一个新的东西之前,你总得知道这个东西是什么?这个东西可以用来做什么?然后你才会去学习它,使用它。简单来说,kafka既是一个消息队列,如今,它也演变为一个分布式的流处理平台,这一点就是很厉害的了。所以,学习kafka对于大数据的小伙伴们来说,是 阅读全文
posted @ 2018-10-31 14:43 liuge36 阅读(144) 评论(0) 推荐(0) 编辑
摘要: Flume案例实战 写在前面 通过前面一篇文章http://blog.csdn.net/liuge36/article/details/78589505的介绍我们已经知道flume到底是什么?flume可以用来做什么?但是,具体怎么做,这就是我们这篇文章想要介绍的。话不多说,直接来案例学习。 实战一 阅读全文
posted @ 2018-10-31 14:43 liuge36 阅读(422) 评论(0) 推荐(2) 编辑
摘要: Flume和Kafka完成实时数据的采集 写在前面 Flume和Kafka在生产环境中,一般都是结合起来使用的。可以使用它们两者结合起来收集实时产生日志信息,这一点是很重要的。如果,你不了解flume和kafka,你可以先查看我写的关于那两部分的知识。再来学习,这部分的操作,也是可以的。 实时数据的 阅读全文
posted @ 2018-10-31 14:42 liuge36 阅读(3513) 评论(0) 推荐(1) 编辑
摘要: Python日志产生器 写在前面 有的时候,可能就是我们做实时数据收集的时候,会有一个头疼的问题就是,你会发现,你可能一下子,没有日志的数据源。所以,我们可以简单使用python脚本来实现产生实时的数据,这样就很方便了 在编写代码之前,我们得知道我们的webserver日志到底长什么样,下面我找了一 阅读全文
posted @ 2018-10-31 14:42 liuge36 阅读(395) 评论(0) 推荐(0) 编辑
摘要: 环境搭建 Hadoop集群搭建 写在前面,前面我们快速搭建好了centos的集群环境,接下来,我们就来开始hadoop的集群的搭建工作 实验环境 Hadoop版本:CDH 5.7.0 这里,我想说一下,我们我没有选择官方版本,是因为,cdh版本已经解决好了各个组件之间的依赖。因为,后面,我们还会使用 阅读全文
posted @ 2018-10-31 14:41 liuge36 阅读(299) 评论(0) 推荐(0) 编辑
摘要: ELK搭建实时日志分析平台 导言 ELK由ElasticSearch、Logstash和Kiabana三个开源工具组成,ELK平台可以同时实现日志收集、日志搜索和日志分析的功能。对于生产环境中海量日志信息的分析处理无疑不是一个好的解决方案。 官方网站:https://www.elastic.co/ 阅读全文
posted @ 2018-10-31 14:41 liuge36 阅读(303) 评论(0) 推荐(0) 编辑
摘要: 使用JSP+Servlet+Jdbc+Echatrs实现对豆瓣电影Top250的展示 写在前面: 有的小伙伴,会吐槽啦,你这个标题有点长的啊。哈哈 ,好像是的!不过,这个也是本次案例中使用到的关键技术。如果,你正愁不会的数据可视化,那么我接下来,我会带你一步一步的实现这个数据可视化的功能。 效果图: 阅读全文
posted @ 2018-10-31 14:40 liuge36 阅读(458) 评论(0) 推荐(0) 编辑
摘要: 环境搭建 CentOS集群搭建 写在前面 最近有许多小伙伴问我,大数据的hadoop分布式集群该如何去搭建。所以,想着,就写一篇博客,帮助到更多刚入门大数据的人。本博客会一步一步带你实现一个Hadoop的搭建。跟着博客上面的步骤,很详细的。你很快就会有一个自己的hadoop集群啦。 我是在自己的wi 阅读全文
posted @ 2018-10-31 14:40 liuge36 阅读(1641) 评论(1) 推荐(0) 编辑
摘要: 写在前面 接触spark有一段时间了,但是一直都没有真正意义上的在集群上面跑自己编写的代码。今天在本地使用scala编写一个简单的WordCount程序。然后,打包提交到集群上面跑一下... 在本地使用idea开发,由于这个程序比较简单,我这里就直接给出代码。 代码,写完之后,就是打包成一个jar文 阅读全文
posted @ 2018-10-31 14:39 liuge36 阅读(638) 评论(0) 推荐(0) 编辑
摘要: 写在前面 因为前面有写过一篇关于豆瓣的top250的电影的可视化展示项目,你可以移步http://blog.csdn.net/liuge36/article/details/78607955了解这个项目。因为,想着,完全可以把这个项目部署到我们的腾讯云服务器上。说干就干,直接切入正题。 实验环境 一 阅读全文
posted @ 2018-10-31 14:39 liuge36 阅读(223) 评论(0) 推荐(0) 编辑
摘要: 概述 什么是 Spark Streaming? Spark Streaming is an extension of the core Spark API that enables scalable, high throughput, fault tolerant stream processing 阅读全文
posted @ 2018-10-31 14:38 liuge36 阅读(152) 评论(0) 推荐(0) 编辑
摘要: 在linux下我们一般是需要了解我们的进程的状态的. 我们以mysql为例 service mysqld status 我这里是启动状态,可以看见pid chkconfig list +你的服务 可以看见是启动的,有on状态 pidof +你的服务 可以看见pid,说明,此时,mysql服务正在运行 阅读全文
posted @ 2018-10-31 14:38 liuge36 阅读(2278) 评论(0) 推荐(0) 编辑
摘要: 查看当前的存储引擎 show engines; 基本的差别:MyISAM类型不支持事务处理等高级处理,而InnoDB类型支持。MyISAM类型的表强调的是性能,其执行数度比InnoDB类型更快,但是不提供事务支持,而InnoDB提供事务支持以及外部键等高级数据库功能。然后,一般我们的项目中设计的数据 阅读全文
posted @ 2018-10-31 14:38 liuge36 阅读(712) 评论(0) 推荐(0) 编辑
摘要: 上面我们可以看见房屋的各种属性信息 也就是房屋的各个特征 为了更形象化的展示房屋的特征,我们使用图形来直观展现 使用,我们前面介绍的Graphlab Canvas来展现 重定向到当前页面展现 接下来,我们就来,构建回归模型 被用来去拟合模型的数据叫做训练集 那些作为真实预测的替代叫做测试集 步骤: 阅读全文
posted @ 2018-10-31 14:37 liuge36 阅读(328) 评论(0) 推荐(0) 编辑