2016 年 9月随笔档案 - xingoo

[大数据之Sqoop] —— 什么是Sqoop?

摘要：介绍 sqoop是一款用于hadoop和关系型数据库之间数据导入导出的工具。你可以通过sqoop把数据从数据库（比如mysql,oracle）导入到hdfs中；也可以把数据从hdfs中导出到关系型数据库中。sqoop通过Hadoop的MapReduce导入导出，因此提供了很高的并行性能以及良好的容错阅读全文

posted @ 2016-09-29 18:33 xingoo 阅读(15734) 评论(0) 推荐(4) 编辑

《Effective Java》—— 对于所有对象都通用的方法

摘要：本节主要涉及Object中通用的一些方法，比如 ,`hashCode toString clone finalize`等等覆盖equals时请遵守通用约定 equals方法实现的等价关系：自反性：对于所有的非null，a=a 对称性：a=b,则b=a 传递性：a=b,b=c,则a=c 一致性：对阅读全文

posted @ 2016-09-27 18:08 xingoo 阅读(922) 评论(0) 推荐(0) 编辑

《Effective Java》—— 创建与销毁对象

摘要：本篇主要总结的是《Effecticve Java》中关于创建和销毁对象的内容。比如：何时以及如何创建对象何时以及如何避免创建对象如何确保及时销毁如何管理对象销毁前的清理动作考虑用静态工厂方法代替构造器使用静态工厂的优势：有名称不必每次调用的时候都创建一个新的对象返回原返回类型的任阅读全文

posted @ 2016-09-26 19:13 xingoo 阅读(1807) 评论(4) 推荐(1) 编辑

如何在Elasticsearch中安装中文分词器(IK+pinyin)

摘要：如果直接使用Elasticsearch的朋友在处理中文内容的搜索时，肯定会遇到很尴尬的问题——中文词语被分成了一个一个的汉字，当用Kibana作图的时候，按照term来分组，结果一个汉字被分成了一组。这是因为使用了Elasticsearch中默认的标准分词器，这个分词器在处理中文的时候会把中文单词阅读全文

posted @ 2016-09-26 18:05 xingoo 阅读(48861) 评论(8) 推荐(4) 编辑

《Effective Java》—— 读后总结

摘要：这本书在Java开发的行业里，颇有名气。今天总算是粗略的看完了...后面线程部分和序列化部分由于心浮气躁看的不仔细。这个月还剩下一周，慢慢总结消化。阅读全文

posted @ 2016-09-24 17:11 xingoo 阅读(2439) 评论(2) 推荐(1) 编辑

自己写的数据交换工具——从Oracle到Elasticsearch

摘要：先说说需求的背景，由于业务数据都在Oracle数据库中，想要对它进行数据的分析会非常非常慢，用传统的数据仓库数据集市这种方式，集市层表会非常大，查询的时候如果再做一些group的操作，一个访问需要一分钟甚至更久才能响应。为了解决这个问题，就想把业务库的数据迁移到Elasticsearch中，然后阅读全文

posted @ 2016-09-23 18:13 xingoo 阅读(12217) 评论(8) 推荐(3) 编辑

Oozie 快速入门

摘要：设想一下，当你的系统引入了spark或者hadoop以后，基于Spark和Hadoop已经做了一些任务，比如一连串的Map Reduce任务，但是他们之间彼此右前后依赖的顺序，因此你必须要等一个任务执行成功后，再手动执行第二个任务。是不是很烦！这个时候Oozie（驯象人，典故来自评论一楼）就派上用阅读全文

posted @ 2016-09-22 22:41 xingoo 阅读(19108) 评论(3) 推荐(1) 编辑

[大数据之Spark]——快速入门

摘要：本篇文档是介绍如何快速使用spark，首先将会介绍下spark在shell中的交互api，然后展示下如何使用java,scala,python等语言编写应用。可以查看 "编程指南" 了解更多的内容。为了良好的阅读下面的文档，最好是结合实际的练习。首先需要 "下载spark" ,然后安装hdfs，可阅读全文

posted @ 2016-09-21 23:03 xingoo 阅读(5920) 评论(2) 推荐(0) 编辑

《Spark快速大数据分析》—— 第七章在集群上运行Spark

摘要：![](http://images2015.cnblogs.com/blog/449064/201609/449064-20160913230519695-1813024039.png) 阅读全文

posted @ 2016-09-13 23:06 xingoo 阅读(1328) 评论(0) 推荐(1) 编辑

[大数据之Sqoop] —— Sqoop初探

摘要：Sqoop是一款用于把关系型数据库中的数据导入到hdfs中或者hive中的工具，当然也支持把数据从hdfs或者hive导入到关系型数据库中。 Sqoop也是基于Mapreduce来做的数据导入。关于sqoop的原理 sqoop的原理比较简单，就是根据用户指定的sql或者字段参数，从数据库中读取数据阅读全文

posted @ 2016-09-12 19:17 xingoo 阅读(2198) 评论(0) 推荐(0) 编辑

Java程序员的日常——存储过程知识普及

摘要：存储过程是保存可以接受或返回用户提供参数的SQL语句集合。在日常的使用中，经常会遇到复杂的业务逻辑和对数据库的操作，使用存储过程可以进行封装。可以在数据库中定义子程序，然后把子程序存储在数据库服务器，之后通过名称调用。特点 1 提高性能存储过程是预先编译过，进行优化后，存储在SQL的内存中，使用阅读全文

posted @ 2016-09-10 11:20 xingoo 阅读(1322) 评论(1) 推荐(1) 编辑

Java程序员的日常—— 基于类的策略模式、List<?>与List、泛型编译警告、同比和环比

摘要：早晨起得太早，昨晚睡得太晚，一天都迷迷糊糊的。中午虽然睡了半个小时，可是依然没有缓过来。整个下午都在混沌中....不过今天下载了一款手游——《剑侠情缘》，感觉不错，喜欢这种类型的游戏。今天主要的工作还是做业务需求，不过下午状态不好，看了下《Effective java》，正好重构了下代码。 eff 阅读全文

posted @ 2016-09-08 21:12 xingoo 阅读(2091) 评论(8) 推荐(1) 编辑

Mybatis文档阅读笔记（明日继续更新...）

摘要：今天在编写mybatis的mapper.xml时，发现对sql的配置还不是很熟，有很多一坨一坨的东西，其实是可以抽取成服用的。不过良好的组织代码，还是更重要的。阅读全文

posted @ 2016-09-07 22:53 xingoo 阅读(607) 评论(1) 推荐(1) 编辑

《Spark快速大数据分析》—— 第六章 Spark编程进阶

摘要：这章讲述了Spark编程中的高级部分，比如累加器和广播等，以及分区和管道... 阅读全文

posted @ 2016-09-06 23:01 xingoo 阅读(1548) 评论(0) 推荐(1) 编辑

Java程序员的日常——SpringMVC+Mybatis开发流程、推荐系统

摘要：今天大部分时间都在写业务代码，然后算是从无到有的配置了下spring与mybatis的集成。 SpringMVC+Mybatis Web开发流程配置数据源在applicationContext.xml中引入数据源的配置：在spring my datasource.xml中配置数据源相关的内容：阅读全文

posted @ 2016-09-06 19:03 xingoo 阅读(3559) 评论(0) 推荐(0) 编辑

《Spark快速大数据分析》—— 第五章数据读取和保存

摘要：由于Spark是在Hadoop家族之上发展出来的，因此底层为了兼容hadoop,支持了多种的数据格式。如S3、HDFS、Cassandra、HBase，有了这些数据的组织形式，数据的来源和存储都可以多样化~ 阅读全文

posted @ 2016-09-05 22:41 xingoo 阅读(1829) 评论(0) 推荐(0) 编辑

Java程序员的日常—— POI与JDBC、Mockmvc与单元测试

摘要：周日没怎么休息好，周一一天都迷迷糊糊的，不过还算是干了不少的活。总结一下，大致有以下几点内容： 1 使用poi以及mysql jdbc实现了一个复杂excel的导入 2 基于工程原有的代码，书写spring mvc的业务代码以及测试用例使用POI以及jdbc POI是用于处理excel文件很常用阅读全文

posted @ 2016-09-05 22:23 xingoo 阅读(1915) 评论(0) 推荐(0) 编辑

《Spark快速大数据分析》—— 第三章 RDD编程

摘要：![](http://images201609.cnblogs.com/blog/449064/201609/449064-20160903170725952-338488532.png) 阅读全文

posted @ 2016-09-03 17:08 xingoo 阅读(2417) 评论(0) 推荐(0) 编辑

xingoo

09 2016 档案

公告

最新随笔

积分与排名

随笔分类 (900)

随笔档案 (1028)

常用工具

官方文档

好友链接