wq920 - 博客园

2017年10月30日

摘要：在开发完Spark作业之后，就该为作业配置合适的资源了。Spark的资源参数，基本都可以在spark-submit命令中作为参数设置。很多Spark初学者，通常不知道该设置哪些必要的参数，以及如何设置这些参数，最后就只能胡乱设置，甚至压根儿不设置。资源参数设置的不合理，可能会导致没有充分利用集群资源阅读全文

posted @ 2017-10-30 18:50 wq920 阅读(173) 评论(0) 推荐(0) 编辑

2017年9月20日

linux下IPTABLES配置详解（转）

摘要： WARD两个链采用的是允许什么包通过,而OUTPUT链采用的是不允许什么包通过. 这样设置还是挺合理的,当然你也可以三个链都DROP,但这样做我认为是没有必要的,而且要写的规则就会增加.但如果你只想要有限的几个规则是,如只做WEB服务器.还是推荐三个链都是DROP. 注:如果你是远程SSH登陆的话, 阅读全文

posted @ 2017-09-20 14:34 wq920 阅读(226) 评论(0) 推荐(0) 编辑

2017年9月12日

log4j的ConversionPattern参数的格式含义

摘要： Log4j建议只使用四个级别，优先级从高到低分别是ERROR、WARN、INFO、DEBUG #这里定义能显示到的最低级别,若定义到INFO级别,则看不到DEBUG级别的信息了~! log4j.rootLogger=DEBUG #将DAO层log记录到DAOLog,allLog中 log4j.log 阅读全文

posted @ 2017-09-12 15:32 wq920 阅读(255) 评论(0) 推荐(0) 编辑

2017年7月27日

Apache Kafka 0.9消费者客户端

摘要：当Kafka最初创建时，它与Scala生产者和消费者客户端一起运送。随着时间的推移，我们开始意识到这些API的许多限制。例如，我们有一个“高级”消费者API，它支持消费者组并处理故障转移，但不支持许多更复杂的使用场景。我们还有一个“简单”的消费者客户端，提供完全控制，但需要用户自己管理故障转移和错误阅读全文

posted @ 2017-07-27 15:22 wq920 阅读(1002) 评论(0) 推荐(0) 编辑

2017年7月25日

hive加载json数据解决方案

摘要： hive官方并不支持json格式的数据加载，默认支持csv格式文件加载，如何在不依赖外部jar包的情况下实现json数据格式解析，本编博客着重介绍此问题解决方案首先创建元数据表：创建视图表：视图表利用json tuple将json object的数据进行抽取，这样就实现了字段分离。但是有些日阅读全文

posted @ 2017-07-25 21:10 wq920 阅读(3832) 评论(0) 推荐(1) 编辑

2017年6月30日

Spark Streaming性能调优

摘要：数据接收并行度调优（一）通过网络接收数据时（比如Kafka、Flume），会将数据反序列化，并存储在Spark的内存中。如果数据接收称为系统的瓶颈，那么可以考虑并行化数据接收。每一个输入DStream都会在某个Worker的Executor上启动一个Receiver，该Receiver接收一个数据阅读全文

posted @ 2017-06-30 15:35 wq920 阅读(4703) 评论(0) 推荐(0) 编辑

2017年5月27日

Kafka之sync、async以及oneway

摘要： kafka有同步（sync）、异步（async）以及oneway这三种发送方式，某些概念上区分也可以分为同步和异步两种，同步和异步的发送方式通过“producer.type”参数指定，而oneway由“request.require.acks”参数指定。 1. sync vs async 在官方文档阅读全文

posted @ 2017-05-27 15:10 wq920 阅读(1568) 评论(0) 推荐(0) 编辑

2017年4月12日

linux中控操作相关

摘要： 1、首先生成无密码登陆密钥一般使用rsa 2、编写shell脚本 3、远程拷贝 4、远程执行命令阅读全文

posted @ 2017-04-12 11:22 wq920 阅读(415) 评论(0) 推荐(0) 编辑

2017年3月7日

Eclipse与IDEA快捷键对比

摘要： from：http://blog.csdn.net/dc_726/article/details/9531281 from：http://blog.csdn.net/dc_726/article/details/9531281 花了一天时间熟悉IDEA的各种操作，将各种快捷键都试了一下，感觉很是不错阅读全文

posted @ 2017-03-07 16:49 wq920 阅读(221) 评论(0) 推荐(0) 编辑

2017年1月6日

关于并发

摘要： hashMap 在进行多线程put的时候并且同时触发了rehash操作，会导致hashMap的entry链表出现环形数据结构，导致查找entry链表出现死循环。 hashTable多线程状态下进入阻塞或轮询，所有线程竞争同一把锁，并发越高性能越低 concurrentHashMap 采用锁分段技术，阅读全文

posted @ 2017-01-06 11:04 wq920 阅读(225) 评论(0) 推荐(0) 编辑

The-Most-Speial

wq920 做一个有思想的人...

公告