1、hadoop、Hive、sqoop、spark、storm、odps、dremel、hbase(hadoop、spark重要)

2、oracle、mysql后台开发,以及对量海数据处理、高并发请求处理

3、熟悉Linux,Shell或Python等语言

4、互联网行业数据挖掘

5、分布式、多线程及高性能的设计与编码及性能调优(重要)

6、熟悉Internet基本协议(如TCP/IP. HTTP等)内容及相关应用

7、设计模式、事务处理、缓存框架、搜索引擎、任务调试、Web Service、http、图片服务器

8、熟悉相关计算学习算法,包括贝叶斯、随机树、神经网络等,良好的数据结构基础,包括树和图的相关计算

9、熟悉全文检索技术,如ElasticSearch、lucene等使用