返回顶部 Fork me on GitHub
摘要: 一 HDFS客户端环境准备 1.1 jar包准备 1)解压hadoop-2.7.6.tar.gz到非中文目录 2)进入share文件夹,查找所有jar包,并把jar包拷贝到_lib文件夹下 3)在全部jar包中查找sources.jar,并剪切到_source文件夹。 4)在全部jar包中查找tes 阅读全文
posted @ 2018-05-19 23:56 Frankdeng 阅读(2569) 评论(0) 推荐(1) 编辑
摘要: 一、背景 Hadoop业务的整体开发流程: 从Hadoop的业务开发流程图中可以看出,在大数据的业务处理过程中,对于数据的采集是十分重要的一步,也是不可避免的一步. 许多公司的平台每天会产生大量的日志(一般为流式数据,如,搜索引擎的pv,查询等),处理这些日志需要特定的日志系统,一般而言,这些系统需 阅读全文
posted @ 2018-05-19 23:26 Frankdeng 阅读(1620) 评论(0) 推荐(0) 编辑
摘要: 索引类似大学图书馆建书目索引,可以提高数据检索的效率,降低数据库的IO成本。MySQL在300万条记录左右性能开始逐渐下降,虽然官方文档说500~800w记录,所以大数据量建立索引是非常有必要的。MySQL提供了Explain,用于显示SQL执行的详细信息,可以进行索引的优化。 一、导致SQL执行慢 阅读全文
posted @ 2018-05-19 13:20 Frankdeng 阅读(1504) 评论(0) 推荐(0) 编辑