摘要: 详见内容。 阅读全文
posted @ 2017-04-12 13:30 柯君 阅读(194) 评论(0) 推荐(0) 编辑
摘要: 说起大数据开发,必然就会提到Spark,在这片博文中,我们就介绍一下Spark的安装和配置。 阅读全文
posted @ 2017-04-01 14:48 柯君 阅读(1008) 评论(0) 推荐(0) 编辑
摘要: 详细见正文。 阅读全文
posted @ 2017-03-31 16:32 柯君 阅读(454) 评论(0) 推荐(0) 编辑
摘要: 一直有看到网上有讨论Python2和Python3的比较,最近公司也在考虑是否在spark-python大数据开发环境中升级到python3。通过本篇博文记录Python2.7.13和Pthon3.5.3的各方面比较。 环境配置 阅读全文
posted @ 2017-03-23 16:08 柯君 阅读(587) 评论(0) 推荐(0) 编辑
摘要: 最近公司准备升级spark环境,主要原因是生产环境的spark和hadoop版本都比较低,但是具体升级到何种版本还不确定,需要做进一步的测试分析。这个任务对于大数据开发环境配置有要求,这里记录一下配置过程,但是对于为什么要做这些配置还不是很了解,算是知其然不知其所以然,深入了解再写篇博文分析。 阅读全文
posted @ 2017-03-20 13:48 柯君 阅读(1643) 评论(0) 推荐(0) 编辑
摘要: 在公司开发部干活的好处是可以再分配一台高性能的PC,有了新的工作电脑,原来分配的笔记本电脑就可以安装linux系统做开发了,主要有两方面的开发计划,一个是计划中要参与爬虫系统的开发,第二个是大数据环境的安装和测试。 阅读全文
posted @ 2017-03-15 16:03 柯君 阅读(1128) 评论(0) 推荐(0) 编辑
摘要: Flask是Python应用于WEB开发的第三方开源框架,以设计简单高效著称。我也尝试过Django,相对于Flask显得更加全面同样也更加笨重,并且我也不需要它的后台管理功能,因此选择了Flask作为我的首选开发框架 阅读全文
posted @ 2016-12-30 15:57 柯君 阅读(1471) 评论(0) 推荐(0) 编辑
摘要: 最近在阅读《利用Python进行数据分析》,本篇博文作为读书笔记 ,记录一下阅读书签和实践心得。 阅读全文
posted @ 2016-08-09 09:19 柯君 阅读(429) 评论(0) 推荐(0) 编辑
摘要: 昨天突然记起我已经入职银联一年多7天了,时间过得真是快啊!这一年从学生转变为社会机器运转中的螺丝钉,我感觉自己有收获也有遗憾。 阅读全文
posted @ 2016-07-21 09:23 柯君 阅读(425) 评论(1) 推荐(1) 编辑
摘要: 索引在数据库中是一个很特殊的存在,它的目的就是为了提高数据查询得效率。同样,它也有弊端,更新一个带索引的表的时间比更新一个没有带索引的时间更长。有得有失。我希望做一些研究测试,搞清楚索引对于我们使用数据库有什么影响,以及如何控制这个影响。 阅读全文
posted @ 2016-03-11 16:03 柯君 阅读(768) 评论(0) 推荐(0) 编辑