摘要: 一、排序思想 希尔排序思想请参见:https://www.cnblogs.com/luomeng/p/10592830.html二、python实现def shellSort(arr): """ python希尔排序 :param arr: 待排序列 step :步长值 """ step = len(arr) // 2 while step > ... 阅读全文
posted @ 2019-04-11 02:51 Lvan灬 阅读(720) 评论(0) 推荐(0) 编辑
摘要: 一、排序思想 快速排序思想请参见:https://www.cnblogs.com/luomeng/p/10587492.html二、python实现def quickSort(arr, leftIndex, rightIndex): """ python实现快速排序 :param arr: 待排序列 :param leftIndex: 待排序列开始索引 :p... 阅读全文
posted @ 2019-04-10 02:43 Lvan灬 阅读(243) 评论(0) 推荐(0) 编辑
摘要: 一、排序思想 二分(折半)查找思想请参见:https://www.cnblogs.com/luomeng/p/10585291.html 二、python实现 阅读全文
posted @ 2019-04-09 13:38 Lvan灬 阅读(355) 评论(0) 推荐(0) 编辑
摘要: 一、排序思想 排序思想参见:https://www.cnblogs.com/luomeng/p/10583124.html二、python实现def InsertSort(arrs): """ 插入排序 :param arrs: 待排序列 index:有序序列尾元素下标 value:有序序列尾元素值 """ for i in range(1, l... 阅读全文
posted @ 2019-04-05 13:22 Lvan灬 阅读(353) 评论(0) 推荐(0) 编辑
摘要: 一、排序思想 选择排序思想参见:https://www.cnblogs.com/luomeng/p/10581732.html 二、Python实现 阅读全文
posted @ 2019-04-05 01:10 Lvan灬 阅读(659) 评论(0) 推荐(0) 编辑
摘要: 一、排序思想 排序思想参见:https://www.cnblogs.com/luomeng/p/10161794.html二、python实现def bubble_sort(nums): """ 冒泡排序 Python3 range() 函数返回的是一个可迭代对象(类型是对象),而不是列表类型, 所以打印的时候不会打印列表。 Python2 range() 函数返... 阅读全文
posted @ 2019-04-03 23:37 Lvan灬 阅读(435) 评论(0) 推荐(0) 编辑
摘要: 一、基数排序思想 相比其它排序,主要是利用比较和交换,而基数排序则是利用分配和收集两种基本操作。基数 排序是一种按记录关键字的各位值逐步进行排序的方法。此种排序一般适用于记录的关键字为整数类型的情况。所有对于字符串和文字排序不适合。 实现:将所有待比较数值(自然数)统一为同样的数位长度,数位较短的数前面补零。然后,从最低位开始,依次进行一次排序。这样从最低位排序一直到最高位排... 阅读全文
posted @ 2019-04-01 23:10 Lvan灬 阅读(4703) 评论(0) 推荐(2) 编辑
摘要: Sqoop是用来实现结构型数据(如:关系型数据库RDBMS)和Hadoop之间进行数据迁移的工具。它充分利用了MapReduce的并行特点以批处理的方式加快数据的传输,同时也借助MapReduce实现容错。一、将MySQL中的表迁移到HDFS上(RDBMS —> HDFS)导入MySQL"db_sqoop.mysql_emp表"所有数据到HDFS中;sqoop import \--co... 阅读全文
posted @ 2019-03-31 20:04 Lvan灬 阅读(357) 评论(0) 推荐(0) 编辑
摘要: 最近被朋友问到有关于Hive Join的问题,保守回答过后,来补充补充知识; Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。一、Hive支持哪些连接来自官网的截图:二、Hive五种连接INNER JOIN:返回两张表中关联条件为"真"的记录;LEFT JOIN(LEFT OUTER JOIN):返回左表中所有的... 阅读全文
posted @ 2019-03-31 17:54 Lvan灬 阅读(449) 评论(0) 推荐(0) 编辑
摘要: 用来测试,我在VMware下用Centos7搭起一个三节点的Hadoop完全分布式集群。其中NameNode和DataNode在同一台机器上,如果有条件建议大家把NameNode单独放在一台机器上,因为NameNode是集群的核心承载压力是很大的。hadoop版本:Hadoop-2.7.4; had 阅读全文
posted @ 2019-03-31 12:51 Lvan灬 阅读(650) 评论(0) 推荐(0) 编辑