摘要:
hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。 其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据 阅读全文
摘要:
Sqoop是一款开源的工具,主要用于在Hadoop(Hive)与传统的数据库(mysql、postgresql...)间进行数据的传递,可以将一个关系型数据库(例如 : MySQL ,Oracle ,Postgres等)中的数据导进到Hadoop的HDFS中,也可以将HDFS的数据导进到关系型数据库 阅读全文
摘要:
OSI七层模型介绍: 下面4层(物理层、数据链路层、网络层和传输层)主要提供数据传输和交换功能,即以节点到节点之间的通信为主;第4层作为上下两部分的桥梁,是整个网络体系结构中最关键的部分;而上3层(会话层、表示层和应用层)则以提供用户与应用程序之间的信息和数据处理功能为主。 物理层的主要功能是:利用 阅读全文
摘要:
```C++ //打印从1到最大的n位数:大数问题,用字符串表示数字来避免溢出 bool increment(char number){ bool isOverFlow = false; int nTakeOver = 0; size_t strLength = strlen(number); fo 阅读全文
摘要:
```C++ //在O(1)时间内删除链表节点,给定单向链表的一个头指针和一个节点指针,假设该节点一定是链表中的节点 struct ListNode{ int m_nValue; ListNode* m_pNext; }; void DeleteNode(ListNode** pListHead, ListNode* pToBeDeleted){ //传入特殊值:空链表,空... 阅读全文
摘要:
```C++ //调整数组顺序使奇数位于偶数前面: void reorderOddEven(int pData, unsigned int length){ if (pData == nullptr || length pBegin && func( pEnd)) pEnd ; if (pBegin 阅读全文
摘要:
```C++ //树的子结构:输入两颗二叉树A, B,判断B是不是A的子结构 struct BinaryTreeNode{ double m_dbValue; BinaryTreeNode* m_pLeft; BinaryTreeNode* m_pRight; }; bool hasSubTree(BinaryTreeNode* pRoot1, BinaryTreeNode... 阅读全文
摘要:
```C++
//字符串的全排列:递归实现
void Permutation(char* pStr){ if (pStr == nullptr) return; Permutation(pStr, pStr);
}
void Permutation(char* pStr, char* pBegin){ if (*pBegin == '\0') ... 阅读全文
摘要:
```C++ //快速排序:Partition分割函数,三数中值分割 bool g_bInvalidInput = false; int median3(int data, int start, int end){ int middle = (start + end) 1; if (data[sta 阅读全文
摘要:
C++ //把字符串转换成整数: // 1:考虑特殊输入,空指针,空字符串,只有正负号之后没有数字,字符串中有非数字字符 // 2:考虑整型的(正数)上溢出,(负数)下溢出, 需要把num类型设置为long long才能不溢出,再用num与int的极大极小值比较 // 3:输入测试:正数,负数,0 阅读全文
摘要:
C++ //丑数:求从小到达排列的第1500个丑数 //暴力枚举 bool isUgly(int number){ while (number % 2 == 0) number /= 2; while (number % 3 == 0) number /= 3; while (number % 5 阅读全文
摘要:
```C++ //mergeSort: void mergeSort(int data, int length, int start, int end, int tempArray){ if (start == end){ tempArray[start] = data[start]; return 阅读全文
摘要:
```C++ //两个链表的第一个公共节点:可以利用两个辅助栈实现, 也 //可以遍历链表两次,求节点个数差,长的链表先遍历, 然后同时开始遍历, 找到相同节点 struct ListNode{ int m_nValue; ListNode* m_pNext; }; ListNode* FirstPublicNode(ListNode* pHead1, ListNode* pHea... 阅读全文
摘要:
```C++ //二叉查找树的第k大节点:利用二叉搜索树的中序遍历序列是递增排序的性质,递归实现 struct BinaryTreeNode{ int m_nValue; BinaryTreeNode m_pLeft; BinaryTreeNode m_pRight; }; BinaryTreeNo 阅读全文
摘要:
```C++ // 数组中数字出现的次数:数组中只出现一次的两个数字,其他数字都出现两次(位运算特点:位异或exclusiveOR(^), 位与(&)) // 其他解法:使用排序,然后二分查找只出现一次的数字,时间O(n log n), // 使用哈希表存储每个数字出现的次数,时间O(n),空间O( 阅读全文
摘要:
//添加赋值运算符函数: 阅读全文
摘要:
"原文链接" 系列 ● 《使用sklearn进行集成学习——理论》 ● 《使用sklearn进行集成学习——实践》 目录 1 Random Forest和Gradient Tree Boosting参数详解 2 如何调参? 2.1 调参的目标:偏差和方差的协调 2.2 参数对整体模型性能的影响 2. 阅读全文
摘要:
"原文链接" 系列 ● 《使用sklearn进行集成学习——理论》 ● 《使用sklearn进行集成学习——实践》 目录 1 前言 2 集成学习是什么? 3 偏差和方差 3.1 模型的偏差和方差是什么? 3.2 bagging的偏差和方差 3.3 boosting的偏差和方差 3.4 模型的独立性 阅读全文
摘要:
TensorFlow 官方文档:https://www.tensorflow.org/api_guides/python/math_ops TensorFlow Mini batching 学习率和epochs 1. 学习率过高,在相同的epochs条件下准确率会过早的停止改进,导致最终准确率会低 阅读全文
摘要:
TFLearn构建神经网络 Building the network "TFLearn" lets you build the network by "defining the layers" . Input layer For the input layer, you just need to t 阅读全文