会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
奔跑的小河
Talk is cheap. Show me the code.
导航
博客园
首页
新随笔
联系
订阅
管理
公告
1
2
3
4
5
下一页
2017年5月23日
常用文本操作命令
摘要: 1. tr 按列替换 删除输入中的 "{" 和 "}" 将文件testfile中的小写字母全部转换成大写字母 2. cut : cut [ b] [file] 列切分 cut 命令从文件的每一行剪切字节、字符和字段并将这些字节、字符和字段写至标准输出。 如果不指定 File 参数,cut 命令将读取
阅读全文
posted @ 2017-05-23 20:27 奔跑的小河
阅读(599)
评论(0)
推荐(0)
编辑
2017年4月19日
记一次蛋疼的mongo to hive导数过程
摘要: 1. 起因 一次hive查数过程中,发现hive中缺省了10天的近3000w的数据,自问自答:怎么办,当然是要补数啊!从哪里补,mongo啊(还好mongo中有一份)! mongo中数据是bson保存,而且数据列与hive不一样! 2. 解决方案 方案1: 思路:由于 只能以逗号分割字段,所以要导到
阅读全文
posted @ 2017-04-19 20:11 奔跑的小河
阅读(335)
评论(0)
推荐(0)
编辑
记一次22亿大数据分析处理踩坑经历
摘要: 前言 :用最简单最少的语言,分享我的坑,理不理解需求不重要,问题都在shell代码中,看shell极度枯燥,希望能有帮助! 一. 起因 需求,分析hive表中两年内用户XX的所有数据,按照每天早,中,晚三个时间段统计,按照两年内的节假日统计,按照月份的上旬,中旬,下旬统计,按照周末,工作日统计等等。
阅读全文
posted @ 2017-04-19 20:10 奔跑的小河
阅读(1087)
评论(0)
推荐(0)
编辑
2015年7月20日
说说我对写技术博客的感受
摘要: 前言 其实在读大学时就开始想写技术博客,可是一直都没有开始,就在今年的一个偶然的想法,就陆陆续续开始写自己的博客,后来基本就成为一种习惯,当每遇到或学习了一种 新的技术或知识,第一想法就是整理到自己的博客里去,而以前总是喜欢拿个txt或者word总结整理出来。写到txt或word中一个非常不好的就是
阅读全文
posted @ 2015-07-20 18:12 奔跑的小河
阅读(172)
评论(0)
推荐(0)
编辑
2015年7月19日
仰视源码,实现strlen
摘要: 最近对于C++源码特别感兴趣,读源码,然后根据源码实现一遍,对我帮助蛮大的。下面给出我们天天用的strlen的实现: 普通实现 size_t strlen1(const char* str){ const char* tmp = str; size_t rtn = 0; while(tmp++ !=
阅读全文
posted @ 2015-07-19 20:27 奔跑的小河
阅读(130)
评论(0)
推荐(0)
编辑
字符串匹配算法——Boyer-Moore算法
摘要: 字符串匹配算法很多,Boyer-Moore算法也不算是效率最高的算法,它常用于各种文本编辑器的”查找”功能(Ctrl+F)。 比较经典的字符串模式匹配算法还有:Horspool算法、Sunday算法、KR算法、AC自动机等。不多说,进入主题。 Boyer-Moore算法概率 假定字符串为”HERE
阅读全文
posted @ 2015-07-19 17:29 奔跑的小河
阅读(350)
评论(0)
推荐(0)
编辑
2015年7月18日
KMP字符串匹配算法—用最容易理解的方式描述(整理)
摘要: 看了数据结构书上对于快速模式匹配算法KMP的介绍,感觉云里雾里。本文根据自己理解,并查资料整理了一种非常清晰简单的字符串匹配算法,并给予实现,自诩原创吧。 字符串匹配是我们经常要用到的一种算法,与普通的匹配算法相比KMP算法效率更高,时间复杂度为O(m+n)。下面给予详细讲解: 概念详解 设原字符串
阅读全文
posted @ 2015-07-18 21:00 奔跑的小河
阅读(256)
评论(0)
推荐(0)
编辑
LeetCode之RemoveElement
摘要: 题目: Given an array and a value, remove all instances of that value in place and return the new length. The order of elements can be changed. It doesn’
阅读全文
posted @ 2015-07-18 10:18 奔跑的小河
阅读(89)
评论(0)
推荐(0)
编辑
2015年7月16日
Linux中fork函数详解
摘要: 如果对中间的零碎的讲解没有兴趣,可以直接跳到文章末尾,看总结。 一、fork基础知识 一个进程,包括代码、数据和分配给进程的资源。fork()函数通过系统调用创建一个与原来进程几乎完全相同的进程,也就是两个进程可以做完全相同的事,但如果初始参数或者传入的变量不同,两个进程也可以做不同的事。 一个进程
阅读全文
posted @ 2015-07-16 20:47 奔跑的小河
阅读(279)
评论(0)
推荐(0)
编辑
Linux中的经典双链表的实现
摘要: 首先上一篇博客介绍了Linux下的两个经典宏,它可以根据结构体中的成员变量地址,计算出结构体地址。有了它,就可以实现可复用的高效双链表。这次我再Windows环境下给予的实现,看完觉得会受益匪浅。 Linux中双向链表的使用思想 它是将双向链表节点嵌套在其它的结构体中;在遍历链表的时候,根据双链表节
阅读全文
posted @ 2015-07-16 19:29 奔跑的小河
阅读(276)
评论(0)
推荐(0)
编辑
1
2
3
4
5
下一页