2012年9月9日

百度笔试题目剖析——拼写纠错

摘要: 网上流传的百度笔试题目部分附有答案。但一家之言,难免偏颇。题目:在用户输入英文单词时,经常发生错误,我们需要对其进行纠错。假设已经有一个包含了正确英文单词的词典,请你设计一个拼写纠错的程序。(1)请描述你解决这个问题的思路;(2)请给出主要的处理流程,算法,以及算法的复杂度;(3)请描述可能的改进(改进的方向如效果,性能等等,这是一个开放问题)。网上流传解答:(1)思路:字典以字母键树组织,在用户输入同时匹配(2)流程:每输入一个字母:沿字典树向下一层,a)若可以顺利下行,则继续至结束,给出结果;b)若该处不能匹配,纠错处理,给出拼写建议,继续至a);算法:1.在字典中查找单词字典采用27叉树 阅读全文

posted @ 2012-09-09 20:10 原来... 阅读(4346) 评论(0) 推荐(0) 编辑

十道海量数据处理面试题与十个方法大总结

摘要: 海量数据处理:十道面试题与十个海量数据处理方法总结作者:July、youwang、yanxionglu。时间:二零一一年三月二十六日本文之总结:教你如何迅速秒杀掉:99%的海量数据处理面试题。有任何问题,欢迎随时交流、指正。出处:http://blog.csdn.net/v_JULY_v。------------------------------------------第一部分、十道海量数据处理面试题1、海量日志数据,提取出某日访问百度次数最多的那个IP。 首先是这一天,并且是访问百度的日志中的IP取出来,逐个写入到一个大文件中。注意到IP是32位的,最多有个2^32个IP。同样可以采用映. 阅读全文

posted @ 2012-09-09 17:17 原来... 阅读(549) 评论(0) 推荐(0) 编辑

对内存重叠的深入认识

摘要: 内存重叠:拷贝的目的地址在源地址范围内。所谓内存重叠就是拷贝的目的地址和源地址有重叠。在函数strcpy和函数memcpy都没有对内存重叠做处理的,使用这两个函数的时候只有程序员自己保证源地址和目标地址不重叠,或者使用memmove函数进行内存拷贝。memmove函数对内存重叠做了处理。现在来看函数strcpy原型:extern char *strcpy(char *dest,char *source);功能:把source所指由NULL结束的字符串复制到dest所指的数组中。说明:source和dest所指内存区域不可以重叠且dest必须有足够的空间来容纳source的字符串。返回指向des 阅读全文

posted @ 2012-09-09 15:45 原来... 阅读(757) 评论(0) 推荐(0) 编辑

B树、B-树、B+树、B*树

摘要: B树 即二叉搜索树: 1.所有非叶子结点至多拥有两个儿子(Left和Right); 2.所有结点存储一个关键字; 3.非叶子结点的左指针指向小于其关键字的子树,右指针指向大于其关键字的子树; 如: http://p.blog.csdn.net/images/p_blog_csdn_net/manesking/1.JPG B树的搜索,从根结点开始,如果查询的关键字与结点的关键字相等,那么就命中;否则,如果查询关键字比结点关键字小,就进入左儿子;如果比结点关键字大,就进入右儿子;如果左儿子或右儿子的指针为空,则报告... 阅读全文

posted @ 2012-09-09 11:10 原来... 阅读(243) 评论(0) 推荐(0) 编辑

导航