摘要: 0 堆内存的在计算机内存中的形式根据《TheC Programming language》推测得到堆内存,图中的Heap区域即为堆内存块(Heap区域的数目不代表计算机堆内存的真实数目)。[1]堆内存不连续。只有标识为Heap的才是堆内存。[2] 在malloc()/free()看来,每个Heap所... 阅读全文
posted @ 2015-04-02 16:22 Jessica程序猿 阅读(1065) 评论(0) 推荐(0) 编辑
摘要: 解决TCP网络传输“粘包”问题当前在网络传输应用中,广泛采用的是TCP/IP通信协议及其标准的socket应用开发编程接口(API)。TCP/IP传输层有两个并列的协议:TCP和UDP。其中TCP(transport control protocol,传输控制协议)是面向连接的,提供高可靠性服务。U... 阅读全文
posted @ 2015-04-02 15:47 Jessica程序猿 阅读(1593) 评论(0) 推荐(0) 编辑
摘要: 许多程序会大量使用字符串。对于不同的字符串,我们希望能够有办法判断其相似程序。我们定义一套操作方法来把两个不相同的字符串变得相同,具体的操作方法为: 1.修改一个字符(如把“a”替换为“b”); 2.增加一个字符(如把“abdd”变为“aebdd”); 3.删除一个字符(如把“travelli... 阅读全文
posted @ 2015-04-02 09:50 Jessica程序猿 阅读(340) 评论(0) 推荐(0) 编辑
摘要: 我们试着降低此问题的复杂度。因为上述思路一再进行查找的时候,总是重复地循环,效率不高。那么怎么简化呢?先来看看这些序列:w0,w1,w2,w3,q0,w4,w5,q1,w6,w7,w8,q0,w9,q1 问题在于,如何一次把所有的关键词都扫描到,并且不遗漏。扫描肯定是无法避免的,但是如何把两次扫描... 阅读全文
posted @ 2015-04-02 09:40 Jessica程序猿 阅读(283) 评论(0) 推荐(0) 编辑
摘要: 今天,我们再来研究另一个相关的问题。有些时候,除了找到关键词,我们还希望找到与原文章相似的其他文章。比如,"Google新闻"在主新闻下方,还提供多条相似的新闻。为了找出相似的文章,需要用到"余弦相似性"(cosine similiarity)。下面,我举一个例子来说明,什么是"余弦相似性"。为了简... 阅读全文
posted @ 2015-04-02 09:33 Jessica程序猿 阅读(294) 评论(0) 推荐(0) 编辑
摘要: 这个标题看上去好像很复杂,其实我要谈的是一个很简单的问题。有一篇很长的文章,我要用计算机提取它的关键词(Automatic Keyphrase extraction),完全不加以人工干预,请问怎样才能正确做到?这个问题涉及到数据挖掘、文本处理、信息检索等很多计算机前沿领域,但是出乎意料的是,有一个非... 阅读全文
posted @ 2015-04-02 09:31 Jessica程序猿 阅读(227) 评论(0) 推荐(0) 编辑