06 2015 档案
摘要:多态性学习(上)什么是多态?多态是指同样的消息被不同类型的对象接收时导致不同的行为。所谓消息是指对类的成员函数的调用,不同的行为是指不同的实现,也就是调用了不同的函数。虽然这看上去好像很高级的样子,事实上我们普通的程序设计中经常用到多态的思想。最简单的例子就是运算符,使用同样的加号“+”,就可以实现...
阅读全文
摘要:认识Session机制前文也提到过,常用的会话跟踪有两种技术:Cookie和Session。今天就为大家讲解一下Session机制。什么是Session?Session是另一种记录客户状态的机制,不同的是Cookie保存在客户端浏览器中,而Session保存在服务器上。客户端浏览器访问服务器的时候,...
阅读全文
摘要:认识标准库bitset类型位是用来保存一组项或者条件的yes/no(1或者0)信息的一种简洁方法,那么位集就是二进制位的有序集。C++中标准库提供的bitset类在我们程序中就很有效的简化了对于位集的处理。bitset对象的定义我们要使用bitset,首先需要包含头文件bitset。和vector对...
阅读全文
摘要:Python自然语言处理(1):初识NLP自然语言处理(Natural Language Processing,NLP):计算机科学领域和人工智能领域中的一个重要方向。它研究实现人与计算机之间用自然语言进行有效通信的各种理论和方法,涉及所有用计算机对自然语言进行的操作。NLP的技术应用日益广泛。例如...
阅读全文
摘要:Cookie机制前言会话跟踪是Web程序中常用的技术,用来跟踪用户的整个会话。常用的会话跟踪技术是Cookie和Session。Cookie通过在客户端记录信息确定用户身份,Session通过在服务器端记录信息确定用户身份。今天,我首先给大家讲解一下Cookie机制,后面我会给大家提到Session...
阅读全文
摘要:爬虫学习一系列:urllib2抓取网页内容所谓网页抓取,就是把URL地址中指定的网络资源从网络中读取出来,保存到本地。我们平时在浏览器中通过网址浏览网页,只不过我们看到的是解析过的页面效果,而通过程序获取的则是程序源代码。我们通过使用Python中urllib2来获取网页的URL资源,最简单方法就是...
阅读全文
摘要:基于概率的分类方法:朴素贝叶斯贝叶斯决策理论朴素贝叶斯是贝叶斯决策理论的一部分,所以在讲解朴素贝叶斯之前我们先快速简单了解一下贝叶斯决策理论知识。贝叶斯决策理论的核心思想:选择具有最高概率的决策。比如我们毕业选择就业方向,选择C++方向的概率为0.3,选择Java的概率为0.2,选择机器学习的概率为...
阅读全文
摘要:Python语言实现机器学习的K-近邻算法写在前面额、、、最近开始学习机器学习嘛,网上找到一本关于机器学习的书籍,名字叫做《机器学习实战》。很巧的是,这本书里的算法是用Python语言实现的,刚好之前我学过一些Python基础知识,所以这本书对于我来说,无疑是雪中送炭啊。接下来,我还是给大家讲讲实际...
阅读全文
摘要:检索模型与搜索排序前言搜索结果排序是搜索引擎最核心的构成部分,很大程度上决定了搜索引擎的质量好坏以及用户接受与否。尽管搜索引擎在实际结果排序时融合了上百种排序因子,但最重要的两个因素还是用户查询和网页的内容相关性及网页链接情况。那么,我们得到用户搜索词之后,如何从内容相关性的角度上对网页进行排序输出...
阅读全文
摘要:决策树学习从今天开始,坚持每天学习一个机器学习的新知识,加油!决策树学习是应用最广的归纳推理算法之一,是一种逼近离散值目标函数的方法,在这种方法中学习到的函数被表示为一颗决策树。决策树表示法决策树通过把实例从根结点排列到某个叶子结点来分类实例,叶子结点即为实例所属的分类。树上的每一个结点指定了对实例...
阅读全文
摘要:机器学习中的监督学习和无监督学习说在前面最近的我一直在寻找实习机会,很多公司给了我第一次电话面试的机会,就没有下文了。不管是HR姐姐还是第一轮的电话面试,公司员工的态度和耐心都很值得点赞,我也非常感激他们。但是我都没有进入下一轮面试的机会,一路想想我的简历和学习经历,确实也挺难有进入第二轮面试的机会...
阅读全文
摘要:转载地址 : 通过身边小事解释机器学习是什么一个给不知道机器学习是什么东西的人讲的一个挺不错的例子,方法。今天从quora上看了一个问题:如何给不是CS的学生,给不知道机器学习和数据挖掘的学生,讲明白什么是机器学习和数据挖掘。其中有个答案很不错,拿买芒果的例子来给大家解释。老师们也应该多用用类似的...
阅读全文
摘要:倒排列表压缩算法目前有很多种倒排列表算法可以选择,但是我们对评判算法的优劣需要定量指标。一般会考虑3个指标:压缩率、压缩速度以及解压速度。压缩率是指数据压缩前和压缩后大小的比例,显然,压缩率越高,就越节约磁盘空间。而压缩速度是压缩单位量的数据所花的时间,但是压缩往往是在建立索引过程中进行的,这是一个...
阅读全文
摘要:索引的查询处理为搜索引擎构建索引,其目的是能更快速地提取与用户查询相关的文档信息,假设搜索引擎已经建立了索引,我们如何利用倒排索引来相应用户的查询呢?这一次的总结就是给大家分享一下搜索引擎对于用户查询的处理过程。目前有两种常见的查询处理机制,一种称为一次一文档方式,另外一种称为一次一单词方式。下面我...
阅读全文
摘要:索引的建立和更新索引的建立前一总结里说到,如果索引结构建立好了,可以提高搜索的速度,那么给定一个文档集合,索引是如何建立起来的呢?建立索引的方式有很多种,在这里我就书中提到的三种方法简单总结一下。两遍文档遍历法第一次文档遍历第一次扫描文档集合时,并没有立即开始建立索引,而是收集一些的统计信息,比如文...
阅读全文
摘要:Servlet开发用户在浏览器中输入一个网址并回车,浏览器会向服务器发送一个HTTP请求。服务器端程序接受这个请求,并对请求进行处理,然后发送一个回应。浏览器收到回应,再把回应的内容显示出来。这种请求—响应模式就是典型的Web应用程序访问过程。JavaWeb应用程序中所有的请求—响应都是由Servl...
阅读全文
摘要:《算法帝国》--读书笔记大约一个半月前在网上很偶然的机会看到了一则广告,就是对《算法帝国》一书的推销,作为现在大三的我,虽然已经不再参加ACM/ICPC竞赛,但是在看到书名的时候,还是被算法这两个字深深的吸引住了,以为这是一本算法竞赛方面的书籍,于是赶紧去京东购买此书。当我看到此书封面的时候,也就是...
阅读全文