摘要: 问题由来在很多机器学习任务中,特征并不总是连续值,而有可能是分类值。例如,考虑一下的三个特征:["male","female"]["from Europe","from US","from Asia"]["uses Firefox","uses Chrome","uses Safari","uses... 阅读全文
posted @ 2014-06-02 21:44 ps龙之吻 阅读(9111) 评论(0) 推荐(0) 编辑
摘要: K最近邻(K-Nearest-Neighbour,KNN)算法是机器学习里简单易掌握的一个算法。通过你的邻居判断你的类型,“近朱者赤,近墨者黑”表达了K近邻的算法思想。一.算法描述:1.1KNN算法的原理KNN算法的前提是存在一个样本的数据集,每一个样本都有自己的标签,表明自己的类型。现在有一个新的未知的数据,需要判断它的类型。那么通过计算新未知数据与已有的数据集中每一个样本的距离,然后按照从近到远排序。取前K个最近距离的样本,来判断新数据的类型。通过两个例子来说明KNN算法的原理(1)下图中,绿色圆要被决定赋予哪个类,是红色三角形还是蓝色四方形?如果K=3,由于红色三角形所占比例为2/3,绿 阅读全文
posted @ 2014-03-14 19:44 ps龙之吻 阅读(1666) 评论(0) 推荐(0) 编辑
摘要: 正则表达式通过特定的式子匹配某种类型的字符串。对字符串进行匹配验证或者从大量的字符串里提取出特定的信息。正则表达式包含普通字符和特殊字符。大部分的普通字符如‘A’或‘0’可以简单的来匹配自己。如text可以匹配‘text’。特殊字符,可以来匹配一组字符串,或者来说明字符的用法。特征字符包括:.匹配任意一个字符除了\,如cabcd中ab.可以匹配abc$匹配字符串的结束位置。(如果设置了RegExp对象的Multiline属性,$也匹配“\n”之前的位置),如123folked中fol匹配folked,而fol$匹配fol^匹配字符串的开始位置(如果设置了RegExp对象的Multiline属性 阅读全文
posted @ 2014-03-14 19:42 ps龙之吻 阅读(410) 评论(0) 推荐(0) 编辑
摘要: 一、简答题1. 动态链接库和静态链接库的优缺点2. 轮询任务调度和可抢占式调度有什么区别?3. 列出数据库中常用的锁及其应用场景二、算法设计题1. 给定N是一个正整数,求比N大的最小“不重复数”,这里的不重复是指没有两个相等的相邻位,如1102中的11是相等的两个相邻位故不是不重复数,而12301是不重复数。2. 设N是一个大整数,求长度为N的字符串的最长回文子串。3. 坐标轴上从左到右依次的点为a[0]、a[1]、a[2]……a[n-1],设一根木棒的长度为L,求L最多能覆盖坐标轴的几个点?三、系统设计题1. 在现代系统的设计过程中,为了减轻请求的压力,通常采用缓存技术,为了进一步提升缓存的 阅读全文
posted @ 2014-02-07 15:52 ps龙之吻 阅读(278) 评论(0) 推荐(0) 编辑
摘要: 安装easy_installwget http://peak.telecommunity.com/dist/ez_setup.pypython ez_setup.py安装pipwget https://pypi.python.org/packages/source/p/pip/pip-1.4.tar.gz#md5=ca790be30004937987767eac42cfa44atar -zxf pip-1.4.tar.gz && cd pip-1.4python setup.py install通过easy_install安装pip 写道easy_install pip显示已安 阅读全文
posted @ 2014-01-16 10:03 ps龙之吻 阅读(210) 评论(0) 推荐(0) 编辑
摘要: 物理层——中继器和集线器二者都起数字信号放大和中转的作用。中继器 Repeater用来延长网络距离的互连设备。REPEATER可以增强线路上衰减的信号,它两端即可以连接相同的传输媒体,也可以连接不同的媒体,如一头是同轴电缆另一头是双绞线。集线器 HUBHub 在英语中的意思:①轮毂中心, ②中心,中心所在实际上就是一个多端口的中继器,它有一个端口与主干网相连,并有多个端口连接一组工作站。它应用于使用星型拓扑结构的网络中,连接多个计算机或网络设备。集线器就是一种共享设备,HUB本身不能识别目的地址,当同一局域网内的A主机给B主机传输数据时,数据包在以HUB为架构的网络上是以广播方式传输的,由每一 阅读全文
posted @ 2013-12-22 21:36 ps龙之吻 阅读(339) 评论(0) 推荐(0) 编辑
摘要: 前段时间看DP中的01背包问题,大部分内容都好理解,网上也有很多关于这个问题的博客,但自己提出的问题没有得到解决,只好苦思冥想,以求进一步理解。 首先是问题描述:给定n种物品和一背包,物品i的重量是wi,其价值是pi,背包的容量是M,问如何选择装入背包中的物品总价值最大? 这里有两种情况一种是将背包恰好装满,一种是不要求恰好装满。解决这样的问题的方式就是通过设置初始化来解决。 01背包详细内容不再唠叨了,大家看看http://www.cnblogs.com/lzh-cnblogs/p/3359881.html,现在主要就上述两种情况来说明。 当要求恰好装满时,初始化f[0,0]... 阅读全文
posted @ 2013-10-09 22:25 ps龙之吻 阅读(1122) 评论(0) 推荐(1) 编辑
摘要: 首先是问题描述:给定n种物品和一背包,物品i的重量是wi,其价值是pi,背包的容量是M,问如何选择装入背包中的物品总价值最大?可以这样理解:背包的背负有上限,因此在这个上限内尽可能多的装东西,并且价值越多越好。在这里我之想讨论动态规划解决这个问题的详细过程。动态规划是用空间换时间的一种方法的抽象。其关键是发现子问题和记录其结果。然后利用这些结果减轻运算量。因为背包的最终最大容量未知,所以,我们得从1到M一个一个的试,比如,刚开始任选N件物品中的一个,看对应的M的背包,能不能放进去,如果能放进去,并且还有多少空间,则,多出来的空间能放N-1物品中的最大价值,怎么能保证总选则是最大价值呢,看下表: 阅读全文
posted @ 2013-10-09 18:58 ps龙之吻 阅读(620) 评论(0) 推荐(0) 编辑
摘要: 最近看深入了解计算机系统,在开始的时候有对hello.c程序的在计算机内部的执行分析过程,于是就有了前面转载关于gcc对hello.c逐步编译的过程的帖子。现在对其补充与进一步的深入分析与讨论。计算机系统层级可以由用户到底层硬件划为以下几层:1.高级语言级:也就是大家所熟悉的C,C++,JAVA等等。2.汇编语言级:对高级语言进行预处理,编译后生成汇编语言,程序员也可以直接编写。linux下可以gcc -E hello.c -o hello.i.进行预处理,然后进行通过gcc -s hello.i -o hello.s生成汇编语言的文件。3.操作系统级:由操作系统程序实现。这些操作系统由机.. 阅读全文
posted @ 2013-10-01 10:33 ps龙之吻 阅读(2362) 评论(0) 推荐(0) 编辑