摘要: 1、基本抓取网页 2、使用代理IP 在开发爬虫过程中经常会遇到IP被封掉的情况,这时就需要用到代理IP; 在urllib2包中有ProxyHandler类,通过此类可以设置代理访问网页,如下代码片段: 3、Cookies处理 cookies是某些网站为了辨别用户身份、进行session跟踪而储存在用 阅读全文
posted @ 2016-07-21 11:45 94julia 阅读(307) 评论(0) 推荐(0) 编辑
摘要: 前言: 找工作时(IT行业),除了常见的软件开发以外,机器学习岗位也可以当作是一个选择,不少计算机方向的研究生都会接触这个,如果你的研究方向是机器学习/数据挖掘之类,且又对其非常感兴趣的话,可以考虑考虑该岗位,毕竟在机器智能没达到人类水平之前,机器学习可以作为一种重要手段,而随着科技的不断发展,相... 阅读全文
posted @ 2015-11-12 10:02 94julia 阅读(318) 评论(1) 推荐(0) 编辑
摘要: 分治算法一、基本概念在计算机科学中,分治法是一种很重要的算法。字面上的解释是“分而治之”,就是把一个复杂的问题分成两个或更多的相同或相似的子问题,再把子问题分成更小的子问题……直到最后子问题可以简单的直接求解,原问题的解即子问题的解的合并。这个技巧是很多高效算法的基础,如排序算法(快速排序,归并排序... 阅读全文
posted @ 2015-11-12 10:00 94julia 阅读(369) 评论(0) 推荐(0) 编辑
摘要: Overview综述TensorFlow has APIs available in several languages both for constructing and executing a TensorFlow graph. The Python API is at present the ... 阅读全文
posted @ 2015-11-10 11:02 94julia 阅读(441) 评论(0) 推荐(0) 编辑
摘要: 1.对象的强、软、弱和虚引用在JDK 1.2以前的版本中,若一个对象不被任何变量引用,那么程序就无法再使用这个对象。也就是说,只有对象处于可触及(reachable)状态,程序才能使用它。从JDK 1.2版本开始,把对象的引用分为4种级别,从而使程序能更加灵活地控制对象的生命周期。这4种级别由高到低... 阅读全文
posted @ 2015-09-15 17:24 94julia 阅读(181) 评论(0) 推荐(0) 编辑
摘要: 特征选择,我对这一部分也不熟,大概讲一下,用AttributeSelection进行特征选择,它需要设置3个方面,第一:对属性评价的类(自己到Weka软件里看一下,英文Attribute Evaluator),第二:搜索的方式(自己到Weka软件里看一下,英文Search Method),第三:就是... 阅读全文
posted @ 2015-07-03 17:14 94julia 阅读(648) 评论(0) 推荐(0) 编辑
摘要: 上一次最后的结果就是一个分类的值,可能让大家大失所望,这一次会给大家一个比较完美的答案,这就是Evaluation类,这次只讲一下最简单的用法,首先初始化一个Evaluation对象,Evaluation类没有无参的构造函数,一般用Instances对象作为构造函数的参数。如果没有分开训练集和测试集... 阅读全文
posted @ 2015-07-03 16:16 94julia 阅读(704) 评论(0) 推荐(0) 编辑
摘要: 这次介绍如何利用weka里的类对数据集进行分类,要对数据集进行分类,第一步要指定数据集中哪一列做为类别,如果这一步忘记了(事实上经常会忘记)会出现“Class index is negative (not set)!”这个错误,设置某一列为类别用Instances类的成员方法setClassInde... 阅读全文
posted @ 2015-07-03 15:27 94julia 阅读(412) 评论(0) 推荐(0) 编辑
摘要: 先google一下,把Weka软件下载下来,安装完成之后,在Weka的安装目录中有一个weka.jar的包。把包添加到工程中后,就可以调用weka中的函数了。再介绍一点weka的基本知识,在weka的目录下,有一个data的文件夹,里面存放的是一些数据集,以第一个数据集contact-lens... 阅读全文
posted @ 2015-07-03 10:13 94julia 阅读(520) 评论(0) 推荐(0) 编辑
摘要: RTB中引入了修改后的Second-Price竞价模型,竞价成功的广告不需要向Ad-Exchange付他的出价,而只会付第二名的出价。Second-Price的理论思想是这样的:假设我在卖莫奈的油画。有许多人想竞得这幅油画,每个人心里都有一个最高出价,但问题是他不想付比能竞得这幅画的出价多一分钱。那... 阅读全文
posted @ 2015-07-01 10:19 94julia 阅读(618) 评论(0) 推荐(0) 编辑