94julia

2016年7月21日

摘要： 1、基本抓取网页 2、使用代理IP 在开发爬虫过程中经常会遇到IP被封掉的情况，这时就需要用到代理IP；在urllib2包中有ProxyHandler类，通过此类可以设置代理访问网页，如下代码片段： 3、Cookies处理 cookies是某些网站为了辨别用户身份、进行session跟踪而储存在用阅读全文

posted @ 2016-07-21 11:45 94julia 阅读(320) 评论(0) 推荐(0)

2015年11月12日

常见面试之机器学习算法思想简单梳理【转】

摘要：前言：找工作时（IT行业），除了常见的软件开发以外，机器学习岗位也可以当作是一个选择，不少计算机方向的研究生都会接触这个，如果你的研究方向是机器学习/数据挖掘之类，且又对其非常感兴趣的话，可以考虑考虑该岗位，毕竟在机器智能没达到人类水平之前，机器学习可以作为一种重要手段，而随着科技的不断发展，相... 阅读全文

posted @ 2015-11-12 10:02 94julia 阅读(334) 评论(1) 推荐(0)

基本算法思想

摘要：分治算法一、基本概念在计算机科学中，分治法是一种很重要的算法。字面上的解释是“分而治之”，就是把一个复杂的问题分成两个或更多的相同或相似的子问题，再把子问题分成更小的子问题……直到最后子问题可以简单的直接求解，原问题的解即子问题的解的合并。这个技巧是很多高效算法的基础，如排序算法(快速排序，归并排序... 阅读全文

posted @ 2015-11-12 10:00 94julia 阅读(384) 评论(0) 推荐(0)

2015年11月10日

【译】TensorFlow Python Docs 之 overview

摘要： Overview综述TensorFlow has APIs available in several languages both for constructing and executing a TensorFlow graph. The Python API is at present the ... 阅读全文

posted @ 2015-11-10 11:02 94julia 阅读(458) 评论(0) 推荐(0)

2015年9月15日

Java:对象的强、软、弱和虚引用

摘要： 1．对象的强、软、弱和虚引用在JDK 1.2以前的版本中，若一个对象不被任何变量引用，那么程序就无法再使用这个对象。也就是说，只有对象处于可触及（reachable）状态，程序才能使用它。从JDK 1.2版本开始，把对象的引用分为4种级别，从而使程序能更加灵活地控制对象的生命周期。这4种级别由高到低... 阅读全文

posted @ 2015-09-15 17:24 94julia 阅读(206) 评论(0) 推荐(0)

2015年7月3日

Weka开发［4］－特征选择

摘要：特征选择，我对这一部分也不熟，大概讲一下，用AttributeSelection进行特征选择，它需要设置3个方面，第一：对属性评价的类（自己到Weka软件里看一下，英文Attribute Evaluator），第二：搜索的方式（自己到Weka软件里看一下，英文Search Method），第三：就是... 阅读全文

posted @ 2015-07-03 17:14 94julia 阅读(686) 评论(0) 推荐(0)

Weka开发［3］－Evaluation类

摘要：上一次最后的结果就是一个分类的值，可能让大家大失所望，这一次会给大家一个比较完美的答案，这就是Evaluation类，这次只讲一下最简单的用法，首先初始化一个Evaluation对象，Evaluation类没有无参的构造函数，一般用Instances对象作为构造函数的参数。如果没有分开训练集和测试集... 阅读全文

posted @ 2015-07-03 16:16 94julia 阅读(734) 评论(0) 推荐(0)

Weka开发［2］－分类器类

摘要：这次介绍如何利用weka里的类对数据集进行分类，要对数据集进行分类，第一步要指定数据集中哪一列做为类别，如果这一步忘记了（事实上经常会忘记）会出现“Class index is negative (not set)!”这个错误，设置某一列为类别用Instances类的成员方法setClassInde... 阅读全文

posted @ 2015-07-03 15:27 94julia 阅读(435) 评论(0) 推荐(0)

Weka 开发［1］－Instances类

摘要：先google一下，把Weka软件下载下来，安装完成之后，在Weka的安装目录中有一个weka.jar的包。把包添加到工程中后，就可以调用weka中的函数了。再介绍一点weka的基本知识，在weka的目录下，有一个data的文件夹，里面存放的是一些数据集，以第一个数据集contact-lens... 阅读全文

posted @ 2015-07-03 10:13 94julia 阅读(555) 评论(0) 推荐(0)

2015年7月1日

底价优化

摘要： RTB中引入了修改后的Second-Price竞价模型，竞价成功的广告不需要向Ad-Exchange付他的出价，而只会付第二名的出价。Second-Price的理论思想是这样的：假设我在卖莫奈的油画。有许多人想竞得这幅油画，每个人心里都有一个最高出价，但问题是他不想付比能竞得这幅画的出价多一分钱。那... 阅读全文

posted @ 2015-07-01 10:19 94julia 阅读(661) 评论(0) 推荐(0)

公告