摘要: /级别类别论文ANature, ScienceSCI核心库、SSCI、A&HCI收录期刊论文SCI扩展库BSSCI、SCI、A&HCI收录的会议论文HI收录论文、EI期刊论文北京联合大学权威期刊目录C1CSCD期刊论文(核心库),CSSCI期刊论文(核心库)《国外人文社会科学核心期刊总览》期刊论文《... 阅读全文
posted @ 2015-05-22 11:00 chamie 阅读(858) 评论(0) 推荐(0) 编辑
摘要: 1、背景简介 互联网的出现和普及给用户带来了大量的信息,满足了用户在信息时代对信息的需求,但随着网络的迅速发展而带来的网上信息量的大幅增长,使得用户在面对大量信息时无法从中获得对自己真正有用的那部分信息,对信息的使用效率反而降低了,这就是所谓的信息超载(informationoverload)问题... 阅读全文
posted @ 2015-05-22 09:59 chamie 阅读(905) 评论(0) 推荐(1) 编辑
摘要: 世界上已经成型的爬虫软件多达上百种,本文对较为知名及常见的开源爬虫软件进行梳理,按开发语言进行汇总,如下表所示。虽然搜索引擎也有爬虫,但本次我汇总的只是爬虫软件,而非大型、复杂的搜索引擎,因为很多兄弟只是想爬取数据,而非运营一个搜索引擎。开源爬虫汇总表开发语言软件名称软件介绍许可证JavaArach... 阅读全文
posted @ 2015-05-21 16:01 chamie 阅读(1385) 评论(0) 推荐(0) 编辑
摘要: 来源:《这就是搜索引擎核心技术详解》 2014.51搜索引擎及其技术框架1.1搜索引擎发展史 1)分类目录 “导航时代”,代表:Yahoo和国内hao123。通过人工收集整理,把属于各个类别的高质量网站或者网页分门别类罗列,用户可以根据分级目录来查找高质量的网站。 采取分类目录的方式,一半被收... 阅读全文
posted @ 2015-05-21 15:37 chamie 阅读(865) 评论(0) 推荐(0) 编辑
摘要: 1、Java是一种面向对象语言,Java中的类把方法和数据连接在一起,构成了自包含式的处理单元。但在Java中不能定义基本类型(primitive type)对象,为了能将基本类型视为对象进行处理,并能连接相关的方法,Java为每个基本类型都提供了包装类,如:int型数值的包装类Integer,bo... 阅读全文
posted @ 2015-05-19 17:13 chamie 阅读(142) 评论(0) 推荐(0) 编辑
摘要: 7.1 面向对象概述 7.1.1对象和类 类的实例化就是对象 7.1.2面向对象程序设计的特点:封装、继承、多态7.2类 7.2.1成员变量和成员方法 7.2.2权限修饰符 7.2.3局部变量和局部变量的有效范围 7.2.4静态变量、常量和方法 由static修饰的变量、常... 阅读全文
posted @ 2015-05-18 22:20 chamie 阅读(291) 评论(0) 推荐(0) 编辑
摘要: 在Java语言中有两种对象的比较方式:package seven;public class Sevenzerofive { public static void main(String[] args){ String c1=new String("abc");//创建两个Stri... 阅读全文
posted @ 2015-05-18 20:05 chamie 阅读(142) 评论(0) 推荐(0) 编辑
摘要: 1、 类是世间事物的抽象称呼,而对象则是这个事物相对应的实体; 类是封装对象的属性和行为的载体,反过来说具有相同属性和行为的一类实体被称为类,例如:鸟类封装了所有鸟的共同属性和应具有的行为。 在Java语言中,类中对象的行为是以方法的形式定义的,对象的属性是以成员变量的形式定义的。2、面向对象程... 阅读全文
posted @ 2015-05-17 21:14 chamie 阅读(119) 评论(0) 推荐(0) 编辑
摘要: 1、注意待预测数据集和训练用数据集各个属性的设置必须是一致的。即使你没有待预测数据集的Class属性的值,你也要添加这个属性,可以将该属性在各实例上的值均设成缺失值。比如你可以将欲预测的类别设为?即缺失值。2、在“Test Opion”中选择“Supplied test set”,并且“Set”成你... 阅读全文
posted @ 2015-05-14 10:49 chamie 阅读(2655) 评论(0) 推荐(1) 编辑
摘要: 一、描述统计描述性统计是指运用制表和分类,图形以及计筠概括性数据来描述数据的集中趋势、离散趋势、偏度、峰度。1、缺失值填充:常用方法:剔除法、均值法、最小邻居法、比率\回归法、决策树法。2、正态性检验:很多统计方法都要求数值服从或近似服从正态分布,所以之前需要进行正态性检验。常用方法:非参数检验的K... 阅读全文
posted @ 2015-05-11 22:21 chamie 阅读(985) 评论(0) 推荐(1) 编辑