摘要: 通用爬虫和聚焦爬虫 根据使用场景,网络爬虫可分为 通用爬虫 和 聚焦爬虫 两种. 通用爬虫 通用网络爬虫 是 捜索引擎抓取系统(Baidu、Google、Yahoo等)的重要组成部分。主要目的是将互联网上的网页下载到本地,形成一个互联网内容的镜像备份。 通用搜索引擎(Search Engine)工作 阅读全文
posted @ 2019-09-26 17:21 EspenWu 阅读(928) 评论(0) 推荐(0) 编辑
摘要: 最近做的项目用到了ETL工具Kettle,这个工具相当好用,可以将各种类型数据作为数据流,经过处理后再生成各种类型的数据。正如其名“水壶”,将各个地方的水倒进水壶里,再用水壶倒入不同的容器。不过一来初学乍用,二来对此任务不是很感兴趣,研究的不是很深入,可能是以一种不科学的方法使用的,但观教程,常用的 阅读全文
posted @ 2019-09-24 15:44 EspenWu 阅读(677) 评论(0) 推荐(0) 编辑
摘要: 逃逸分析(Escape Analysis)是目前Java虚拟机中比较前沿的优化技术。 逃逸分析的基本行为就是分析对象动态作用域:当一个对象在方法中被定义后,它可能被外部方法所引用,例如作为调用参数传递到其他地方中,称为方法逃逸。 例如: StringBuffer sb是一个方法内部变量,上述代码中直 阅读全文
posted @ 2019-09-12 14:35 EspenWu 阅读(1871) 评论(0) 推荐(0) 编辑
摘要: 类型: 1.普通游标 只有NEXT操作 2.滚动游标 有多种操作 1.普通游标 结果: 2.滚动游标 结果(可以参考第一个结果分析): 具体FETCH用法: Arguments NEXTReturns the result row immediately following the current 阅读全文
posted @ 2019-07-01 17:43 EspenWu 阅读(211) 评论(0) 推荐(0) 编辑
摘要: 在了解CLASSPATH变量之前,我们要先设置JAVA_HOME和path这两个环境变量,让JAVA环境可以成功地运行起来,然后,再开始我们的想法。 首先,我们在E盘下的test目录下准备两个目录,分别叫HelloWorld和ClassPath,在HelloWorld目录下编写一个JAVA源文件—— 阅读全文
posted @ 2019-04-03 17:02 EspenWu 阅读(7243) 评论(0) 推荐(1) 编辑
摘要: 单点登录SSO(Single Sign On)说得简单点就是在一个多系统共存的环境下,用户在一处登录后,就不用在其他系统中登录,也就是用户的一次登录能得到其他所有系统的信任。单点登录在大型网站里使用得非常频繁,例如像阿里巴巴这样的网站,在网站的背后是成百上千的子系统,用户一次操作或交易可能涉及到几十 阅读全文
posted @ 2019-04-03 09:48 EspenWu 阅读(326) 评论(0) 推荐(0) 编辑
摘要: oracle中 connect by prior 递归算法 如果表中存在层次数据,则可以使用层次化查询子句查询出表中行记录之间的层次关系基本语法: [ START WITH CONDITION1 ]CONNECT BY [ NOCYCLE ] CONDITION2[ NOCYCLE ]参数暂时不解释 阅读全文
posted @ 2019-03-04 09:55 EspenWu 阅读(454) 评论(0) 推荐(0) 编辑
摘要: test 阅读全文
posted @ 2019-03-01 17:28 EspenWu 阅读(103) 评论(0) 推荐(0) 编辑