摘要: 1. 什么是WS-Security? WS-Security 是一个 SOAP 的扩展,它提供了对 SOAP 消息的认证和加密。 在介绍 WS-Security 之前,我们有必要了解一下 WS-Security 存在的原因。很多刚刚接触 Web 服务的人都将 SOAP 看作是通过 HTTP 在两个端点之间交换消息的方法。通过 HTTP 可以验证调用方的身份、对消息签名以及对消息内容加密。这可以在... 阅读全文
posted @ 2014-07-06 23:03 褐色礁石 阅读(1110) 评论(0) 推荐(1) 编辑
摘要: 1. 有哪些网页检索维护的方法 主要有宽度(广度)优先,兼顾深度的遍历策略、不重复抓取策略、大站优先策略、非完全PageRank策略、OCIP策略、合作抓取策略等主流的网页抓取策略。 详细内容请参考:搜索引擎爬虫网页抓取策略 非完全PageRank策略(Partial PageRank) 对于已经下载的网页(不完整的互联网页面的子集)内,加上待抓取的URL队列中的URL一起,形成网页集合,在... 阅读全文
posted @ 2014-07-06 23:02 褐色礁石 阅读(596) 评论(0) 推荐(0) 编辑
摘要: 1. 网页提取正文的方法有哪些? 基于统计信息: 基于DOM的网页主题信息自动提取, 使用特征文本密度的网页正文提取, 基于标签密度的自适应正文提取方法, 基于行块分布函数的正文提取方法。 基于视觉 基于决策树 基于包装器 2. 有哪些中文分词方法 基于字符串匹配的分词方法 一般的做法是首选根据停顿词(比如:的,是等)将字符串分解多个更小的字符串,之后在对分解后的字符串分词,该分词方... 阅读全文
posted @ 2014-07-06 23:00 褐色礁石 阅读(338) 评论(0) 推荐(0) 编辑
摘要: Spring的集成测试单位测试和集成测试,我想大家都做过,一般情况下,一般逻辑且不需要操作数据库的情况比较适合于单位测试了。而对于一个数据库应用来说,集成测试可能比单元测试更重要,你可以想象,一个互联网应用,不是增修数据,就是查询数据了,那么验证操作在数据记录上的影响就更为需要。如果在的应用中使用了... 阅读全文
posted @ 2014-06-25 23:09 褐色礁石 阅读(333) 评论(0) 推荐(0) 编辑
摘要: 工作有些年月了,或许就是工作有些年月,所以在导致问题越是凸显了,那是什么问题呢?比如:写好周报,写好任务列表,另外上头安排下来的任务不能及时反馈,另外还一个大问题,就是不能和同事很少的协调工作了,至于原因是什么,正如前面所说的,工作有些年月了,职位没有得到升迁,就出现了一个奇怪的现象了,一些年轻的同事成了自己的上司,当然也可能个人认为领导的能力不够,不能很少的带领我们诸如此类。 ... 阅读全文
posted @ 2014-06-23 22:31 褐色礁石 阅读(345) 评论(0) 推荐(0) 编辑
摘要: 平时工作比较忙了,在白天去学习的可能性不大,那么新知识的学习时间就只能放在晚上了。那么现在的问题就是如何能白天的工作当中获取经验和知识呢?毕竟这样的一个信息化的社会,知识的获取还是比较容易,但是经验的获取就比较难了,比如你想获取一个大并发,大流量系统的架构开发经验了,如果你不是经历过这样的系统架... 阅读全文
posted @ 2014-06-22 23:50 褐色礁石 阅读(245) 评论(0) 推荐(0) 编辑