摘要:
做网站的朋友们不免都会涉及到要从其他网站抓取一些信息。
1. 常用的办法是用正则表达式来获取
优点:比较精准,一蹴而就,不会遗漏你需要的内容
缺点:全中国这么多网页,如果写正则表达式要写到发疯! 如果目标网页一旦改版就要重新写正则表达式,人工排查工作太大。
2. 我们要讨论的是是否能自动分析网页正文 (标题在下一章节讲)
有两个思路 第一是:关键字匹配法(本次主要讲述此方法,仅思路,因商业原因不提供源代码) 第二个是:文本区域获取法 阅读全文
摘要:
一个软件产品做的好不好,从用户角度至少会有三个因素:产品的价格、性能、服务(用户体验)。以前很多用户往往只关注前面两个因素,现在的用户对产品的服务以及用户体验的重视程度已经远远高于前两项。就像我们到超市去购买消费品,如果你是个会过日子的人,那么性价比是你最重视,而不是哪样便宜买哪样。现在政府采购软件也是需要对各家供应商提供的产品进行综合评分,当然涉及到的因素不止上述三项,但是都包含上述三项。 接... 阅读全文