上一页 1 ··· 4 5 6 7 8
摘要: 做网站的朋友们不免都会涉及到要从其他网站抓取一些信息。 1. 常用的办法是用正则表达式来获取 优点:比较精准,一蹴而就,不会遗漏你需要的内容 缺点:全中国这么多网页,如果写正则表达式要写到发疯! 如果目标网页一旦改版就要重新写正则表达式,人工排查工作太大。 2. 我们要讨论的是是否能自动分析网页正文 (标题在下一章节讲) 有两个思路 第一是:关键字匹配法(本次主要讲述此方法,仅思路,因商业原因不提供源代码) 第二个是:文本区域获取法 阅读全文
posted @ 2011-07-04 17:23 沈逸 阅读(2233) 评论(4) 推荐(2) 编辑
摘要: 一个软件产品做的好不好,从用户角度至少会有三个因素:产品的价格、性能、服务(用户体验)。以前很多用户往往只关注前面两个因素,现在的用户对产品的服务以及用户体验的重视程度已经远远高于前两项。就像我们到超市去购买消费品,如果你是个会过日子的人,那么性价比是你最重视,而不是哪样便宜买哪样。现在政府采购软件也是需要对各家供应商提供的产品进行综合评分,当然涉及到的因素不止上述三项,但是都包含上述三项。 接... 阅读全文
posted @ 2009-12-28 11:05 沈逸 阅读(2029) 评论(0) 推荐(1) 编辑
摘要: 利用回调实现脚本实体类和模拟Ajax 阅读全文
posted @ 2008-05-20 10:00 沈逸 阅读(2660) 评论(8) 推荐(0) 编辑
摘要: 最近在搞数据挖据。偶然看到有些功能可以应用到一些网站当中去. 大家都上网购买图书的时候一般都会上像 dearbook,当当这样的国内专业购书网站。这些网站一般都会提供一个常用的功能叫做销售排名,用来向大家展现一段时间内图书销售的排名情况。一般都是展现当月的图书销量排名。这里我们其实可以加一个功能叫做“下个月销售排行榜”,这样可以增加用户体验和使用户购书的时候更具有针对性. 阅读全文
posted @ 2008-05-20 09:53 沈逸 阅读(4237) 评论(12) 推荐(0) 编辑
上一页 1 ··· 4 5 6 7 8