08 2010 档案
摘要:<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html xmlns="http://www.w3.org/1999/xhtml"><head><meta htt...
阅读全文
摘要:在抓取网页过程中,很多网页内容都预先存储到JAVASCRIPT变量中,如果仅通过SUBSTRING 进行截取分析,效率慢,错误率多。如何才能更好的解决呢?用MSScriptControl在C#中,我们也可以通过Com组件来执行一段javascript代码。下面的代码展示了如何用MSScriptControl 组件执行一段数学表达式:MSScriptControl.ScriptControlClas...
阅读全文
摘要:常用正则表达式大全!(例如:匹配中文、匹配html)匹配中文字符的正则表达式: [u4e00-u9fa5] 评注:匹配中文还真是个头疼的事,有了这个表达式就好办了 匹配双字节字符(包括汉字在内):[^x00-xff] 评注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1) 匹配空白行的正则表达式:ns*r 评注:可以用来删除空白行 匹配HTML标记的正...
阅读全文
摘要:首先将网页内容整个抓取下来,数据放在byte[]中(网络上传输时形式是byte),进一步转化为String,以便于对其操作,实例如下:private static string GetPageData(string url){ if (url == null || url.Trim() == "") return null; WebClient wc = new WebClient(); wc.C...
阅读全文
摘要:课程一:收藏店铺 其实很简单 这个是搞定后的代码,大家可以点击一下看看是不是能收藏: http://favorite.taobao.com/popup/add_collection.htm?itemid=35358353&itemtype=0&ownerid=186e94365009c8feebcb3e9fcbd7f869&t=0 主要是两点设置: 1)itemid=353...
阅读全文
摘要:using System;using System.Data;using System.Configuration;using System.Web;using System.Web.Security;using System.Web.UI;using System.Web.UI.WebControls;using System.Web.UI.WebControls.WebParts;using ...
阅读全文
摘要:转载自:http://www.cnblogs.com/liping13599168/archive/2009/02/08/1386111.html1. 首先新建一个用于进行下载处理的page页,如download.aspx,里面什么东西也没有。2. 添加一个DownloadHandler类,它继承于IHttpHandler接口,可以用来自定义HTTP 处理程序同步处理HTTP的请求。 [代码]3....
阅读全文