火星文 技术研习社

Noname Cat, Keep Thinking
  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

[转] Asp.net 数据采集基类(远程抓取,分解,保存,匹配)

Posted on 2006-12-11 18:22  剑廿三  阅读(1094)  评论(0编辑  收藏  举报
http://www.opent.cn/article.asp?id=5

/############################################
版权声明:
http://www.opent.cn  作者:浪淘沙
############################################/


using System;
using System.Data;
using System.Configuration;
using System.Web;
using System.Web.Security;
using System.Web.UI;
using System.Web.UI.WebControls;
using System.Web.UI.WebControls.WebParts;
using System.Web.UI.HtmlControls;
using MSXML2;
using System.Text.RegularExpressions;
namespace EC
{
    
/// <summary>
    
/// 远程文件抓取类
    
/// </summary>

    public class GetRemoteObj
    
{
      
        
构造与析构函数

        
IDisposable 成员

        
日期随机函数

        
取得文件后缀

        
获取远程文件源代码

        
保存远程文件

        
替换网页中的换行和引号               

        
执行正则提取出值        

        
替换HTML源代码

        
匹配页面的链接

        
匹配页面的图片地址

        
替换通过正则获取字符串所带的正则首尾匹配字符串


    }

}