2012年4月14日

(转)跟我一起制作数据采集-获取淘宝网店宝贝数据信息(一)

摘要: 原文地址:http://www.cnblogs.com/leizhang/archive/2012/04/13/2446220.html创建项目并绘制界面打开Visual Studio并创建一个基于.net 4.5的WPF项目:GetTaoBaoItems之所以采用4.5是因为后面我们将要用到里面免费的新的异步编程特性.绘制如下主界面: 下载网页我们知道要进行网络数据采集必不可少就要下载网页内容,因此我们首先需要构建一个下载网页内容的函数:注意using System.Net 我们下载哪个网页了?我们可以通过类似网址查看一个店铺的所有宝贝: [淘宝店铺地址]/search.htm,如下图所示. 阅读全文

posted @ 2012-04-14 17:28 黑子范 阅读(591) 评论(0) 推荐(0) 编辑

(转)正则表达式语法

摘要: 原文地址:http://www.yesky.com/imagesnew/software/vbscript/html/jsgrpRegExpSyntax.htm一个正则表达式就是由普通字符(例如字符 a 到 z)以及特殊字符(称为元字符)组成的文字模式。该模式描述在查找文字主体时待匹配的一个或多个字符串。正则表达式作为一个模板,将某个字符模式与所搜索的字符串进行匹配。这里有一些可能会遇到的正则表达式示例:Visual Basic Scripting EditionVBScript匹配/^\[ \t]*$/"^\[ \t]*$"匹配一个空白行。/\d{2}-\d{5}/&qu 阅读全文

posted @ 2012-04-14 17:27 黑子范 阅读(148) 评论(0) 推荐(0) 编辑

(转)30分钟正则表达式入门

摘要: 原文地址:http://www.cnblogs.com/xiaohuzi1990/archive/2011/08/29/2157510.h入门\b代表着单词的开头或结尾,也就是单词的分界处。虽然通常英文的单词是由空格或标点符号或换行来分隔的,但是\b并不匹配这些单词分隔符中的任何一个,它只匹配一个位置。如果同时使用其它的一些元字符,我们就能构造出功能更强大的正则表达式。比如下面这个例子:0\d\d-\d\d\d\d\d\d\d\d匹配这样的字符串:以0开头,然后是两个数字,然后是一个连字号“-”,最后是8个数字(也就是中国的电话号码。当然,这个例子只能匹配区号为3位的情形)。这里的\d是一个. 阅读全文

posted @ 2012-04-14 17:26 黑子范 阅读(200) 评论(0) 推荐(0) 编辑

导航