搜索引擎算法程序分析研究

搜索引擎算法程序分析研究,放在一个 javascript里面解释一下陶瓷阀,好理解点:

<script type="text/javascript">
var arrBaiduCproConfig=new Array();
arrBaiduCproConfig['uid'] = nnnnnn; /* 你的用户ID*/
arrBaiduCproConfig['n'] = 'xxxxxxx'; /* 你的用户名,会在你原有搜索陶瓷阀用户名后面加cpr */
arrBaiduCproConfig['tm'] = 44; /* 广告单元标题字数 */
arrBaiduCproConfig['cm'] = 134; /* 广告单元描述字数 */
arrBaiduCproConfig['um'] = 44; /* url长度 */
arrBaiduCproConfig['rad'] = 1; /* 需查 */
arrBaiduCproConfig['w'] = 300; /* 宽度 */
arrBaiduCproConfig['h'] = 250; /* 高度 */
arrBaiduCproConfig['bd'] = '#CC0000'; /* 边框颜色 */
arrBaiduCproConfig['bg'] = '#ffffff'; /* 背景色 */
arrBaiduCproConfig['tt'] = '#0000ff'; /* 标题颜色 */
arrBaiduCproConfig['ct'] = '#000000'; /* 广告描述颜色 */
arrBaiduCproConfig['url'] = '#666666'; /* url颜色 */
arrBaiduCproConfig['bdl'] = '#ffffff'; /* "百度主题推广"文字的颜色 */
arrBaiduCproConfig['wn'] = 1; /* 广告内显示广告单元的列数 */
arrBaiduCproConfig['hn'] = 3; /* 广告内显示广告单元的行数 */
arrBaiduCproConfig['ta'] = 'center'; /* 百度主题推广"文字的水平位置right,left,center */
arrBaiduCproConfig['tl'] = 'top'; /* 百度主题推广"文字的垂直位置 top,bottom */
arrBaiduCproConfig['bu'] = 1; /* 需查 */
</script>

接下来就可以利用循环来检查HTML文档包含的所有文本和标记。通常,检查过程可以从一个测试Eof方法的while循环开始:

while(!parse.Eof()){char ch = parse.Parse();

 

  Parse方法将返回HTML文档包含的字符--它返回的内容只包含那些非HTML标记的字符,如果遇到了HTML标记,Parse方法将返回0值,表示大田阀门产品中心现在遇到了一个HTML标记。遇到一个标记之后,我们可以用GetTag()方法来处理它。

if(ch==0){HTMLTag tag = parse.GetTag();}

 

  一般地,蜘蛛程序最重要的任务之一就是找出各个HREF属性,这可以借助C#的索引功能完成。例如,下面的代码将提取出HREF属性的值(如果存在的话)。

Attribute href = tag["HREF"];string link = href.Value;

 

  获得Attribute对象之后,通过Attribute.Value可以得到该属性的值。

陶瓷阀相关产品:奉贤鲜花/徐汇保洁公司/闵行租车/静安汽车租赁/奉贤婚庆礼仪/颚式破碎机/捆札机/潜水泵/旋塞阀/摆动混合机/螺丝/球磨机/注册公司/装修公司/空调维修/代开发票

posted @ 2011-11-05 15:40  蓝色的天空下  阅读(202)  评论(0编辑  收藏  举报
google