虚心使人进步

虚心学习,天天向上......
随笔 - 274, 文章 - 2, 评论 - 161, 阅读 - 76万
  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理
< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

利用WebClient抓取百度收录数(C#)

Posted on   Showker  阅读(3562)  评论(21编辑  收藏  举报

网上好多asp版本的百度抓取程序,现贴上asp.net 2.0,C#的百度收录数抓取方法。希望各位指正。

复制代码
 1using System;
 2using System.Collections.Generic;
 3using System.Text;
 4using System.Net;
 5using System.Text.RegularExpressions;
 6namespace Tool
 7{
 8    public class SeoCount
 9    {
10        /// <summary>返回百度:某期间,收录数量
11        /// 参数strTimespan代表意义
12        /// "1"请选择要查询近几天的收录量
13        /// "1"查询昨日收录情况
14        /// "7"查询最近1星期收录情况
15        ///"30"查询最近1月收录情况
16        ///"360"查询最近1年收录情况
17        ///"0"查询总的(所有日期)收录情况
18        /// </summary>
19        /// <param name="strHostName"></param>
20        /// <returns></returns>

21        public string BaiduCount(string strTimespan,string strHostName)
22        {
23            string uri = "http://www.baidu.com/s?lm="+strTimespan+"&wd=site:"+strHostName;
24            string html = new WebClient().DownloadString(uri);
25            string pattern = @"百度一下,找到相关网页[\s\S]*?(?=篇,用时)";
26            //string number = new Regex(@"找到相关网页约([\d,]+)篇").Match.Groups[1].Value; 
27            string number1 = Regex.Match(html, pattern, RegexOptions.IgnoreCase).Value;
28            string lastnumber = number1.Replace("百度一下,找到相关网页""");
29            //如果有很多篇去掉约,返回纯数字串
30            if (lastnumber.Contains(""))
31            {
32                lastnumber.Replace("","");
33            }

34            //如果一篇都没有返回0
35            if (lastnumber == "")
36            {
37                lastnumber = "0";
38            }

39            return lastnumber;
40
41        }

42    }

43}
复制代码

 

编辑推荐:
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
阅读排行:
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· Manus的开源复刻OpenManus初探
· AI 智能体引爆开源社区「GitHub 热点速览」
· 从HTTP原因短语缺失研究HTTP/2和HTTP/3的设计差异
· 三行代码完成国际化适配,妙~啊~
点击右上角即可分享
微信分享提示