Kevin

虫虫的痕迹!!!
  首页  :: 新随笔  :: 订阅 订阅  :: 管理

C#通过URL获取顶级域名的方法

Posted on 2013-05-04 17:01  KevinYao  阅读(4694)  评论(0编辑  收藏  举报

写的一个小工具需要获取指定URL的顶级域名,就写了这么个方法:

private static string GetBaseDomain(string host)
        {
            List<string> list = new List<string>(".com|.co|.info|.net|.org|.me|.mobi|.us|.biz|.xxx|.ca|.co.jp|.com.cn|.net.cn|.org.cn|.mx|.tv|.ws|.ag|.com.ag|.net.ag|.org.ag|.am|.asia|.at|.be|.com.br|.net.br|.bz|.com.bz|.net.bz|.cc|.com.co|.net.co|.nom.co|.de|.es|.com.es|.nom.es|.org.es|.eu|.fm|.fr|.gs|.in|.co.in|.firm.in|.gen.in|.ind.in|.net.in|.org.in|.it|.jobs|.jp|.ms|.com.mx|.nl|.nu|.co.nz|.net.nz|.org.nz|.se|.tc|.tk|.tw|.com.tw|.idv.tw|.org.tw|.hk|.co.uk|.me.uk|.org.uk|.vg".Split('|'));
            string[] hs = host.Split(".".ToCharArray(), StringSplitOptions.RemoveEmptyEntries);

            if (hs.Length > 2)
            {
                //传入的host地址至少有三段
                int p2 = host.LastIndexOf('.');                 //最后一次“.”出现的位置
                int p1 = host.Substring(0, p2).LastIndexOf('.');//倒数第二个“.”出现的位置
                string s1 = host.Substring(p1);
                if (!list.Contains(s1))
                    return s1.TrimStart('.');

                //域名后缀为两段(有用“.”分隔)
                if (hs.Length > 3)
                    return host.Substring(host.Substring(0, p1).LastIndexOf('.'));
                else
                    return host.TrimStart('.');
            }
            else if (hs.Length == 2)
            {
                return host.TrimStart('.');
            }
            else
            {
                return string.Empty;
            }
        }

 

调用方式(以下代码中的 url 为实际访问的网址):

string baseDomain = GetBaseDomain((new Uri(url)).Host);

 

因为写的程序是.NET 2.0 的,如果是高版本的话可以把List改为HashSet,效率应该会高一点(虽然基本感觉不出来,但处理上万行数据的话还是建议用HashSet,效率提升很明显,元素数量在10个以内的话两个是基本没区别的)