代码改变世界

正则表达式:为站内链接加上域名

  敏捷的水  阅读(1356)  评论(0编辑  收藏  举报

1、测试文本

1
2
3
4
5
6
7
<a href='http://search/a.aspx'>home</a>
 
<a href='/aab/bb'>hello</a><a href='http://www.sohu.com'>sohu</a><p>sdfsf</p>
 
<a href="/aab/bb">hello</a>
<div>hello world</div>
<a href="aaa/bb"></a>

 

2、为站内链接加上域名

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Text.RegularExpressions;
using System.IO;
 
namespace ConsoleApplication1
{
    class Program
    {
        static void Main(string[] args)
        {
            string s = File.ReadAllText(@"c:\a.txt");
 
            //给所有非http的链接加上域名,链接前无/
            string d = Regex.Replace(s,
                @"<a\s+href\s?=\s?[\'|\""]((?!http)/.*)?[\""\']",
 
                @"<a href=""www.cnblogs.com$1""",
 
                RegexOptions.Compiled|RegexOptions.IgnoreCase);
 
            //给所有非http的链接加上域名,链接前有/
            string e = Regex.Replace(d,
                @"<a\s+href\s?=\s?[\'|\""]((?!http)(?!/).*)?[\""\']",
 
                @"<a href=""www.cnblogs.com/$1""",
 
                RegexOptions.Compiled | RegexOptions.IgnoreCase);
 
            // Console.WriteLine(d);
 
            Console.WriteLine(e);
 
            Console.Read();
 
        }
    }
}

a. 不包含http, (?!http)表示。

b. 非贪婪匹配 ?> 代表遇到第一个>匹配结束。

c. $1代表前面的组1.

d. 双引号在模式里\""

e. 双引号在@转义的字符串里用两个""表示.

编辑推荐:
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
阅读排行:
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· Manus的开源复刻OpenManus初探
· 写一个简单的SQL生成工具
· AI 智能体引爆开源社区「GitHub 热点速览」
· C#/.NET/.NET Core技术前沿周刊 | 第 29 期(2025年3.1-3.9)
历史上的今天:
2009-01-24 一步一步学Ruby(四):Ruby标准类型
点击右上角即可分享
微信分享提示