正则表达式:为站内链接加上域名
2010-01-24 11:42 敏捷的水 阅读(1356) 评论(0) 编辑 收藏 举报1、测试文本
1 2 3 4 5 6 7 | < a href='http://search/a.aspx'>home</ a > < a href='/aab/bb'>hello</ a >< a href='http://www.sohu.com'>sohu</ a >< p >sdfsf</ p > < a href="/aab/bb">hello</ a > < div >hello world</ div > < a href="aaa/bb"></ a > |
2、为站内链接加上域名
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 | using System; using System.Collections.Generic; using System.Linq; using System.Text; using System.Text.RegularExpressions; using System.IO; namespace ConsoleApplication1 { class Program { static void Main( string [] args) { string s = File.ReadAllText( @"c:\a.txt" ); //给所有非http的链接加上域名,链接前无/ string d = Regex.Replace(s, @"<a\s+href\s?=\s?[\'|\""]((?!http)/.*)?[\""\']" , @"<a href=""www.cnblogs.com$1""" , RegexOptions.Compiled|RegexOptions.IgnoreCase); //给所有非http的链接加上域名,链接前有/ string e = Regex.Replace(d, @"<a\s+href\s?=\s?[\'|\""]((?!http)(?!/).*)?[\""\']" , @"<a href=""www.cnblogs.com/$1""" , RegexOptions.Compiled | RegexOptions.IgnoreCase); // Console.WriteLine(d); Console.WriteLine(e); Console.Read(); } } } |
a. 不包含http, (?!http)表示。
b. 非贪婪匹配 ?> 代表遇到第一个>匹配结束。
c. $1代表前面的组1.
d. 双引号在模式里\""
e. 双引号在@转义的字符串里用两个""表示.
扫码关注公众号,了解更多管理,见识,育儿等内容

作者: 王德水
出处:http://www.cnblogs.com/cnblogsfans
版权:本文版权归作者所有,转载需经作者同意。
出处:http://www.cnblogs.com/cnblogsfans
版权:本文版权归作者所有,转载需经作者同意。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· Manus的开源复刻OpenManus初探
· 写一个简单的SQL生成工具
· AI 智能体引爆开源社区「GitHub 热点速览」
· C#/.NET/.NET Core技术前沿周刊 | 第 29 期(2025年3.1-3.9)
2009-01-24 一步一步学Ruby(四):Ruby标准类型