从内容里提取出链接和标题

比如内容格式是HTML格式的,里面有一堆的链接,希望从内容里提取出链接和标题。

如:

复制代码
 1 <a href='http://www.xx.cn/art/2017/12/26/art_8801_1776064.html' title='标题1' target="_blank"></a>        <p>2017-12-26</p>    </li>    ]]></record>
 2 <record><![CDATA[
 3     <li> <a href='http://www.xx.gov.cn/art/2017/12/26/art_8801_1776063.html' title='标题2' target="_blank"></a>        <p>2017-12-26</p>    </li>    ]]></record>
 4 <record><![CDATA[
 5     <li>        <a href='http://www.xx.gov.cn/art/2017/12/26/art_8801_1776060.html' title='标题3' target="_blank"></a>        <p>2017-12-26</p>    </li>    ]]></record>
 6 <record><![CDATA[
 7     <li>        <a href='http://www.xx.gov.cn/art/2017/12/26/art_8801_1776059.html' title='标题4' target="_blank"></a>        <p>2017-12-26</p>    </li>    ]]></record>
 8 <record><![CDATA[
 9     <li>        <a href='http://www.xx.gov.cn/art/2017/12/25/art_8801_1775473.html' title='标题5' target="_blank"></a>        <p>2017-12-25</p>    </li>    ]]></record>
10 <record><![CDATA[
11     <li>        <a href='http://www.xx.gov.cn/art/2017/12/22/art_8801_1775476.html' title='标题6' target="_blank"></a>        <p>2017-12-22</p>    </li>    ]]></record>
12 <record><![CDATA[
复制代码

 

方法正则表达式

 

 

复制代码
1 string htmlcontext = “”;
2 
3 Regex regex = new Regex(@"\<a.*href\s*=\s*(?:""(?<url>[^""]*)""|'(?<url>[^']*)'|(?<url>[^\>^\s]+)).*\>(?<title>[^\<^\>]*)\<[^\</a\>]*/a\>", RegexOptions.IgnoreCase);
4 
5 for (Match m = regex.Match(htmlcontext); m.Success; m = m.NextMatch())
6 {
7         string stringurl = m.Groups[1].Value.ToString();
8         string stringtitle = m.Groups[2].Value.ToString();
9 }
复制代码

 

输出结果:

http://www.xx.cn/art/2017/12/26/art_8801_1776064.html   标题1

 

posted @   yopoyan  阅读(881)  评论(0编辑  收藏  举报
编辑推荐:
· .NET Core GC压缩(compact_phase)底层原理浅谈
· 现代计算机视觉入门之:什么是图片特征编码
· .NET 9 new features-C#13新的锁类型和语义
· Linux系统下SQL Server数据库镜像配置全流程详解
· 现代计算机视觉入门之:什么是视频
阅读排行:
· Sdcb Chats 技术博客:数据库 ID 选型的曲折之路 - 从 Guid 到自增 ID,再到
· .NET Core GC压缩(compact_phase)底层原理浅谈
· Winform-耗时操作导致界面渲染滞后
· Phi小模型开发教程:C#使用本地模型Phi视觉模型分析图像,实现图片分类、搜索等功能
· 语音处理 开源项目 EchoSharp
点击右上角即可分享
微信分享提示