c#自动修复缺损和不规范的html

复制代码
private string fixHTML(string html)
        {
            using (var reader = new SgmlReader())
            {
                reader.DocType = "HTML";
                reader.InputStream = new StringReader(html);

                using (var sw = new StringWriter())
                {
                    using (var writer = new XmlTextWriter(sw))
                    {
                        writer.Formatting = Formatting.Indented;
                        while (reader.Read())
                        {
                            if (reader.NodeType != XmlNodeType.Whitespace)
                            {
                                writer.WriteNode(reader, true);
                            }
                        }

                        var sb = new StringBuilder();
                        var doc = new XPathDocument(new StringReader(sw.ToString()));
                        var nav = doc.CreateNavigator();
                        var result = nav.SelectSingleNode("/").OuterXml;
                        return result;
                    }
                }
            }
        }
复制代码

 

posted on   空明流光  阅读(167)  评论(0编辑  收藏  举报

编辑推荐:
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
阅读排行:
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 单线程的Redis速度为什么快?
· SQL Server 2025 AI相关能力初探
· AI编程工具终极对决:字节Trae VS Cursor,谁才是开发者新宠?
· 展开说说关于C#中ORM框架的用法!
历史上的今天:
2019-02-19 c++ 创建线程以及参数传递
2019-02-19 c#函数地址传入c++

导航

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5
点击右上角即可分享
微信分享提示