【开源工具】C# 批量规范HTML工具

1、问题描述:

由为知笔记导出的文件导入Evernote的时候,有一些(新建的)HTML文件以<mate>标签开头,查阅Evernote的log可知因此文件不能被导入。

责任无论归于为知还是Evernote都不重要,总之几百篇日志不可能通过复制粘贴进行导入。

 

2、工具解决问题:

批量将某一文件夹内不合规范html文件规范化。

 

3、界面

 

4、主要代码

private void button2_Click(object sender, EventArgs e)
        {
            if (folderBrowserDialog1.ShowDialog() == DialogResult.OK)
            {
                DirectoryInfo dir = new DirectoryInfo(folderBrowserDialog1.SelectedPath);
                FileInfo[] files = dir.GetFiles("*.html");
                for (int i = 0; i < files.Length; i++)
                {
                    System.IO.StreamReader sr = new System.IO.StreamReader(files[i].DirectoryName+"\\"+files[i].ToString());
                    NSoup.Nodes.Document doc = NSoup.NSoupClient.Parse(sr.ReadToEnd());
                    try
                    {
                        sr.Dispose();
                        File.Delete(files[i].DirectoryName + "\\" + files[i].ToString());
                        using (StreamWriter sw = new StreamWriter(files[i].DirectoryName+"\\"+files[i].ToString(), false, System.Text.Encoding.GetEncoding("UTF-8"))) //保存地址
                        {
                            sw.WriteLine(doc.ToString());
                            sw.Flush();
                            sw.Close();
                        }
                    }
                    catch
                    {

                    } 
                }
                Application.Exit();
            }
        }

5、源码:

环境:vs2008

组件:Nsoup.dll

https://files.cnblogs.com/files/yixiaozi/NsoupApplication.zip

 

可执行程序:https://files.cnblogs.com/files/yixiaozi/FormatHtml.zip

posted @ 2014-08-25 15:55  Toby Wang  阅读(2637)  评论(0编辑  收藏  举报