Kevin Shan

如何自动检查文档中的中文汉字和日文汉字?

项目文档可能是用中文写的、然后要翻译成日文。如果完全依靠人眼区分,很难防止漏掉一些中文汉字,比如“总数”、“选择”等等。

有没有办法写一个程序,自动查找Excel或者Word文档中的中文汉字?

如果将Excel文件转存为XML,可否通过对Unicode内码的判断区分出中文和日文?



using System;

using System.Collections.Generic;

using System.Text;

using System.IO;

 

namespace ConsoleApplication2

{

    class Program

    {

        static void Main(string[] args)

        {

            string input = "飞机啊だf对抗赛家非ふぁdだsf假大空dファf家饭店撒酒疯看三rちぇrfgdふぁがdfg大件防盗锁dふぁfdさふぁsdf可录放机dファfダs速度咖啡碱速度开发间";

           

            byte[] data= Encoding.Unicode.GetBytes(input);

            byte[] data2 = Encoding.Convert(Encoding.Unicode, Encoding.GetEncoding("shift_jis"), data);

            byte[] data3 = Encoding.Convert(Encoding.GetEncoding("shift_jis"), Encoding.Unicode, data2);

 

            string result = Encoding.Unicode.GetString(data3);

 

            for (int i = 0; i < input.Length; i++)

            {

                if (input[i] != result[i])

                {

                    Console.BackgroundColor = ConsoleColor.Cyan;

                }

                else

                {

                    Console.BackgroundColor = ConsoleColor.Black;

                }

 

                Console.Write(input[i]);

            }

 

            Console.ReadKey();

        }

    }

}

 

posted on 2007-07-09 13:53  Kevin Shan  阅读(1846)  评论(3编辑  收藏  举报