如何自动检查文档中的中文汉字和日文汉字?
项目文档可能是用中文写的、然后要翻译成日文。如果完全依靠人眼区分,很难防止漏掉一些中文汉字,比如“总数”、“选择”等等。
有没有办法写一个程序,自动查找Excel或者Word文档中的中文汉字?
如果将Excel文件转存为XML,可否通过对Unicode内码的判断区分出中文和日文?
using System;
using System.Collections.Generic;
using System.Text;
using System.IO;
namespace ConsoleApplication2
{
class Program
{
static void Main(string[] args)
{
string input = "飞机啊だf对抗赛家非ふぁdだsf假大空dファf家饭店撒酒疯看三rちぇrfgdふぁがdfg大件防盗锁dふぁfdさふぁsdf可录放机dファfダs速度咖啡碱速度开发间";
byte[] data= Encoding.Unicode.GetBytes(input);
byte[] data2 = Encoding.Convert(Encoding.Unicode, Encoding.GetEncoding("shift_jis"), data);
byte[] data3 = Encoding.Convert(Encoding.GetEncoding("shift_jis"), Encoding.Unicode, data2);
string result = Encoding.Unicode.GetString(data3);
for (int i = 0; i < input.Length; i++)
{
if (input[i] != result[i])
{
Console.BackgroundColor = ConsoleColor.Cyan;
}
else
{
Console.BackgroundColor = ConsoleColor.Black;
}
Console.Write(input[i]);
}
Console.ReadKey();
}
}
}
posted on 2007-07-09 13:53 Kevin Shan 阅读(1846) 评论(3) 编辑 收藏 举报