Xml的编码问题大讨论

近来工作时遇到一个问题。一个在window下编辑的Xml文件,格式为UTF-8。然后通过php程序导入数据库服务器中。php程序使用的也是UTF-8格式,但是却总是出现乱码。


经过测试,发现原来是因为服务器是UNIX操作系统。而一个文件的格式除了编码以外,还有一个不同:window下的文件是以回车、换行(CRLF)为行尾的;UNIX系统下的文件是以换行(LF)为行尾的。所以需要先将window下的文件,修改成UNIX下需要的格式。


使用微软的Visual Studio.Net可以修改文件的编码格式。方法是用VS打开需要修改格式的xml文件,然后选择[另存为]打开对话框,再选择[编码保存]打开高级保存选项,在[编码]输入框内选择UTF-8(无标签),在[行尾]选择框内选择Unix(LF)。保存即可!

我用它修改了编码及行尾表示后。成功解决问题!

现在有几个问题不明白:

一、UTF8(无标签)和UTF8(带标签)有何区别?

二、如何使用C#编程了修改一个xml的编码为UTF8(无标签)且行尾为UNIX(LF)?

posted @ 2005-07-14 16:24  hardyfan  阅读(191)  评论(0编辑  收藏  举报