perl xml dom中文乱码问题解决

在linux服务器上,很容易出现中文乱码。

一般情况下,只要保持服务器环境是utf8,文件格式是utf8,用各种语言默认的读写文件方式通常不会出现乱码。

但是,在用perl xml dom写xml的时候就出现了这个问题。

perl xml dom默认应该是用ascii来读写文件,所以,对中文要先进行解码decode,再写入。

例如:

 1 #更新显示的xml文件
 2 sub writeXml
 3 {
 4     my $projectList = "$hometouch_root/config/projectList.xml";
 5     my $parser = new XML::DOM::Parser ;
 6     my $doc = $parser->parsefile($projectList);
 7     XML::DOM::setTagCompression(sub{return 1}); 
 8     my $newItem = $doc->createElement("item");
 9     #所以这里先将中文进行解码
10     $newItem->setAttribute("name",decode("utf8",$projectChinese));
11     $newItem->setAttribute("eng",$projectName);
12     $newItem->setAttribute("version","");
13     my $root = $doc->getElementsByTagName("projects")->[0];
14     $root->appendChild($newItem);
15     
16     #write the file
17     my $xml = ($doc->createXMLDecl('1.0','UTF-8')->toString).($root->toString) ;
18     
19     open my $myfd, ">", $projectList;
20     print $myfd $xml ;
21     close $myfd ;
22     
23     #xml tidy
24     my $tidy_obj = XML::Tidy->new('filename' => $projectList);
25     $tidy_obj->tidy();
26     $tidy_obj->write();
27 }

 

posted @ 2013-03-12 15:53  ifeixiang  阅读(869)  评论(0编辑  收藏  举报