接手一个韩国的项目,需要在arcmap中配置一个韩国地图并发布到arcserver中进行切图,给的韩国地图的shapefile文件中属性字段都是韩文的,在中文的系统中,arcMap中显示的韩文都是乱码,因此添加标注时,都是一系列的乱码。
原因分析:中文系统一般采用GBK的编码方式,因此中文系统下,生成的shapefile文件都是以GBK来编码其中的字段属性的。而项目中的shapefile文件都是韩国朋友直接发送过来的,在韩文系统下,他们用的UTF-8方式来编码其中的韩文属性,因此在我的中文系统电脑上,arcmap用默认GBK方式来打开UTF-8编码的韩文,就会出现乱码。
解决办法:
在 ArcGIS Desktop (ArcMap, ArcCatalog, and ArcToolbox) 中,有编码页转换功能(CODE PAGE CONVERSION),可以读写多种字符编码的 shapefile 和 dBASE 表。在系统注册表中,编码页转换功能(CODE PAGE CONVERSION)命名为 'dbfDefault',可以修改这个值。在 shapefile (.DBF) 的头文件中包含了引用的编码页,用来与用户的区域设置一致。例如,如果用户使用了日本的区域设置,那编码页是'Shft-JIS'。
在 ArcGIS 10.2.1 版本,shapefile (.DBF) 的编码页的默认设置为 UTF-8 (UNICODE) 。
在 ArcGIS 10.2.1 之前,可以通过下面的方法来设置编码行为:
1. 开始--运行,输入”Regedit“,打开注册表。
2. 如是用的是 10.x 版本 ArcGIS Desktop,定位到” My Computer\HKEY_CURRENT_USER\Software\ESRI\Desktop 10.x' (如果是9.3.1之前的版本,定位到 'My Computer\HKEY_CURRENT_USER\Software\ESRI')。
3. 创建项 'Common',接着创建 'CodePage'项,添加 ‘字符串’,名称: dbfDefault,健值:oem(或者UTF-8,我的都设置成UTF-8)。
如下为支持的编码值:
OEM Code Page Values:
OEM, 437, 708, 720, 737, 775, 850, 852, 855, 857, 860, 861, 862, 863, 864, 865, 866, 869, 932, 936, 950
ANSI Code Page Values:
ANSI, 1250, 1251, 1252, 1253, 1254, 1255, 1256, 1257, 1258, Big5, SJIS
ISO Code Page Values:
ISO, 88591, 88592, 88593, 88594, 88595, 88596, 88597, 88598, 88599, 885910, 885913, 885915, EUC
Unicode Values:
UTF-8
备注:
1)我装的是arcgis9.3,为了保险起见,修改'dbfDefault'时,我找到了注册表中所有的ESRI项值,然后都进行了步骤3.
2)需要注意的是'dbfDefault' 这项设置仅对 ArcGIS Desktop 生效,对于一些很老版本的ArcGIS 产品不适用;仅对 shapefile 生效,Personal GDB等不生效。
3)'dbfDefault' 的作用
使用 ArcGIS for Desktop 打开 dBase 表文件时,程序先去读头文件中的 Language Driver ID (LDID) 或者是同名 *.CPG文件。前面二者都是用来在读文件之前,决定用什么编码类型来正确读出文件。如果有必要, ArcGIS for Desktop 会进行编码转换来显示字符串。
如果文件缺失 LDID 或者 .CPG 文件,编码就会被假定为 Windows (ANSI/Multi-byte)。也是因为这个原因,如果文件是 OEM 编码的,并且没有写入 LDID 或者 .CPG,字符就会出现乱码。 也就说 ArcGIS 把 OEM 文件当成 ANSI 文件来处理了。
多数情况下, shapefiles 和 dBASE 文件都会存储编码页信息。 但是有些程序的OEM文件没有包含编码页信息,例如 Microsoft Access 2000 and Excel 2000,所以这些文件读取时,就会乱码。为了避免这个问题,用户可以给没有编码页信息的文件设置dbfDefault 。
写: 在注册表中设置 'dbfDefault' ,可以决定导出的 shapefile 和 dBASE 的编码类型。例如,把 'dbfDefault' 设置为 OEM ,那么用 ArcMap, ArcCatalog, ArcToolbox 生成出来的 shapefile 和 dBASE 文件就是以 OEM编码的,设置成 ANSI ,那 shapefile 和 dBASE 文件就是 ANSI 编码的。
读: 读 shapefile 和 dBASE 文件的逻辑与写是相同的,如果缺失编码信息,ArcGIS 读取文件的编码类型由 dbfDefault 决定。
相关技术文章:http://support.esri.com/en/knowledgebase/techarticles/detail/21106
本文转载自http://blog.csdn.net/kikitamoon/article/details/19116415