Utf-8+Bom编码导致的读取数据部分异常问题
项目中经常会有这种场景,在配置文件中配置对应关系,项目启动的时候从中读取数据存入map缓存起来,这样使用的时候就可以直接从map找到对应的映射关系.
然后遇到了这么一个诡异的问题,一个简单的映射关系如下:
1:"语文"
2:"数学"
3:"英语"
第一行的语文的映射关系无论如何都取不到,debug的时候可以看到实际上map中是存在1:"语文"这条映射关系,但是取的时候却取不到.这个很诡异啊,取2或是3的映射关系一点问题都没有,仅仅取1的时候失败,返回null.debug来debug去,完全看不出来问题,实在没解点开map中的key仔细端详一番,发现这个1的key有点不一样,2和3的key就是一个char对应2或是3,但是这个1的key却对应2个char, 前一个char存的是\ufeff, 后一个存的才是1.百度了一下这个\ufeff发现这个是由于采用utf-8+bom编码,它属于bom头部分.到此问题明了了,实际上存入map的时候,将bom头也作为key的一部分存入了,导致第一行的key存入的是错误的值,取值时自然取不到.
解决方法也就明了,只需要将配置文件另存成utf-8编码即可.