【教程】配置IDEA文件编码为UTF-8

✨文件编码

UTF-8

UTF-8(8-bit Unicode Transformation Format)是一种针对Unicode的可变长度字符编码,也是一种前缀码。它可以用一至四个字节对Unicode字符集中的所有有效编码点进行编码,属于Unicode标准的一部分,最初由肯·汤普逊和罗布·派克提出。

自2009年以来,UTF-8一直是万维网的最主要的编码形式(对所有,而不仅是Unicode范围内的编码)(并由WHATWG宣布为强制性的“适用于所有事物(for all things)”,截止到2019年11月, 在所有网页中,UTF-8编码应用率高达94.3%(其中一些仅是ASCII编码,因为它是UTF-8的子集),而在排名最高的1000个网页中占96%。第二热门的多字节编码方式Shift JIS和GB 2312分别具有0.3%和0.2%的占有率。

  • Internet邮件联盟( Internet Mail Consortium, IMC)建议所有电子邮件程序都能够使用UTF-8展示和创建邮件,W3C建议UTF-8作为XML文件和HTML文件的默认编码方式。

  • 互联网工程工作小组(IETF)要求所有互联网协议都必须支持UTF-8编码。

  • 互联网邮件联盟(IMC)建议所有电子邮件软件都支持UTF-8编码。


GBK

汉字内码扩展规范,简称GBK,全名为《汉字内码扩展规范(GBK)》1.0版

由中华人民共和国全国信息技术标准化技术委员会1995年12月1日制订,国家技术监督局标准化司和电子工业部科技与质量监督司1995年12月15日联合以《技术标函[1995]229号》文件的形式公布。

GBK共收录21886个汉字和图形符号,其中汉字(包括部首和构件)21003个,图形符号883个。

GBK的K为“扩展”的汉语拼音(kuòzhǎn)第一个声母。英文全称 Chinese Internal Code Extension Specification


✨IDEA文件编码

  • Windows下IDEA默认的文件编码为 GBK
  • macOS下默认的文件编码为 UTF-8

建议将IDEA 全局编码、项目编码、属性文件的默认编码 都修改为 UTF-8

并且同时在 IDEA设置新项目的设置 中修改

修改完 重新启动IDEA 重新加载Maven项目


✨碎碎念

发现之前在macOS能跑的代码到Windows下一直报错= =

排错很久之后发现是在XML中写了中文

修改文件编码后问题解决


✨参考及引用

https://zh.wikipedia.org/wiki/汉字内码扩展规范#编码方式

https://zh.wikipedia.org/wiki/UTF-8


⭐转载请注明出处

本文作者:双份浓缩馥芮白

原文链接:https://www.cnblogs.com/Flat-White/p/15109945.html

版权所有,如需转载请注明出处。

posted @ 2021-08-06 18:31  双份浓缩馥芮白  阅读(2107)  评论(0编辑  收藏  举报