字符集编码与乱码问题
一、字符集编码格式
常见的字符集目前是三个
- ASCII:美国信息交换标准码
- GBK:汉字内码扩展规范(国标),兼容ASCII
- UTF-8:8字节万国码,兼容GBK和ASCII
目前基本都统一使用UTF-8开发和数据存储
二、字符编码选择
1、字符集格式选择:
utf8:全球化
gbk: 中文多
2、存储角度分析:
UTF-8对中文采用3个字节,对英文采用1个字节,
GBK对中英文都采用2个字节
三、查看时文件乱码
windows的写字板默认编码格式为:ASNI
windows的记事本默认编码格式为:GBK
解决办法:
下一个Notepad++,可以查看各种格式编码的文件
判断乱码原因:
(1)
(2)
四、如何防止乱码产生
1、mysql仿乱码
①先在C:\ProgramData\MySQL\MySQL Server 5.7\my.ini
,对字符集进行设置
-
[mysql] 中 设置为utf8
-
-
[mysqld]中 设置为utf8
-
-
设置好后,重启mysql服务
②然后在创建数据库时,首先 输入: set names gbk;
2、其他
在创建项目文件后,立即在编辑器的设置栏中统一编码格式为utf8💖
切记一旦✨数据产生了乱码,通常是不可逆操作
原因:
大部分编辑器的默认编码格式并不是我们想要的编码格式。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· Manus的开源复刻OpenManus初探
· AI 智能体引爆开源社区「GitHub 热点速览」
· 从HTTP原因短语缺失研究HTTP/2和HTTP/3的设计差异
· 三行代码完成国际化适配,妙~啊~