随笔 - 89 文章 - 1 评论 - 261 阅读 - 16万

如何判断文本文件的编码方式？

文本文件通常通过其前2个字节来标识自身的编码方式，但UTF-32编码则通过前4个字节来标识自己的编码方式。下面是一些编码格式的标识：

编码方式 前几个字节值

ANSI 无格式定义

Unicode FF FE

Unicode big endian FE FF

UTF-8 EF BB

UTF-16/UCS-2, little endian FE FF

UTF-16/UCS-2, big endian FF FE

UTF-32/UCS-4, little endian FF FE 00 00

UTF-32/UCS-4, big-endian 00 00 FE FF

这样一来，我们写代码的时候只需要读取文件的前2个字节~4个字节，即可知道其编码方式。但在.Net中，还有另一种更简单的办法可以知道文本文件的编码方式，及使用以下的代码：

public Encoding GetEncoding(string file)
{
var r = new StreamReader(file, true); //这里的true表示由程序自动判断文件编码
return r.CurrentEncoding; //返回编码
}

posted on 2010-11-08 15:56 阿齐阅读(2752) 评论(3) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】国内首个AI IDE，深度理解中文开发场景，立即下载体验Trae
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包，你的智能百科全书，全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

编辑推荐：
· Linux系列：如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列（二）：开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识（上）

阅读排行：
· DeepSeek 开源周回顾「GitHub 热点速览」
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布：重大改进与新特性概览！
· AI与.NET技术实操系列（二）：开始使用ML.NET
· 单线程的Redis速度为什么快？

昵称：阿齐
园龄： 18年
粉丝： 11
关注： 2

<

2010年11月

>

日

一

二

三

四

五

六

31

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

1

2

3

4

5

6

7

8

9

10

11

随笔分类

随笔档案

相册

阅读排行榜

评论排行榜

推荐排行榜

最新评论

1. Re:EA（Enterprise Architect）
正在用EA。。。。。。
--不止所见
2. Re:如何判断文本文件的编码方式？
楼主写错了,大端和小端的编码弄反了
--万飞
3. Re:屌丝笔记本玩Windows Phone 8开发（在Windows Server 2012中安装WP8 SDK）
core t4400 虚拟化也不支持.只能用真机.
--丐帮大侠
4. Re:屌丝笔记本玩Windows Phone 8开发（在Windows Server 2012中安装WP8 SDK）
不会吧，用wp8sdk 对硬件这么多限制？
--音乐啤酒
5. Re:屌丝笔记本玩Windows Phone 8开发（在Windows Server 2012中安装WP8 SDK）
公司同时为了开发wp8，所以重新申请了一台高配置的机器。按理说Windows Server 2012的内核和windows8应该是一样的，为什么它安装Hyper-v不强制cpu支持SLAT。不知道微软...
--快乐八哥

AI FOR CODE 大赛