C语言判断文件编码格式
/* 功能:实现文件编码格式的判断 通过一个文件的最前面三个字节,可以判断出该的编码类型: ANSI: 无格式定义;(第一个字节开始就是文件内容) Unicode: 前两个字节为FFFE; Unicode big endian: 前两字节为FEFF; UTF-8: 前两字节为EFBB,第三字节为BF */ #include <stdio.h> #include <stdlib.h> #include <string.h> // 读取一个文件的最前面n个字节,并以十六进制形式输出每个字节的值 void readNBytes( char *fileName, int n) { FILE *fp = fopen (fileName, "r" ); unsigned char *buf = (unsigned char *) malloc ( sizeof (unsigned char )*n); int i; if (fp == NULL) { printf ( "open file [%s] failed.\n" , fileName); return ; } fread (buf, sizeof (unsigned char ), n, fp); fclose (fp); printf ( "%s:\t" , fileName); for (i = 0; i < n; i++) { printf ( "%x\t" , buf[i]); } printf ( "\n" ); free (buf); } void main() { char fileName[][50] = { "ansi.txt" , "unicode.txt" , "ubigendian.txt" , "utf8.txt" }; int i; for (i = 0; i < 4; i++) { // 每个文件中的内容都是:你what123456 readNBytes(fileName[i], 3); } } |
每个测试文件中的内容都是:你what123456
运行结果为:
ansi.txt: c4 e3 77
unicode.txt: ff fe 60
ubigendian.txt: fe ff 4f
utf8.txt: ef bb bf
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识(上)
· 浏览器原生「磁吸」效果!Anchor Positioning 锚点定位神器解析
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET10 - 预览版1新功能体验(一)