JAVA根据文件头判断文件类型(持续更新)
举个例子,一张jpg格式的图片直接修改后缀名为png也可以打开,但当一些方法需要调用后缀为png格式图片的时候,再使用这个文件,则会出现报错。是因为这张图片的本质没有变,他还是个png格式的文件。
那么,该如何去掉文件名的伪装,拿到文件的真实格式呢?
使用java.io包中的FileInputStream类。通过读取原始字节流,根据字节流头部获取到文件格式。从而判断一个文件是否被修改过。
下面提供一个可行方法
// file path String path = ""; File file = new File(path); FileInputStream fs = new FileInputStream(file); // 具体需要多大的数组要根据具体文件来判断,这里先定义大小为10,大部分文件定义3够用 byte[] b = new byte[10];
fs.read(b,0,b.length);
String suffix = checkFileType(bytesToHexString(b));
这里给出一个讲数组转换成为十六进制字符串的方法
public static String bytesToHexString(byte[] b){ StringBuilder stringBuilder = new StringBuilder(); if (b == null || b.length <= 0) { return null; } for (int i = 0; i < b.length; i++) { int v = b[i] & 0xFF; String hv = Integer.toHexString(v); if (hv.length() < 2) { stringBuilder.append(0); } stringBuilder.append(hv); } return stringBuilder.toString(); }
再定义一个枚举类 点击查看代码

public static String checkFileType(String x) { switch (x) { case "255044462d312e360d25": return "pdf"; case "e69292e58f91e8bebee6": return "txt"; case "d0cf11e0a1b11ae10000": return "doc,ppt,xls"; case "504b0304140006000800": return "docx,xlsx"; case "504b03040a0000000000": return "pptx,jar"; case "89504e470d0a1a0a0000": return "png"; case "ffd8ffe000104a464946": return "jpg,jpeg"; case "47494638396126026f01": return "gif"; case "49492a00227105008037": return "tif,tiff"; //16位色图 case "424d228c010000000000": return "bmp"; //24位色图 case "424d8240090000000000": return "bmp"; //256位色图 case "424d8e1be30000000000": return "bmp"; case "3c21444f435459504520": return "html"; case "526172211a0700cf9073": return "rar"; case "504b0304140000000800": return "zip"; case "235468697320636f6e66": return "ini"; case "4d5a9000030000000400": return "exe"; case "49443303000000002176": return "mp3"; case "49443303000000034839": return "mp3"; case "00000020667479706973": return "mp4"; case "000001ba210001000180": return "mpg"; case "3026b2758e66cf11a6d9": return "wmv,asf"; case "52494646d07d60074156": return "avi"; case "464c5601050000000900": return "flv,f4v"; case "4d546864000000060001": return "mid,midi"; default: return "0000"; } }
后续还会补充各种各样的文件类型。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· Manus爆火,是硬核还是营销?
· 终于写完轮子一部分:tcp代理 了,记录一下
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 别再用vector<bool>了!Google高级工程师:这可能是STL最大的设计失误
· 单元测试从入门到精通