【转】Java计算文件的hash值
原文地址:http://blog.csdn.net/qq_25646191/article/details/78863110
如何知道一个文件是否改变了呢?当然是用比较文件hash值的方法,文件hash又叫文件签名,文件中哪怕一个bit位被改变了,文件hash就会不同。
比较常用的文件hash算法有MD5和SHA-1。
我用的是MD5算法,java中,计算MD5可以用MessageDigest这个类。
下面是代码:
- package com.test;
- import java.io.FileInputStream;
- import java.io.FileNotFoundException;
- import java.io.InputStream;
- import java.math.BigInteger;
- import java.security.MessageDigest;
- public class MD5Util {
- public static void main(String[] args) {
- try {
- //此处我测试的是我本机jdk源码文件的MD5值
- String filePath = "C:\\Program Files\\Java\\jdk1.7.0_45\\src.zip";
- String md5Hashcode = md5HashCode(filePath);
- String md5Hashcode32 = md5HashCode32(filePath);
- System.out.println(md5Hashcode + ":文件的md5值");
- System.out.println(md5Hashcode32+":文件32位的md5值");
- //System.out.println(-100 & 0xff);
- } catch (FileNotFoundException e) {
- e.printStackTrace();
- }
- }
- /**
- * 获取文件的md5值 ,有可能不是32位
- * @param filePath 文件路径
- * @return
- * @throws FileNotFoundException
- */
- public static String md5HashCode(String filePath) throws FileNotFoundException{
- FileInputStream fis = new FileInputStream(filePath);
- return md5HashCode(fis);
- }
- /**
- * 保证文件的MD5值为32位
- * @param filePath 文件路径
- * @return
- * @throws FileNotFoundException
- */
- public static String md5HashCode32(String filePath) throws FileNotFoundException{
- FileInputStream fis = new FileInputStream(filePath);
- return md5HashCode32(fis);
- }
- /**
- * java获取文件的md5值
- * @param fis 输入流
- * @return
- */
- public static String md5HashCode(InputStream fis) {
- try {
- //拿到一个MD5转换器,如果想使用SHA-1或SHA-256,则传入SHA-1,SHA-256
- MessageDigest md = MessageDigest.getInstance("MD5");
- //分多次将一个文件读入,对于大型文件而言,比较推荐这种方式,占用内存比较少。
- byte[] buffer = new byte[1024];
- int length = -1;
- while ((length = fis.read(buffer, 0, 1024)) != -1) {
- md.update(buffer, 0, length);
- }
- fis.close();
- //转换并返回包含16个元素字节数组,返回数值范围为-128到127
- byte[] md5Bytes = md.digest();
- BigInteger bigInt = new BigInteger(1, md5Bytes);//1代表绝对值
- return bigInt.toString(16);//转换为16进制
- } catch (Exception e) {
- e.printStackTrace();
- return "";
- }
- }
- /**
- * java计算文件32位md5值
- * @param fis 输入流
- * @return
- */
- public static String md5HashCode32(InputStream fis) {
- try {
- //拿到一个MD5转换器,如果想使用SHA-1或SHA-256,则传入SHA-1,SHA-256
- MessageDigest md = MessageDigest.getInstance("MD5");
- //分多次将一个文件读入,对于大型文件而言,比较推荐这种方式,占用内存比较少。
- byte[] buffer = new byte[1024];
- int length = -1;
- while ((length = fis.read(buffer, 0, 1024)) != -1) {
- md.update(buffer, 0, length);
- }
- fis.close();
- //转换并返回包含16个元素字节数组,返回数值范围为-128到127
- byte[] md5Bytes = md.digest();
- StringBuffer hexValue = new StringBuffer();
- for (int i = 0; i < md5Bytes.length; i++) {
- int val = ((int) md5Bytes[i]) & 0xff;//解释参见最下方
- if (val < 16) {
- /**
- * 如果小于16,那么val值的16进制形式必然为一位,
- * 因为十进制0,1...9,10,11,12,13,14,15 对应的 16进制为 0,1...9,a,b,c,d,e,f;
- * 此处高位补0。
- */
- hexValue.append("0");
- }
- //这里借助了Integer类的方法实现16进制的转换
- hexValue.append(Integer.toHexString(val));
- }
- return hexValue.toString();
- } catch (Exception e) {
- e.printStackTrace();
- return "";
- }
- }
- /**
- * 方法md5HashCode32 中 ((int) md5Bytes[i]) & 0xff 操作的解释:
- * 在Java语言中涉及到字节byte数组数据的一些操作时,经常看到 byte[i] & 0xff这样的操作,这里就记录总结一下这里包含的意义:
- * 1、0xff是16进制(十进制是255),它默认为整形,二进制位为32位,最低八位是“1111 1111”,其余24位都是0。
- * 2、&运算: 如果2个bit都是1,则得1,否则得0;
- * 3、byte[i] & 0xff:首先,这个操作一般都是在将byte数据转成int或者其他整形数据的过程中;使用了这个操作,最终的整形数据只有低8位有数据,其他位数都为0。
- * 4、这个操作得出的整形数据都是大于等于0并且小于等于255的
- */
- }
运行结果如下图:
PS:其实还有一个重点,就是如何知道自己生成的MD5值是否正确呢?
方法很多,其实有一个挺简单的方法,不需要另外安装什么软件。
使用windows自带的命令即可:certutil -hashfile [文件路径] MD5,
例子如下: