IT이야기

Java에서 파일의 MD5 체크섬 가져오기

cyworld 2022. 5. 15. 23:44
반응형

Java에서 파일의 MD5 체크섬 가져오기

파일의 MD5 체크섬을 얻기 위해 Java를 사용하려고 한다.나는 정말 놀랐지만 파일의 MD5 체크섬을 얻는 방법을 찾을 수 없었다.

어떻게 된 거야?

입력 스트림 장식가가 있는데java.security.DigestInputStream데이터를 추가로 통과해야 하는 대신 평소와 같이 입력 스트림을 사용하여 다이제스트를 계산할 수 있다.

MessageDigest md = MessageDigest.getInstance("MD5");
try (InputStream is = Files.newInputStream(Paths.get("file.txt"));
     DigestInputStream dis = new DigestInputStream(is, md)) 
{
  /* Read decorated stream (dis) to EOF as normal... */
}
byte[] digest = md.digest();

Apache Commons Codec 라이브러리의 DigestUtils 사용:

try (InputStream is = Files.newInputStream(Paths.get("file.zip"))) {
    String md5 = org.apache.commons.codec.digest.DigestUtils.md5Hex(is);
}

MessageDigest 클래스를 사용하는 Real의 Java-How-to에 예가 있다.

CRC32 및 SHA-1을 사용한 예는 이 페이지를 참조하십시오.

import java.io.*;
import java.security.MessageDigest;

public class MD5Checksum {

   public static byte[] createChecksum(String filename) throws Exception {
       InputStream fis =  new FileInputStream(filename);

       byte[] buffer = new byte[1024];
       MessageDigest complete = MessageDigest.getInstance("MD5");
       int numRead;

       do {
           numRead = fis.read(buffer);
           if (numRead > 0) {
               complete.update(buffer, 0, numRead);
           }
       } while (numRead != -1);

       fis.close();
       return complete.digest();
   }

   // see this How-to for a faster way to convert
   // a byte array to a HEX string
   public static String getMD5Checksum(String filename) throws Exception {
       byte[] b = createChecksum(filename);
       String result = "";

       for (int i=0; i < b.length; i++) {
           result += Integer.toString( ( b[i] & 0xff ) + 0x100, 16).substring( 1 );
       }
       return result;
   }

   public static void main(String args[]) {
       try {
           System.out.println(getMD5Checksum("apache-tomcat-5.5.17.exe"));
           // output :
           //  0bb2827c5eacf570b6064e24e0e6653b
           // ref :
           //  http://www.apache.org/dist/
           //          tomcat/tomcat-5/v5.5.17/bin
           //              /apache-tomcat-5.5.17.exe.MD5
           //  0bb2827c5eacf570b6064e24e0e6653b *apache-tomcat-5.5.17.exe
       }
       catch (Exception e) {
           e.printStackTrace();
       }
   }
}

com.google.common.해시 API 제공:

  • 모든 해시함수를 위한 사용자 친화적인 통합 API
  • 시드 가능 32비트 및 128비트 dumer3 구현
  • md5(), sha1(), sha256(), sha512() 어댑터, 이것들 사이에서 전환하기 위해 코드 한 줄만 변경하고 중얼거림.
  • goodFastHash(int 비트), 어떤 알고리즘을 사용하든 상관 없는 경우
  • bombineOrdered / combinedUnordered와 같은 HashCode 인스턴스에 대한 일반 유틸리티

사용 설명서(IO 설명, 해싱 설명)를 읽어 보십시오.

사용 사례의 경우 파일의 다이제스트 값을 계산하고 반환하십시오.

: sHA-1 다이제스트 계산(MD5 다이제스트를 가져오려면 SHA-1을 MD5로 변경)

HashCode hc = Files.asByteSource(file).hash(Hashing.sha1());
"SHA-1: " + hc.toString();

보다 훨씬 빠르므로 암호화된 보안 체크섬이 필요하지 않은 경우 를 사용하십시오.또한, 암호는 , 또는 을 대신 사용하기 때문에 를 암호 저장 등에 사용해서는 안 된다는 점에 유의하십시오.

해시를 이용한 장기 보호의 경우, Merkle 서명 체계가 보안에 추가되며, 유럽위원회가 후원하는 포스트 Quantum Cryptography Study Group은 양자 컴퓨터(ref)에 대한 장기 보호를 위해 이 암호법을 사용할 것을 권고했다.

는 다른 crc32보다 충돌률이 높다는 점에 유의하십시오.

nio2(Java 7+) 사용 및 외부 라이브러리 없음:

byte[] b = Files.readAllBytes(Paths.get("/path/to/file"));
byte[] hash = MessageDigest.getInstance("MD5").digest(b);

결과를 예상 체크섬과 비교하려면:

String expected = "2252290BC44BEAD16AA1BF89948472E8";
String actual = DatatypeConverter.printHexBinary(hash);
System.out.println(expected.equalsIgnoreCase(actual) ? "MATCH" : "NO MATCH");

Guava는 이제 JDK에서 제공하는 다양한 해싱 API보다 훨씬 더 사용자 친화적인 새롭고 일관된 해싱 API를 제공한다.해싱 설명 참조.파일의 경우 MD5 합, CRC32(버전 14.0+ 포함) 또는 기타 여러 해시를 쉽게 얻을 수 있다.

HashCode md5 = Files.hash(file, Hashing.md5());
byte[] md5Bytes = md5.asBytes();
String md5Hex = md5.toString();

HashCode crc32 = Files.hash(file, Hashing.crc32());
int crc32Int = crc32.asInt();

// the Checksum API returns a long, but it's padded with 0s for 32-bit CRC
// this is the value you would get if using that API directly
long checksumResult = crc32.padToLong();

좋아. 덧붙여야만 했어.Spring 및 Apache Commons에 이미 종속되어 있거나 추가할 예정인 사용자를 위한 단일 라인 구현:

DigestUtils.md5DigestAsHex(FileUtils.readFileToByteArray(file))

및 Apache 커먼즈 전용 옵션(신용 @duleshi):

DigestUtils.md5Hex(FileUtils.readFileToByteArray(file))

이게 누군가에게 도움이 되길 바래.

Java 7을 사용하는 타사 라이브러리가 없는 단순한 접근 방식

String path = "your complete file path";
MessageDigest md = MessageDigest.getInstance("MD5");
md.update(Files.readAllBytes(Paths.get(path)));
byte[] digest = md.digest();

이 바이트 배열을 인쇄해야 하는 경우아래와 같이 사용

System.out.println(Arrays.toString(digest));

이 다이제스트에서 육각 문자열이 필요한 경우.아래와 같이 사용

String digestInHex = DatatypeConverter.printHexBinary(digest).toUpperCase();
System.out.println(digestInHex);

여기서 DatatypeConverter는 javax.xml.bind.데이터타입컨버터

난 최근에 단지 역동적인 끈을 위해 이것을 해야만 했다.MessageDigest해시를 다양한 방법으로 나타낼 수 있다.당신이 md5sum 명령으로 얻을 수 있는 것처럼 파일의 서명을 받기 위해 나는 다음과 같은 것을 해야만 했다.

try {
   String s = "TEST STRING";
   MessageDigest md5 = MessageDigest.getInstance("MD5");
   md5.update(s.getBytes(),0,s.length());
   String signature = new BigInteger(1,md5.digest()).toString(16);
   System.out.println("Signature: "+signature);

} catch (final NoSuchAlgorithmException e) {
   e.printStackTrace();
}

이것은 분명히 파일을 위해 그것을 어떻게 하는가에 대한 당신의 질문에 대답하지 않는다. 위의 대답은 그 조용한 것을 잘 다룬다.나는 단지 그 합계가 대부분의 어플리케이션의 디스플레이처럼 보이도록 많은 시간을 보냈고, 같은 문제에 부딪힐지도 모른다고 생각했다.

public static void main(String[] args) throws Exception {
    MessageDigest md = MessageDigest.getInstance("MD5");
    FileInputStream fis = new FileInputStream("c:\\apache\\cxf.jar");

    byte[] dataBytes = new byte[1024];

    int nread = 0;
    while ((nread = fis.read(dataBytes)) != -1) {
        md.update(dataBytes, 0, nread);
    };
    byte[] mdbytes = md.digest();
    StringBuffer sb = new StringBuffer();
    for (int i = 0; i < mdbytes.length; i++) {
        sb.append(Integer.toString((mdbytes[i] & 0xff) + 0x100, 16).substring(1));
    }
    System.out.println("Digest(in hex format):: " + sb.toString());
}

또는 더 많은 정보를 얻을 수 있다. http://www.asjava.com/core-java/java-md5-example/

우리는 이전 포스트에서 위 코드와 유사한 코드를 사용하고 있었다.

...
String signature = new BigInteger(1,md5.digest()).toString(16);
...

단, 사용 시 주의하십시오.BigInteger.toString()여기서, 선두의 0을 자를 것이기 때문에...(예를 들어, 시도하라.s = "27", 체크섬은 다음과 같아야 한다."02e74f10e0327ad868d138f2b4fdd6f0")

나는 아파치 커먼스 코덱을 사용하자는 제안에 동의한다. 나는 우리 자신의 코드를 그것으로 대체했다.

public static String MD5Hash(String toHash) throws RuntimeException {
   try{
       return String.format("%032x", // produces lower case 32 char wide hexa left-padded with 0
      new BigInteger(1, // handles large POSITIVE numbers 
           MessageDigest.getInstance("MD5").digest(toHash.getBytes())));
   }
   catch (NoSuchAlgorithmException e) {
      // do whatever seems relevant
   }
}

외부 라이브러리에 의존하지 않는 매우 빠르고 깨끗한 Java-method:

(원하는 경우 MD5를 SHA-1, SHA-256, SHA-384 또는 SHA-512로 간단히 교체)

public String calcMD5() throws Exception{
        byte[] buffer = new byte[8192];
        MessageDigest md = MessageDigest.getInstance("MD5");

        DigestInputStream dis = new DigestInputStream(new FileInputStream(new File("Path to file")), md);
        try {
            while (dis.read(buffer) != -1);
        }finally{
            dis.close();
        }

        byte[] bytes = md.digest();

        // bytesToHex-method
        char[] hexChars = new char[bytes.length * 2];
        for ( int j = 0; j < bytes.length; j++ ) {
            int v = bytes[j] & 0xFF;
            hexChars[j * 2] = hexArray[v >>> 4];
            hexChars[j * 2 + 1] = hexArray[v & 0x0F];
        }

        return new String(hexChars);
}
String checksum = DigestUtils.md5Hex(new FileInputStream(filePath));

여기 다음과 같은 편리한 변형이 있다.InputStream.transferTo() 9까지OutputStream.nullOutputStream()쟈바 11번 지만 없고 외부 라이브러리가 필요하지 않고 전체 파일을 메모리에 로드할 필요가 없다.

public static String hashFile(String algorithm, File f) throws IOException, NoSuchAlgorithmException {
    MessageDigest md = MessageDigest.getInstance(algorithm);

    try(BufferedInputStream in = new BufferedInputStream((new FileInputStream(f)));
        DigestOutputStream out = new DigestOutputStream(OutputStream.nullOutputStream(), md)) {
        in.transferTo(out);
    }

    String fx = "%0" + (md.getDigestLength()*2) + "x";
    return String.format(fx, new BigInteger(1, md.digest()));
}

그리고

hashFile("SHA-512", Path.of("src", "test", "resources", "some.txt").toFile());

돌아온다

"e30fa2784ba15be37833d569280e2163c6f106506dfb9b07dde67a24bfb90da65c661110cf2c5c6f71185754ee5ae3fd83a5465c92f72abd888b03187229da29"

또 다른 구현:Java에서 신속한 MD5 구현

String hash = MD5.asHex(MD5.getHash(new File(filename)));

표준 Java Runtime Environment 방식:

public String checksum(File file) {
  try {
    InputStream fin = new FileInputStream(file);
    java.security.MessageDigest md5er =
        MessageDigest.getInstance("MD5");
    byte[] buffer = new byte[1024];
    int read;
    do {
      read = fin.read(buffer);
      if (read > 0)
        md5er.update(buffer, 0, read);
    } while (read != -1);
    fin.close();
    byte[] digest = md5er.digest();
    if (digest == null)
      return null;
    String strDigest = "0x";
    for (int i = 0; i < digest.length; i++) {
      strDigest += Integer.toString((digest[i] & 0xff) 
                + 0x100, 16).substring(1).toUpperCase();
    }
    return strDigest;
  } catch (Exception e) {
    return null;
  }
}

결과는 리눅스 md5sum 유틸리티와 같다.

여기에 선일의 코드를 감싸 파일(File)을 매개 변수로 삼도록 하는 간단한 기능이 있다.함수는 외부 라이브러리가 필요 없지만 자바 7이 필요하다.

import java.io.File;
import java.io.IOException;
import java.nio.file.Files;
import java.security.MessageDigest;
import java.security.NoSuchAlgorithmException;

import javax.xml.bind.DatatypeConverter;

public class Checksum {

    /**
     * Generates an MD5 checksum as a String.
     * @param file The file that is being checksummed.
     * @return Hex string of the checksum value.
     * @throws NoSuchAlgorithmException
     * @throws IOException
     */
    public static String generate(File file) throws NoSuchAlgorithmException,IOException {

        MessageDigest messageDigest = MessageDigest.getInstance("MD5");
        messageDigest.update(Files.readAllBytes(file.toPath()));
        byte[] hash = messageDigest.digest();

        return DatatypeConverter.printHexBinary(hash).toUpperCase();
    }

    public static void main(String argv[]) throws NoSuchAlgorithmException, IOException {
        File file = new File("/Users/foo.bar/Documents/file.jar");          
        String hex = Checksum.generate(file);
        System.out.printf("hex=%s\n", hex);            
    }


}

출력 예:

hex=B117DD0C3CBBD009AC4EF65B6D75C97B

만약 당신이 ANT를 사용해서 만든다면, 이것은 아주 간단하다.다음을 build.xml에 추가하십시오.

<checksum file="${jarFile}" todir="${toDir}"/>

여기서 jarFile은 MD5를 생성하려는 JAR이고 toDir는 MD5 파일을 배치할 디렉토리다.

자세한 내용은 여기를 참조하십시오.

구글 구아바는 새로운 API를 제공한다.아래 항목 찾기:

public static HashCode hash(File file,
            HashFunction hashFunction)
                     throws IOException

Computes the hash code of the file using hashFunction.

Parameters:
    file - the file to read
    hashFunction - the hash function to use to hash the data
Returns:
    the HashCode of all of the bytes in the file
Throws:
    IOException - if an I/O error occurs
Since:
    12.0
public static String getMd5OfFile(String filePath)
{
    String returnVal = "";
    try 
    {
        InputStream   input   = new FileInputStream(filePath); 
        byte[]        buffer  = new byte[1024];
        MessageDigest md5Hash = MessageDigest.getInstance("MD5");
        int           numRead = 0;
        while (numRead != -1)
        {
            numRead = input.read(buffer);
            if (numRead > 0)
            {
                md5Hash.update(buffer, 0, numRead);
            }
        }
        input.close();

        byte [] md5Bytes = md5Hash.digest();
        for (int i=0; i < md5Bytes.length; i++)
        {
            returnVal += Integer.toString( ( md5Bytes[i] & 0xff ) + 0x100, 16).substring( 1 );
        }
    } 
    catch(Throwable t) {t.printStackTrace();}
    return returnVal.toUpperCase();
}

참조URL: https://stackoverflow.com/questions/304268/getting-a-files-md5-checksum-in-java

반응형