데이터의 손상

반디집 게시판에 자주 올라오는 게시글 유형 중 하나는 “중요한 파일을 압축하고, 원본은 삭제했는데 압축 파일이 손상되었다고 나옵니다. 어떻게 하나요?” 입니다.


crcerror

하지만, 일단 이러한 문제가 발생한 경우 압축 파일 자체가 손상된 경우이기 때문에, 데이터를 복구할 수 없는 경우가 대부분입니다. 따라서, 파일이 손상되지 않도록 미리미리 주의하는 것이 제일 중요하며, 먼저 압축파일이 손상되는 원인을 살펴보도록 하겠습니다.



압축 파일이 손상되는 원인은 보통 다음과 같은 이유를 가지고 있습니다.


압축 프로그램의 버그로 압축한 파일이 압축 단계에서 손상된 경우

어떤 소프트웨어도 버그가 있을 수 있습니다. 일부 버그는 특정 조건에서만 발생하기 때문에 평소에는 전혀 문제가 없다가 어느 날 갑자기 당신이 중요한 데이터를 압축하는 순간에 문제가 생길 수 있습니다.

압축 파일을 인터넷으로 전송하는 과정에서 데이터 전송 오류로 파일이 손상된 경우

인터넷으로 파일을 전송할 때 오류가 발생할 확률은 극히 드물지만, 네트워크가 불안정하여 전송 오류가 빈번하게 발생하는 경우, 전송 프로토콜이 오류를 검출하지 못하여 파일이 손상된 채로 전송되는 경우가 있습니다.

클라우드 서버에 저장한 파일이 손상된 경우

일부 클라우드 서비스는 원가 비용을 줄이기 위해서 저가 장비를 사용하는 경우가 있으며, 저가 장비를 사용한 경우, 서버에 보관한 파일이 일반 PC와 비교하여 더 쉽게 손상되는 경우가 종종 있습니다.

압축 파일을 저장한 하드 디스크나 USB 메모리가 손상된 경우

하드 디스크나 SSD는 비교적 신뢰도가 높은 저장 매체이지만, 사용자의 실수가 아닌 기계적인 결함으로 데이터의 손상이 발생하는 일은 무척 자주 일어납니다. 특히 USB 메모리는 데이터 손상이 아주 빈번하게 발생하는 저장 매체입니다.


이렇듯 멀쩡하던 파일이 어느 날 갑자기 손상될 수 있으며, 특히 압축 파일은 그 포맷의 특성상 극히 일부의 데이터가 손상된 경우에도 파일 전체를 복구할 수 없는 문제가 발생할 수 있습니다.



중요한 데이터 보관 방법

반드시 이중 백업을 하시기 바랍니다.

원본은 가급적 삭제하지 않도록 하며, 원본을 삭제해야 하는 경우에는 최소 두 개의 백업 본을 보관하도록 합니다.

이중 백업한 데이터는 반드시 분산 보관을 하시기 바랍니다.

두 개의 백업 데이터를 동일한 미디어에 보관하는 경우, 미디어가 손상되면 백업파일을 동시에 분실할 수 있으므로, 꼭 다른 방법을 이용하여 따로 따로 보관하시기 바랍니다.

중요한 파일을 압축 한 경우, 압축 파일 테스트 기능을 사용하여 압축이 잘 되었는지 확인합니다.

ZIP 포맷과 같은 압축 포맷은 내부에 CRC 라는 체크섬 정보를 보관하며, 이를 이용하여 압축 파일이 손상되었는지 여부를 판단하는 용도로 사용합니다. 반디집으로 압축 파일을 열고 '테스트' 버튼을 클릭하여 파일이 손상되었는지 여부를 확인할 수 있습니다.

test