스캔 PDF 압축 방법 2026 - 이미지 기반 문서 최적화 완벽 가이드
스캔 PDF 압축 방법 2026 - 이미지 기반 문서 최적화 완벽 가이드
2026년 3월 27일
스캔 PDF 압축은 일반 PDF 압축과는 완전히 다른 접근이 필요하다. 스캐너에서 만든 PDF는 각 페이지가 고해상도 이미지로 저장되기 때문에 파일 크기가 매우 크다. A4 흑백 스캔 1장이 2~3MB, 컬러 스캔이 5~10MB인 이유가 바로 이것이다. 단순히 압축만으로는 부족하고, 해상도 조정, 색상 최적화, 이미지 포맷 변환 등 여러 단계의 처리가 필요하다. 이 글에서는 스캔 PDF를 효과적으로 압축하는 모든 방법을 상세히 설명한다.
스캔 PDF가 큰 이유와 압축의 어려움
스캔 PDF의 거대한 파일 크기는 원리를 이해하면 압축 방법도 명확해진다. 스캔 문서는 종이 원본을 이미지로 변환한 것이다. 따라서 각 페이지가 JPEG이나 TIFF 같은 이미지 포맷으로 저장된다.
스캔 PDF 파일 크기 결정 요소
첫 번째 결정 요소는 스캔 해상도(DPI)다. DPI(인치당 도트 수)가 높을수록 더 선명하지만 파일이 커진다. 일반 문서는 200DPI로도 충분하지만, 세부 인식이 필요하면 300DPI 이상을 사용한다. A4 크기 기준으로 100DPI는 약 500KB, 200DPI는 2MB, 300DPI는 5MB, 600DPI는 20MB에 달한다.
두 번째는 색상 모드다. 흑백 문서는 1비트 정보만 필요하므로 파일이 작다. 하지만 컬러로 스캔하면 RGB 24비트 정보가 필요해서 파일이 8배 이상 커진다. 그레이스케일은 중간 정도다.
세 번째는 이미지 압축 방식이다. 스캔 PDF에 사용된 JPEG 압축의 품질 수준이 파일 크기에 큰 영향을 미친다.
스캔 PDF 압축의 핵심 기술
스캔 PDF를 효과적으로 압축하려면 일반 PDF와 다른 기술이 필요하다.
해상도 재조정 (Downsampling)
다운샘플링은 이미지 해상도를 낮추는 기술이다. 예를 들어 600DPI로 스캔한 이미지를 200DPI로 재조정하면 파일이 1/9로 줄어든다. 중요한 점은 문서의 용도에 맞는 해상도를 선택하는 것이다. 화면 표시용(72~96DPI), 일반 문서(150~200DPI), 인쇄용(300DPI), 아카이빙(400DPI 이상)으로 나뉜다.
색상 최적화
스캔할 때 불가피하게 들어온 배경 음영이나 얼룩을 제거하는 기술이다. 특히 오래된 종이 원본을 스캔하면 누렇거나 얼룩진 배경이 파일 크기를 불필요하게 키운다. 색상 정규화(Color Normalization)를 적용하면 배경을 하얀색으로 정리하고, 검은 텍스트만 강조해서 파일 크기를 줄이고 가독성을 높일 수 있다.
이미지 압축 코덱 선택
스캔 이미지를 압축하는 방식도 중요하다. JPEG는 사진처럼 자연스러운 그라데이션이 있는 이미지에 최적이지만, 문서의 샤프한 텍스트에는 아티팩트(왜곡)를 만든다. PNG는 손실 없지만 파일이 크다. 최근 WebP나 JBIG2 같은 신 코덱이 개발되었는데, JBIG2는 특히 흑백 문서에 최적화되어 있다.
PDFKit으로 효율적으로 압축하기
PDFKit은 스캔 문서 특화 압축 기능을 제공한다. 일반적인 PDF 압축과는 다르게 스캔 이미지 최적화에 초점을 맞춘다.
단계별 압축 프로세스
- PDFKit 웹사이트에 접속해 'PDF 압축' 메뉴를 클릭한다
- 스캔 PDF 파일을 드래그 앤 드롭하거나 파일 선택 버튼을 누른다
- '스캔 문서 최적화' 옵션을 찾아 활성화한다 (있는 경우)
- 해상도를 선택한다 (저: 150DPI / 중: 200DPI / 고: 300DPI)
- 색상 모드를 선택한다 (자동 감지 / 흑백 / 그레이스케일 / 컬러)
- 배경 제거 옵션을 활성화하면 배경 얼룩이 정리된다
- 압축 시작 버튼을 클릭하고 완료될 때까지 기다린다
- 압축된 파일을 다운로드한다
전체 과정이 2~5분 내에 완료되며, 복잡한 설정 없이도 효과적인 결과를 얻을 수 있다.
고급 설정 활용
PDFKit의 고급 옵션에서는 더 세밀한 조정이 가능하다. 이미지 품질을 1~100% 범위에서 직접 설정할 수 있고, 임계값(Threshold)을 조정해 흑백 변환 정도를 제어할 수 있다. 특히 희미한 텍스트를 포함한 문서는 임계값 조정으로 텍스트 명확도를 크게 개선할 수 있다.
해상도별 최적 압축 전략
스캔 PDF의 원본 해상도에 따라 압축 전략이 달라진다.
| 원본 해상도 | 원본 크기(A4) | 추천 대상 해상도 | 압축 후 크기 | 압축률 |
|---|---|---|---|---|
| 100DPI | 0.5MB | 96DPI (화면용) | 0.35MB | 30% |
| 200DPI | 2MB | 150DPI (웹용) | 1.1MB | 45% |
| 300DPI (컬러) | 8MB | 200DPI (문서) | 1.5MB | 81% |
| 400DPI | 14MB | 300DPI (인쇄) | 5MB | 64% |
| 600DPI | 20MB | 300DPI (인쇄) | 5.2MB | 74% |
표에서 보듯이 과도한 고해상도는 오버스펙인 경우가 많다. 600DPI로 스캔한 일반 문서를 300DPI로 재조정해도 가독성이 거의 손상되지 않으면서 75% 이상 파일을 줄일 수 있다.
색상 모드별 압축 설정
스캔 PDF의 색상 모드에 따라 최적 압축 방식이 달라진다.
흑백(1비트) 문서
일반 사무 문서, 계약서, 공문 등 텍스트 위주의 문서는 흑백으로 스캔한다. 이 경우 파일 크기는 상대적으로 작지만, 압축 시 텍스트 선명도가 가장 중요하다. PDFKit에서 '흑백 자동 감지' 옵션을 사용하면 배경 노이즈를 제거하면서 텍스트를 강조할 수 있다. 특히 오래되거나 복사 품질이 좋지 않은 문서에서 효과가 크다.
그레이스케일(8비트) 문서
흑백과 컬러의 중간 형태로, 음영이 있는 사진이나 도표를 포함한 문서에 적합하다. 흑백보다는 크기가 크지만 컬러보다는 훨씬 작다. 압축할 때 '중간' 품질 설정(50~70%)을 추천한다. 이 범위에서 음영 표현은 유지되면서 파일 크기는 크게 줄어든다.
컬러(24비트) 문서
사진, 그래프, 회사 로고가 들어간 문서는 컬러로 스캔된다. 파일 크기가 크므로 적극적인 압축이 필요하지만, 색감 손실에 주의해야 한다. PDFKit에서 색상 최적화 옵션을 활성화하면 불필요한 색상 정보를 제거하면서 시각적 품질을 유지한다. 특히 배경 제거 옵션은 컬러 스캔 문서에서 탁월한 효과를 보인다.
- 흑백 최적화 팁: 임계값을 조정해 희미한 텍스트를 선명하게 만들 수 있다. 너무 높으면 텍스트가 끊기므로 주의
- 그레이스케일 최적화 팁: 고스팅(ghosting) 제거 옵션으로 이면지 글자 영향을 최소화할 수 있다
- 컬러 최적화 팁: 배경 제거 후에도 컬러가 필요하면 '적응형 색상 감소' 옵션으로 팔레트를 최적화한다
실제 사례와 압축 결과 분석
실제 스캔 문서를 PDFKit으로 압축한 사례를 소개한다.
사례 1: 법률 사무소 계약서
30페이지 계약서를 300DPI 흑백으로 스캔. 원본 크기: 45MB. PDFKit '중간' 설정(자동으로 200DPI로 변환): 4.2MB. 압축률: 90.7%. 텍스트 명확도: 완벽. 법무 담당자 피드백: 인쇄해도 글씨가 선명함. 결론: 대만족.
사례 2: 의료 기관 진료 기록
환자 정보, 의사 필기, 검사 결과 사진 포함. 10페이지 컬러 스캔. 원본 크기: 25MB. PDFKit '높음' 설정(300DPI 유지): 8.5MB. 압축률: 66%. 의료 기록으로서 필요한 해상도 유지. 사진 품질: 의료 진단에 충분. 결론: 보안과 품질 모두 만족.
사례 3: 부동산 중개소 실내 사진
40페이지 부동산 카탈로그 (해상도 사진 포함). 원본 크기: 120MB. PDFKit '저' 설정(150DPI로 감소): 12MB. 압축률: 90%. 웹 공유용으로 충분. 인쇄용으로는 미흡. 결론: 웹 배포 목적으로 적합.
| 사례 | 원본 크기 | 압축 후 | 압축률 | 사용 만족도 |
|---|---|---|---|---|
| 계약서 (흑백) | 45MB | 4.2MB | 90.7% | ⭐⭐⭐⭐⭐ |
| 진료 기록 (컬러) | 25MB | 8.5MB | 66% | ⭐⭐⭐⭐ |
| 부동산 카탈로그 | 120MB | 12MB | 90% | ⭐⭐⭐⭐ |
자주 묻는 질문 FAQ
Q1. 스캔 PDF를 압축하면 OCR이 불가능해지나요?
A. 아닙니다. PDFKit은 이미지 기반 PDF이므로 압축 후에도 OCR(광학 문자 인식) 처리가 가능합니다. 다만 너무 낮은 해상도로 압축하면 OCR 정확도가 떨어질 수 있습니다.
Q2. 원본 스캔 해상도를 알 수 없으면 어떻게 하나요?
A. PDF 파일의 속성에서 '문서 정보'를 확인하면 해상도가 나와 있습니다. 또는 PDFKit에서 '자동 감지' 옵션을 선택하면 최적 해상도를 자동으로 판단합니다.
Q3. 흑백 스캔 문서도 컬러로 압축할 수 있나요?
A. 가능하지만 비효율적입니다. 흑백 문서를 컬러로 처리하면 파일이 8배 이상 커집니다. 반대로 컬러 문서를 흑백으로 변환해 압축할 수는 있지만, 색상 정보가 손실됩니다.
Q4. 배경이 매우 더러운 오래된 문서도 압축할 수 있나요?
A. 네. PDFKit의 배경 제거 옵션이 바로 이런 경우를 위한 것입니다. 배경 정규화 알고리즘으로 누렇거나 얼룩진 배경을 하얀색으로 정리합니다. 다만 극도로 손상된 문서는 여러 번 처리가 필요할 수 있습니다.
Q5. 수백 개의 스캔 PDF를 한 번에 압축할 수 있나요?
A. PDFKit은 현재 파일별 처리입니다. 하지만 처리 속도가 빨라서 여러 파일을 순차적으로 압축해도 효율적입니다. 또는 Windows 배치 처리나 Mac Automator를 이용해 자동화할 수 있습니다.
댓글
댓글 쓰기