Question 1

OCR이란 무엇이고 어떻게 작동하나요?

Accepted Answer

OCR(광학 문자 인식)은 이미지의 픽셀 패턴을 분석하여 문자를 식별하고 기계가 읽을 수 있는 텍스트로 변환하는 기술입니다. 이 도구는 Tesseract 4 엔진의 WebAssembly 포트인 Tesseract.js를 사용하며, 대규모 다국어 데이터셋으로 학습된 LSTM 신경망을 통해 이미지 데이터에서 문자를 인식합니다.

Question 2

어떤 언어를 지원하나요?

Accepted Answer

영어, 한국어, 일본어, 중국어 간체, 중국어 번체, 그리고 두 언어가 혼재된 문서를 위한 영어+한국어 혼합 모드를 지원합니다. 인식 시작 전에 언어를 선택하면 해당 언어 모델이 로드됩니다. 올바른 언어를 선택하면 인식 정확도가 크게 향상됩니다.

Question 3

어떤 이미지 형식과 크기를 지원하나요?

Accepted Answer

브라우저가 표시할 수 있는 모든 이미지 형식(PNG, JPG/JPEG, BMP, WebP, GIF)을 지원하며 최대 파일 크기는 20MB입니다. 최상의 결과를 위해서는 고해상도(인쇄 텍스트는 최소 300 DPI), 텍스트와 배경 간 높은 대비의 이미지를 사용하세요.

Question 4

처음 사용 시 인식이 오래 걸리는 이유는 무엇인가요?

Accepted Answer

처음 인식 시 Tesseract.js가 Tesseract 코어(WebAssembly 바이너리)와 선택한 언어의 학습 데이터 파일을 다운로드해야 합니다. 초기 다운로드 후에는 브라우저가 캐시하므로 같은 언어의 후속 사용은 훨씬 빨라집니다. 진행률 표시줄에서 각 로딩 단계를 확인할 수 있습니다.

Question 5

이미지가 서버에 업로드되나요?

Accepted Answer

아니요. 모든 OCR 처리는 WebAssembly로 컴파일된 Tesseract.js를 사용하여 브라우저 내에서만 이루어집니다. 이미지는 FileReader API를 통해 로컬에서 읽혀 메모리에서 처리됩니다. 이미지 데이터, 인식된 텍스트, 메타데이터 등 어떤 것도 서버로 전송되지 않습니다.

Question 6

OCR 후 인식된 텍스트를 수정할 수 있나요?

Accepted Answer

네. 인식된 텍스트는 편집 가능한 텍스트 영역에 표시되어 복사나 다운로드 전에 오류를 수정할 수 있습니다. Tesseract는 특정 폰트, 손글씨, 낮은 대비 텍스트를 잘못 읽을 수 있으며, 편집 가능한 출력이 그런 오류를 바로 수정할 수 있게 해줍니다.

Question 7

OCR 정확도에 영향을 미치는 요소는 무엇인가요?

Accepted Answer

이미지 품질이 가장 중요합니다. 높은 해상도(300+ DPI), 깨끗한 배경, 수평 텍스트 방향, 표준 폰트, 강한 대비가 모두 정확도를 높입니다. 기울어지거나 회전되거나 저해상도이거나 강하게 양식화된 텍스트는 정확도를 낮춥니다. 손글씨는 필체에 따라 정확도가 크게 달라집니다.

Question 8

인식된 텍스트를 어떻게 다운로드하나요?

Accepted Answer

인식이 완료된 후 텍스트 다운로드 버튼을 클릭하세요. 도구가 원본 이미지 파일명으로 자동 생성된 .txt 파일을 만들어 브라우저의 기본 다운로드 기능을 통해 저장합니다. 예를 들어 "scan.png" 이미지는 "ocr_scan.txt"로 저장됩니다. 서버 통신은 없습니다.

OCR Tool

OCR Tool 소개

주요 기능

자주 묻는 질문