liminfo

OCR Tool

이미지에서 텍스트 추출 (OCR)

이미지 파일을 여기에 드래그하거나

파일 선택

PNG, JPG, BMP, WebP 등 (최대 20MB)

OCR Tool 소개

OCR 도구는 Tesseract.js 기반의 무료 브라우저 광학 문자 인식 도구입니다. Tesseract는 원래 HP가 개발하고 현재 Google이 관리하는 업계 표준 오픈소스 OCR 엔진으로, 이 도구는 그 WebAssembly 버전을 사용합니다. 이미지 속 인쇄된 텍스트를 인식하여 편집 가능한 일반 텍스트로 변환하는 모든 과정이 브라우저 내에서만 이루어지며, 파일은 절대 서버로 전송되지 않습니다.

웹 개발자, 연구자, 학생, 행정 업무 담당자, 접근성 전문가 등 다양한 사용자가 스캔 문서 디지털화, 스크린샷 텍스트 추출, 화이트보드 사진 처리, 인쇄된 양식 데이터화에 이 도구를 활용합니다. PNG, JPG, BMP, WebP 파일을 최대 20MB까지 지원합니다.

내부적으로 Tesseract.js 라이브러리를 필요 시 동적으로 임포트하고, 선택한 언어의 학습된 신경망 데이터를 로드한 후 전체 인식 파이프라인을 브라우저에서 실행합니다. 진행률 표시줄이 코어 로딩, 언어 데이터 로딩, API 초기화, 텍스트 인식 각 단계를 실시간으로 보여줍니다.

주요 기능

  • 다중 언어 OCR: 영어, 한국어, 일본어, 중국어(간체), 중국어(번체), 영어+한국어 혼합 모드
  • PNG, JPG, BMP, WebP 이미지 형식 최대 20MB 지원
  • Tesseract.js 초기화 단계별 진행률과 인식 퍼센트를 보여주는 실시간 진행 표시줄
  • 인식된 텍스트를 복사 또는 다운로드 전에 직접 수정할 수 있는 편집 가능한 결과 영역
  • 원본 이미지 파일명으로 자동 생성되는 .txt 파일 다운로드 및 클립보드 복사 기능
  • 올바른 파일 선택 여부를 확인할 수 있는 인식 전 이미지 미리보기
  • 100% 클라이언트 사이드 Tesseract.js 처리 — 이미지 데이터가 서버로 전송되지 않음
  • 다크 모드 지원 및 모바일 친화적 드래그 앤 드롭 파일 업로드 영역

자주 묻는 질문

OCR이란 무엇이고 어떻게 작동하나요?

OCR(광학 문자 인식)은 이미지의 픽셀 패턴을 분석하여 문자를 식별하고 기계가 읽을 수 있는 텍스트로 변환하는 기술입니다. 이 도구는 Tesseract 4 엔진의 WebAssembly 포트인 Tesseract.js를 사용하며, 대규모 다국어 데이터셋으로 학습된 LSTM 신경망을 통해 이미지 데이터에서 문자를 인식합니다.

어떤 언어를 지원하나요?

영어, 한국어, 일본어, 중국어 간체, 중국어 번체, 그리고 두 언어가 혼재된 문서를 위한 영어+한국어 혼합 모드를 지원합니다. 인식 시작 전에 언어를 선택하면 해당 언어 모델이 로드됩니다. 올바른 언어를 선택하면 인식 정확도가 크게 향상됩니다.

어떤 이미지 형식과 크기를 지원하나요?

브라우저가 표시할 수 있는 모든 이미지 형식(PNG, JPG/JPEG, BMP, WebP, GIF)을 지원하며 최대 파일 크기는 20MB입니다. 최상의 결과를 위해서는 고해상도(인쇄 텍스트는 최소 300 DPI), 텍스트와 배경 간 높은 대비의 이미지를 사용하세요.

처음 사용 시 인식이 오래 걸리는 이유는 무엇인가요?

처음 인식 시 Tesseract.js가 Tesseract 코어(WebAssembly 바이너리)와 선택한 언어의 학습 데이터 파일을 다운로드해야 합니다. 초기 다운로드 후에는 브라우저가 캐시하므로 같은 언어의 후속 사용은 훨씬 빨라집니다. 진행률 표시줄에서 각 로딩 단계를 확인할 수 있습니다.

이미지가 서버에 업로드되나요?

아니요. 모든 OCR 처리는 WebAssembly로 컴파일된 Tesseract.js를 사용하여 브라우저 내에서만 이루어집니다. 이미지는 FileReader API를 통해 로컬에서 읽혀 메모리에서 처리됩니다. 이미지 데이터, 인식된 텍스트, 메타데이터 등 어떤 것도 서버로 전송되지 않습니다.

OCR 후 인식된 텍스트를 수정할 수 있나요?

네. 인식된 텍스트는 편집 가능한 텍스트 영역에 표시되어 복사나 다운로드 전에 오류를 수정할 수 있습니다. Tesseract는 특정 폰트, 손글씨, 낮은 대비 텍스트를 잘못 읽을 수 있으며, 편집 가능한 출력이 그런 오류를 바로 수정할 수 있게 해줍니다.

OCR 정확도에 영향을 미치는 요소는 무엇인가요?

이미지 품질이 가장 중요합니다. 높은 해상도(300+ DPI), 깨끗한 배경, 수평 텍스트 방향, 표준 폰트, 강한 대비가 모두 정확도를 높입니다. 기울어지거나 회전되거나 저해상도이거나 강하게 양식화된 텍스트는 정확도를 낮춥니다. 손글씨는 필체에 따라 정확도가 크게 달라집니다.

인식된 텍스트를 어떻게 다운로드하나요?

인식이 완료된 후 텍스트 다운로드 버튼을 클릭하세요. 도구가 원본 이미지 파일명으로 자동 생성된 .txt 파일을 만들어 브라우저의 기본 다운로드 기능을 통해 저장합니다. 예를 들어 "scan.png" 이미지는 "ocr_scan.txt"로 저장됩니다. 서버 통신은 없습니다.