XLIFF Reference
XLIFF/TMX/TBX 번역 표준 포맷 레퍼런스
XLIFF Reference 소개
XLIFF 레퍼런스는 주요 XML 기반 번역 교환 형식인 XLIFF, TMX, TBX 및 관련 표준을 다루는 검색 가능한 빠른 참조입니다. XLIFF(xliff 루트 요소, source/target 언어 속성을 가진 file 컨테이너, 승인 상태를 포함한 trans-unit 세그먼트, 번역 상태 추적이 포함된 source/target 요소, 번역 단위 정리를 위한 group 요소, 번역자/개발자 코멘트를 위한 note 요소, g/x/bx/ex/ph 인라인 서식 태그, TM 매치를 위한 alt-trans, segment/unit 모델을 도입한 XLIFF 2.0 차이점, 추출-번역-병합 라운드트립 워크플로우), TMX(tmx/header/body 구조, tuid와 changedate를 가진 tu 번역 단위, 생성 메타데이터를 포함한 tuv 언어별 변형, 도메인/클라이언트 태깅을 위한 prop 사용자 정의 속성), TBX(ISO 30042 표준 구조, conceptEntry 용어 항목, 다국어 용어를 위한 langSec/termSec, 품사 및 관리 상태를 위한 termNote 메타데이터), 기타 표준(SRX 세그멘테이션 규칙, ITS 국제화 태그셋, XLIFF 편집/검증 도구, 파일 형식 변환을 위한 Okapi Framework, UTF-8 준수를 위한 인코딩 고려사항)의 4개 카테고리로 구성되어 있습니다.
이 형식들은 번역 및 현지화 산업의 근간입니다. XLIFF는 콘텐츠 관리 시스템과 SDL Trados, memoQ, OmegaT 같은 CAT(Computer-Assisted Translation) 도구 사이의 교환 형식으로, 번역자가 원본 문서 서식을 보존하면서 소스 텍스트를 작업할 수 있게 합니다. TMX는 서로 다른 CAT 도구 간의 번역 메모리 교환을 가능하게 하여 이전에 번역된 세그먼트를 프로젝트와 업체 간에 재사용할 수 있습니다. TBX는 조직 전체에서 일관된 용어 사용을 보장하기 위해 용어집 데이터베이스를 표준화합니다. 이 형식들을 이해하는 것은 현지화 엔지니어, 번역 프로젝트 관리자, 국제화된 애플리케이션을 구축하는 개발자에게 필수적입니다.
이 레퍼런스는 모든 요소에 대해 실제 마크업 구조를 보여주는 실용적인 XML 예제를 포함합니다. XLIFF 섹션은 trans-unit ID가 개별 세그먼트를 추적하는 방법, state 속성(new, needs-translation, translated, needs-review-translation, final, signed-off)이 번역 워크플로우를 관리하는 방법, 인라인 요소가 원본 문서의 서식 태그를 보존하는 방법을 보여줍니다. TMX 섹션은 번역 단위가 메타데이터와 함께 이중 언어 세그먼트 쌍을 저장하는 방법을, TBX 섹션은 개념 지향 용어 항목을 설명합니다. Okapi Framework 부분에서는 50개 이상의 파일 형식에 대한 파일-XLIFF 라운드트립 프로세스를 설명합니다. 모든 콘텐츠는 즉시 검색과 다크 모드 지원으로 탐색 가능합니다.
주요 기능
- XLIFF 형식 레퍼런스: xliff 루트 요소, file 컨테이너, trans-unit 세그먼트, 상태 추적이 포함된 source/target, group/note 요소, 인라인 태그(g/x/bx/ex/ph)
- XLIFF 워크플로우 기능: TM 매치 저장을 위한 alt-trans, XLIFF 2.0 segment/unit 모델 차이점, 완전한 라운드트립(추출-번역-병합) 프로세스
- TMX 형식 레퍼런스: tmx/header/body 구조, tuid/changedate를 가진 tu 번역 단위, tuv 언어별 변형, prop 사용자 정의 메타데이터 속성
- TBX 형식 레퍼런스: ISO 30042 구조, conceptEntry/langSec/termSec 계층, 품사 및 관리 상태(preferred/admitted/deprecated)를 위한 termNote
- 관련 표준: 문장 분리를 위한 SRX 세그멘테이션 규칙, translate/locNote/term 마크업을 위한 ITS 국제화 태그셋
- 도구 수록: XLIFF로의 파일 형식 변환을 위한 Okapi Framework(Rainbow GUI, Tikal CLI)와 XLIFF 편집기 및 검증기
- 인코딩 가이드: TMX/XLIFF/TBX의 UTF-8 요구사항, BOM 처리, XML 엔티티 이스케이프, 특수 문자를 위한 CDATA 사용
- 서버 처리 없이 모든 번역 형식 요소를 카테고리 필터링과 즉시 검색
자주 묻는 질문
이 레퍼런스에서 어떤 번역 형식을 다루나요?
CMS와 CAT 도구 간 번역 데이터 교환을 위한 XLIFF(XML Localization Interchange File Format), 도구 간 번역 메모리 공유를 위한 TMX(Translation Memory eXchange), 용어집 데이터베이스 교환을 위한 TBX(TermBase eXchange, ISO 30042), 그리고 세그멘테이션 규칙을 위한 SRX, 국제화 메타데이터를 위한 ITS, 파일 형식 변환을 위한 Okapi Framework 등 관련 표준을 포함하여 4개 영역을 다룹니다. 각 형식은 XML 구조, 요소, 속성, 실용적인 마크업 예제와 함께 문서화되어 있습니다.
XLIFF 1.2와 XLIFF 2.0의 차이점은 무엇인가요?
XLIFF 2.0은 1.2와 호환되지 않는 중요한 구조적 변경을 도입했습니다. trans-unit 요소가 unit/segment 계층으로 대체되었고, 인라인 요소가 간소화되었으며, 스키마가 더 엄격해졌고, 기능들이 선택적 모듈(translation candidates 등)로 이동했습니다. 2.0의 file/group/unit/segment 계층은 번역 세그먼트에 대해 더 세분화된 제어를 제공합니다. 그러나 실제로는 XLIFF 1.2가 CAT 도구에서 더 널리 지원되므로, 버전 간 변환이 필요한 경우가 있습니다.
trans-unit 상태(state)는 번역 진행을 어떻게 추적하나요?
target 요소의 state 속성이 세그먼트가 번역 워크플로우에서 어디에 있는지 추적합니다. 값은 new(미번역), needs-translation(번역 표시), translated(초기 번역 완료), needs-review-translation(검토 전송), final(승인), signed-off(공식 수락) 순서로 진행됩니다. trans-unit에는 이진 승인 추적을 위한 approved 속성도 있습니다. 이 상태들은 번역 관리 시스템에서 워크플로우 자동화를 가능하게 하여, 세그먼트를 현재 상태에 따라 번역자, 검토자, 승인자에게 라우팅합니다.
TMX는 XLIFF와 어떻게 다른가요?
XLIFF는 활성 번역 프로젝트를 위해 설계되었습니다 — 번역해야 할 소스 텍스트와 워크플로우 상태, 주석, 인라인 서식을 포함합니다. TMX는 번역 메모리 저장을 위해 설계되었습니다 — 향후 프로젝트에서 재사용할 이미 완료된 번역 쌍(소스 + 타겟 세그먼트)을 포함합니다. 새 XLIFF 파일이 CAT 도구에 전송되면, 도구는 TMX 번역 메모리에서 이전에 번역된 유사 세그먼트를 검색합니다. TMX 파일은 영구 자산으로 시간이 지남에 따라 누적되고, XLIFF 파일은 프로젝트별 산출물입니다.
XLIFF의 인라인 요소란 무엇이고 왜 중요한가요?
인라인 요소는 번역 중 보존해야 하는 원본 문서의 서식을 나타냅니다. g 요소는 쌍태그(볼드, 하이퍼링크 등)를 감싸고, x는 독립 태그(줄바꿈 등), bx/ex는 태그 쌍의 시작/종료를 표시하며, ph는 번역 불가능한 콘텐츠의 플레이스홀더입니다. 번역자는 번역에서 이 요소들을 유지해야 하며, 대상 언어 문법에 맞게 순서를 변경할 수 있지만 삭제하거나 수정할 수 없습니다. 깨진 인라인 요소는 병합된 출력 문서를 손상시킵니다.
TBX란 무엇이고 용어를 어떻게 구조화하나요?
TBX(TermBase eXchange, ISO 30042)는 용어집 데이터베이스를 위한 개념 지향 형식입니다. 각 conceptEntry는 하나의 개념을 포함하고 각 언어에 대한 langSec 요소를 갖습니다. 각 langSec 안에 termSec 요소가 개별 용어와 termNote 메타데이터를 보유합니다: termType(fullForm, abbreviation, acronym), partOfSpeech(noun, verb, adjective), administrativeStatus(preferredTerm, admittedTerm, deprecatedTerm). 이 구조는 번역 전반에 걸친 일관된 용어 사용을 보장합니다.
Okapi Framework란 무엇이고 XLIFF와 어떤 관계가 있나요?
Okapi Framework는 50개 이상의 파일 형식(HTML, XML, DOCX, JSON, PO 등)을 번역을 위해 XLIFF로 변환하고, 번역된 XLIFF를 원본 형식으로 다시 병합하는 오픈소스(LGPL) 현지화 파이프라인입니다. Rainbow는 GUI 도구이고 Tikal은 CLI 도구입니다. 추출 단계에서 원본 문서 구조를 보존하면서 번역 가능한 텍스트를 XLIFF trans-unit으로 노출합니다. CAT 도구에서 번역 후, 병합 단계에서 원본 레이아웃과 서식을 유지하면서 번역된 콘텐츠로 문서를 재조립합니다.
이 레퍼런스 사용 시 데이터가 서버로 전송되나요?
아닙니다. 전체 번역 형식 레퍼런스는 페이지에 내장되어 클라이언트 사이드로 렌더링됩니다. XLIFF, TMX, TBX, 기타 표준 카테고리별 필터링, 검색, 항목 탐색 모두 JavaScript로 브라우저 내에서만 이루어집니다. XLIFF 마크업, 번역 데이터, 검색 쿼리가 어떤 서버로도 전송되지 않습니다.