ELAN Reference

ELAN 시간정렬 멀티티어 전사/어노테이션 레퍼런스

27개 결과

ELAN Reference 소개

이 ELAN 어노테이션 레퍼런스는 막스 플랑크 심리언어학 연구소에서 개발한 멀티미디어 어노테이션 도구인 ELAN(EUDICO Linguistic Annotator)의 검색 가능한 참조 가이드입니다. 기본 인터페이스, 티어 구조와 언어학적 유형, 어노테이션 워크플로우, 가져오기/내보내기 형식, 키보드 단축키, 분석 기능, 파일 형식 사양 등 7개 카테고리를 다루며, 시간 정렬 언어 어노테이션에 필요한 기능을 빠르게 찾을 수 있습니다.

티어 구조 섹션에서는 ELAN의 4가지 스테레오타입을 설명합니다. 상위 종속 없이 독립적으로 동작하는 Independent 티어, 상위 티어의 구간을 시간 기반 하위 세그먼트로 분할하는 Time Subdivision, 상위 내용을 균등 시간으로 배분된 기호 단위로 나누는 Symbolic Subdivision(음소 분절에 유용), 글로스나 품사 태그 같은 1:1 매핑을 위한 Symbolic Association이 포함됩니다. 어노테이션 섹션에서는 재생 중 실시간 경계 생성을 위한 Segmentation Mode, Tab/Shift+Tab 내비게이션의 Transcription Mode, 정규식 검색, 자동 단어 단위 분할을 위한 Tokenize Tier를 다룹니다.

데이터 교환을 위해 Praat TextGrid 파일, CSV/탭 구분 텍스트(열 매핑 포함), SRT 자막 파일의 가져오기 기능과 통계 분석용 탭 구분 텍스트, 언어학 출판용 인터리니어 글로스 형식의 내보내기 옵션을 상세히 안내합니다. 분석 기능으로는 Cohen's Kappa를 이용한 어노테이터 간 일치도 계산, 어노테이션 통계(빈도, 지속시간), 다중 파일 일괄 처리가 포함됩니다. EAF XML 형식 사양과 템플릿 시스템(.etf)도 고급 워크플로우 커스터마이징을 위해 문서화되어 있습니다.

주요 기능

Independent, Time Subdivision, Symbolic Subdivision, Symbolic Association 등 티어 구조 가이드
계층적 어노테이션 레이어를 위한 스테레오타입 제약 조건이 포함된 Linguistic Type 정의
특정 티어에 닫힌 세트 태깅을 위한 Controlled Vocabulary(CV) 설정 안내
어노테이션 모드 참조: Segmentation Mode(Enter 키 경계), Transcription Mode(Tab 내비게이션)
Praat TextGrid, CSV/탭 구분 텍스트, SRT 자막 파일 가져오기 가이드
탭 구분 텍스트, 인터리니어 글로스, EAF 템플릿(.etf) 등 내보내기 형식
필수 단축키: Alt+휠(확대/축소), Ctrl+Shift+A(새 어노테이션), Shift+Space(선택 구간 재생)
어노테이터 간 일치도(Cohen's Kappa), 어노테이션 통계, 일괄 처리 등 분석 도구

자주 묻는 질문

ELAN의 4가지 티어 스테레오타입은 무엇인가요?

ELAN은 티어 관계를 위해 4가지 스테레오타입을 사용합니다. (1) None/Independent: 자체 시간 정렬을 가진 독립 티어, (2) Time Subdivision: 상위 티어의 시간 구간을 더 작은 시간 정렬 하위 세그먼트로 분할, (3) Symbolic Subdivision: 상위 내용을 자동 균등 시간 배분의 기호 단위로 분할(예: 음소 분절), (4) Symbolic Association: 하위가 상위의 시간 범위를 상속하는 1:1 매핑(예: 번역, 품사 태그).

Praat TextGrid 파일을 ELAN에 어떻게 가져오나요?

File > Import > Praat TextGrid File에서 .TextGrid 파일을 선택합니다. ELAN이 Praat의 interval tier를 시간 정렬이 일치하는 ELAN 티어로 자동 변환합니다. Point tier도 변환됩니다. Praat에서 시작한 전사 작업을 ELAN에서 데이터 손실 없이 다중 레이어 어노테이션으로 이어갈 수 있습니다.

Segmentation Mode와 Transcription Mode의 차이는 무엇인가요?

Segmentation Mode는 미디어 재생 중 Enter 키를 눌러 실시간으로 시간 경계를 생성하는 모드로, 초기 발화 수준 분절에 효율적입니다. Transcription Mode는 경계 설정 후 텍스트 입력을 위한 모드로, Tab으로 다음 어노테이션, Shift+Tab으로 이전 어노테이션으로 이동하며 Enter로 값을 확정합니다. 경계 생성에는 Segmentation, 텍스트 입력에는 Transcription을 사용하세요.

ELAN에서 어노테이터 간 일치도를 어떻게 계산하나요?

File > Compare Annotators에서 같은 미디어에 대해 서로 다른 어노테이터가 작성한 2개의 EAF 파일을 선택합니다. ELAN이 Cohen's Kappa 계수와 백분율 일치율을 포함한 일치도 지표를 계산합니다. Kappa 값 0.80 이상은 높은 일치도, 0.60~0.80은 보통 수준의 일치도를 나타냅니다.

Controlled Vocabulary(CV)란 무엇이고 어떻게 사용하나요?

Controlled Vocabulary는 티어에 입력할 수 있는 값을 제한하는 미리 정의된 닫힌 레이블 집합입니다. Edit > Edit Controlled Vocabularies에서 CV를 만들고 항목(예: 품사 태그 N, V, ADJ, ADV)을 정의한 다음 티어에 연결합니다. 어노테이션 시 자유 텍스트 대신 CV 드롭다운에서 선택하므로, 어노테이터와 세션 간 일관성이 보장됩니다.

ELAN 어노테이션을 통계 분석용으로 어떻게 내보내나요?

File > Export As > Tab-delimited Text를 사용합니다. Begin Time, End Time, Tier 이름, Annotation Value 열이 포함된 출력을 R, Python, Excel, SPSS에 직접 가져올 수 있습니다. 여러 파일을 처리하려면 File > Multiple File Processing으로 폴더 내 모든 .eaf 파일을 하나의 CSV로 일괄 내보낼 수 있습니다.

EAF 파일 형식은 무엇인가요?

EAF(ELAN Annotation Format)는 모든 어노테이션 데이터를 저장하는 XML 기반 파일 형식입니다. TIER 요소 안에 ANNOTATION이 있고, 각 ALIGNABLE_ANNOTATION이 TIME_SLOT 항목을 참조하여 정밀한 시간 정렬을 구현합니다. 티어 구조를 .etf 템플릿으로 저장(File > Save as Template)하여 프로젝트 간 일관된 어노테이션 스키마를 재사용할 수 있습니다.

이 ELAN 레퍼런스는 모바일에서도 사용 가능한가요?

네, 이 레퍼런스는 완전 반응형으로 데스크톱, 태블릿, 모바일 브라우저에서 모두 사용할 수 있습니다. 7개 카테고리의 28개 항목을 별도 설치 없이 브라우저에서 검색하고 필터링할 수 있습니다. 다크 모드를 지원하며 어노테이션 명령어, 단축키, 형식 사양 전반에 걸친 즉시 키워드 검색이 가능합니다.