UMLS Reference
UMLS 메타시소러스/시맨틱 네트워크 레퍼런스
UMLS Reference 소개
UMLS Reference는 미국 국립의학도서관(NLM)이 관리하는 Unified Medical Language System을 위한 검색 가능한 치트 시트입니다. UMLS의 3가지 지식 소스를 모두 다룹니다: 메타시소러스(ICD-10, SNOMED CT, MeSH, RxNorm, CPT, LOINC 등 200+ 소스 용어체계를 440만+ 통합 개념으로 통합), 시맨틱 네트워크(Entity와 Event 하위에 계층적으로 조직된 127개 의미 유형), SPECIALIST Lexicon(바이오메디컬 NLP를 위한 형태소 분석).
메타시소러스의 완전한 식별자 계층을 문서화합니다 — CUI(개념 고유 식별자, C + 7자리), LUI(철자 변형을 그룹화하는 어휘 식별자), SUI(대소문자 구분 문자열 식별자), AUI(각 소스별 출현의 원자 식별자). 관계 유형(REL: PAR, CHD, RB, RN, SIB, SY, RO), 관계 속성(RELA: isa, finding_site_of, has_ingredient, may_treat), 용어 유형(TTY: PT 선호 용어, SY 동의어, FN 전체 명칭), 소스 약어(SAB: SNOMEDCT_US, ICD10CM, MSH, RXNORM, LNC)를 설명합니다.
실무 섹션은 RRF(Rich Release Format) 파일 구조를 다룹니다 — 개념/명칭 데이터의 MRCONSO.RRF, 관계의 MRREL.RRF, 의미 유형 할당의 MRSTY.RRF, 정의의 MRDEF.RRF, 소스 제공 매핑의 MRMAP.RRF. API 섹션은 uts-ws.nlm.nih.gov/rest의 UMLS REST API를 통한 CUI 조회, 설정 가능한 매개변수(exact/words/approximate)로 텍스트 검색, Python 예제를 포함한 프로그래밍 접근을 문서화합니다. CUI를 통한 교차 용어체계 매핑(ICD-10-CM에서 SNOMED CT)과 QuickUMLS 개념 추출 라이브러리도 다룹니다. 모든 콘텐츠는 브라우저에서만 실행됩니다.
주요 기능
- 완전한 메타시소러스 식별자 계층: CUI, LUI, SUI, AUI 형식 예제 포함
- SNOMED CT, ICD-10, MeSH, RxNorm, LOINC, CPT 등의 소스 용어체계 약어(SAB)
- 부모/자식, 상위/하위, 임상 관계를 포함한 관계 유형(REL)과 속성(RELA)
- 시맨틱 네트워크 레퍼런스: 127개 의미 유형(TUI), 의미 그룹, 허용 관계
- RRF 파일 구조: MRCONSO, MRREL, MRSTY, MRDEF, MRMAP 컬럼 정의 및 사용법
- UMLS REST API 문서: CUI 조회, 텍스트 검색, 필드 선택, Python 코드 예제
- ICD-10에서 SNOMED CT 등 시스템 간 CUI 기반 교차 용어체계 매핑(크로스워크) 워크플로
- MetamorphoSys 구성 및 빠른 개념 추출을 위한 QuickUMLS Python 라이브러리
자주 묻는 질문
CUI란 무엇이고 UMLS 식별자 계층은 어떻게 작동하나요?
CUI(Concept Unique Identifier)는 C0011849(Diabetes Mellitus)와 같은 UMLS 메타시소러스의 중심 식별자로 단일 바이오메디컬 개념을 나타냅니다. 각 CUI는 여러 LUI(대소문자/굴절 변형 그룹화), 각 LUI는 여러 SUI(정확한 대소문자 구분 문자열), 각 SUI는 여러 AUI(특정 소스 용어체계의 각 출현)를 포함합니다. CUI > LUI > SUI > AUI가 개념에서 개별 소스 용어까지의 계층을 형성합니다.
UMLS 메타시소러스와 다른 의학 용어체계의 차이는?
UMLS 메타시소러스는 단독 용어체계가 아니라 200+ 소스 용어체계(ICD-10, SNOMED CT, MeSH, RxNorm, CPT, LOINC 등)를 CUI라는 공통 개념 식별자로 통합하는 메타 시스템입니다. 개별 용어체계가 각자의 분류 체계를 가진 반면, UMLS는 이들을 연결하여 서로 다른 시스템 간 용어를 매핑하고 번역하는 것을 가능하게 합니다. 임상 NLP, 용어 매핑, 의료 정보학에 핵심적입니다.
UMLS를 사용하여 ICD-10과 SNOMED CT를 매핑하는 방법은?
CUI 기반 크로스워킹을 사용합니다: 먼저 MRCONSO.RRF에서 SAB=ICD10CM으로 ICD-10-CM 코드의 CUI를 찾습니다. 그런 다음 같은 CUI이지만 SAB=SNOMEDCT_US인 원자를 찾습니다. 이렇게 하면 같은 개념을 공유하는 SNOMED CT 코드를 얻습니다. 매핑이 1:1이 아닐 수 있음에 주의하세요 — 하나의 ICD-10 코드가 여러 SNOMED 개념에 매핑되거나 그 반대일 수 있습니다. 공식 매핑은 소스 제공 크로스워크가 포함된 MRMAP.RRF를 확인하세요.
시맨틱 타입과 시맨틱 그룹은 무엇인가요?
메타시소러스의 모든 CUI에는 하나 이상의 시맨틱 타입이 할당됩니다(TUI로 식별, 예: T047=질병 또는 증후군, T121=약리학적 물질, T023=신체 부위/기관). 127개 의미 유형은 Entity와 Event 두 루트 타입 하위에 계층적으로 조직됩니다. 시맨틱 그룹은 더 높은 수준의 클러스터입니다: DISO(질환), CHEM(화학물질 및 약물), ANAT(해부학), PROC(절차), GENE(유전자 및 분자 서열) 등. 이 분류 체계로 대규모 개념 집합을 필터링하고 분류할 수 있습니다.
UMLS REST API는 어떻게 사용하나요?
REST API 기본 URL은 https://uts-ws.nlm.nih.gov/rest이며 무료 UTS 계정의 API 키가 필요합니다. 주요 엔드포인트: GET /content/current/CUI/{CUI}로 개념 조회, GET /search/current?string={term}으로 텍스트 검색(소스 필터, 검색 유형, 페이징 매개변수 포함), GET /content/current/CUI/{CUI}/relations로 관계 조회, GET /content/current/CUI/{CUI}/atoms?sabs=SNOMEDCT_US&ttys=PT로 필터링된 원자 검색. 응답은 JSON 형식입니다.
MRREL.RRF에서 REL과 RELA의 차이는?
REL은 UMLS가 정의한 일반 관계 유형입니다(PAR=부모, CHD=자식, RB=상위, RN=하위, SIB=형제, SY=동의어, RO=기타 관련). RELA는 소스 용어체계가 정의한 더 구체적인 관계 속성입니다(예: isa, finding_site_of, causative_agent_of, has_ingredient, may_treat). REL은 관계의 넓은 범주를 알려주고, RELA는 원본 소스의 정확한 임상적 또는 온톨로지적 의미를 제공합니다.
MetamorphoSys란 무엇이고 언제 필요한가요?
MetamorphoSys는 UMLS 설치 및 커스터마이징 도구입니다(Java 필요). 전체 UMLS 릴리스를 다운로드하여 로컬 서브셋을 만들 때 필요합니다 — 포함/제외할 소스 용어체계를 선택하고, 출력 형식(RRF)을 지정하며, 무료 소스만 포함하는 Level 0 Subset을 생성할 수 있습니다. 가끔 조회만 필요하면 REST API가 더 간단합니다. MetamorphoSys는 대량 처리 NLP 파이프라인이나 오프라인 임상 시스템용 로컬 데이터베이스를 구축할 때 필요합니다.
QuickUMLS는 개념 추출에 어떻게 작동하나요?
QuickUMLS는 임상 텍스트에서 UMLS 개념에 대해 빠른 근사 문자열 매칭을 수행하는 Python 라이브러리입니다. 로컬 UMLS 설치 경로로 초기화한 후 matcher.match(text)를 호출하여 "Patient has diabetes and hypertension" 같은 자유 텍스트에서 UMLS 개념을 찾습니다. 매칭된 CUI, 선호 용어, 유사도 점수, 의미 유형을 반환합니다. simstring을 사용한 근사 매칭으로 정확한 문자열 조회보다 훨씬 빠르게 임상 NLP 작업을 수행합니다.