PDB Reference
단백질 구조 데이터뱅크 검색/시각화 레퍼런스
PDB Reference 소개
PDB 레퍼런스는 실험적으로 결정된 생체 거대분자 3D 구조의 국제 저장소인 단백질 데이터 뱅크(PDB)에 대한 검색 가능한 참고 자료입니다. PDB의 4자리 영숫자 식별 체계, ATOM과 HETATM 레코드의 필드 구조(일련번호, 원자명, 잔기, 체인, 좌표, 점유율, B-인자), 차세대 mmCIF/PDBx 형식, 원자 수준(1 옹스트롬 미만)부터 저해상도(4 옹스트롬 이상)까지의 해상도 해석 기준, B-인자의 의미와 범위, 실험 방법(X선 결정학, NMR, 극저온 전자현미경), 비대칭 단위와 생물학적 조립체 개념을 다룹니다.
RCSB PDB에서의 구조 검색과 다운로드를 종합적으로 안내합니다. 텍스트, 서열(BLAST), 구조 유사성, 서열 모티프 검색, 프로그래밍 접근을 위한 REST API 엔드포인트, rsync를 통한 일괄 다운로드, SIFTS 매핑을 이용한 UniProt 교차 참조를 포함합니다. 시각화 도구 항목에서는 PyMOL(fetch, select, show, color, 거리 측정, ray tracing), UCSF ChimeraX(스타일, B-인자별 색상, 표면, matchmaker 정렬), VMD(mol load, modstyle, TCL 스크립팅)의 핵심 명령어를 다룹니다.
구조 분석과 검증에서는 이차 구조 요소(회전당 3.6 잔기의 알파 헬릭스와 i에서 i+4 수소결합, 베타 시트, 310 나선, 턴)와 DSSP 할당 코드, 라마찬드란 도표의 phi/psi 각도 분석과 허용 영역(알파 헬릭스 phi=-60/psi=-45, 베타 시트 phi=-135/psi=135), R-인자와 R-free 검증 지표, 잔기 거리 시각화를 위한 접촉 지도, 구조 비교를 위한 RMSD 계산과 해석, AlphaFold DB의 pLDDT 신뢰도 점수, Swiss-Model 상동 모델링, AutoDock Vina 분자 도킹과 결합 에너지 평가 등 구조 예측 자원까지 폭넓게 다룹니다.
주요 기능
- PDB 파일 형식의 ATOM/HETATM 레코드 필드 구조: 일련번호, 원자명, 잔기, 체인 ID, 좌표, 점유율, B-인자
- 초고해상도(<1 A)부터 초저해상도(>4 A)까지의 해상도 해석 기준과 질서/유연 영역별 B-인자 범위
- RCSB PDB 검색 방법(텍스트, BLAST, 구조 유사성, 모티프), REST API, 일괄 다운로드, UniProt SIFTS 교차 참조
- PyMOL 명령어: fetch, select, show/hide, color, 거리 측정, ray tracing, 이미지 저장
- ChimeraX와 VMD 시각화: 카툰 스타일, B-인자 색상화, 표면 렌더링, matchmaker 정렬, TCL 스크립팅
- 라마찬드란 도표 검증(phi/psi 허용 영역)과 R-인자/R-free 품질 지표 및 과적합 감지
- DSSP 이차 구조 코드, 접촉 지도, 해석 임계값(<1~>3 A)과 함께하는 RMSD 구조 비교
- AlphaFold DB의 pLDDT 신뢰도 점수, Swiss-Model 상동 모델링 워크플로, AutoDock Vina 도킹 구문
자주 묻는 질문
PDB ATOM 레코드에는 어떤 정보가 있나요?
ATOM 레코드는 열 1-6(레코드 타입), 7-11(원자 일련번호), 13-16(원자명 CA, N, C 등), 17(대체 위치), 18-20(잔기명 ALA, GLY 등), 22(체인 ID), 23-26(잔기 일련번호), 31-54(X/Y/Z 좌표, 옹스트롬), 55-60(점유율, 보통 1.00), 61-66(B-인자/온도 인자)를 포함합니다. HETATM은 리간드, 금속, 물 같은 비단백질 분자에 같은 형식을 사용합니다.
해상도와 B-인자 값은 어떻게 해석하나요?
해상도는 구조 세부 수준을 나타냅니다: 1 옹스트롬 미만은 원자 수준(극고), 1-2는 고해상도, 2-3은 중간, 3-4는 저해상도, 4 이상은 매우 낮음. Cryo-EM 평균은 3-4 A입니다. B-인자는 원자 무질서 정도: 20 미만은 잘 정돈, 20-40은 일반적, 40-60은 유연, 60 이상은 매우 유연/무질서. 루프가 헬릭스보다, 헬릭스가 시트보다 B-인자가 높습니다.
RCSB PDB에서 구조를 어떻게 검색하나요?
rcsb.org에서 여러 검색 방법을 지원합니다: 텍스트 검색("human hemoglobin"), BLAST 서열 검색, 구조 유사성 검색, C-x(2,4)-C-x(3)-[LIVMFYWC] 같은 서열 모티프 검색. Advanced Search Builder로 여러 기준을 조합할 수 있습니다. 프로그래밍 접근은 data.rcsb.org과 search.rcsb.org의 REST API로 가능합니다.
이 레퍼런스에 어떤 PyMOL 명령어가 포함되나요?
fetch(PDB ID로 로드), select(원자 선택 구문), show/hide(cartoon, lines, sticks, surface), color(체인, 원소, B-인자별), distance(원자 간 거리 측정), ray(고품질 이미지 렌더링), png(이미지 저장) 등 필수 명령어를 다룹니다. 예: "fetch 1HHO; select chain_A, chain A; show cartoon, chain_A; color red, chain_A; ray 2400, 1800; png output.png".
라마찬드란 도표는 무엇을 보여주나요?
주쇄 이면각 phi(C-N-CA-C)와 psi(N-CA-C-N)를 -180~180도 범위로 매핑합니다. 허용 영역은 이차 구조에 대응: 알파 헬릭스 phi=-60/psi=-45, 베타 시트 phi=-135/psi=135, 좌선 나선 phi=60/psi=45. 잘 정제된 구조는 잔기의 98% 이상이 허용 영역에 위치해야 합니다. 벗어난 잔기는 모델 오류를 시사할 수 있습니다.
R-인자로 구조 품질을 어떻게 평가하나요?
R = sum|Fobs - Fcalc| / sum|Fobs|로 결정학 모델과 실험 데이터의 일치도를 측정합니다. R-factor는 모든 반사를, R-free는 정제에 사용하지 않은 5% 반사를 사용합니다. 좋은 구조는 R-factor 0.15-0.20, R-free 0.20-0.25입니다. R-free에서 R-factor를 뺀 값이 0.05를 초과하면 과적합이 의심됩니다.
구조 비교 시 RMSD 값은 어떻게 해석하나요?
RMSD는 대응하는 원자 위치(주로 CA 원자)를 비교하여 구조 유사성을 정량화합니다. 1 A 미만은 매우 유사(거의 동일), 1-2 A는 유사, 2-3 A는 같은 폴드, 3 A 이상은 다른 구조입니다. PyMOL에서는 "align obj1, obj2", ChimeraX에서는 "matchmaker #1 to #2"로 RMSD를 계산합니다.
어떤 구조 예측 도구를 다루나요?
AlphaFold DB(alphafold.ebi.ac.uk)의 pLDDT 신뢰도 해석(>90 매우 높음, 70-90 높음, 50-70 낮음, <50 매우 낮음/무질서 가능), Swiss-Model 상동 모델링(템플릿 검색, 정렬, 모델 구축, QMEAN 품질 점수), AutoDock Vina 분자 도킹(수용체/리간드 PDBQT 입력, 그리드 박스 정의, 결합 에너지 kcal/mol)의 세 가지 예측 접근법을 다룹니다.