Question 1

텍스트 임베딩 모델이란 무엇인가요?

Accepted Answer

텍스트 임베딩 모델은 텍스트(단어, 문장, 문서)를 고차원 공간의 밀집 수치 벡터로 변환합니다. 의미가 유사한 텍스트는 이 공간에서 가까운 벡터를 생성합니다. 임베딩은 시맨틱 검색, 검색 증강 생성(RAG), 클러스터링, 분류, 추천 시스템의 기반이 됩니다.

Question 2

레퍼런스의 차원(dimensions)은 무엇을 의미하나요?

Accepted Answer

차원은 모델이 생성하는 벡터의 길이를 나타냅니다. text-embedding-3-large는 3072차원 벡터를, all-MiniLM-L6-v2는 384차원 벡터를 생성합니다. 차원이 높을수록 더 많은 시맨틱 뉘앙스를 포착할 수 있지만 저장소와 연산이 더 많이 필요합니다. 많은 애플리케이션에서 768~1024 차원이 좋은 균형을 제공합니다.

Question 3

최대 토큰 수 제한이란 무엇인가요?

Accepted Answer

최대 토큰 수는 모델이 단일 임베딩 요청에서 처리할 수 있는 최대 토큰 수입니다. OpenAI 모델은 8,191 토큰(약 6,000 단어)을 지원하는 반면, all-MiniLM-L6-v2는 256 토큰만 지원합니다. 긴 문서의 경우 임베딩 전에 모델의 토큰 제한에 맞는 청크로 분할해야 합니다.

Question 4

RAG 애플리케이션에는 어떤 모델을 선택해야 하나요?

Accepted Answer

프로덕션 RAG 시스템에는 text-embedding-3-small(OpenAI, $0.02/1M 토큰, 1536 차원)이 비용 효율적인 인기 선택입니다. 오픈소스 옵션으로는 BGE-M3(BAAI, 무료, 1024 차원, 8192 최대 토큰)이 매우 우수합니다. 경량 온디바이스 사용에는 all-MiniLM-L6-v2(384 차원, 무료)가 빠르고 리소스 효율적입니다.

Question 5

오픈소스와 상용 모델의 차이점은 무엇인가요?

Accepted Answer

오픈소스 모델(BGE, E5, nomic-embed, all-MiniLM, GTE)은 무료로 사용하고 자체 인프라에 셀프 호스팅할 수 있습니다. 상용 모델(OpenAI, Voyage AI, Cohere)은 API를 통해 접근하며 토큰 단위로 요금이 청구됩니다. 오픈소스 모델은 데이터 프라이버시와 쿼리 비용 없음을 제공하고, 상용 모델은 통합이 쉽고 더 높은 품질을 제공하는 경우가 많습니다.

Question 6

BGE-M3와 BGE-large-en-v1.5의 차이점은 무엇인가요?

Accepted Answer

BGE-large-en-v1.5는 512 최대 토큰 제한이 있는 영어 특화 모델이며, BGE-M3는 8,192 토큰 제한으로 100개 이상의 언어를 지원하는 다국어 모델입니다. BGE-M3는 일반적으로 다국어 애플리케이션이나 더 긴 컨텍스트 윈도우가 필요한 경우에 선호됩니다.

Question 7

상용 임베딩의 가격 정책은 어떻게 되나요?

Accepted Answer

상용 임베딩 API는 백만 입력 토큰당 요금을 청구합니다. OpenAI의 text-embedding-3-large는 $0.13/1M 토큰, text-embedding-3-small은 $0.02/1M 토큰입니다. Voyage AI의 voyage-3는 $0.06/1M 토큰, Cohere의 embed-v3.5는 $0.10/1M 토큰입니다. 이 레퍼런스의 다른 모든 모델은 무료입니다.

Question 8

벡터 데이터베이스 차원 설정에 이 레퍼런스를 사용할 수 있나요?

Accepted Answer

네. 차원 열에서 모델이 생성하는 벡터 크기를 직접 확인하여 벡터 데이터베이스(Pinecone, Weaviate, Qdrant, Milvus, pgvector 등)의 인덱스 크기를 설정할 수 있습니다. 예를 들어 text-embedding-3-large를 선택했다면 인덱스를 3072 차원으로 설정하면 됩니다. 차원이 적은 모델을 선택하면 스토리지가 줄고 쿼리 속도가 향상됩니다.

모델	제공사	차원	Max Tokens	MTEB	다국어	가격	오픈
`text-embedding-3-large`	OpenAI	3072	8,191	64.6	Yes	$0.13/1M	No
`text-embedding-3-small`	OpenAI	1536	8,191	62.3	Yes	$0.02/1M	No
`text-embedding-4`	OpenAI	3072	8,191	66.4	Yes	$0.10/1M	No
`voyage-3`	Voyage AI	1024	32,000	67.3	Yes	$0.06/1M	No
`embed-v3.5`	Cohere	1024	512	65.0	Yes	$0.10/1M	No
`mistral-embed`	Mistral	1024	8,192	63.2	Yes	$0.10/1M	No
`jina-embeddings-v3`	Jina AI	1024	8,192	65.5	Yes	$0.02/1M	No
`BGE-large-en-v1.5`	BAAI	1024	512	64.2	No	Free	Yes
`BGE-M3`	BAAI	1024	8,192	68.1	Yes	Free	Yes
`nomic-embed-text-v1.5`	Nomic	768	8,192	62.3	No	Free	Yes
`e5-mistral-7b-instruct`	Microsoft	4096	32,768	66.6	Yes	Free	Yes
`e5-large-v2`	Microsoft	1024	512	62.0	No	Free	Yes
`GTE-Qwen2-7B-instruct`	Alibaba	3584	32,768	67.2	Yes	Free	Yes
`GTE-large`	Alibaba	1024	8,192	63.1	No	Free	Yes
`all-MiniLM-L6-v2`	SBERT	384	256	56.3	No	Free	Yes

Embedding Model Reference

관련 도구

Embedding Model Reference 소개

주요 기능

자주 묻는 질문