Vector Database (벡터 DB) | KAITRUST AI 백과사전

📖 상세 설명

벡터 데이터베이스(Vector Database)는 고차원 벡터 데이터를 효율적으로 저장하고 유사도 기반 검색을 수행하는 특화된 데이터베이스입니다. 전통적인 관계형 데이터베이스가 정확한 값 매칭에 최적화된 반면, 벡터 DB는 "의미적으로 유사한" 데이터를 찾는 데 특화되어 있습니다. 텍스트, 이미지, 오디오 등을 AI 모델이 생성한 임베딩 벡터로 변환하여 저장하고, 쿼리 벡터와 가장 가까운 벡터들을 빠르게 검색합니다.

벡터 DB의 핵심 기술은 ANN(Approximate Nearest Neighbor) 알고리즘입니다. 수백만~수억 개의 고차원 벡터에서 정확한 최근접 이웃을 찾는 것은 계산적으로 매우 비싸므로, HNSW(Hierarchical Navigable Small World), IVF(Inverted File Index), PQ(Product Quantization) 같은 근사 알고리즘을 사용합니다. 이 알고리즘들은 약간의 정확도를 희생하여 검색 속도를 수백~수천 배 향상시킵니다.

실무에서 벡터 DB는 RAG(Retrieval-Augmented Generation) 시스템의 핵심 구성 요소입니다. 문서를 청킹하고 임베딩하여 벡터 DB에 저장한 후, 사용자 질문과 유사한 문서 조각을 검색하여 LLM에 컨텍스트로 제공합니다. 이 외에도 시맨틱 검색, 이미지 유사도 검색, 추천 시스템, 중복 탐지 등 다양한 AI 애플리케이션에서 활용됩니다.

주요 벡터 DB로는 Pinecone(완전 관리형 SaaS), Weaviate(오픈소스, GraphQL API), Qdrant(Rust 기반 고성능), Milvus(대규모 분산), Chroma(로컬 개발용) 등이 있습니다. 또한 PostgreSQL의 pgvector, Elasticsearch의 벡터 검색 기능처럼 기존 DB에 벡터 기능을 추가한 솔루션도 있습니다. 선택 시 확장성, 호스팅 옵션, 메타데이터 필터링, 하이브리드 검색 지원 여부를 고려해야 합니다.

💻 코드 예제

Pinecone과 OpenAI 임베딩을 활용한 벡터 검색 예제:

Python

# Vector Database 활용 예제 - Pinecone + OpenAI
# pip install pinecone-client openai

import os
from typing import List, Dict, Any
import hashlib

# Pinecone 클라이언트 (v3.0+)
from pinecone import Pinecone, ServerlessSpec

# OpenAI 임베딩
from openai import OpenAI


class VectorDBManager:
    """벡터 데이터베이스 관리 클래스"""

    def __init__(self, pinecone_api_key: str, openai_api_key: str):
        # 클라이언트 초기화
        self.pc = Pinecone(api_key=pinecone_api_key)
        self.openai = OpenAI(api_key=openai_api_key)

        self.embedding_model = "text-embedding-3-small"
        self.dimension = 1536  # text-embedding-3-small 차원

    def create_index(self, index_name: str):
        """인덱스 생성"""
        # 기존 인덱스 확인
        existing_indexes = [idx.name for idx in self.pc.list_indexes()]

        if index_name not in existing_indexes:
            self.pc.create_index(
                name=index_name,
                dimension=self.dimension,
                metric="cosine",  # 코사인 유사도
                spec=ServerlessSpec(
                    cloud="aws",
                    region="us-east-1"
                )
            )
            print(f"Index '{index_name}' created successfully")
        else:
            print(f"Index '{index_name}' already exists")

        return self.pc.Index(index_name)

    def get_embedding(self, text: str) -> List[float]:
        """텍스트를 임베딩 벡터로 변환"""
        response = self.openai.embeddings.create(
            input=text,
            model=self.embedding_model
        )
        return response.data[0].embedding

    def get_embeddings_batch(self, texts: List[str]) -> List[List[float]]:
        """배치 임베딩 생성"""
        response = self.openai.embeddings.create(
            input=texts,
            model=self.embedding_model
        )
        return [item.embedding for item in response.data]

    def upsert_documents(self, index, documents: List[Dict[str, Any]]):
        """
        문서를 벡터 DB에 삽입/업데이트

        Args:
            index: Pinecone 인덱스
            documents: [{"id": str, "text": str, "metadata": dict}, ...]
        """
        # 임베딩 생성
        texts = [doc["text"] for doc in documents]
        embeddings = self.get_embeddings_batch(texts)

        # 벡터 준비
        vectors = []
        for doc, embedding in zip(documents, embeddings):
            # ID 생성 (없으면 텍스트 해시)
            doc_id = doc.get("id") or hashlib.md5(doc["text"].encode()).hexdigest()

            vectors.append({
                "id": doc_id,
                "values": embedding,
                "metadata": {
                    "text": doc["text"][:1000],  # 메타데이터 크기 제한
                    **doc.get("metadata", {})
                }
            })

        # 배치 업서트 (1000개씩)
        batch_size = 100
        for i in range(0, len(vectors), batch_size):
            batch = vectors[i:i + batch_size]
            index.upsert(vectors=batch)

        print(f"Upserted {len(vectors)} documents")

    def search(self, index, query: str, top_k: int = 5,
               filter: Dict = None) -> List[Dict]:
        """
        유사도 검색

        Args:
            index: Pinecone 인덱스
            query: 검색 쿼리
            top_k: 반환할 결과 수
            filter: 메타데이터 필터

        Returns:
            검색 결과 리스트
        """
        # 쿼리 임베딩 생성
        query_embedding = self.get_embedding(query)

        # 검색 실행
        results = index.query(
            vector=query_embedding,
            top_k=top_k,
            include_metadata=True,
            filter=filter
        )

        # 결과 정리
        formatted_results = []
        for match in results.matches:
            formatted_results.append({
                "id": match.id,
                "score": match.score,
                "text": match.metadata.get("text", ""),
                "metadata": match.metadata
            })

        return formatted_results

    def hybrid_search(self, index, query: str, keyword_filter: str = None,
                      top_k: int = 5) -> List[Dict]:
        """
        하이브리드 검색 (벡터 + 키워드)
        """
        # 메타데이터 필터 구성
        filter_dict = None
        if keyword_filter:
            filter_dict = {
                "text": {"$contains": keyword_filter}
            }

        return self.search(index, query, top_k, filter_dict)


class RAGPipeline:
    """RAG (Retrieval-Augmented Generation) 파이프라인"""

    def __init__(self, vector_manager: VectorDBManager, index):
        self.vector_manager = vector_manager
        self.index = index

    def add_documents(self, texts: List[str], metadata_list: List[Dict] = None):
        """문서 추가"""
        documents = []
        for i, text in enumerate(texts):
            doc = {
                "text": text,
                "metadata": metadata_list[i] if metadata_list else {}
            }
            documents.append(doc)

        self.vector_manager.upsert_documents(self.index, documents)

    def retrieve_context(self, query: str, top_k: int = 3) -> str:
        """쿼리와 관련된 컨텍스트 검색"""
        results = self.vector_manager.search(self.index, query, top_k)

        context_parts = []
        for i, result in enumerate(results):
            context_parts.append(f"[{i+1}] {result['text']}")

        return "\n\n".join(context_parts)

    def generate_answer(self, query: str, top_k: int = 3) -> str:
        """RAG 기반 답변 생성"""
        # 1. 관련 문서 검색
        context = self.retrieve_context(query, top_k)

        # 2. 프롬프트 구성
        prompt = f"""다음 컨텍스트를 바탕으로 질문에 답변해주세요.

컨텍스트:
{context}

질문: {query}

답변:"""

        # 3. LLM으로 답변 생성
        response = self.vector_manager.openai.chat.completions.create(
            model="gpt-4o-mini",
            messages=[{"role": "user", "content": prompt}],
            temperature=0.7
        )

        return response.choices[0].message.content


# 사용 예제
if __name__ == "__main__":
    # 환경 변수에서 API 키 로드
    PINECONE_API_KEY = os.getenv("PINECONE_API_KEY", "your-api-key")
    OPENAI_API_KEY = os.getenv("OPENAI_API_KEY", "your-api-key")

    # 매니저 초기화
    manager = VectorDBManager(PINECONE_API_KEY, OPENAI_API_KEY)

    # 인덱스 생성
    index = manager.create_index("knowledge-base")

    # 문서 추가
    documents = [
        {
            "text": "벡터 데이터베이스는 고차원 벡터를 저장하고 유사도 검색을 수행합니다.",
            "metadata": {"category": "database", "lang": "ko"}
        },
        {
            "text": "RAG는 검색과 생성을 결합하여 LLM의 답변 품질을 향상시킵니다.",
            "metadata": {"category": "ai", "lang": "ko"}
        },
        {
            "text": "Pinecone은 완전 관리형 벡터 데이터베이스 서비스입니다.",
            "metadata": {"category": "database", "lang": "ko"}
        }
    ]

    manager.upsert_documents(index, documents)

    # 검색 테스트
    print("\n=== 유사도 검색 ===")
    results = manager.search(index, "벡터 DB란 무엇인가요?", top_k=2)
    for r in results:
        print(f"Score: {r['score']:.4f} | {r['text'][:50]}...")

    # RAG 파이프라인 테스트
    print("\n=== RAG 답변 생성 ===")
    rag = RAGPipeline(manager, index)
    answer = rag.generate_answer("RAG가 뭔가요?")
    print(f"Answer: {answer}")

📊 성능 & 비용

주요 벡터 데이터베이스 비교 (2025년 기준):

서비스	가격	특징	적합한 사용 사례
Pinecone	사용량 기반 (Free tier 있음)	완전 관리형 Serverless	빠른 프로토타이핑, 운영 부담 최소화
Weaviate	$25~$153/월 (Serverless)	오픈소스 GraphQL 하이브리드 검색	복잡한 필터링, 셀프호스팅 선호
Qdrant	$102+/월 (Cloud)	Rust 기반 SOC2 인증 고성능	대규모 프로덕션, 보안 중요
Chroma	무료 (오픈소스)	로컬 실행 간단한 API	로컬 개발, 소규모 프로젝트
pgvector	PostgreSQL 비용	PostgreSQL 확장 SQL 통합	기존 PostgreSQL 활용, 단일 DB

선택 가이드: 빠른 시작은 Chroma(로컬) 또는 Pinecone(클라우드), 프로덕션 규모는 Qdrant 또는 Weaviate, 기존 PostgreSQL 스택이 있으면 pgvector가 경제적입니다. 대부분의 서비스가 무료 티어를 제공하므로 먼저 테스트해보세요.

🗣️ 실무에서 이렇게 말해요

RAG 시스템 설계 회의에서

"문서를 청킹해서 임베딩 만들고 벡터 DB에 넣을 건데, Pinecone이랑 Weaviate 중에 뭐가 나을까요? 하이브리드 검색이 필요하면 Weaviate가 나을 것 같아요."

검색 품질 논의에서

"벡터 검색만으로는 정확도가 좀 떨어져서, 메타데이터 필터링이랑 리랭킹을 추가하면 좋을 것 같아요."

인프라 비용 논의에서

"1억 건 이상이면 Pinecone 비용이 꽤 나올 텐데, Qdrant 셀프호스팅으로 가는 게 어떨까요?"

개발 초기 단계에서

"일단 Chroma로 로컬에서 빠르게 테스트하고, 나중에 프로덕션 때 Pinecone으로 마이그레이션하죠."

⚠️ 흔한 실수 & 주의사항

청킹 전략 무시

문서를 통째로 임베딩하면 검색 품질이 떨어집니다. 의미 단위로 적절히 청킹(500-1000 토큰)하고, 청크 간 오버랩을 두어 컨텍스트 손실을 방지하세요.

임베딩 모델 불일치

인덱싱할 때와 검색할 때 반드시 동일한 임베딩 모델을 사용해야 합니다. 모델이 바뀌면 벡터 공간이 달라져 검색 결과가 무의미해집니다.

벡터 검색만 의존

벡터 검색은 의미적 유사성에 강하지만 정확한 키워드 매칭에는 약합니다. 제품명, 코드 등 정확한 매칭이 필요하면 하이브리드 검색(벡터 + BM25)을 사용하세요.

메타데이터 설계 소홀

벡터만 저장하지 말고 필터링용 메타데이터(날짜, 카테고리, 출처 등)를 함께 저장하세요. 나중에 "최근 1년 문서에서만 검색" 같은 요구사항이 생기면 메타데이터 필터가 필수입니다.

🔗 관련 용어

📚 더 배우기

📘 Pinecone Learning Center - 벡터 DB 기초 📘 Weaviate 공식 문서 📘 Qdrant 공식 문서 🎬 Vector Databases Explained (Fireship)