주-복제본 복제 (Primary-Replica Replication)

상세 설명

주-복제본 복제(Primary-Replica Replication)는 하나의 Primary(마스터) 서버가 모든 쓰기 작업을 처리하고, 여러 Replica(슬레이브) 서버가 읽기 작업을 분담하는 데이터베이스 복제 방식입니다. 읽기와 쓰기 비율이 높은 대부분의 웹 애플리케이션에서 널리 사용됩니다.

Primary에서 발생한 변경사항은 복제 로그(binlog, WAL 등)를 통해 Replica로 전파됩니다. 동기식 복제는 데이터 일관성을 보장하지만 지연이 발생하고, 비동기식 복제는 빠르지만 일시적 데이터 불일치(Replica Lag)가 발생할 수 있습니다.

읽기 부하를 여러 Replica로 분산하여 처리량을 늘릴 수 있고, Primary 장애 시 Replica 중 하나를 승격시켜 서비스 연속성을 유지할 수 있습니다. 다만 애플리케이션 레벨에서 읽기/쓰기 라우팅 로직이 필요합니다.

코드 예제

# Python - SQLAlchemy 읽기/쓰기 분리
from sqlalchemy import create_engine
from sqlalchemy.orm import sessionmaker

# Primary (쓰기용)
primary_engine = create_engine('postgresql://primary-host:5432/mydb')

# Replica (읽기용)
replica_engine = create_engine('postgresql://replica-host:5432/mydb')

PrimarySession = sessionmaker(bind=primary_engine)
ReplicaSession = sessionmaker(bind=replica_engine)

class DatabaseRouter:
    def get_session(self, readonly=False):
        if readonly:
            return ReplicaSession()
        return PrimarySession()

# 사용 예시
router = DatabaseRouter()

# 쓰기 작업 - Primary로
with router.get_session(readonly=False) as session:
    new_user = User(name="홍길동", email="hong@example.com")
    session.add(new_user)
    session.commit()

# 읽기 작업 - Replica로
with router.get_session(readonly=True) as session:
    users = session.query(User).filter(User.active == True).all()

# Django - 데이터베이스 라우터 설정
# settings.py
DATABASES = {
    'default': {
        'ENGINE': 'django.db.backends.postgresql',
        'HOST': 'primary-host',
        'NAME': 'mydb',
    },
    'replica': {
        'ENGINE': 'django.db.backends.postgresql',
        'HOST': 'replica-host',
        'NAME': 'mydb',
    }
}

# routers.py
class PrimaryReplicaRouter:
    def db_for_read(self, model, **hints):
        return 'replica'

    def db_for_write(self, model, **hints):
        return 'default'

    def allow_relation(self, obj1, obj2, **hints):
        return True

    def allow_migrate(self, db, app_label, model_name=None, **hints):
        return db == 'default'

실무 대화 예시

DevOps: DB 서버 CPU가 80% 넘게 올라가요. 대부분 읽기 쿼리인데요.

DBA: Primary-Replica 구성으로 읽기 분산하면 되겠네요. 현재 읽기/쓰기 비율이 어떻게 되나요?

DevOps: 읽기가 90% 정도예요.

DBA: Replica 2대 추가하고 읽기 쿼리를 분산시키면 Primary 부하가 크게 줄 거예요. 다만 Replica Lag 모니터링도 설정해야 합니다.

면접관: Primary-Replica 구성에서 Replica Lag가 발생하면 어떤 문제가 생기나요?

지원자: 사용자가 방금 작성한 글을 바로 조회하면 안 보일 수 있습니다. 이를 해결하려면 쓰기 직후 읽기는 Primary에서 하거나, 쿠키/세션으로 최근 쓰기 시간을 추적해서 Lag보다 이전 데이터만 Replica에서 읽는 방법이 있습니다.

면접관: Primary 장애 시 Failover는 어떻게 하나요?

지원자: Replica 중 하나를 Primary로 승격시킵니다. 자동화 도구로는 MySQL의 MHA, PostgreSQL의 Patroni 등이 있습니다.

시니어: 여기서 데이터 저장 직후 바로 같은 데이터를 조회하네요. Replica Lag 고려했어요?

주니어: 아, Replica에서 읽으면 방금 쓴 데이터가 안 보일 수 있겠네요.

시니어: 네, 쓰기 직후 읽기는 Primary에서 하도록 수정하거나, 최소한 1초 정도 지연 후 조회하도록 바꾸세요.

주의사항

Replica Lag로 인한 읽기 일관성 문제에 대한 애플리케이션 레벨 대응 필요
쓰기 직후 읽기는 Primary에서 하도록 설계
Failover 시 데이터 손실 가능성 (비동기 복제의 경우)
복제 지연 모니터링과 임계치 알림 설정 필수

주-복제본 복제

상세 설명

코드 예제

실무 대화 예시

주의사항

관련 용어

더 배우기