🔥 Partition Key와 Sort Key: 데이터 분산의 원리

1550자

17분

강의 목차

partition key는 두 가지 일을 같이 한다
partition마다 throughput 한도가 따로 있다
sort key는 같은 partition 안에서 항목을 정렬해 둔다
hot partition은 partition key 분포가 만든다
adaptive capacity는 한도 자체를 올리지 않는다
write sharding은 PK를 인위적으로 분산시킨다
DynamoDB를 안 쓰는 워크로드

DynamoDB 표지 — 데이터베이스 캐비넷 안에 partition slice 다섯 개가 나열돼 있고, 위쪽 hash 함수 노드가 partition key 값(user#A, user#B, user#C, user#D, user#E)을 각 slice로 매핑한다. 가운데 한 slice는 hot partition을 암시하는 더 진한 톤이다.

처음 사이드 프로젝트에서 나는 DynamoDB 테이블을 하나 만들었다. partition key를 country로 잡고 나라별 사용자 활동 로그를 적었다. 한국 사용자 비율이 다른 나라를 합친 것보다 압도적으로 높았는데, 평소에는 문제가 없다가 이벤트성 트래픽이 한 번 들어왔을 때 ProvisionedThroughputExceededException이 떴다. 테이블 전체 RCU는 한참 남아 있었다. 콘솔의 그래프도 한도 라인 아래쪽에서 놀고 있었다. 처음에는 그게 왜 그렇게 보이는지 알지 못했다.

이유는 partition 한 곳에 트래픽이 몰렸기 때문이었다. 테이블 전체에 capacity를 더 줘도, 그 capacity는 partition 사이에서 균등하게 나뉘기 때문에 한 partition이 받는 몫은 한정돼 있다. partition key를 country로 잡은 그 한 줄이, 한국 트래픽을 한 partition으로 모은 셈이었다. 그제야 partition key가 항목을 식별하는 역할만 하는 게 아니라, 항목이 어느 partition으로 갈지를 정하는 입력값이라는 걸 알게 됐다.

partition key는 두 가지 일을 같이 한다

partition key는 항목을 식별하는 값이다. GetItem(table, key)에 들어가는 그 key다. 그리고 동시에, DynamoDB가 항목을 어느 partition에 둘지를 정하는 hash 함수의 입력값이다. 같은 partition key 값을 가진 항목들은 항상 같은 partition으로 간다. DynamoDB는 다른 partition key 값을 hash로 계산한 뒤 여러 partition에 나눠 담는다.

DynamoDB란 무엇인가: 키-값 스토어의 관점에서 본 라우팅 계층이 이 hash 결과를 사용한다. 클라이언트가 GetItem을 호출하면 request router가 partition key를 hash해서 metadata subsystem에 그 hash가 어느 storage node 범위에 들어가는지 묻고, 그 노드로 요청을 보낸다. partition key 한 값에 대한 모든 요청은 같은 storage node 한 곳으로 도착한다. 이 사실이 partition 한도와 hot partition 현상을 동시에 설명한다.

partition key 외에 sort key를 더해서 composite primary key를 만들 수도 있다. 이때는 partition key + sort key 조합이 항목을 식별하고, partition 라우팅에는 partition key만 사용한다. sort key는 partition 안에서 항목들을 정렬해 두는 두 번째 축이다.

partition마다 throughput 한도가 따로 있다

DynamoDB의 한 partition이 받을 수 있는 throughput은 초당 1,000 WCU(write capacity units), 3,000 RCU(read capacity units)다. 이 숫자는 AWS DynamoDB Developer Guide의 "Best practices for designing and using partition keys effectively"에 그대로 적혀 있고, 2026-05-01 기준 변경 없다. on-demand 모드여도 DynamoDB는 partition마다 같은 한도를 둔다.

이 뜻은 숫자를 직접 넣어 계산하면 바로 드러난다. 테이블에 partition이 5개 있고 각 partition이 3,000 RCU를 낼 수 있으면, 테이블 전체 read capacity는 15,000 RCU다. 콘솔이 보여주는 숫자가 이거다. 그런데 트래픽이 한 partition key 값에 9,000 RPS 몰리면 그 partition은 3,000 RCU까지만 받는다. 나머지 6,000 RPS는 throttle된다. 다른 partition 4개는 거의 노는 상태인데도 그렇다. 콘솔 그래프와 실제 throttling이 어긋나 보이는 첫 번째 이유다.

partition 한도가 partition 단위라는 건, 테이블 전체 capacity 계획만으로는 throttling을 막을 수 없다는 뜻이다. 트래픽을 partition들 사이로 어떻게 분산시키느냐가 partition key 설계의 일이 된다.

DynamoDB partition 한도 — 가로로 나열된 partition slice 5개, 각 slice 위에 3,000 RCU 한도 라인. 가운데 partition만 9,000 RPS 트래픽 화살표가 한도 라인을 넘어 throttle 표시. 양옆 4개는 한도 한참 아래에서 idle 상태.

sort key는 같은 partition 안에서 항목을 정렬해 둔다

sort key는 partition 안에서 항목들을 사전식 순서로 정렬해 둔다. 같은 partition key를 가진 모든 항목이 sort key 순서로 디스크에 나란히 적혀 있다고 보면 된다. 그래서 Query API가 한 partition key 안에서 sort key 조건(begins_with, between, >, <, =)으로 항목을 좁힐 수 있다.

예를 들어 user 한 명의 주문 내역을 저장한다면 partition key는 userId#42로 두고, sort key는 order#2026-01-01#abc, order#2026-02-15#def처럼 만든다. 2026년 2월 주문만 보고 싶다면 Query(PK=userId#42, SK begins_with "order#2026-02") 한 번이면 된다. 이 쿼리는 사용자 42의 항목이 모인 partition 한 곳만 읽고, 그 안에서 sort key prefix 조건으로 필요한 범위만 좁힌다. 같은 일을 partition key만으로 하려면 사용자별로 항목을 여러 개로 나누어 적거나, sort key 없이 주문 목록 전체를 한 항목에 담아야 한다. 후자는 400 KB 항목 한도에 금방 부딪힌다.

begins_with를 쓰려면 sort key 안에 #로 계층을 넣어 두면 된다. AWS Developer Guide의 "Best practices for using sort keys to organize data"가 권하는 방식도 이거다. country#region#city처럼 적어 두면 한 query로 한국 전체, 한국 서울 전체, 한국 서울 강남 전체를 각각 다른 prefix로 좁힐 수 있다.

composite primary key — 같은 partition key userId#42 아래 항목 네 개가 sort key 오름차순으로 정렬돼 있고, 'Query(PK=userId#42, SK begins_with order#2026-02)' 한 호출이 2월 항목 두 개만 감싼다.

hot partition은 partition key 분포가 만든다

hot partition은 한 partition이 1,000 WCU 또는 3,000 RCU 한도에 부딪혀 throttle되는 상태다. partition key 값들의 분포가 한쪽으로 기울어지면 자연스럽게 그 값이 몰린 partition이 먼저 한도에 도달한다.

partition 분포를 결정하는 두 변수가 있다. AWS Developer Guide의 "Designing partition keys to distribute your workload"는 이걸 cardinality(서로 다른 값이 몇 개나 있는가)와 request distribution(요청이 그 값들 사이로 얼마나 균등하게 흩어지는가)으로 적어 둔다. partition key 값 종류가 적거나(low cardinality), 종류는 많아도 트래픽이 몇 개에 몰려 있으면(skewed distribution) hot partition이 생긴다.

내가 처음 고른 country PK는 두 기준에서 모두 나빴다. 사용자가 만 명이 넘어도 country 값은 5개 안팎이고(low cardinality), 한국 비율이 90%(skewed). 같은 데이터를 userId로 PK를 잡았으면 cardinality는 사용자 수만큼 늘고, 요청 분포도 트래픽이 특정 사용자에게 극단적으로 몰리지 않는 한 한쪽 partition으로 쏠리지 않는다.

partition key 설계 비교 — 왼쪽은 country를 PK로 잡은 경우로 KR partition에만 9,000 RPS가 몰리고 나머지는 1,000 RPS 미만이다. 오른쪽은 userId를 PK로 잡은 경우로 다섯 partition이 1,800~2,200 RPS로 고르게 분산된다.

adaptive capacity는 한도 자체를 올리지 않는다

DynamoDB는 partition key 분포가 흔들리는 워크로드를 자동으로 어느 정도 흡수한다. 2019년 11월에 GA된 instant adaptive capacity가 그 일을 한다. AWS What's New 공지에 따르면 adaptive capacity는 모든 테이블과 global secondary index에 기본 활성화돼 있고, 추가 비용이 없다. partition 사이로 capacity를 재분배하고, 한 partition 안에서 frequently accessed item을 식별해 다른 partition으로 분리하기까지 한다.

다만 adaptive capacity가 partition 한도 자체를 올리지는 않는다. AWS re:Post의 동일 질문에 AWS 답변이 적은 그대로, 한 partition은 여전히 1,000 WCU / 3,000 RCU에서 throttle된다. 지속적인 hot key가 있으면 DynamoDB는 그 partition을 두 partition으로 split해서 capacity를 두 배로 만든다. 이걸 split for heat라고 부르는데, AWS Database Blog "Scaling DynamoDB" 글이 적은 그대로 이 과정은 보통 분 단위로 진행한다. 그 시간 동안 DynamoDB는 이미 뜨거워진 partition을 바로 고르게 펴지 못한다.

또 하나, burst capacity가 있다. AWS DynamoDB Developer Guide "Burst and adaptive capacity"는 DynamoDB가 사용자가 안 쓴 용량을 최대 5분(300초)까지 적립해 둔다고 적는다. 짧은 burst는 이 적립분에서 흡수되지만, 지속적인 트래픽 spike에는 부족하다. 같은 문서는 DynamoDB가 burst capacity를 내부 백그라운드 작업에도 예고 없이 쓴다고 분명히 적는다. 그래서 5분 적립을 운영적으로 가정하고 capacity 계획을 짜면 안 된다.

split for heat — 위쪽 partition 하나 안에 hot item 한 개와 일반 항목 일곱 개가 섞여 한도에 부딪힌 상태가 위쪽에, 아래쪽에는 partition이 둘로 쪼개져 hot item만 따로 한 partition에, 나머지가 다른 partition에 분리된 후 각자 1,000 WCU / 3,000 RCU 한도가 새로 적용된 모습이 그려져 있다.

DynamoDB가 자동으로 해결하는 범위는 partition 운영까지다. partition을 쪼개고 합치는 일은 DynamoDB가 맡지만, partition key를 어떻게 정의해 트래픽을 어떻게 분산시킬지는 사용자가 정한다. 잘못 잡힌 partition key는 adaptive capacity가 끝까지 보정해 주지 못한다.

write sharding은 PK를 인위적으로 분산시킨다

partition key를 자연스럽게 분산시키기 어려운 워크로드도 있다. 시간 기반 PK가 그 예다. 모든 이벤트의 PK를 2026-05-01 같은 날짜 하나로 잡으면 애플리케이션은 그날 요청을 한 PK로만 보낸다. 그러면 DynamoDB는 그 PK에 붙은 쓰기를 같은 지점에서 계속 처리해야 하고, 결국 병목도 거기서 바로 생긴다. AWS Developer Guide "Using write sharding to distribute workloads evenly"는 이런 부분에 random suffix를 붙이라고 권한다.

같은 날짜에 random suffix(예: 1–200 사이 정수)를 붙여 PK 값을 2026-05-01.1, 2026-05-01.2, ..., 2026-05-01.200처럼 200개로 늘리면 애플리케이션은 같은 날 트래픽을 200개 PK로 나눠 보낸다. 그러면 DynamoDB도 그 쓰기를 여러 지점에서 함께 받는다. 한 partition에 9,000 RPS 몰리던 워크로드가 partition 200개로 나뉘면서 각 PK는 평균 45 RPS만 받는다.

write sharding — 왼쪽은 PK가 2026-05-01 하나로 같은 partition에 9,000 RPS가 몰려 한도를 넘는 모습, 가운데는 random suffix 1..200 변환 박스, 오른쪽은 200개 partition key 값으로 흩어진 트래픽이 partition 200개에 평균 45 RPS씩 분산된 모습이다.

대신 읽을 때는 비용이 바로 늘어난다. 그 날 모든 항목을 보고 싶으면 200개 PK 값에 각각 Query를 보내고 결과를 merge해야 한다. 트래픽 패턴을 알고 있으면 random 대신 결정적 hash(예: userId % 200)를 쓰는 변형이 있는데, 같은 사용자의 항목은 항상 같은 shard에 들어가니 single-shard query만으로 그 사용자 데이터를 다 읽을 수 있다.

DynamoDB를 안 쓰는 워크로드

partition key 분포가 자연스럽게 분산되지 않는 워크로드는 DynamoDB와 잘 안 맞는다. 소수의 사용자에게 트래픽 대부분이 몰리는 워크로드(예: 인플루언서 한 명의 타임라인을 모든 follower가 읽는다), 미리 정해진 access pattern 없이 임의 조합으로 ad-hoc 질문을 던지는 분석 워크로드, 강한 일관성과 복잡한 다중 항목 트랜잭션이 절대 조건인 워크로드가 여기에 든다. 첫 번째는 hot partition의 정의다. 두 번째는 Scan이 partition 한도를 우회하지 못하기 때문이고(Scan은 모든 partition을 순회한다), 세 번째는 RDBMS의 영역이다.

partition key를 어떻게 잡느냐가 access pattern을 그대로 받아 적은 결정이라는 말이다. RDBMS는 schema → relations → queries 순서로 갔지만, DynamoDB는 access patterns → key design → schema 순서다. 같은 데이터라도 어떤 query를 가장 자주 보낼지를 먼저 정하지 않으면 PK가 잡히지 않고, PK가 잘못 잡히면 partition 한도가 그 잘못을 그대로 노출한다.

다음에 DynamoDB 테이블을 짤 때는 PK 후보 두세 개를 두고 cardinality와 분포를 먼저 비교한다. country 같은 값으로 PK를 잡지는 않는다.

⚡️ 시작하기

○ 이 101편을 어떻게 읽어야 할까

⚡️ IAM — 자격증명과 권한

○ IAM이란 무엇인가 — 계정 보안의 문지기

○ User, Group, Role — 세 가지 주체의 차이

○ Policy — JSON으로 권한을 표현하는 법

○ 정책 평가 흐름 — Allow와 Deny가 만나면

○ Assume Role — 임시 자격증명이 만들어지는 순간

○ Instance Profile — EC2는 IAM을 어떻게 얻는가

○ IAM Access Analyzer — 과권한을 탐지하는 법

○ Organizations와 SCP — 조직 전체 권한 제어

○ IAM Identity Center — 사람 계정을 관리하는 현대적 방법

○ IAM 실수 모음 — 프로덕션에서 마주치는 권한 함정

⚡️ VPC — 가상 네트워크

○ VPC란 무엇인가 — 가상 네트워크의 경계

○ Subnet — Public과 Private의 진짜 차이

○ 라우팅 테이블 — 패킷이 어디로 가는지

○ Internet Gateway — 외부로 나가는 유일한 길

○ NAT Gateway — Private Subnet의 외부 연결

○ Security Group — 인스턴스 레벨 방화벽

○ Network ACL — Subnet 레벨 방화벽과의 차이

○ VPC Peering과 Transit Gateway — VPC를 잇는 두 방법

○ VPC Endpoint — S3·DynamoDB에 나가지 않고 접근하기

○ VPC 설계 패턴 — 3-tier, Hub-and-Spoke, 그 외

⚡️ CloudWatch — 관측

○ CloudWatch란 무엇인가 — AWS의 관측 허브

○ Metric — 숫자 하나가 찍히는 흐름

○ Alarm — 임계값을 걸고 알림을 받는 법

○ Logs — 구조화 로그와 인덱싱 관점

○ Logs Insights — 로그에 쿼리를 날리는 법

○ Dashboard — 여러 지표를 한 화면에

○ Events — EventBridge의 이전 이름과 현재

○ Synthetics — 엔드포인트 가용성 모니터링

○ X-Ray — 분산 트레이싱의 출발점

○ Observability 비용 함정 — 관찰하는 데 돈이 새는 이유

⚡️ EC2 — 가상 서버

○ EC2란 무엇인가 — 가상 머신의 추상 계층

○ 인스턴스 타입 — CPU·메모리·네트워크의 조합

○ AMI — 머신 이미지의 라이프사이클

○ EBS vs Instance Store — 디스크는 어디 붙어 있는가

○ Spot, On-Demand, Reserved — 세 가지 가격 모델

○ Auto Scaling Group — 수요에 따라 늘리고 줄이는 법

○ Load Balancer — ALB·NLB·GWLB의 역할

○ 언제 EC2가 아닌 다른 걸 써야 하는가

⚡️ Lambda — 서버리스 함수

○ Lambda란 무엇인가 — 서버리스의 경계

○ Handler와 실행 모델 — 이벤트가 들어오면

○ 실행 역할과 최소 권한 — Lambda의 IAM

○ Cold Start — 왜 첫 호출이 느린가

○ 동시성과 Reserved Concurrency — 폭주를 막는 법

○ 트리거 종류 — API Gateway·SQS·EventBridge·S3

○ Lambda와 VPC — Private 리소스에 접근하는 비용

○ 언제 Lambda가 아닌 ECS/Fargate를 써야 하는가

⚡️ S3 — 오브젝트 스토리지

○ S3란 무엇인가 — 오브젝트 스토리지의 구조

○ 버킷과 키 — 플랫 네임스페이스의 의미

○ 버전 관리와 삭제 마커 — 실수로부터 복구

○ 스토리지 클래스 — Standard·IA·Glacier의 차이

○ 버킷 정책과 ACL — 공개와 비공개의 경계

○ Presigned URL — 임시 접근 링크의 원리

○ 이벤트 알림 — S3 → Lambda·SQS 연결

○ 정적 웹 호스팅과 CloudFront 결합

⚡️ RDS — 관리형 관계형 DB

○ RDS란 무엇인가 — 관리형 DB의 의미

○ 엔진 선택 — MySQL·PostgreSQL·Aurora

○ Multi-AZ와 장애 조치 — 가용성의 기제

○ Read Replica — 읽기 부하 분산

○ 백업과 PITR — 시점 복구의 범위

○ 파라미터 그룹과 옵션 그룹 — DB 설정의 추상

○ RDS 비용의 구조 — 스토리지·I/O·백업

⚡️ DynamoDB — 관리형 NoSQL

○ DynamoDB란 무엇인가 — 키-값 스토어의 관점

🔥 Partition Key와 Sort Key — 데이터 분산의 원리

○ GSI와 LSI — 다른 키로 조회하기

○ On-Demand vs Provisioned — 가격 모델

○ DynamoDB Streams — 변경 이벤트 스트림

○ 트랜잭션과 조건부 쓰기 — ACID의 한계

○ DynamoDB를 쓰지 말아야 할 때

⚡️ SQS — 메시지 큐

○ SQS란 무엇인가 — 큐의 추상