Database Sharding: Bài Toán Hotspot & Trade-offs Cho PM/BA

1. Nút Thắt Cuối Cùng: Khi "Cỗ Máy Ghi" Cạn Kiệt

Chúng ta đã dùng Replication để xử lý hàng triệu lượt Đọc (Read), dùng PITR để đảm bảo RPO = 0. Nhưng có một giới hạn vật lý tàn khốc mà kiến trúc Single-leader không thể vượt qua: Mọi lệnh Ghi (Write) đều phải đi qua một server duy nhất.

Khi một sản phẩm Scale-up chạm ngưỡng 10,000 Write QPS (Queries Per Second) — ví dụ: hệ thống xử lý cuốc xe của Grab giờ cao điểm, hoặc ví điện tử lúc Flash Sale — CPU và Disk IOPS của Primary DB sẽ chạm trần 100%. Lúc này, việc vung tiền mua một server to hơn (Vertical Scaling) là bất khả thi vì phần cứng tốt nhất thế giới cũng có giới hạn.

Giải pháp tối hậu của các Big Tech là Database Sharding (Phân mảnh): Cắt nhỏ khối dữ liệu khổng lồ thành nhiều phần (Shards) và phân tán chúng ra nhiều cụm server độc lập.

Database Architecture 4: Sharding: Phá Vỡ Giới Hạn Vật Lý & Nỗi Đau Vận Hành

1. Nút Thắt Cuối Cùng: Khi "Cỗ Máy Ghi" Cạn Kiệt

"Act as an Expert": Vì sao Prompt Persona phá hủy độ chính xác của AI

2. Sinh Tử Nằm Ở Shard Key: Thảm Họa Hotspot

Anti-Pattern: Trực giác "Ngây Thơ" (Range-based bằng Thời gian)

Best Practice: Phân tán đồng đều (Hash-based bằng User ID)

3. Mặt Tối Của Sharding: Đánh Đổi Bằng Nỗi Đau Vận Hành

4. Rà Soát Sharding Cluster Khéo Léo Với PEUF

5. Tổng Kết Series: Khung Tư Duy Kiến Trúc Dữ Liệu

Database Architecture 3: Backup, PITR & Các Chỉ Số Phục Hồi (RPO, RTO)