๐จ AWS Disaster Recovery โ Whitepaper Summary
์ถ์ฒ: Disaster Recovery of Workloads on AWS: Recovery in the Cloud
Publication: February 12, 2021 | AWS Well-Architected Framework
๋ชฉ์ฐจ
- ํต์ฌ ๊ฐ๋ ์ ์
- Business Continuity Plan (BCP)
- Data Plane vs. Control Plane
- DR ์ ๋ต 4๊ฐ์ง
- Active/Passive vs. Active/Active
- Failover ํธ๋ํฝ ๋ผ์ฐํ ์๋น์ค
- AWS ํต์ฌ DR ์๋น์ค
- DR ํ ์คํ (Testing Disaster Recovery)
- ์ ๋ต ์ ํ ๊ฐ์ด๋
- ๋น์ฉ ์ต์ ํ ๊ด์
- ๐ ์ํ ์์ฃผ ์ถ์ ํฌ์ธํธ ์ด์ ๋ฆฌ
1. ํต์ฌ ๊ฐ๋ ์ ์
Disaster (์ฌํด)๋?
์ํฌ๋ก๋ ๋๋ ์์คํ ์ด Primary ๋ฐฐํฌ ์์น์์ ๋น์ฆ๋์ค ๋ชฉํ๋ฅผ ๋ฌ์ฑํ์ง ๋ชปํ๋๋ก ๋ฐฉํดํ๋ ์ด๋ฒคํธ.
์์ฐ์ฌํด, ๊ธฐ์ ์ฅ์ , ์ธ์์ ์ค์ ๋ชจ๋ ํฌํจ.
RTO & RPO
| ์งํ | ์ ์ |
|---|---|
| RTO (Recovery Time Objective) | ์๋น์ค ์ค๋จ ํ ๋ณต๊ตฌ๊น์ง ํ์ฉ ๊ฐ๋ฅํ ์ต๋ ์๊ฐ (โ์ผ๋ง๋ ๋นจ๋ฆฌ ๋์์ฌ ์ ์๋๊ฐ?โ) |
| RPO (Recovery Point Objective) | ๋ง์ง๋ง ๋ฐ์ดํฐ ๋ณต๊ตฌ ์์ ๋ถํฐ ํ์ฉ ๊ฐ๋ฅํ ์ต๋ ์๊ฐ (โ์ผ๋ง๋งํผ์ ๋ฐ์ดํฐ ์์ค์ ํ์ฉํ๋๊ฐ?โ) |
์ฌํด ๋ฐ์ โ โโโโ RPO โโโโ (๋ง์ง๋ง ๋ฐฑ์
์์ ) โ ๋ฐ์ดํฐ ์์ค ๋ฒ์ โ โโโโ RTO โโโโ (์๋น์ค ๋ณต๊ตฌ ์์ ) ์๋น์ค ๋ค์ดํ์ ๋ฒ์๐ RTO, RPO๊ฐ ๋ฎ์์๋ก ๋น์ฉ๊ณผ ๋ณต์ก๋ ์ฆ๊ฐ โ ๋น์ฆ๋์ค ์๊ตฌ์ฌํญ์ ๋ง๋ ์์ค ์ ํ ํ์
Resiliency vs. DR vs. High Availability
| ๊ฐ๋ | ์ ์ | ๋ฒ์ |
|---|---|---|
| Resiliency | ์ธํ๋ผ/์๋น์ค ์ฅ์ ๋ณต๊ตฌ ๋ฅ๋ ฅ | ๊ด๋ฒ์ |
| High Availability | ๋จ์ผ ๊ตฌ์ฑ์์ ์ฅ์ ์์๋ ์๋น์ค ์ง์ | AZ ๋ ๋ฒจ ๋จ์ผ ์ฅ์ |
| Disaster Recovery | ์ผํ์ฑ ์ฌ๋ ์ด๋ฒคํธ ๋ฐ์ ์ ๋ณต๊ตฌ | ๋ฐ์ดํฐ ์ผํฐ/๋ฆฌ์ ๋ ๋ฒจ |
DR์ HA์ ๋ณ๊ฐ์ด๋ฉฐ, HA๊ฐ ์๋ฒฝํด๋ DR ์ ๋ต์ ๋ณ๋๋ก ํ์ํจ.
2. Business Continuity Plan (BCP)
- DR ์ ๋ต์ BCP(๋น์ฆ๋์ค ์ฐ์์ฑ ๊ณํ)์ ํ์ ์งํฉ์ด์ด์ผ ํจ (๋ ๋ฆฝ์ ์ธ ๋ฌธ์ ์๋)
- ๋น์ฆ๋์ค ์ํฅ ๋ถ์ (Business Impact Analysis)์ผ๋ก ์ํฌ๋ก๋ ์ค๋จ์ ๋น์ฆ๋์ค ์ํฅ ์ ๋ํ
- DR ๋ชฉํ๋ ๋น์ฆ๋์ค ์๊ตฌ์ฌํญ, ์ฐ์ ์์, ๋งฅ๋ฝ์ ๊ธฐ๋ฐํด์ผ ํจ
์์: ์ง์ง์ผ๋ก ๋ฌผ๋ฅ๊ฐ ์ฐจ๋จ๋๋ฉด eCommerce ์ฑ DR์ด ์๋ฒฝํด๋ BCP๊ฐ ๋ฌผ๋ฅ๋ฅผ ํด๊ฒฐ ๋ชปํ๋ฉด ๋น์ฆ๋์ค ๋ชฉํ ๋ฌ์ฑ ๋ถ๊ฐ.
3. Data Plane vs. Control Plane
DR ์ ๋ต ์ค๊ณ ์ ํต์ฌ ๊ตฌ๋ถ:
| ๊ตฌ๋ถ | ์ญํ | ๊ฐ์ฉ์ฑ ๋ชฉํ | Failover ์ ์ฌ์ฉ |
|---|---|---|---|
| Data Plane | ์ค์๊ฐ ์๋น์ค ์ ๊ณต | ๋์ | โ ๊ถ์ฅ |
| Control Plane | ํ๊ฒฝ ์ค์ /๊ด๋ฆฌ | ๋ฎ์ | โ ์ง์ |
IMPORTANTFailover ์์ ์๋ Data Plane ์์ ๋ง ์ฌ์ฉ โ Control Plane ์์ (์: AWS Backup ๋ณต์)์ ์ฌํด ์ ์ ๊ทผ ๋ถ๊ฐ๋ฅํ ์ ์์.
TIP๋ฐฑ์ ์์ ๋ฐ์ดํฐ ๋ณต์์ Control Plane ์์ โ ์ ๊ธฐ์ ์ฃผ๊ธฐ ๋ณต์(Scheduled Periodic Restore)์ ๋ฏธ๋ฆฌ ์ค์ ํ์ฌ ๋ณต์๋ ๋ฐ์ดํฐ์คํ ์ด๋ฅผ ํญ์ ๋ณด์ ํด์ผ ํจ.
4. DR ์ ๋ต 4๊ฐ์ง
์ ๋ต ๋น๊ต ํ๋์ ๋ณด๊ธฐ
| ์ ๋ต | RPO | RTO | ๋น์ฉ | ๋ณต์ก๋ | ํธ๋ํฝ ์ ํ |
|---|---|---|---|---|---|
| Backup & Restore | ์๊ฐ ๋จ์ | ์๊ฐ ๋จ์ | ์ต์ ๐ฒ | ์ต์ | Active/Passive |
| Pilot Light | ๋ถ ๋จ์ | ์์ญ ๋ถ | ์ค๊ฐ ๐ฒ๐ฒ | ์ค๊ฐ | Active/Passive |
| Warm Standby | ์ด ๋จ์ | ๋ถ ๋จ์ | ๋์ ๐ฒ๐ฒ๐ฒ | ๋์ | Active/Passive |
| Multi-Site Active/Active | Near-zero | Near-zero | ์ต๊ณ ๐ฒ๐ฒ๐ฒ๐ฒ | ์ต๊ณ | Active/Active |
๋น์ฉ/๋ณต์ก๋ (๋ฎ์ โ ๋์):Backup & Restore โ Pilot Light โ Warm Standby โ Multi-Site Active/Active
RTO/RPO (๋์ โ ๋ฎ์, ์ฆ ๋ณต๊ตฌ ์๊ฐ ๊ธธ์ด์ง):Multi-Site Active/Active โ Warm Standby โ Pilot Light โ Backup & Restore์ ๋ต 1: Backup & Restore (๋ฐฑ์ ๋ฐ ๋ณต์)
๊ฐ๋ : ๋ฐ์ดํฐ๋ฅผ ์ ๊ธฐ์ ์ผ๋ก ๋ฐฑ์ โ ์ฌํด ๋ฐ์ ์ ๋ณต์
[Primary Region] [Recovery Region]EC2 / RDS / EBS ๋ฑ โ โโโ ์ค๋
์ท ์์ฑ (๊ฐ์ ๋ฆฌ์ ) โโโ ์ค๋
์ท ๋ณต์ฌ โโโโโโโโโโโโโโโโโโ S3 / Glacier ์ ์ฅ (์ฌํด ์ ๋ณต์) ์ธํ๋ผ๋ IaC๋ก ์ฌ๋ฐฐํฌํน์ฑ:
- ๊ฐ์ฅ ๋จ์ํ๊ณ ๊ฐ์ฅ ์ ๋ ดํ ์ ๋ต
- Recovery ์ ์ธํ๋ผ ๋ฐฐํฌ + ์ฝ๋ ๋ฐฐํฌ + ๋ฐ์ดํฐ ๋ณต์ ๋ชจ๋ ํ์ โ ๋์ RTO
- PITR(Point-in-Time Recovery) ํ์ฉ ์ RPO๋ฅผ ์ฝ 5๋ถ๊น์ง ๋ฎ์ถ ์ ์์
- ๋ชจ๋ ์ํฌ๋ก๋์ ๊ธฐ๋ณธ ์ ์ฉ (๋ค๋ฅธ ์ ๋ต๊ณผ ํจ๊ป ์ฌ์ฉ)
AWS ์๋น์ค:
- AWS Backup: EC2, EBS, RDS, DynamoDB, EFS, FSx ๋ฑ ์ค์ ์ง์ค ๋ฐฑ์ ๊ด๋ฆฌ
- S3 + S3 Glacier: ๋ฐฑ์ ์ ์ฅ (Glacier: ์์๊ฐ ๋ณต์)
- CloudFormation / CDK: ์ธํ๋ผ ์ฝ๋(IaC)๋ก ๋ณต์ ์๊ฐ ๋จ์ถ
- Amazon EventBridge + Lambda: ๊ฐ์ง ์๋ํ โ RTO ๋จ์ถ
์ ํฉํ ๊ฒฝ์ฐ:
- ๋น์ฆ๋์ค ํฌ๋ฆฌํฐ์ปฌํ์ง ์์ ์ํฌ๋ก๋
- ๋จ์ผ AZ/๋ฐ์ดํฐ ์ผํฐ ์ฅ์ ์์ค์ ์ฌํด๋ง ๊ณ ๋ คํ ๋
- ๋น์ฉ ์ ๊ฐ์ด ์ต์ฐ์ ์ผ ๋ (
cost-effective)
์ ๋ต 2: Pilot Light (ํ์ผ๋ฟ ๋ผ์ดํธ)
๊ฐ๋ : ๋ฐ์ดํฐ๋ ํญ์ ๋ณต์ ์ ์ง โ ํต์ฌ ์ธํ๋ผ๋ง Recovery Region์ ๋ฐฐํฌ โ ์ปดํจํ (EC2 ๋ฑ)์ ๊บผ์ง(Shut-off) ์ํ
[Primary Region] [Recovery Region]์ฑ ์๋ฒ (Active) ์ฑ ์๋ฒ = 0๊ฐ (๋ฐฐํฌ ์ ๋จ)RDS Primary โโโ Async ๋ณต์ โโโ RDS Replica (ํญ์ ์คํ)ELB / ASG ELB / ASG (๋ฐฐํฌ๋จ, ํธ๋ํฝ ์์) โ โ โ ์ฌํด ๋ฐ์ โ โโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโ AMI์์ EC2 ์ธ์คํด์ค ๋ฐฐํฌ + ์ค์ผ์ผ ์์ DNS/Global Accelerator๋ก ํธ๋ํฝ ์ ํํน์ฑ:
- ๋ฐ์ดํฐ๋ ํญ์ ๋ผ์ด๋ธ ๋ณต์ (DB๋ ํญ์ ์ผ์ง)
- ์ปดํจํ ๋ฆฌ์์ค๋ ์ฌํด ์ ๋น๋ก์ ๋ฐฐํฌ โ ๋ฐฐํฌ ์๊ฐ ํฌํจ = RTO ์์ญ ๋ถ
- Warm Standby ๋๋น ๋น์ฉ ์ ๊ฐ (์ปดํจํ ๋น์ฉ ์์)
- Pilot Light vs Warm Standby ํต์ฌ ์ฐจ์ด: Pilot Light๋ ์ปดํจํ ์์ โ ์ฌํด ์ โTurn onโ(๋ฐฐํฌ) ํ์
AWS Elastic Disaster Recovery (DRS):
- Pilot Light ์ ๋ต์ ๊ธฐ๋ฐ์ผ๋ก ๊ตฌํ
- ์์ด์ ํธ ๊ธฐ๋ฐ ๋ธ๋ก ๋ ๋ฒจ ์ฐ์ ๋ณต์ (Block-level replication)
- On-premises/EC2 โ AWS๋ก ๋ณต์ ๊ฐ๋ฅ (๋จ, RDS ์ ์ธ โ EC2 ๊ธฐ๋ฐ DB๋ง)
- RPO: ์ด ๋จ์ / RTO: ๋ถ ๋จ์ ๋ฌ์ฑ ๊ฐ๋ฅ
- Staging Area์ ๋ณต์ ๋ณธ ์ ์ง (์ ๋น์ฉ ์คํ ๋ฆฌ์ง + ์ต์ ์ปดํจํ )
- ๋นํ๊ดด์ (Non-disruptive) ํ ์คํธ ๋๋ฆด ์ง์
- Failover/Failback ๋ชจ๋ ์ง์
AWS ์๋น์ค:
- Aurora Global Database (๋ณต์ )
- Amazon S3 + CloudFormation (๋ฐฑ์ + IaC)
- Route 53 / Global Accelerator (ํธ๋ํฝ ์ ํ)
- AWS Elastic Disaster Recovery
์ ๋ต 3: Warm Standby (์ ์คํ ๋ฐ์ด)
๊ฐ๋ : Recovery Region์ ์ถ์๋(Scaled-down) ์์ ํ ๊ธฐ๋ฅ์ ํ๊ฒฝ ํญ์ ์คํ โ ์ฌํด ์ ์ค์ผ์ผ ์ (Scale up)๋ง ํ๋ฉด ๋จ
[Primary Region] [Recovery Region]์ฑ ์๋ฒ ร N๊ฐ (Full) ์ฑ ์๋ฒ ร 1๊ฐ (Minimum) โ ํญ์ ์คํRDS Primary โโโ ๋ณต์ โโโโโโโโ RDS Replica (ํญ์ ์คํ)ELB / ASG (Full) ELB / ASG (Minimum) โ โ โ ์ฌํด ๋ฐ์ โ โโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโ Scale Out๋ง ํ๋ฉด ๋จ (๋ฐฐํฌ ๋ถํ์) DNS/Global Accelerator๋ก ํธ๋ํฝ ์ ํํน์ฑ:
- ํญ์ ์ต์ํ์ ํ๋ก๋์ ํ๊ฒฝ์ด ์คํ ์ค โ ์ฆ์ ์ผ๋ถ ํธ๋ํฝ ์ฒ๋ฆฌ ๊ฐ๋ฅ
- ์ฌํด ์ ์ค์ผ์ผ ์ ๋ง ํ์ โ Pilot Light๋ณด๋ค ๋ฎ์ RTO
- Pilot Light์ ๋น๊ต: ์ฝ๋์ ์ธํ๋ผ๊ฐ ์ด๋ฏธ ์คํ ์ค์ธ ๊ฒ์ด ์ฐจ์ด
- Full Scale = โHot Standbyโ๋ผ๊ณ ๋ ๋ถ๋ฆผ
Pilot Light vs Warm Standby ์ฐจ์ด ์์ฝ:
| ํญ๋ชฉ | Pilot Light | Warm Standby |
|---|---|---|
| ์ปดํจํ ์ํ | ๋ฐฐํฌ ์ ๋จ (๊บผ์ง) | ์ต์ ๊ท๋ชจ๋ก ์คํ ์ค |
| ์ฌํด ์ ํ๋ | ๋ฐฐํฌ + ์ค์ผ์ผ ์์ | ์ค์ผ์ผ ์์๋ง |
| RTO | ๋ ๋์ | ๋ ๋ฎ์ |
| ๋น์ฉ | ๋ ๋ฎ์ | ๋ ๋์ |
| ์ฆ์ ํธ๋ํฝ ์ฒ๋ฆฌ | โ | โ (์ถ์๋ ์ฉ๋) |
AWS ์๋น์ค:
- Aurora Global Database / RDS Multi-Region Replica
- EC2 Auto Scaling (์ค์ผ์ผ ์ )
- Route 53 / Global Accelerator (Failover ๋ผ์ฐํ )
์ ๋ต 4: Multi-Site Active/Active (๋ฉํฐ ์ฌ์ดํธ ์กํฐ๋ธ/์กํฐ๋ธ)
๊ฐ๋ : 2๊ฐ ์ด์์ AWS Region์์ ๋์์ ํธ๋ํฝ ์ฒ๋ฆฌ โ ํ ๋ฆฌ์ ์ฅ์ ์ ํธ๋ํฝ๋ง ์ฌ๋ผ์ฐํ
[Region A: Active] [Region B: Active]์ฑ ์๋ฒ (Full) ์ฑ ์๋ฒ (Full)RDS โโโโโ ์๋ฐฉํฅ ๋ณต์ โโโโโโ RDS (Aurora Global) โ โ โโโโโ Route 53 / Global Accelerator โโโโโ (๋ ๋ฆฌ์ ๋ชจ๋ ํธ๋ํฝ ์์ )
์ฌํด ๋ฐ์ ์: ํธ๋ํฝ์ ์ฅ์ ๋ฆฌ์ ์์ ๋นผ๋ ๊ฒ๋ง์ผ๋ก ๋ณต๊ตฌํน์ฑ:
- RPO: Near-zero / RTO: Near-zero ๋๋ Zero
- ๋น๋๊ธฐ ๋ฐ์ดํฐ ๋ณต์ ๋ก Near-zero RPO ๋ฌ์ฑ
- ๊ฐ์ฅ ๋์ ๋น์ฉ๊ณผ ๋ณต์ก๋
- ์ฐ๊ธฐ ์ถฉ๋(Write Conflict) ๊ด๋ฆฌ ํ์ (๋ ๋ฆฌ์ ์ ๋์ Write ๊ฐ๋ฅ)
- ๋ฐ์ดํฐ ๋ณต์ ๋ ์ผ๋ถ ์ฌํด๋ก๋ถํฐ๋ง ๋ณดํธ โ PITR(Point-in-Time Recovery)๋ ํจ๊ป ํ์
ํธ๋ํฝ ๋ผ์ฐํ :
- Route 53: ์ง์ญ๋ณ ๋ผ์ฐํ ์ ์ฑ (Geoproximity, Latency ๋ฑ), ๋น์จ ๊ธฐ๋ฐ ๊ฐ์ค์น
- Global Accelerator: AWS Edge Network ํ์ฉ โ ๋ฎ์ ์ง์ฐ ์๊ฐ, DNS ์บ์ ๋ฌธ์ ์์, Traffic Dial๋ก ๋ฆฌ์ ๋ณ ๋น์จ ์ค์
5. Active/Passive vs. Active/Active
| ํญ๋ชฉ | Active/Passive | Active/Active |
|---|---|---|
| ํด๋น ์ ๋ต | Backup & Restore, Pilot Light, Warm Standby | Multi-Site Active/Active |
| ๋์ | Primary์์ ํธ๋ํฝ ์ฒ๋ฆฌ, DR์ Standby | ๋ชจ๋ ๋ฆฌ์ ์์ ํธ๋ํฝ ์ฒ๋ฆฌ |
| Failover ๋ฐฉ๋ฒ | DNS/Global Accelerator๋ก ํธ๋ํฝ ์ ํ | ์ฅ์ ๋ฆฌ์ ์์ ํธ๋ํฝ ๋นผ๊ธฐ๋ง |
| ๋ฐ์ดํฐ ์ถฉ๋ | ์์ | ์ฐ๊ธฐ ์ถฉ๋ ๊ด๋ฆฌ ํ์ |
6. Failover ํธ๋ํฝ ๋ผ์ฐํ ์๋น์ค
| ์๋น์ค | ํน์ง | Active/Active ์ง์ | DNS ์บ์ ๋ฌธ์ |
|---|---|---|---|
| Amazon Route 53 | DNS ๊ธฐ๋ฐ, ๋ค์ํ ๋ผ์ฐํ ์ ์ฑ ์ง์ | โ | ์์ |
| AWS Global Accelerator | Anycast IP, AWS Edge ๋คํธ์ํฌ ์ง์ ์ง์ | โ | โ ์์ |
| Amazon CloudFront | Origin Failover (์์ฒญ ๋จ์), ์ดํ ์์ฒญ์ Primary๋ก | ์ ํ์ | - |
TIPGlobal Accelerator: DNS ์บ์ ๋ฌธ์ ์์, ๋ฎ์ ์ง์ฐ ์๊ฐ โ Active/Active, Pilot Light, Warm Standby ๋ชจ๋ ์ ํฉ
7. AWS ํต์ฌ DR ์๋น์ค
| ์๋น์ค | ์ญํ | ์ฃผ์ ์ ๋ต |
|---|---|---|
| AWS Backup | EC2, EBS, RDS, DynamoDB ๋ฑ ์ค์ ์ง์ค ๋ฐฑ์ | Backup & Restore |
| AWS Elastic Disaster Recovery (DRS) | ๋ธ๋ก ๋ ๋ฒจ ์ฐ์ ๋ณต์ , Failover/Failback | Pilot Light |
| Aurora Global Database | ๋ฆฌ์ ๊ฐ ๋ณต์ < 1์ด, ์ต๋ 5๊ฐ Secondary | Pilot Light, Warm Standby |
| RDS Read Replica (Cross-Region) | ๋น๋๊ธฐ ๋ณต์ | Pilot Light, Warm Standby |
| S3 Cross-Region Replication | ๊ฐ์ฒด ๋ณต์ | ๋ชจ๋ ์ ๋ต |
| CloudFormation / CDK | IaC๋ก DR ๋ฆฌ์ ์ธํ๋ผ ์ ์ ๋ฐฐํฌ | Backup & Restore |
| AWS Resilience Hub | RTO/RPO ๋ชฉํ ๋ฌ์ฑ ์ฌ๋ถ ์ง์ ๊ฒ์ฆ ๋ฐ ์ถ์ | ๋ชจ๋ ์ ๋ต |
| Route 53 / Global Accelerator | Failover ํธ๋ํฝ ๋ผ์ฐํ | ๋ชจ๋ ์ ๋ต |
| Amazon EventBridge + Lambda | ์ฌํด ๊ฐ์ง ์๋ํ, RTO ๋จ์ถ | ๋ชจ๋ ์ ๋ต |
8. DR ํ ์คํ (Testing Disaster Recovery)
WARNINGโ ๏ธ DR ์ ๋ต์ ์ ๊ธฐ์ ์ผ๋ก ํ ์คํธํ์ง ์์ผ๋ฉด ์ค์ ์ฌํด ์ ์๋ ๋ณด์ฅ ๋ถ๊ฐ
ํต์ฌ ์์น
- DR ๊ตฌํ์ ๊ฒ์ฆํ๊ณ DR ๋ฆฌ์ ์ผ๋ก์ Failover๋ฅผ ์ ๊ธฐ ํ ์คํธํ์ฌ RTO/RPO ๋ฌ์ฑ ์ฌ๋ถ ํ์ธ
- โ๊ฑฐ์ ์คํ๋์ง ์๋ ๋ณต๊ตฌ ๊ฒฝ๋กโ ํจํด ํผํ๊ธฐ: ๋๋ฌผ๊ฒ ํ ์คํธ๋ ๊ฒฝ๋ก๋ ์ค์ ์ฅ์ ์ ์คํจ ์ํ
ํ ์คํธํด์ผ ํ๋ ์ด์ (์ค์ ์ฌ๋ก):
๊ฐ์ : Secondary DB๊ฐ Read-only ์ฟผ๋ฆฌ๋ฅผ ๋ด๋น Primary ์ฅ์ ์ Secondary๋ก Write ๊ฐ๋ฅํ๋ค๊ณ ์๊ฐ
ํ์ค: ์ค๋ซ๋์ Failover ํ
์คํธ๋ฅผ ์ ํ๋ค๋ฉด โ Secondary ์ฉ๋์ด ๋ถ์กฑํ๊ฑฐ๋ โ ์๋น์ค ์ฟผํฐ๊ฐ ์ถฉ์กฑ ์ ๋ ์ ์์DR ํ ์คํธ ๋ฐฉ๋ฒ
| ๋ฐฉ๋ฒ | ์ค๋ช |
|---|---|
| Backup ํ ์คํธ | ๋ฐฑ์ ๋ณต์ ์ ๊ธฐ ์คํ (๋จ์ํ ๋ฐฑ์ ์์ฑ์ผ๋ก ์ถฉ๋ถ ์๋) |
| Failover ๋๋ฆด | ์ค์ DR ๋ฆฌ์ ์ผ๋ก Failover ์์ฐ |
| Chaos Engineering | ์๋์ ์ฅ์ ์ฃผ์ ์ผ๋ก ๋ณต๊ตฌ ๋ฅ๋ ฅ ๊ฒ์ฆ |
| DR ๋๋ฆด | Isolated Subnet์์ ์คํ โ ํ๋ก๋์ ๋ฏธ๊ฐ์ญ |
NOTE๐ก AWS Resilience Hub: RTO/RPO ๋ชฉํ ๋ฌ์ฑ ์ฌ๋ถ๋ฅผ ์ง์์ ์ผ๋ก ๊ฒ์ฆํ๋ ์๋น์ค
9. ์ ๋ต ์ ํ ๊ฐ์ด๋
๋จ์ํ ๋ฐ์ดํฐ ์ผํฐ ์ฅ์ ์์ค + ๋น์ฉ ์ต์ํ โ Backup & Restore
๋ฐ์ดํฐ ์ผํฐ ์ฅ์ ์์ค + RPO/RTO ์์ญ ๋ถ + ๋น์ฉ ์ ๊ฐ โ Pilot Light (๋๋ AWS Elastic Disaster Recovery)
๋ฆฌ์ ๋ ๋ฒจ ์ฅ์ + RPO/RTO ๋ถ ๋จ์ + ๋น์ฆ๋์ค ํฌ๋ฆฌํฐ์ปฌ โ Warm Standby
๋ฆฌ์ ๋ ๋ฒจ ์ฅ์ + Near-zero RPO/RTO + ๋ฏธ์
ํฌ๋ฆฌํฐ์ปฌ โ Multi-Site Active/Active๊ท์ ์๊ฑด: ๋ฐ์ดํฐ ๋ ์ง๋์ ์๊ตฌ์ฌํญ์ด ์์ด ๋จ์ผ ๋ฆฌ์ ๋ง ์ฌ์ฉ ๊ฐ๋ฅํ ๊ฒฝ์ฐ โ AZ๋ฅผ Region ๋์ DR ์ฌ์ดํธ๋ก ํ์ฉ ๊ฐ๋ฅ
10. ๋น์ฉ ์ต์ ํ ๊ด์
- AWS๋ ๋ฌผ๋ฆฌ์ Backup Data Center์ ๊ณ ์ ์๋ณธ ๋น์ฉ(CapEx) โ **์ค์ ์ฌ์ฉ๋ ๊ธฐ๋ฐ ์ด์ ๋น์ฉ(OpEx)**์ผ๋ก ์ ํ
- ์จํ๋ ๋ฏธ์ค DR์ ํญ์ 2๋ฒ์งธ ๋ฐ์ดํฐ ์ผํฐ ํ ์ด์ ๋น์ฉ โ AWS์์๋ Pilot Light/Warm Standby๋ก ์ต์ ๋น์ฉ๋ง ์ ์ง
- Glacier / Glacier Deep Archive: ๋ฐฑ์ ์ ์ฅ ๋น์ฉ ๋ํญ ์ ๊ฐ (์์นด์ด๋ธ ๋ฐ์ดํฐ)
- ํ์ ์ด์์ผ๋ก ์๊ฒฉํ ์ ๋ต ์ ํ ๊ธ์ง โ ๋ถํ์ํ ๋น์ฉ ๋ฐ์
๐ ์ํ ์์ฃผ ์ถ์ ํฌ์ธํธ ์ด์ ๋ฆฌ
| ํฌ์ธํธ | ๋ด์ฉ |
|---|---|
| RTO ์ ์ | ์๋น์ค ์ค๋จ ํ ๋ณต๊ตฌ๊น์ง ํ์ฉ ์ต๋ ์๊ฐ |
| RPO ์ ์ | ๋ง์ง๋ง ๋ฐ์ดํฐ ๋ณต๊ตฌ ์์ ์ดํ ํ์ฉ ์ต๋ ์๊ฐ (๋ฐ์ดํฐ ์์ค ํ์ฉ ๋ฒ์) |
| RTO/RPO ๋ฎ์์๋ก | ๋น์ฉ๊ณผ ๋ณต์ก๋ ์ฆ๊ฐ |
| Data Plane vs Control Plane | Failover์๋ Data Plane ์์ ๋ง ์ฌ์ฉ ๊ถ์ฅ |
| Backup & Restore RTO/RPO | ๊ฐ์ฅ ๋์ (์๊ฐ ๋จ์) / ๋น์ฉ ์ต์ |
| Pilot Light ํน์ง | ๋ฐ์ดํฐ ๋ผ์ด๋ธ ๋ณต์ , ์ปดํจํ ๋ฐฐํฌ ์์ |
| Pilot Light vs Warm Standby | Pilot: ์ฌํด ์ โTurn onโ(๋ฐฐํฌ) / Warm: ์ฌํด ์ โScale upโ๋ง |
| Warm Standby ํน์ง | ์ต์ ๊ท๋ชจ ํ๊ฒฝ ํญ์ ์คํ, ์ฆ์ ์ผ๋ถ ํธ๋ํฝ ์ฒ๋ฆฌ ๊ฐ๋ฅ |
| Multi-Site Active/Active | Near-zero RPO/RTO, ๋ชจ๋ ๋ฆฌ์ Active, ์ฐ๊ธฐ ์ถฉ๋ ๊ด๋ฆฌ ํ์ |
| Active/Passive ํด๋น ์ ๋ต | Backup & Restore, Pilot Light, Warm Standby |
| Active/Active ํด๋น ์ ๋ต | Multi-Site Active/Active |
| AWS Elastic DRS ์ ๋ต | Pilot Light ๊ธฐ๋ฐ, ๋ธ๋ก ๋ ๋ฒจ ์ฐ์ ๋ณต์ |
| AWS Elastic DRS ๋์ | On-premises ๋๋ EC2 ๊ธฐ๋ฐ ์ฑ/DB (RDS ์ ์ธ) |
| Global Accelerator ์ฅ์ | DNS ์บ์ ๋ฌธ์ ์์, Edge ๋คํธ์ํฌ ํ์ฉ |
| DR ํ ์คํ ํ์ ์ด์ | ๋๋ฌผ๊ฒ ์คํ๋๋ ๋ณต๊ตฌ ๊ฒฝ๋ก๋ ์ค์ ์ฅ์ ์ ์คํจ ๊ฐ๋ฅ |
| Backup์์ ์๋ ๋ณต์ | AWS SDK๋ก AWS Backup API ํธ์ถ (์๋ ๋ณต์ ๊ธฐ๋ณธ ๋ฏธ์ง์) |
| DR ๋ชฉํ ์ง์ ์ถ์ | AWS Resilience Hub |
| ๋จ์ผ ๋ฆฌ์ ๊ท์ ํ๊ฒฝ DR | AZ๋ฅผ Recovery Site๋ก ํ์ฉ |