2548 ๋จ์ด
13 ๋ถ
๐ AWS Database & Data Analytics
๐ AWS Database & Data Analytics
RDS ยท Aurora ยท ElastiCache ยท DynamoDB ยท DocumentDB ยท Neptune ยท Keyspaces ยท Timestream
Athena ยท Redshift ยท OpenSearch ยท EMR ยท QuickSight ยท Glue ยท Lake Formation ยท Flink ยท MSK
๋ชฉ์ฐจ
- DB ์ ํ ์ ์ฒด ๋น๊ต
- RDS (์์ฝ)
- Aurora (์์ฝ)
- ElastiCache (์์ฝ)
- DocumentDB
- Amazon Neptune
- Amazon Keyspaces (for Apache Cassandra)
- Amazon Timestream
- Amazon Athena
- Amazon Redshift
- Amazon OpenSearch Service
- Amazon EMR (Elastic MapReduce)
- Amazon QuickSight
- AWS Glue
- AWS Lake Formation
- Amazon Managed Service for Apache Flink
- Amazon MSK (Managed Streaming for Apache Kafka)
- ๋น ๋ฐ์ดํฐ ์์ง ํ์ดํ๋ผ์ธ ์ํคํ ์ฒ
- ๐ ์ํ ์์ฃผ ์ถ์ ํฌ์ธํธ
DB ์ ํ ์ ์ฒด ๋น๊ต
| ์ ํ | ์๋น์ค | ํน์ง |
|---|---|---|
| RDBMS (OLTP) | RDS, Aurora | SQL, JOIN ๊ฐ๋ฅ |
| NoSQL | DynamoDB, ElastiCache, Neptune, DocumentDB, Keyspaces | JOIN/SQL ์์ |
| Object Store | S3, S3 Glacier | ๋์ฉ๋ ๊ฐ์ฒด, ์์นด์ด๋ธ |
| Data Warehouse (OLAP) | Redshift, Athena, EMR | SQL ๋ถ์, BI |
| Search | OpenSearch | ์ ์ฒด ํ ์คํธ ๊ฒ์, ๋น์ ํ |
| Graph | Neptune | ๊ด๊ณ ๋ฐ์ดํฐ ์๊ฐํ |
| Ledger | QLDB (Quantum Ledger DB) | ๋ณ๊ฒฝ ๋ถ๊ฐ ํธ๋์ญ์ ์ด๋ ฅ |
| Time Series | Timestream | ์๊ณ์ด ๋ฐ์ดํฐ |
RDS (์์ฝ)
- Managed: PostgreSQL / MySQL / Oracle / SQL Server / DB2 / MariaDB / Custom
- Provisioned Instance Size + EBS Volume
- Read Replicas, Multi-AZ, Storage Auto Scaling
- IAM, Security Groups, KMS(rest), SSL(transit)
- PITR ์ต๋ 35์ผ, Manual Snapshot ๋ฌด์ ํ
- RDS Custom: Oracle/SQL Server ์ ์ฉ, OS ๋ฐ DB ์ง์ ์ ๊ทผ ๊ฐ๋ฅ
- Use Case: RDBMS/OLTP, SQL ์ฟผ๋ฆฌ, ํธ๋์ญ์
Aurora (์์ฝ)
- PostgreSQL/MySQL API ํธํ, ์คํ ๋ฆฌ์ง์ ์ปดํจํ ๋ถ๋ฆฌ
- ์คํ ๋ฆฌ์ง: 3 AZ ร 2 = 6๊ฐ ๋ณต์ฌ๋ณธ, Self-healing, Auto Scaling
- ์ปดํจํ : Multi-AZ DB Cluster, Read Replica Auto Scaling
- Aurora Serverless: ์์ธก ๋ถ๊ฐ/๊ฐํ์ ์ํฌ๋ก๋
- Aurora Global: ๋ฆฌ์ ๋น ์ต๋ 16 Read Instance, ๋ฆฌ์ ๊ฐ ๋ณต์ < 1์ด
- Aurora ML: SageMaker/Comprehend ํตํฉ
- Aurora Cloning: ๊ธฐ์กด ํด๋ฌ์คํฐ์์ ๋น ๋ฅด๊ฒ ์ ํด๋ฌ์คํฐ ์์ฑ (์คํ ์ด์ง DB)
- Use Case: RDS์ ๋์ผ + ๋ ๋์ ์ฑ๋ฅ, ๊ฐ์ฉ์ฑ, ์ ์ฐ์ฑ
ElastiCache (์์ฝ)
- Managed Redis / Memcached, Sub-millisecond ์ง์ฐ
- Redis: Multi-AZ, Read Replicas, Backup, AOF ์์์ฑ
- Memcached: Sharding, ๋น์์, ๋ฉํฐ์ค๋ ๋
- ๋ณด์: IAM, Security Groups, KMS, Redis AUTH
- ์ ํ๋ฆฌ์ผ์ด์ ์ฝ๋ ๋ณ๊ฒฝ ํ์
- Use Case: Key/Value ์บ์, ์ธ์ ์คํ ์ด, DB ์ฟผ๋ฆฌ ๊ฒฐ๊ณผ ์บ์
DocumentDB
- Aurora์ AWS ๊ตฌํ์ฒ๋ผ, DocumentDB๋ MongoDB์ AWS ๊ตฌํ
- JSON ๋ฐ์ดํฐ ์ ์ฅ/์ฟผ๋ฆฌ/์ธ๋ฑ์ฑ
- Aurora์ ์ ์ฌํ ๋ฐฐํฌ ๊ฐ๋ : Fully Managed, 3 AZ ๊ณ ๊ฐ์ฉ์ฑ
- ์คํ ๋ฆฌ์ง ์๋ ์ฆ๊ฐ (10 GB ๋จ์)
- ์ด๋น ์๋ฐฑ๋ง req๋ก ์๋ ํ์ฅ
- Use Case: MongoDB ์ํฌ๋ก๋๋ฅผ AWS๋ก ์ด์
Amazon Neptune
- ์์ ๊ด๋ฆฌํ Graph Database
- ์์ญ์ต ๊ฐ ๊ด๊ณ ์ ์ฅ, Millisecond ๋จ์ ์ฟผ๋ฆฌ
- 3 AZ ๊ณ ๊ฐ์ฉ์ฑ, ์ต๋ 15 Read Replicas
- Use Cases: ์์ ๋คํธ์ํฌ, ์ง์ ๊ทธ๋ํ(Wikipedia), ์ฌ๊ธฐ ํ์ง, ์ถ์ฒ ์์ง
Neptune Streams
- Graph ๋ฐ์ดํฐ ๋ณ๊ฒฝ์ ์ค์๊ฐ ์์ ๋ณด์ฅ ์คํธ๋ฆผ
- HTTP REST API๋ก ์ ๊ทผ
- Use Cases: ๋ณ๊ฒฝ ์๋ฆผ, OpenSearch/ElastiCache ๋๊ธฐํ, ๋ฆฌ์ ๊ฐ ๋ณต์
Amazon Keyspaces (for Apache Cassandra)
- Apache Cassandra ํธํ ์์ ๊ด๋ฆฌํ DB
- Serverless, Scalable, Multi-AZ (3 AZ ๋ณต์ )
- Cassandra Query Language (CQL) ์ฌ์ฉ
- Single-digit millisecond ์ง์ฐ, ์ด๋น ์์ฒ req
- On-Demand ๋๋ Provisioned with Auto-scaling
- PITR ์ต๋ 35์ผ
- Use Cases: IoT ๋๋ฐ์ด์ค ๋ฐ์ดํฐ, ์๊ณ์ด ๋ฐ์ดํฐ
Amazon Timestream
- ์์ ๊ด๋ฆฌํ Time Series Database, Serverless
- ํ๋ฃจ ์์กฐ ๊ฐ ์ด๋ฒคํธ ์ฒ๋ฆฌ, ๊ด๊ณํ DB ๋๋น 100๋ฐฐ ๋น ๋ฆ, 1/10 ๋น์ฉ
- ์คํ ๋ฆฌ์ง ํฐ์ด๋ง: ์ต๊ทผ ๋ฐ์ดํฐ โ ๋ฉ๋ชจ๋ฆฌ / ๊ณผ๊ฑฐ ๋ฐ์ดํฐ โ ์ ๋น์ฉ ์คํ ๋ฆฌ์ง
- ๋ด์ฅ ์๊ณ์ด ๋ถ์ ํจ์ (Near real-time ํจํด ์๋ณ)
- SQL ํธํ, ์ํธํ(transit/rest)
- Use Cases: IoT, ์ด์ ๋ชจ๋ํฐ๋ง, ์ค์๊ฐ ๋ถ์
Amazon Athena
- S3์ ์ ์ฅ๋ ๋ฐ์ดํฐ๋ฅผ Serverless SQL๋ก ๋ถ์
- Presto ๊ธฐ๋ฐ, Standard SQL ์ฌ์ฉ
- ์ง์ ํฌ๋งท: CSV, JSON, ORC, Avro, Parquet
- ๊ฐ๊ฒฉ: ์ค์บ๋ ๋ฐ์ดํฐ TB๋น $5.00
- Amazon QuickSight์ ์ฐ๋ํ์ฌ BI ๋์๋ณด๋ ๊ตฌ์ฑ
์ฑ๋ฅ ์ต์ ํ (๋น์ฉ ์ ๊ฐ):
| ๋ฐฉ๋ฒ | ํจ๊ณผ |
|---|---|
| Columnar ํฌ๋งท (Parquet, ORC) | ์ค์บ ๋ฐ์ดํฐ ๊ฐ์ โ ๋น์ฉ ๋ํญ ์ ๊ฐ |
| Glue๋ก ๋ณํ | CSV โ Parquet/ORC ์๋ ๋ณํ |
| ๋ฐ์ดํฐ ์์ถ | bzip2, gzip, snappy ๋ฑ |
| S3 Partitioning | ๊ฐ์ ์ปฌ๋ผ ๊ธฐ๋ฐ ํํฐ์ ๋์ผ๋ก ์ค์บ ๋ฒ์ ์ถ์ |
| ํฐ ํ์ผ ์ฌ์ฉ | > 128 MB ๊ถ์ฅ (์ํ ํ์ผ ์ค๋ฒํค๋ ์ ๊ฑฐ) |
Federated Query:
- ๊ด๊ณํ/๋น๊ด๊ณํ/S3 ๋ฑ ๋ค์ํ ์์ค๋ฅผ SQL๋ก ํตํฉ ์ฟผ๋ฆฌ
- Lambda ๊ธฐ๋ฐ Data Source Connector ์ฌ์ฉ (CloudWatch Logs, DynamoDB, RDS ๋ฑ)
๐ ์ํ Tip: โS3 ๋ฐ์ดํฐ๋ฅผ Serverless SQL๋ก ๋ถ์โ โ Athena
Amazon Redshift
- PostgreSQL ๊ธฐ๋ฐ์ด์ง๋ง OLAP (๋ฐ์ดํฐ ์จ์ดํ์ฐ์ค), OLTP ์๋
- Columnar Storage + ๋ณ๋ ฌ ์ฟผ๋ฆฌ ์์ง โ Petabyte ๊ท๋ชจ ๋ถ์
- Athena๋ณด๋ค Index ๋๋ถ์ ๋ ๋น ๋ฅธ Join/์ง๊ณ
- BI ๋๊ตฌ (QuickSight, Tableau) ํตํฉ
ํด๋ฌ์คํฐ ๊ตฌ์กฐ
[Leader Node] : ์ฟผ๋ฆฌ ๊ณํ + ๊ฒฐ๊ณผ ์ง๊ณ[Compute Nodes] : ์ค์ ์ฟผ๋ฆฌ ์คํ (N๊ฐ)๋ ๊ฐ์ง ๋ชจ๋: Provisioned Cluster / Serverless Cluster
Snapshots & DR
- ์ผ๋ถ ํด๋ฌ์คํฐ์ Multi-AZ ๋ชจ๋ ์ง์
- Snapshot = ํด๋ฌ์คํฐ์ PITR ๋ฐฑ์ (S3 ๋ด๋ถ ์ ์ฅ, Incremental)
- ์๋ ๋ฐฑ์ : 8์๊ฐ๋ง๋ค / 5 GB๋ง๋ค / ์ค์ผ์ค ๊ธฐ๋ฐ
- ์๋ ๋ฐฑ์ : ๋ช ์์ ์ญ์ ์ ๊น์ง ์ ์ง
- ๋ค๋ฅธ ๋ฆฌ์ ์ผ๋ก Snapshot ์๋ ๋ณต์ฌ ์ค์ ๊ฐ๋ฅ
๋ฐ์ดํฐ ๋ก๋ฉ ๋ฐฉ๋ฒ
| ๋ฐฉ๋ฒ | ์ค๋ช |
|---|---|
| Kinesis Data Firehose | Firehose โ S3 โ COPY๋ก Redshift ์ ์ฌ |
| S3 COPY ๋ช ๋ น | IAM Role๋ก S3์์ ์ง์ COPY (VPC ๋ผ์ฐํ ๊ฐ๋ฅ) |
| EC2 + JDBC | ๋ฐฐ์น๋ก ๋ฐ์ดํฐ ์ ์ก (๋๋ Insert๊ฐ ์ ๋ฆฌ) |
Redshift Spectrum
- S3 ๋ฐ์ดํฐ๋ฅผ Redshift์ ๋ก๋ฉํ์ง ์๊ณ ์ง์ ์ฟผ๋ฆฌ
- Redshift Cluster๊ฐ ์์ด์ผ ํจ (์ฟผ๋ฆฌ๋ ์์ฒ ๊ฐ Spectrum ๋ ธ๋์์ ์ฒ๋ฆฌ)
Amazon OpenSearch Service
- Amazon ElasticSearch์ ํ์ ์๋น์ค
- ์ด๋ค ํ๋๋ ์ ์ฒด ํ ์คํธ ๊ฒ์ ๊ฐ๋ฅ (DynamoDB๋ Primary Key/Index๋ง)
- ๋ค๋ฅธ DB์ ๋ณด์์ฌ๋ก ์ผ๋ฐ์ ์ผ๋ก ์ฌ์ฉ
- Managed Cluster ๋๋ Serverless ๋ชจ๋
- ๊ธฐ๋ณธ SQL ๋ฏธ์ง์ (ํ๋ฌ๊ทธ์ธ์ผ๋ก ํ์ฑํ ๊ฐ๋ฅ)
- ๋ฐ์ดํฐ ์์ง: Kinesis Data Firehose, IoT, CloudWatch Logs
- ๋ณด์: Cognito, IAM, KMS, TLS
- OpenSearch Dashboards (์๊ฐํ) ํฌํจ
OpenSearch ํตํฉ ํจํด
DynamoDB + OpenSearch:
[์ฑ CRUD] โ [DynamoDB] โ [DynamoDB Stream] โ [Lambda] โ [OpenSearch][์ฑ ๊ฒ์] โ OpenSearch API โ ๊ฒ์ ๊ฒฐ๊ณผ โ DynamoDB์์ ์์ธ ์กฐํCloudWatch Logs:
CloudWatch Logs โ Subscription Filter โ Lambda โ OpenSearch (Real-time)CloudWatch Logs โ Subscription Filter โ Firehose โ OpenSearch (Near real-time)Kinesis:
KDS โ Firehose โ OpenSearch (Near real-time)KDS โ Lambda โ OpenSearch (Real-time)Amazon EMR (Elastic MapReduce)
- Hadoop ํด๋ฌ์คํฐ ๊ธฐ๋ฐ ๋น ๋ฐ์ดํฐ ๋ถ์ ํ๋ซํผ
- ์๋ฐฑ ๊ฐ์ EC2 ์ธ์คํด์ค๋ก ๊ตฌ์ฑ๋ ํด๋ฌ์คํฐ
- Apache Spark, HBase, Presto, Flink ๋ฒ๋ค ํฌํจ
- ํ๋ก๋น์ ๋/์ค์ ์๋ํ, Auto Scaling, Spot Instance ํตํฉ
๋ ธ๋ ์ ํ ๋ฐ ๊ตฌ๋งค ์ต์
| ๋ ธ๋ ์ ํ | ์ญํ | ํน์ฑ |
|---|---|---|
| Master Node | ํด๋ฌ์คํฐ ๊ด๋ฆฌ, ์ํ ์กฐ์จ | Long-running |
| Core Node | ์์ ์คํ + ๋ฐ์ดํฐ ์ ์ฅ | Long-running |
| Task Node | ์์ ์คํ๋ง | ์ผ๋ฐ์ ์ผ๋ก Spot Instance |
| ๊ตฌ๋งค ๋ฐฉ์ | ํน์ง |
|---|---|
| On-Demand | ์์ ์ , ์ข ๋ฃ ์์ |
| Reserved | ๋น์ฉ ์ ๊ฐ (๊ฐ์ฉ ์ EMR ์๋ ์ฌ์ฉ) |
| Spot | ์ ๋ ดํ์ง๋ง ์ข ๋ฃ ๊ฐ๋ฅ, ๋ ์์ ์ |
Amazon QuickSight
- Serverless ML ๊ธฐ๋ฐ BI(Business Intelligence) ์๋น์ค
- ์ธํฐ๋ํฐ๋ธ ๋์๋ณด๋ ์์ฑ, ์๋ ํ์ฅ, Session ๋จ์ ๊ณผ๊ธ
- SPICE ์์ง: ๋ฐ์ดํฐ Import ์ In-memory ๊ณ์ฐ
- Enterprise ๋ฒ์ : Column-Level Security (CLS)
ํตํฉ ๋ฐ์ดํฐ ์์ค:
- RDS, Aurora, Redshift, Athena, S3, OpenSearch, Timestream
- Salesforce, Jira, Teradata, ์จํ๋ ๋ฏธ์ค DB (JDBC)
- ํ์ผ: xlsx, csv, json, tsv, elf/clf
๋์๋ณด๋ ๊ณต์ :
- Users (Standard) / Groups (Enterprise) โ QuickSight ๋ด๋ถ ๊ฐ๋ (IAM๊ณผ ๋ณ๊ฐ)
- ๋์๋ณด๋ ๊ณต์ ์ ๋ฐ๋์ Publish ํ์
- ๋์๋ณด๋๋ฅผ ๋ณด๋ ์ฌ์ฉ์๋ ๊ธฐ์ ๋ฐ์ดํฐ๋ ๋ณผ ์ ์์
AWS Glue
- ์์ ๊ด๋ฆฌํ ETL (Extract, Transform, Load) ์๋น์ค, Serverless
- S3 ๋๋ RDS ๋ฐ์ดํฐ โ Glue ETL(๋ณํ) โ Redshift ๋ก๋
Glue Data Catalog
- S3, RDS, DynamoDB, JDBC โ Glue Data Crawler โ Glue Data Catalog (๋ฉํ๋ฐ์ดํฐ)
- Athena, Redshift Spectrum, EMR์ด Catalog๋ฅผ ํตํด ๋ฐ์ดํฐ ๊ฒ์
Glue ์ฃผ์ ๊ธฐ๋ฅ
| ๊ธฐ๋ฅ | ์ค๋ช |
|---|---|
| Job Bookmarks | ์ด๋ฏธ ์ฒ๋ฆฌํ ๋ฐ์ดํฐ ์ฌ์ฒ๋ฆฌ ๋ฐฉ์ง |
| DataBrew | ์ฝ๋ ์๋ ์ฌ์ ๋น๋ ๋ณํ์ผ๋ก ๋ฐ์ดํฐ ์ ์ |
| Glue Studio | ETL Job ์์ฑ/์คํ/๋ชจ๋ํฐ๋ง GUI |
| Streaming ETL | Kinesis Data Streams, Kafka, MSK ๊ธฐ๋ฐ ์คํธ๋ฆฌ๋ฐ ETL (Spark Structured Streaming) |
CSV โ Parquet ๋ณํ ํจํด
[S3 Input] โ(Put)โโ Glue ETL (CSV โ Parquet ๋ณํ) โ [S3 Output] โ Lambda/EventBridge ํธ๋ฆฌ๊ฑฐ ๊ฐ๋ฅโ Athena๊ฐ Parquet ํ์ผ๋ก ํจ์ฌ ์ ์ ๋น์ฉ์ผ๋ก ์ฟผ๋ฆฌ ๊ฐ๋ฅAWS Lake Formation
- Data Lake = ๋ถ์์ฉ ์ค์ ๋ฐ์ดํฐ ์ ์ฅ์
- ๋ณต์กํ ์๋ ๋จ๊ณ(์์ง, ์ ์ , ์ด๋, ์นดํ๋ก๊ทธ) ์๋ํ
- ์ ํ/๋น์ ํ ๋ฐ์ดํฐ ๊ฒฐํฉ
- Source Blueprints: S3, RDS, ๊ด๊ณํ/NoSQL DB
- Row-level / Column-level Fine-grained Access Control
- AWS Glue ์์ ๊ตฌ์ถ
์ค์ ๊ถํ ๊ด๋ฆฌ
[Athena] โโ [QuickSight][Lake Formation] โ Column-level ์ ๊ทผ ์ ์ด ์ค์ โ Athena, QuickSight๊ฐ Lake Formation์ ๊ถํ์ ๋ฐ๋ฆโ ๊ฐ ์๋น์ค๋ณ๋ก ๋ณ๋ ์ ๊ทผ ์ ์ด ๋ถํ์ โ ์ค์ ์ง์ค์ ๋ณด์Amazon Managed Service for Apache Flink
- ์ด์ ์ด๋ฆ: Kinesis Data Analytics for Apache Flink
- Java, Scala, SQL๋ก ๋ฐ์ดํฐ ์คํธ๋ฆผ ์ฒ๋ฆฌ
- ์์ค: Kinesis Data Streams ๋๋ Amazon MSK (Kafka)
- ์์ ๊ด๋ฆฌํ: ํ๋ก๋น์ ๋, ๋ณ๋ ฌ ์ฒ๋ฆฌ, ์๋ ์ค์ผ์ผ๋ง, ๋ฐฑ์ (Checkpoint/Snapshot)
- โ ๏ธ Amazon Data Firehose์์ ์ง์ ์ฝ๊ธฐ ๋ถ๊ฐ (Data Streams์์๋ง)
Amazon MSK (Managed Streaming for Apache Kafka)
- Kinesis์ ๋์: AWS์์ ์์ ๊ด๋ฆฌํ Kafka
- Kafka Broker Node + Zookeeper ๋ ธ๋ ์๋ ๊ด๋ฆฌ
- VPC ๋ด ๋ฐฐํฌ, Multi-AZ (์ต๋ 3 AZ)
- ๋ฐ์ดํฐ๋ฅผ EBS์ ์ํ๋ ๊ธฐ๊ฐ๋งํผ ์ ์ฅ
- MSK Serverless: ์ฉ๋ ๊ด๋ฆฌ ์์ด Kafka ์คํ
Kinesis Data Streams vs. Amazon MSK
| ํญ๋ชฉ | Kinesis Data Streams | Amazon MSK |
|---|---|---|
| ๋ฉ์์ง ํฌ๊ธฐ | 1 MB ์ ํ | ๊ธฐ๋ณธ 1 MB, ์ต๋ 10 MB ์ค์ ๊ฐ๋ฅ |
| ๊ตฌ์กฐ | Shards | Kafka Topics with Partitions |
| ํ์ฅ | Shard ๋ถํ /๋ณํฉ ๊ฐ๋ฅ | ํํฐ์ ์ถ๊ฐ๋ง ๊ฐ๋ฅ |
| ์ํธํ (in-flight) | TLS | PLAINTEXT ๋๋ TLS |
| ์ํธํ (at-rest) | KMS | KMS |
MSK Consumers: Apache Flink, Glue (Streaming ETL), Lambda, EC2/ECS/EKS ์ฑ
๋น ๋ฐ์ดํฐ ์์ง ํ์ดํ๋ผ์ธ ์ํคํ ์ฒ
[IoT Devices] โ โผ[Kinesis Data Streams] โ ์ค์๊ฐ ์์ง โ โผ[Kinesis Data Firehose] โ Near real-time ์ ๋ฌ โ โผ[S3 (Ingestion Bucket)] โ Raw ๋ฐ์ดํฐ ์ ์ฅ โ โ โ โผ (์ ํ) โ [SQS โ Lambda] โ ์ด๋ฒคํธ ๊ธฐ๋ฐ ์ฒ๋ฆฌ โ โผ[Amazon Athena] โ Serverless SQL ๋ถ์ โ โผ[S3 (Reporting Bucket)] โ ๋ถ์ ๊ฒฐ๊ณผ ์ ์ฅ โ โโโโ [QuickSight] โ BI ๋์๋ณด๋ โโโโ [Redshift] โ ๋ฐ์ดํฐ ์จ์ดํ์ฐ์ค๐ ์ํ ์์ฃผ ์ถ์ ํฌ์ธํธ
| ํฌ์ธํธ | ๋ด์ฉ |
|---|---|
| DocumentDB | MongoDB ํธํ AWS ๊ตฌํ |
| Neptune Use Case | ์์ ๊ทธ๋ํ, ์ฌ๊ธฐ ํ์ง, ์ถ์ฒ ์์ง |
| Keyspaces | Apache Cassandra ํธํ |
| Timestream | ์๊ณ์ด DB, IoT/์ด์ ๋ชจ๋ํฐ๋ง |
| Athena ๊ฐ๊ฒฉ | ์ค์บ๋ TB๋น $5 |
| Athena ๋น์ฉ ์ ๊ฐ | Parquet/ORC ํฌ๋งท + Partitioning |
| Athena Federated Query | Lambda Data Source Connector ์ฌ์ฉ |
| Athena vs Redshift | ๊ฐ๋จ S3 ์ฟผ๋ฆฌ โ Athena / ๋ณต์ก Join/์ง๊ณ โ Redshift |
| Redshift Spectrum | S3 ๋ฐ์ดํฐ๋ฅผ Redshift์ ๋ก๋ฉ ์์ด ์ฟผ๋ฆฌ |
| Redshift ๋ฆฌ์ ๊ฐ Snapshot | ์๋ ๋ณต์ฌ ์ค์ ๊ฐ๋ฅ |
| OpenSearch ํน์ง | ์ด๋ค ํ๋๋ ๊ฒ์ ๊ฐ๋ฅ (DynamoDB์ ์ฐจ์ด) |
| Glue Catalog | Athena/Redshift Spectrum/EMR์ด ์ฌ์ฉํ๋ ๋ฉํ๋ฐ์ดํฐ ์ ์ฅ์ |
| Lake Formation ํน์ง | Row/Column ๋ ๋ฒจ ์ธ๋ฐํ ์ ๊ทผ ์ ์ด |
| Flink ์์ค | Kinesis Data Streams ๋๋ MSK (Firehose ์๋) |
| MSK vs Kinesis | MSK: ๋ฉ์์ง ํฌ๊ธฐ ์ต๋ 10 MB, ํํฐ์ ์ถ๊ฐ๋ง ๊ฐ๋ฅ |
| QuickSight SPICE | In-memory ๊ณ์ฐ ์์ง |
| QuickSight Users/Groups | QuickSight ๋ด๋ถ ๊ฐ๋ (IAM๊ณผ ๋ณ๊ฐ) |
| EMR Task Node | ์ฃผ๋ก Spot Instance ์ฌ์ฉ |