<aside> 💡
Servicio de query serverless para analizar los datos almacenados en Amazon S3.
</aside>
Usa lenguaje SQL standard para hacer query a los files (construida en Prest)
Soporta CSV, JSON, ORC, Avro y Parquet.
Se paga: 5 dólares por TB de datos escaneado.
—> Comunmente usando con Amazon Quicksight para reporting/dashboards
Casos de uso de BI, analytics, reporting, analyze and query any type of logs from AWS (VPC, CloudTrail, ELB, etc.)
Cada vez que se tenga que analizar datos con SQL y que sea serverlesss, generalmente la respuesta va a ser Amazon Athena.

¿Cómo mejora el rendimiento?

¿Qué es la Federated Query?
Permite hacer queries SQL en bases de datos relacionales, no relacionales, de objetos y data sources personalizadas (tanto AWS como on-premises)
Usa Data Source Connectores que corren en un AWS Lambda para ejecutar Federated Queries.
Los resultados pueden guardarse en Amazon S3 para análisis a futuro.

<aside> 💡
Base de datos basada en PostgreSQL pero no es usada para OLTP sino para OLAP (online analytical processing)
</aside>
10x better performance que otros data warehouses, escala a PBs de datos.
Los datos se guardan en formato columnar y posee un query parallel engine.
Dos modos: Provisioned cluster o Serverless cluster.
Tiene una interfaz SQL para performar queries.
Se integra con Amazon Quicksight o Tableau (herramientas de BI).
vs. Athena: Es una base de datos o warehouse completo, tiene faster queries, joins y agregaciones gracias los indexes.
¿Cómo funciona un Redshift Cluster?
Nota: En modo provisionado se puede elegir los tipos de instancia y se pueden reservar instancias para ahorrar en costos.
