Tecnologías Big Data
AWS ofrece un entorno idóneo para implementar soluciones Big Data sobre Cloud pública. Provee múltiples servicios core, además de específicos, que permiten realizar esta tarea con un ajustado time-to-market.
AWS ELASTIC MAP REDUCE
Procesamiento de grandes volúmenes de datos de forma rápida y sencilla utilizando frameworks como Spark, Presto, HBase o Flink.
AWS LAMBDA
Ejecución de código como servicio sin necesidad de configurar o administrar infraestructura. Paga solo por lo que utilices y integralo de forma nativa con el resto de servicios de AWS.
AWS KINESIS
Como otros servicios de AWS, es completamente administrado y fácilmente escalable. Recolecta, procesa y analiza flujos de datos a tiempo real.
AWS REDSHIFT
Base de datos especializada en el almacenamiento y procesamiento de grandes candidades de información, con un rendimiento superior a las bases de datos convencionales gracias a sus capacidades de aprendizaje automático y procesamiento paralelizado.
AWS SIMPLE STORAGE SERVICE
Servicio de almacenamiento de objetos que, dadas sus caraterísticas e integración con el resto de servicios de AWS, es utilizado como Datalake en diversas arquitecturas.
AWS QUICKSIGHT
Servicio gestionado para realizar visualizaciones de los datos presentes en diferentes sistemas de almacenamiento. Sin necesidad de administrar servidores escala de 10 a 10.000 usuarios.
Beneficios de la nube en AWS
Separación entre el cómputo (EMR) y el almacenamiento (S3) en Datalakes, permitiendo el aumento de costes por separado a diferencia de aprovisionar un único cluster.
Posibilidad de aprovisionar cualquier número de clusters de Hadoop de cualquier tamaño, ya sea bajo demanda o para Redshift en analítica interactiva.
Capacidad de utilizar tecnologías de Apache Hadoop (Hive, Pig, Spark, Impala…) o lenguajes orientados a consultas SQL con Redshift y Athena.
Ajuste de infraestructura para tener nodos especializados en cómputo, memoria o red, capaz de responder ante cualquier demanda de rendimiento.
Acceso y ejecución de procesos de datos utilizando roles para las instancias y grupos de seguridad para el acceso de redes.
Datos siempre disponibles gracias a servicios como S3 o DynamoDB, teniendo un óptimo compromiso de servicio.
Capacidad de los componentes para recuperarse de las interrupciones del servicio, incluso con características tales como intentos de jobs.
Servicios gestionados como S3, Athena o Quicksight sin gestión por parte de operaciones.