Datos y más datos; ¿qué hacer con ellos?
Con el crecimiento sin precedentes de la información, las empresas tienen el desafío de gestionar y obtener valor.
El rápido crecimiento de datos no estructurados (archivos y objetos) representa un reto importante para las empresas de hoy. Los Big Data requieren gran capacidad de almacenamiento, y según estima la industria, más del 75% de esa capacidad es para datos no estructurados. Éstos se duplican cada dos años, impulsados por el Internet de las Cosas (IoT), el crecimiento en media y en datos de video, así como los flujos de trabajo de video-vigilancia.
A medida que el volumen y las fuentes de datos se han expandido dramáticamente, las técnicas tradicionales para almacenar, gestionar y analizar la información han demostrado ser demasiado costosas y lentas para manejar los volúmenes masivos que producen las organizaciones modernas.
Muchas de ellas también son desafiadas por la proliferación de silos de almacenamiento, difíciles de manejar y proteger. La adición de más estrés a su infraestructura de TI y las presiones competitivas están llevando a las empresas a adoptar aplicaciones de nueva generación para maximizar los resultados de negocio. Además, saben que únicamente almacenar datos no añade valor al negocio a menos que sean capaces de hacer una correlación cruzada de datos de múltiples fuentes y obtengan información predictiva a partir de los datos.
Para enfrentar los retos antes mencionados está el llamado Lago de Datos, o Data Lake, tendencia que consta de una infraestructura holística para colectar datos, aplicaciones y análisis de los mismos. Los datos (metadatos) requieren ser almacenados, administrados y asegurados independientemente de la fuente o el destino. Un Lago de Datos habilita la capacidad de análisis de los que están almacenados cada que sea necesario; hasta el punto de inicio de los datos y de ingesta.
5 ventajas del Lago de Datos
1. Genera un almacenamiento eficiente, mediante la eliminación de los silos, lo que simplifica la gestión del almacenamiento y mejorar su utilización.
2. Incrementa la escalabilidad masiva, pues el Data Lake se construye a partir de las arquitecturas de escalabilidad horizontal, es masivamente escalable, eficiente y simple de manejar.
3. Ayuda a una mayor flexibilidad operacional dado que permite aprovechar las capacidades de múltiples protocolos para apoyar una amplia gama de cargas de trabajo (3ª generación) de la plataforma tradicional y de plataformas modernas.
4. Permite hacer analítica de Big Data, ya que el Data Lake aprovecha la infraestructura de almacenamiento compartido y soporta para protocolos como HDFS para entregar análisis eficientes, además de que optimiza los costos puesto que no se requiere una infraestructura adicional para hacer analítica.
5. Brinda seguridad, al proteger los activos de datos con copia de seguridad eficiente y flexible, y facilitar la recuperación ante desastres para asegurar, de forma eficiente, la información.
Zuney Rojas,es Gerente Regional Territorial para Plataformas de Archivos y Objetos de EMC (Dell Technologies)