¿Qué es Big Data?
¿Qué es Big Data?
Big data es la combinación de datos estructurados, semiestructurados y no estructurados obtenida por organizaciones que puede ser analizada y usada en proyectos de machine learning, modelos predictivos y otras aplicaciones avanzadas de análisis.
Los sistemas que procesan y almacenan big data se han convertido en un componente común para el manejo de datos y la arquitectura para procesar los mismos combinando esto con herramientas de análisis de big data.
Inicialmente la Big Data se caracterizaba por “las 3 Vs”:
- Volumen: Gran volumen de datos en muchos ambientes
- Variedad: Inmensa variedad de tipos de datos
- Velocidad: La velocidad a la que se genera, colecta, almacena y procesa toda esta data
Estas características fueron identificadas por primera vez en 2001 por Doug Laney. Ahora hay varias otras Vs que se han añadido en la evolución del concepto y la práctica del análisis de datos, como son veracidad, valor y variabilidad. Las explicaremos más adelante.
A pesar de que Big Data no equivale a un volumen específico de datos, las operaciones usualmente involucran terabyte, petabytes e incluso exabytes de datos creados, almacenados, procesados y analizados.