Big Data se refiere a conjuntos de datos tan grandes y complejos que las herramientas tradicionales de procesamiento de datos no son capaces de gestionarlos. Se caracteriza por las
: Volumen (gran cantidad de datos), Velocidad (rapidez de generación y procesamiento), Variedad (diversidad de formatos y fuentes), Veracidad (calidad y fiabilidad de los datos) y Valor (potencial para generar conocimiento útil).Su importancia actual radica en:1.
Permite a las organizaciones analizar grandes volúmenes de información para identificar patrones, tendencias y correlaciones, facilitando decisiones más informadas y estratégicas.2.
Las empresas pueden comprender mejor el comportamiento y las preferencias de sus clientes, ofreciendo productos, servicios y experiencias más personalizadas.3.
El análisis de Big Data puede revelar necesidades no cubiertas o nuevas oportunidades de mercado, impulsando la innovación.4.
Ayuda a identificar ineficiencias, predecir fallos y optimizar flujos de trabajo en diversas industrias, desde la manufactura hasta la logística.
b) ¿Qué son las bases de datos distribuidas y qué ventajas ofrecen frente a las bases de datos centralizadas?Una base de datos distribuida es un sistema donde los datos se almacenan en múltiples computadoras ubicadas en diferentes sitios, pero que se gestionan de tal manera que parecen una única base de datos lógica para el usuario. Los nodos de almacenamiento están interconectados por una red de comunicaciones.Ventajas frente a las bases de datos centralizadas:1.
Es más fácil escalar un sistema distribuido añadiendo más nodos (escalado horizontal) que aumentar la capacidad de un único servidor centralizado (escalado vertical).2.
Si un nodo falla, el sistema puede seguir funcionando gracias a la redundancia de datos y la distribución de la carga, evitando un único punto de fallo que sí existe en las bases de datos centralizadas.3.
Los datos pueden almacenarse geográficamente cerca de los usuarios que los necesitan con mayor frecuencia, reduciendo la latencia de acceso. Además, las consultas pueden procesarse en paralelo en diferentes nodos.4.
Cada sitio puede mantener cierto control sobre sus propios datos y operaciones, lo que es útil en organizaciones con estructuras descentralizadas.5.
Facilitan la gestión de datos para empresas con operaciones globales, permitiendo la replicación y el acceso eficiente desde diferentes ubicaciones geográficas.





