1
FACULTAD DE CIENCIAS
ADMINISTRATIVAS
CARRERA LICENCIATURA EN
MERCADOTECNIA
7MO SEMESTRE
SISTEMAS DE INFORMACION GERENCIAL
ESTUDIANTE:
QUINTO VARAS NURIA PAMELA
CICLO II 2023 – 2024
2
Big Data
Resumen de la investigación
Big data es una combinación de tecnologías de gestión de datos que han
evolucionado en las ultimas décadas.
Permite a las compañías almacenar y manipular grandes volúmenes de datos a la
velocidad adecuada y en el momento indicado.
Algunos datos son estructurados y están almacenados en bases de datos, sin
embargo, otros, incluyendo documentos, imágenes y videos, son desestructurados.
Además, las compañías tienen que considerar datos obtenidos de nuevas fuentes como son
los sensores, las redes sociales, las páginas web, etc.
Describe un gran volumen de datos, el cual crece de manera exponencial con el
paso del tiempo. En pocas palabras, es un conjunto de datos tan grande y complejo que
ninguna de las herramientas tradicionales de datos es capaz de almacenarlos o procesarlos
de manera eficiente.
No obstante, este volumen de datos se puede utilizar para abordar problemas
empresariales que no hubieras podido enfrentar antes. (UCSP, 2023)
Las fuentes de procedencia más habituales de estos grandes volúmenes de datos
son:
Procesamiento de datos: ¿cómo se realiza?
La mayoría de las personas utiliza algún tipo de tecnología o servicio online como
Gmail o Facebook. Estas empresas nos permiten que enviemos e intercambiemos datos y, a
su vez, utilizan los datos que les ofrecemos.
Es decir, los servicios en línea, sitios web, aplicaciones y muchos otros dispositivos
analizan datos constantemente para conseguir que sus servicios sean más eficaces y
3
desarrollar nuevos productos. Y para ello, utilizan herramientas y servicios de Big Data
(como Hadoop o NoSQL) para analizar y procesar el gran volumen de datos generados, con
el fin de mejorar su oferta. Pero no se queda ahí. Un día alguien pensó: «¿Por qué no
usamos los datos masivos para que las máquinas aprendan por sí solas?». Así es como
nació el aprendizaje automático, o machine learning, lo que también comenzó a generar
más datos.
Datos y más datos, con aplicaciones casi infinitas que te ayudan a tomar decisiones,
resolver problemas e incluso escribir una respuesta automática en tu correo o LinkedIn.
Tipos de Big Data
Los datos se pueden clasificar según su estructura, y así podemos distinguir entre:
• Datos estructurados
• Datos no estructurados
• Datos semiestructurados
Datos estructurados;
Los datos estructurados tienen un formato fijo y a menudo son numéricos. Este tipo
de datos es información que ya está ordenada en bases de datos y hojas de cálculo, que
están almacenadas en bases de datos SQL, lagos de datos y almacenes de datos. Por ello,
en muchos casos, las máquinas (en lugar de los seres humanos) pueden gestionar los datos
estructurados con éxito.
Datos no estructurados;
Los datos no estructurados es información que carece de organización y no está en
un formato predeterminado porque puede ser muy diversa. Los datos recopilados de fuentes
de redes sociales son un buen ejemplo. Se pueden convertir en archivos de documentos de
texto almacenados en Hadoop, como clústeres o sistemas NoSQL.
4
Datos semiestructurados;
Los datos semiestructurados pueden contener ambas formas de datos, como, por
ejemplo, los registros de servidores web o los datos de sensores que se hayan configurado.
Para ser precisos, son datos que, a pesar de no estar clasificados en un repositorio concreto
(una base de datos), contienen información vital o etiquetas que segregan elementos
individuales dentro de los datos.
El Big Data habitualmente procede de múltiples fuentes, que además pertenecen a
tipos de fuentes diferentes. Por este motivo, no siempre es fácil saber cómo integrar todas
las herramientas necesarias para trabajar con distintos tipos de datos. (ware) (Reserved.,
2022)
El Big Data tiene tres características principales llamadas “las tres v”:
• Volumen: Refiere a la cantidad de información que se genera a cada
segundo desde cualquier dispositivo capaz de procesar datos.
• Velocidad: Tiene que ver con el movimiento de estos datos y mide la rapidez
con la que se producen y modifican además del ritmo con el que se deben
procesar.
• Variedad: Implica los diferentes tipos de datos que se poseen. (Gómez,
2021)
¿Cómo funciona el Big Data?
Hay cinco pasos para que las empresas puedan gestionar esta inmensidad de datos
que implica el Big Data:
• Establecer una estrategia de datos. Diseñar un plan ayuda a controlar y
mejorar la forma en que se gestionan, almacenan y comparten los datos
dentro y fuera de la empresa. Es el piso sobre el que se sustenta toda la
5
estrategia de Big Data y debe considerar los objetivos del negocio, así como
las tecnologías con las que cuenta.
• Identificar fuentes de Big Data. Las fuentes pueden ser tanto de redes
sociales, videos, imágenes, voz, texto, sonido, data.gov (datos abiertos y
públicos), fuentes de datos en la nube, proveedores y clientes, como del
Internet de las Cosas.
• Gestionar y almacenar los datos. Los softwares de Big Data proporcionan
velocidad, potencia y flexibilidad para manejar grandes cantidades de datos.
De este modo, es importante tener métodos confiables para integrar los
datos, asegurar su calidad y gestionar el almacenamiento de estos para
preparar el análisis.
• Analizar los datos. Con los softwares de gestión de Big Data las empresas
pueden analizar los datos recopilados y almacenados y obtener valor e
información a partir de ellos.
• Tomar decisiones basadas en los datos. Los datos presentan una
evidencia confiable y clara. Las organizaciones que basan sus decisiones en
la información aportada por los datos se desempeñan mejor, predicen mejor
sus riesgos y oportunidades y son más rentables. (esic.edu, 2018)
7 beneficios de utilizar Big Data
• Mejora la toma de decisiones. Mediante el análisis de datos se puede
reducir riesgos, captar nuevas oportunidades y prevenir accidentes. Así, es
posible tomar decisiones con más información de manera rápida y con más
probabilidad de éxito.
• Permite anticiparse a los cambios del mercado. Los análisis predictivos
aplicados al mercado permiten identificar tendencias y anticipar los
movimientos de la competencia. De este modo, las empresas serán capaces
de definir estrategias más adecuadas a cada contexto.
6
• Optimiza los costos. El Big Data genera mayor productividad en las
empresas ya que reduce los costos al tener información actualizada
constantemente. Además, contar con un software en la nube implica el ahorro
de grandes infraestructuras para el almacenamiento de datos.
• Permite mejorar la segmentación de bases de datos. Gracias al análisis
del comportamiento de los clientes, es posible orientar productos y servicios a
los clientes específicos que los consuman teniendo en cuenta sus deseos y
necesidades. Es decir, el Big Data permite realizar un marketing
personalizado, campañas de comunicación específicas y call to action más
efectivos.
• Provee seguridad en los datos. Al mantener un control rápido y eficaz de
los datos de la empresa es posible identificar posibles amenazas internas y
externas. Además, permite detectar puntos débiles en la seguridad para
reforzar.
• Mejora la accesibilidad de la información dentro de una empresa. Tener
datos digitalizados y herramientas de búsqueda de información posibilita una
dinámica de trabajo fluida y mayores beneficios para la empresa.
• Posibilita ventajas comparativas. El análisis del comportamiento de los
clientes ayuda a fijar precios y optimizar los inventarios en función de la
demanda en tiempo real. (worldsys, 2022)
Cuerpo del documento:
El Big Data se genera a través de muchas de las actividades que realizamos a diario.
Por ello, las fuentes de datos son verdaderamente diversas: dispositivos GPS, sensores de
reconocimiento facial o emails son solo algunos ejemplos.
7
El Big Data transformó el mundo empresarial de muchas maneras. Desde mejorar la
gestión de inventario y automatizar el reclutamiento de nuevos talentos hasta analizar el
comportamiento de los clientes.
En análisis predictivo que permite el Big Data genera muchas posibilidades. Las
empresas podrán comprender las necesidades de sus consumidores a través de
información generada por software de procesamiento de datos. También reducirá el tiempo
y los esfuerzos en la evaluación de nuevos candidatos.
Además, el Big Data en empresas cambió exponencialmente la lucha contra el
fraude y otros delitos. A través de la recopilación y el análisis de datos se pueden observar
patrones para detectar fraudes y estafas. Esto permite adelantarse al hecho y generar
mecanismos de prevención y protección. La idea principal del Big Data es que permite tener
acceso a más información. Y cuanta más información se tiene, mayor es el entendimiento y
mejor se pueden tomar decisiones o buscar soluciones.
En muchos casos, el proceso de análisis de los datos está totalmente automatizado,
es decir, se disponen de herramientas tan avanzadas que crean millones de simulaciones
para obtener el mejor resultado posible. Pero para conseguirlo con la ayuda de las
herramientas analíticas, el aprendizaje automático o incluso la inteligencia artificial, hay que
saber cómo funciona el Big Data y configurar cada elemento correctamente.
La necesidad de gestionar tantos datos requiere una infraestructura estable y bien
estructurada. ¿Por qué? Puesto que es necesario procesar rápidamente grandes volúmenes
de datos y tipos de datos diferentes, un único servidor o clúster se puede sobrecargar.
Por eso, los científicos de datos necesitan un sistema bien pensado para gestionar el
Big Data, que tenga una capacidad suficiente para soportar todos los procesos necesarios.
Y en el caso de las grandes empresas, pueden hacer falta cientos o miles de servidores.
Como te imaginas, esto puede salir caro. Y cuando añades todas las herramientas que se
requieren, todavía se encarece más.
8
Para crear el mejor sistema posible y elaborar un presupuesto de antemano, es
necesario saber cuáles son las tres acciones principales que se realizan con las grandes
cantidades de datos.
Conclusión:
Big Data es una tecnología que ayuda con el manejo de grandes volúmenes de
información, utilizado principalmente por grandes empresas, pero con la ayuda del fácil
acceso podrá ser utilizado por cualquier empresa o institución que desee vincularse al nuevo
proceso que se puede lograr en la gestión de la información.
La estructura de un ambiente Biga Data ayuda la manipulación de los datos,
optimizando la gestión de la información respecto a tiempo y costo, logrando obtener
mejores resultados en las estadísticas para una buena toma de decisiones.
La creación de un ambiente Big Data se debe realizar dentro de un clúster, el cual
permite integrar todas las aplicaciones que se van a utilizar, como en este caso Hadoop, en
el cual se almacena la información y las aplicaciones corren dentro del mismo modo,
evitando conflictos durante la ejecución.
El correcto manejo del Big Data puede impulsar rápidamente la velocidad a la que
evoluciona un producto o servicio, debido a que disponemos de multitud de datos con la
información que nos da el mercado. De esta manera los plazos para el desarrollo de un
producto o servicio se acortan en el tiempo, así como los costes asociados al proceso que
se derivan del desarrollo de este.
Es importante resaltar que existen muchas maneras para transformar el mismo
modelo relacional al modelo basado en columnas, ya que se pueden tomar distintos
caminos para la unión de los datos, esto depende de la información que se desee encontrar
o saber. Para obtener una adecuada transformación se deben tener en cuenta las llaves
9
primarias, las cuales se convertirán en las row key, que permitirá integrar toda la información
dentro de una misma columna, mejorando la manipulación que se darán a los datos.
Bibliografía
esic.edu. (Enero de 2018). Las vemtajas de big data . Obtenido de
https://www.esic.edu/rethink/tecnologia/las-ventajas-del-big-data
Gómez, C. A. (2021). Beneficios y Usos del Big Data. Obtenido de
https://revistaempresarial.com/tecnologia/tendencias/beneficios-y-usos-del-big-data/
Reserved., ©. 2. (3 de Noviembre de 2022). mailjet. Obtenido de
https://www.mailjet.com/es/blog/marketing/big-data/
UCSP, U. d. (2023). Universidad catolica San Pablo. Obtenido de
https://postgrado.ucsp.edu.pe/articulos/que-es-big-data/
ware, O. c. (s.f.). Introduccion al Big Data .
worldsys. (15 de septiembre de 2022). 7 beneficios del Big Data en empresas. Obtenido de
https://www.worldsys.co/7-beneficios-del-big-data-en-empresas/