Si alguna vez has oído hablar de los modelos de datos en Business Intelligence (BI) quizás pienses en metodologías o herramientas que se utilizan para implementarlo, pero la realidad es algo más compleja, por eso en este post queremos explicarte que es el modelo de datos y su aplicación en Business Intelligence. ¡Adelante!
Te puede interesar: Master en Business Intelligence
Índice de contenidos
¿Qué es el modelo de datos?
El modelo de datos nos da una idea de cómo se verá un sistema final después de su implementación completa. Define los elementos de datos y las relaciones entre sus elementos.
Los modelos de datos se utilizan para mostrar cómo se almacenan, conectan, acceden y actualizan los datos en el sistema de gestión de bases de datos.
Big Data en Tiempo Real
Aquí, usamos un conjunto de símbolos y texto para representar la información de modo que los miembros de una organización puedan comunicarse y comprenderla. Aunque hay muchos modelos de datos que se utilizan hoy en día, el modelo relacional es el modelo más utilizado.
Aparte del modelo relacional, existen muchos otros tipos de modelos de datos. Te los explicamos tras contarte qué es el modelado de datos.
¿Qué es el modelado de datos?
El modelado de datos es una forma de trazar y visualizar todos los lugares donde un software o aplicación almacena información, y cómo estas fuentes de datos encajarán y fluirán entre sí.
Se trata de una etapa muy importante en el proceso de diseño de cualquier sistema de IT en los negocios. Cuando los desarrolladores están averiguando cómo funcionará un nuevo sistema, establecen cuáles son las necesidades más urgentes de una empresa, a qué tipo de datos necesitarán acceder para satisfacer esas necesidades y cómo se utilizarán los datos.
A partir de ahí, pueden comenzar a crear un diagrama (o modelo) de cómo cada grupo de datos fluirá entre sí y cómo interactuarán.
A continuación, te explicamos en qué consisten los diferentes modelos de datos:
Modelo jerárquico
Este modelo organiza los datos en estructura de árbol jerárquica. La jerarquía comienza desde la raíz (que tiene datos raíz)y luego se expande en forma de árbol agregando un nodo secundario al nodo principal.
Este modelo representa fácilmente algunas de las relaciones del mundo real, como recetas de comida, mapa del sitio de un sitio web, etc.
Por ejemplo, podemos representar la relación entre los zapatos presentes en un sitio web de compras de la siguiente manera:
Características del modelo jerárquico
- Relación de uno a muchos: Los datos aquí están organizados en una estructura en forma de árbol donde la relación de uno a muchos es entre los tipos de datos. Además, solo puede haber una ruta desde el «padre» a cualquier nodo. En el ejemplo anterior, si queremos ir al nodo de zapatillas de deporte, solo tenemos un camino para llegar allí, es decir, a través del nodo de zapatos de hombre.
- Relación padre-hijo: Cada nodo «hijo» tiene un nodo «padre», pero un nodo padre puede tener más de un nodo hijo. No se permiten padres múltiples. Problema: si se elimina un nodo principal, el nodo secundario se elimina automáticamente.
- Punteros: Los punteros se utilizan para vincular el nodo principal con el nodo secundario y se utilizan para navegar entre los datos almacenados. En el ejemplo anterior, el nodo ‘zapatos’ apunta a los otros dos nodos, al nodo ‘zapatos de mujer’ y al nodo ‘zapatos de hombre’.
Modelo de red
Este modelo es una extensión del modelo jerárquico. Fue el modelo más popular antes del modelo relacional. Este modelo es el mismo que el modelo jerárquico, la única diferencia es que un registro puede tener más de un «padre».
En el siguiente ejemplo, podemos ver que el estudiante del nodo tiene dos padres, es decir, el Departamento de CSE y la Biblioteca. Esto antes no era posible en el modelo jerárquico.
Características de un modelo de red
- Capacidad para fusionar más relaciones: En este modelo, como hay más relaciones, los datos están más relacionados. Este modelo tiene la capacidad de gestionar relaciones uno a uno, así como relaciones de varios a varios.
- Muchas rutas: Como hay más relaciones, puede haber más de una ruta al mismo registro. Esto hace que el acceso a los datos sea rápido y sencillo.
- Lista enlazada circular: Las operaciones en el modelo de red se realizan con la ayuda de la lista enlazada circular. La posición actual se mantiene con la ayuda de un programa y esta posición navega por los registros de acuerdo con la relación.
Modelo entidad-relación
El Modelo Entidad-Relación o simplemente Modelo ER es un diagrama de modelo de datos de alto nivel. En este modelo, representamos el problema del mundo real en forma pictórica para facilitar la comprensión de las partes interesadas.
También es muy fácil para los desarrolladores comprender el sistema con solo mirar el diagrama ER, que lo utilizamos como una herramienta visual para representar un modelo ER.
Componentes del diagrama ER
- Entidades: la entidad es algo del mundo real. Puede ser una persona, un lugar o incluso un concepto. Ejemplo: Profesores, Estudiantes, Curso, Edificio, Departamento, etc. son algunas de las entidades de un Sistema de Gestión Escolar.
- Atributos: una entidad contiene una propiedad del mundo real llamada atributo. Estas son las características de ese atributo. Ejemplo: el maestro de la entidad tiene la propiedad como identificación del maestro, salario, edad, etc.
- Relación: La relación indica cómo se relacionan dos atributos. Ejemplo: el profesor trabaja para un departamento.
Modelo relacional
El modelo relacional es el modelo más utilizado. En este modelo, los datos se mantienen en forma de tabla bidimensional. Toda la información se almacena en forma de filas y columnas. La estructura básica de un modelo relacional son las tablas, que también se denominan «relaciones» en el modelo relacional. En este ejemplo, tenemos una tabla de empleados.
Master en Business Intelligence y Análisis de Datos
Aprende a utilizar las técnicas más importantes para manejar grandes volúmenes de datos
¡Quiero apuntarme!Características del modelo relacional
- Tuplas: cada fila de la tabla se llama tupla. Una fila contiene toda la información sobre cualquier instancia del objeto. En el ejemplo anterior, cada fila tiene toda la información sobre cualquier individuo específico, como la primera fila tiene información sobre John.
- Atributo o campo: Los atributos son la propiedad que define la tabla o relación. Los valores del atributo deben ser del mismo dominio. En el ejemplo anterior, tenemos diferentes atributos del empleado como Salario, Mobile_no, etc.
Modelo objeto-relacional
Como sugiere el nombre, es una combinación tanto del modelo relacional como del modelo orientado a objetos. Este modelo fue construido para llenar el vacío entre el modelo orientado a objetos y el modelo relacional.
Podemos tener muchas funciones avanzadas, como podemos hacer tipos de datos complejos de acuerdo con nuestros requisitos utilizando los tipos de datos existentes. El problema con este modelo es que puede volverse complejo y difícil de manejar.
Modelo de datos planos
Es un modelo de datos simple en el que la base de datos se representa como una tabla que consta de filas y columnas. Para acceder a cualquier dato, la computadora debe leer la tabla completa, lo que hace que los modos sean lentos e ineficaces.
Modelo semiestructurado
El modelo semiestructurado es una forma evolucionada del modelo relacional. No podemos diferenciar entre datos y esquema en este modelo.
En este modelo, algunas entidades pueden tener atributos faltantes mientras que otras pueden tener un atributo adicional. Este modelo brinda flexibilidad para almacenar los datos y da flexibilidad a los atributos. Por ejemplo, si estamos almacenando cualquier valor en cualquier atributo, ese valor puede ser un valor atómico o una colección de valores.
Modelo asociativo de datos
El modelo asociativo de datos es un modelo en el que los datos se dividen en dos partes. Todo lo que tiene existencia independiente se denomina entidad y la relación entre estas entidades se denomina asociación.
Los datos divididos en dos partes se denominan elementos y enlaces.
- Elemento: los elementos contienen el nombre y el identificador (algún valor numérico).
- Enlaces: los enlaces contienen el identificador, la fuente, el verbo y el asunto.
Ejemplo: digamos que tenemos esta declaración: «La copa del mundo se celebrará en Londres a partir del 30 de mayo de 2022».
En estos datos se deben almacenar dos enlaces:
La copa del mundo está siendo organizada por Londres. La fuente aquí es ‘la copa del mundo’, el verbo ‘es ser’ y el objetivo es ‘Londres’. … a partir del 30 de mayo de 2022. La fuente aquí es el enlace anterior, el verbo es ‘de’ y el destino es ’30 de mayo de 2020 ‘. Esto se representa usando la tabla de la siguiente manera:
Modelos de datos en Business Intelligence
Generalmente, los modelos de datos en Business Intelligence (BI), son de dos tipos: Modelo en estrella y Modelo en copo de nieve.
Modelo en estrella
Este modelo de datos está basado en una tabla central. Esta tabla contiene una tabla de hecho (que es el «hecho» que se analiza), los campos id que la relacionan con las tablas de dimensiones y los cálculos relacionados al hecho en la mínima granularidad requerida.
Lo positivo de este modelo es que facilita el filtrado de los datos.
Cuando se han obtenido las dimensiones relacionadas al hecho, se puede diseñar un modelo de datos dimensional:
Modelo de datos en Copo de Nieve
Este tipo de modelo es más complejo que un modelo en estrella, pero el concepto de creación parte de la misma base de análisis. Este modelo se utiliza cuando las dimensiones tienen más de una tabla. Aquí el ejemplo gráfico:
Aquí te damos una tabla comparativa de NotJustBI en la que se explica a la perfección las características de cada modelo:
¿Te ha gustado este post? No olvides compartirlo y si lo tuyo es la analítica de datos, no te pierdas el Master en Business Intelligence con el que aprenderás a utilizar las técnicas y herramientas más importantes para obtener inteligencia de negocio de los datos.
Master en Business Intelligence y Análisis de Datos
Aprende a utilizar las técnicas más importantes para manejar grandes volúmenes de datos
¡Quiero apuntarme!