Las empresas basadas en datos deben comprender las diferencias entre las tablas de hechos y las tablas de dimensiones.

Las empresas basadas en datos deben comprender las diferencias entre las tablas de hechos y las tablas de dimensiones.

  • Big Data
  • marzo 29, 2022
  • No Comment
  • 124
  • 6 minutes read


Si está en el negocio de ayudar a otros, debe estar en el negocio de los datos. En el mundo del apilamiento de datos, la teoría de la organización de datos, existen dos conceptos que giran en torno a ella:

Este es el tema de utilizar los datos de manera accesible y tangible que muchos han postulado. Profesiones y equipos completos se han construido en torno al análisis y la interpretación de datos, un obstáculo que lo ha hecho inalcanzable para todos excepto para aquellos con suficiente capital y recursos. Esto dificulta que algunas empresas aprovechen cosas como la virtualización de datos.

Afortunadamente, los desarrollos tecnológicos recientes están ayudando a cambiar este discurso. Esta nueva tecnología no solo hace que los datos sean accesibles para personas ajenas a la tecnología, sino que también agiliza la consolidación de múltiples fuentes de datos. Ya sea que haya utilizado Excel, SQL, CRM u otras plataformas para administrar sus datos, esta nueva tecnología facilita el acceso y la configuración de sus datos.

En el campo del modelado de datos dimensionales, o la organización jerárquica de valores numéricos y contextuales, el discurso gira en torno a la naturaleza y funciones de una tabla de hechos frente a una tabla de dimensiones.

¿Qué son las tablas de hechos y las tablas de dimensiones?

Piense en una tabla de hechos como un conjunto de datos que almacena valores numéricos o números. Por ejemplo, podría decir que una organización, llamémosla Compañía A, tuvo 10 ventas de su producto en un mes determinado. Eso es genial, se podría decir. Pero los valores numéricos por sí solos pueden no proporcionar mucha información. Lo que falta es el contexto o el significado que le da a este dígito un valor real y tangible. Esto es lo que ofrecen las tablas de medidas: el contexto o el significado detrás de los valores numéricos.

Aquí hay una lista de ejemplos de valores de contexto que puede contener una tabla de dimensiones:

  • Productos (categoría de producto, características, etc.)
  • Ubicación (país, estados, ciudades donde se vendió el producto)
  • Industria (regiones, sucursales, empleados)
  • Tiempo (Años, Meses, Semanas, Días)

Juntas, las tablas de hechos y dimensiones toman datos y brindan información valiosa que tanto las pequeñas como las grandes empresas desean aprovechar. Pero retrocedamos por un momento y primero hablemos de los dos tipos más comunes de modelos o esquemas de datos que se encuentran allí: estrellas y copos de nieve.

¿Qué son los esquemas de estrella y copo de nieve?

En un esquema en estrella, acertadamente llamado así por su configuración en forma de estrella, la tabla de hechos se encuentra en el centro. Las tablas de dimensiones, cada una con su propio enfoque contextual (consulte los ejemplos anteriores), se derivan de la tabla de hechos. Según la consulta, cuando recupera los datos específicos de su organización o empresa, las tablas de hechos y dimensiones proporcionan los resultados y el contexto que está buscando. Además, la forma prominente también es una forma de diseñar el apilamiento de datos de manera que tenga sentido para la empresa u organización individual.

Ahora existe un enfoque avanzado para apilar datos en forma de esquema de copo de nieve. Cuando piensas en la forma de un copo de nieve, puedes imaginar un punto central desde el cual irradian muchas líneas. Esta sería la tabla de hechos. Sin embargo, a diferencia de un esquema en estrella, estas extrusiones amplían sus propias tablas de dimensiones. En otras palabras, los valores de contexto contienen un nivel adicional de contexto.

Un ejemplo de esto podría ser la tabla de dimensiones A (centrada en los productos) y la tabla de dimensiones B (centrada en las variantes de un producto) que se ramifican desde la primera. La configuración de su pila de datos depende principalmente del alcance de las dimensiones (o valores) utilizados.

No es necesario ser un experto en tecnología para usar datos

Muchas empresas no utilizan estrategias basadas en datos para hacer crecer o comercializar su negocio. El acceso a estos datos suele ser costoso. Sin embargo, los avances en las tecnologías de apilamiento de datos facilitan que las pequeñas empresas, las nuevas empresas, los emprendedores, las organizaciones sin fines de lucro o cualquier tipo de negocio aprovechen sus datos.

Peter Fishman, director ejecutivo y cofundador de Mozart Data, describe su plataforma como «la forma más fácil de crear una pila de datos moderna». Explica que “no todas las empresas obtienen valor de sus datos. . . pero cualquier negocio puede”.

El análisis de datos puede proporcionar beneficios comerciales y orientación, liberando tiempo y recursos para centrarse en el desarrollo de productos, los comentarios de los clientes, la recaudación de fondos, la investigación y el crecimiento a largo plazo.

Related post

Premios de socios globales de ladrillos de datos 2022

Premios de socios globales de ladrillos de datos 2022

Databricks tiene un ecosistema de socios de más de 600 socios en todo el mundo que son fundamentales para crear y…
Después de la realineación, HTEC ve una composición más sólida de empresas rentables en el segundo trimestre

Después de la realineación, HTEC ve una composición más…

Una de las características distintivas del índice HTEC de ROBO Global de otros índices de atención médica es que el índice…
Las tejas de hormigón de base biológica reducen las emisiones de CO2 y los residuos

Las tejas de hormigón de base biológica reducen las…

Las baldosas de base biológica son un nuevo material de construcción sostenible que se utiliza para crear fachadas sostenibles para edificios.…

Leave a Reply

Tu dirección de correo electrónico no será publicada.