¿Por qué el esquema estelar se considera desnormalizado? ¿Es simplemente porque las claves se representan dos veces en las tablas de hechos y dimensiones?

Estrictamente hablando, es probable que el esquema de Star se desnormalice , pero no tiene que ser así. Depende de la complejidad de su modelo de datos subyacente.

La desnormalización generalmente ocurre en las tablas de dimensiones , ya que muchas dimensiones del mundo real a menudo tienen alguna relación jerárquica (es decir, Productos -> Componentes -> Pedidos / Artículos de pedido), posiblemente incluso anidados arbitrariamente. La desnormalización aquí (combinando los atributos que están en tablas separadas) puede ayudar con el rendimiento de sus consultas.

Además, a veces para mejorar aún más el rendimiento, es posible que deba utilizar columnas derivadas en las tablas de hechos. Por ejemplo, subtotal = precio * unidad. En lugar de calcularlo cada vez, cómpralo una vez y guárdalo.

Si lo que está modelando es muy simple, su esquema de estrella podría no requerir el esfuerzo anterior y puede mantenerse normalizado.

a2a

La normalización tiene un significado preciso. Puedes ver el listado aquí en Wikipedia

Normalización de base de datos

Un esquema estelar no está normalizado. No diría que está desnormalizado. Es un tipo diferente de almacenamiento relacional que la normalización:

Esquema de estrella

Tanto la normalización como un esquema en estrella están utilizando la teoría relacional, pero un esquema en estrella no está normalizado. Simplemente no está desnormalizado. Es una estructura completamente diferente.

En un esquema en estrella, las dimensiones suelen estar desnormalizadas. Digamos que tiene una dimensión de empleado, y los empleados pertenecen a un departamento. En un modelo de datos normalizado, tendrá tablas de empleados y departamentos separadas y una relación de clave externa que las vincula. En un esquema en estrella puro, solo tendrá la tabla de empleados y repetirá los datos del departamento para cada empleado. Esto hará que la recuperación de datos sea más rápida; el costo de almacenamiento adicional será aceptable, porque de todos modos será pequeño en comparación con el almacenamiento tomado por la tabla de hechos. La coherencia se mantendrá solo mediante el proceso ETL.

Palabras clave a buscar: Kimball, modelado dimensional.