BI EN LA PRÁCTICA
CONTACTO
|
|
 |
-
México: 01 (55) 5256.4517
Monterrey: 01 (81) 8347.0027
Austin: 713 96 22 003
|
 |
-
México, D.F.
Tamaulipas No. 150
Despacho 501 5°piso Torre A
Col. Hipódormo Condesa.
C.P.06100
-
Monterrey, N.L.
Calle IV No. 1214
Fracc. San Jerónimo
C.P. 64640
-
Austin, TX
3925 W Braker Lane,
Suite 3.8096
Austin, TX 78759
|
|
Artículos BI en la Práctica
IV. Bill Inmon - Ralph Kimball
Publicación: Agosto 20, 2009
Bill Inmon - Ralph Kimball
Para comenzar a tratar el tema de las similitudes y diferencias existentes entre los dos paradigmas más representativos
del Data Warehouse, iniciaremos con una breve descripción de cómo se constituye cada uno de ellos.
Paradigma Bill Inmon: El Data Warehouse es una parte de un sistema de BI. Dentro de una
empresa que tiene un Data Warehouse, los Data Marts obtienen su información a partir de este Data Warehouse. La
información se almacena de acuerdo a la tercera forma normal (3NF).
Ver artículo 1
Paradigma Ralph Kimball: El Data Warehouse es un conglomerado de todos los Data Marts dentro
de una empresa. La información siempre es almacenada de acuerdo al Modelo Dimensional.
Ver artículo 2
Pese a las diferencias que se pueden apreciar de manera inmediata entre ambas arquitecturas, también existen elementos
en común. Todas las empresas requieren almacenar recursos, analizar e interpretar la información que generan y acumulan
con el fin de tomar decisiones críticas que permitan su existencia pero sobre todo que maximicen su prosperidad; por lo
que se vuelve prioritario crear sistemas de análisis y retroalimentación para comprender su información (Data
Warehouse) y de esta manera contar con los elementos adecuados para la toma de decisiones.
Un requisito de la arquitectura del Data Warehouse es que un usuario pueda depender de la precisión y de la prontitud
con que llegue la información, de la facilidad de acceder a ella, de acuerdo a sus necesidades particulares, y de que
los datos sean a la vez comprensibles y simples. La información obtenida de esta manera debe ser compatible con
cualquier otra operación o con cualquier otro usuario dentro de la empresa.
Inmon y Kimball coinciden en que los Data Marts o Data Warehouses independientes no satisfacen las necesidades de
precisión y oportunidad de la información, ni facilitan el acceso para los usuarios. Estos sistemas son construidos para
satisfacer necesidades específicas, sin ver los otros procesos de análisis de la información. Las extracciones múltiples
y sin coordinación de las mismas fuentes son ineficientes y sólo provocan el desperdicio de los recursos, pues generan
reglas y convenciones de negocio similares pero con variaciones e inconsistencias en los nombres, lo que origina
confusión y que varias operaciones se tengan que hacer más de una vez. Lo que se tiene al final, en la toma de
decisiones basada en datos independientes es una atmósfera de incertidumbre y duda.
Fig 1. Data Warehouse Independiente
|
En términos generales se podría decir que es hasta este punto donde tanto Inmon como Kimball coinciden, pues el mismo Inmon expresa esta divergencia al decir que el esquema tipo estrella de la aproximación que Kimball propone genera inflexibilidad y, en consecuencia, lleva a una estructura frágil, lo que considera como la principal debilidad de este modelo como base de un Data Warehouse; "una serie de esquemas estrella y tablas multidimensionales son débiles porque no pueden cambiar fácilmente con el tiempo".
The Corporate Information Factory (CIF), o la aproximación Inmon (ver figura 2), integra extracciones coordinadas de los sistemas fuente con las que se alimenta una base de datos relacional con la información atómica. Este Data Warehouse normalizado es usado para conglomerar repositorios adicionales para presentación de la información, lo que incluye almacenes de propósitos especiales para la exploración y minería de datos, y también Data Marts.
Fig 2. Data Warehouse, tipología
|
Inmon cree que su aproximación, al utilizar Data Marts dependientes como la fuente de un esquema tipo estrella, permite resolver el problema de acceso de toda la empresa a la misma información, la cual puede cambiar con el tiempo. Considera además que un Data Warehouse relacional esta mejor preparado con una base de datos basada en un diseño relacional (3NF).
La arquitectura BUS de Kimball expresa que la información no procesada es transformada a un formato presentable en lo que el concibe como el staging area (ver figura 3), siempre consciente de la productividad y la calidad. Todo comienza con extracciones coordinadas de los sistemas fuente.
Fig 3. Data Warehouse, tipología Kimball
|
Algunas de estas actividades son centralizadas como el mantenimiento y almacenamiento de información común de referencia, mientras que otras pueden ser distribuidas. Esto indica que Kimball ha ido más allá del esquema estrella individual criticado por Inmon, pues describe un Data Warehouse multidimensional. En esta aproximación el modelo contiene información atómica e información resumida, pero su construcción esta basada en mediciones del negocio, lo que permite habilitar diferentes departamentos para consultar la información desde un nivel más alto de detalle o en uno más bajo sin necesidad de reprogramar.
Aunque esta descripción a primera vista es muy similar al Data Warehouse de Inmon, la aproximación de Kimball no es una recomendación para implementar una versión física, realmente se trata de una colección de Data Marts con sus dimensiones ajustadas.
En resumen se puede decir que son dos las principales diferencias entre estos enfoques del Data Warehouse:
1. La presentación de la información para ser almacenada.
Inmon: es necesario normalizar la información antes de almacenarse.
Kimball: las estructuras de los datos requieren una presentación dimensional para ser almacenadas.
2. El tratamiento de la información atómica.
Inmon: la información atómica debe almacenarse en un Data Warehouse normalizado.
Kimball: la información atómica debe estar estructurada dimensionalmente.
Conclusión
Finalmente no se puede decir que haya una aproximación equivocada entre éstas dos vertientes, ya que sólo representan
dos maneras de implementar un Data Warehouse. Lo que se puede afirmar, es que en la mayoría de las empresas el Data
Warehouse es más cercano a la idea de Kimball, esto se debe a que regularmente el construir un Data Warehouse empieza
como una iniciativa dentro de un departamento dentro de una empresa, lo que al final se convierte en un Data Mart. Y es
entonces hasta que más Data Marts son construídos cuando derivan en un Data Warehouse.
Referencias
-
http://www.1keydata.com/datawarehousing/inmon-kimball.html
-
http://www.b-eye-network.com/view/743
-
http://www.intelligententerprise.com/showArticle.jhtml;jsessionid= 3KONGSI04EOVVQE1GHPCKHWATMY32JVN?articleID=17800088&pgno=2
-
http://searchdatamanagement.techtarget.com/expert/KnowledgebaseAnswer/ 0,289625,sid91_gci1348892_mem1,00.html

ZONA DE COMENTARIOS
Si desea hacer algún comentario respecto al artículo , lo puede hacer empleando el
siguiente formulario. En breve será publicado junto con su respuesta.
|
ACCESOS RÁPIDOS
|