un proyecto de business intelligence
Post on 31-Jul-2015
497 Views
Preview:
DESCRIPTION
TRANSCRIPT
FACULTAD DE INGENIERÍA
CARRERA DE INGENIERÍA DE SISTEMAS – EPE
TRABAJO DE CURSO “INTELIGENCIA DE NEGOCIOS”
ENTREGABLE FINAL
“IMPLEMENTACION DE UNA SOLUCION DE
INTELIGENCIA DE NEGOCIOS PARA UNA EMPRESA TEXTIL”
Desarrollado por los alumnos:
200814563 – Martinez Ochoa, Juliana
200900477 – Pizarro Ramírez, Marco
200512648 – Villanueva Ortiz, Tirso
200800140 –Romero Llanos, Sonia
SURCO – LIMA
6 de Agosto de 2012
Inteligencia de Negocios
2
ÍNDICE
1. SITUACIÓN PROBLEMÁTICA ........................................................................................... 3
1.1. Empresa y Área Específica a Analizar ............................................................................ 3
1.2. Situación Problemática ..................................................................................................... 3
1.3. Identificación de las Necesidades de Información y Fuentes para Obtenerla ........... 4
1.3.1. Origen de Datos y Tablas ................................................................................................. 5
1.4. Usuarios de la Información ............................................................................................ 12
1.5. Definición de Antigüedad de Datos y Periodos de Actualización .............................. 13
2. SOLUCIÓN PROPUESTA ................................................................................................ 14
2.1. Características Generales de la Solución Propuesta .................................................. 14
2.2. Beneficios a obtener al Implementar la Solución ........................................................ 14
2.2.1. Beneficios Tangibles ...................................................................................................... 14
2.2.2. Beneficios Intangibles .................................................................................................... 15
2.3. Análisis Dimensional ...................................................................................................... 16
2.3.1. Tablas Dimensionales ..................................................................................................... 16
2.3.2. Modelo Lógico ................................................................................................................. 21
2.4. Estimación de la Cantidad de Datos y Tamaño de BD ................................................ 22
2.5. Reportes y Consultas a Generar .................................................................................... 22
2.6. Identificación de la infraestructura necesaria para el proyecto HW y SW ................ 23
3. Desarrollo de la solución ................................................................................................ 24
4. Administración del Proyecto .......................................................................................... 44
CONCLUSIONES .................................................................................................................... 45
BIBLIOGRAFIA ....................................................................................................................... 46
GLOSARIO .............................................................................................................................. 47
SIGLARIO ................................................................................................................................ 48
ANEXOS .................................................................................................................................. 49
Inteligencia de Negocios
3
1. SITUACIÓN PROBLEMÁTICA
1.1. Empresa y Área Específica a Analizar
La empresa objeto de estudio del presente trabajo es Perú Pima S.A. Es una empresa peruana del
rubro textil, fundada el año 1992. Su giro de negocio es la fabricación de productos textiles y su
comercialización. Posee toda la cadena de producción textil que consta de:
- Hilandería
- Tejeduría
- Tintorería y acabado de telas
- Estampado
- Confecciones
Su Gerente General es el Sr. Daniel Varón Kappari y número de RUC 20122742114. Posee dos
plantas de producción ubicadas en:
- Av. Argentina 2747, Lima Zona Industrial.
- Av. Argentina 5138, Carmen de la Legua-Reynoso, Callao.
Tiene 83 empleados y 509 obreros. Las áreas específicas, cuya información será motivo de estudio
para la implementación de la solución BI del presente trabajo, son: el Área Comercial, Producción
(solo almacenes) y Finanzas. El sitio web de la empresa es: www.perupima.com
1.2. Situación Problemática
Formulación del Problema
En un país de vías de desarrollo, la principal fuente de crecimiento económico es el incremento de
la productividad. De ahí resulta imperiosa la necesidad para la empresa Perú Pima S.A. de estimular
su crecimiento en el mercado globalizado, así como también, una respuesta más efectiva a sus
distintas operaciones.
En tal sentido, considerando el análisis del Área Comercial y de la Gerencia Financiera que son
materia de estudio del presente proyecto, existen factores tanto internos como externos que afectan
dichas operaciones. El Área Comercial ha sido determinada en primera instancia por la Gerencia
General como una de las más críticas por diferentes deficiencias encontradas en los distintos
procesos, tanto en la gestión de las ventas, así como también, por el control y seguimientos de las
cuentas por cobrar ya que no pueden contar con información analítica que les permita tomar
mejores decisiones.
Inteligencia de Negocios
4
El presente estudio surge ante la necesidad de la empresa de encontrar alternativas y métodos que
permitan un mejoramiento continuo para el Área Comercial, ya que los últimos años su crecimiento
ha sido acelerado.
Objetivo General
Contar con una herramienta DSS de Sistema de Soporte de Decisiones con sus siglas en inglés
(DSS) que permita visualizar la situación de las operaciones comerciales, y en particular de las
ventas de la compañía, y de esta manera le permita a los directivos y jefaturas de rango medio
tomar decisiones a favor de la organización utilizando dicha información.
Objetivos Específicos
- Determinar la información importante para el análisis de ventas y cuentas por cobrar.
- Determinar los indicadores necesarios para satisfaces los requerimientos de información.
1.3. Identificación de las Necesidades de Información y Fuentes para
Obtenerla
Identificación de las necesidades de información
La Gerencia General y la Gerencia de Ventas, así como el Directorio, desde hace algunos años
atrás requieren analizar el movimiento comercial de la empresa, y contar con información útil para la
toma de decisiones cruciales en el manejo de la organización. Ellos necesitan información de las
ventas de productos terminados de la empresa, mostrándola según clasificaciones del tipo regional,
de clientes, por familias de productos, y también, comparándola con los costos de producción
unitarios, todo esto expresado en diversas jerarquías de tiempo. Todo eso sería muy útil para ver el
seguimiento de la facturación a través de diferentes estructuras (familias de productos, zonas
geográficas, tipos de clientes, etc.) y asimismo, los márgenes de utilidad bruta por producto
(mostrado en unidades de tiempo, familias de productos, tipos de clientes, etc.)
El área de TI ha estado abocada al desarrollo de la plataforma transaccional básica, y debido a
carencias técnicas y de personal, no ha podido construir un módulo de información gerencial. Hoy
en día, gracias a las herramientas de Business Intelligence es posible construir aplicativos que
permitan satisfacer esos requerimientos de las gerencias mencionadas, en tiempos relativamente
cortos, y contando con herramientas que permitan que el usuario moldee su propia información,
construya sus propias consultas todo esto a través de la presentación de información tanto gráfica
como tabular.
Asimismo, la Dirección de la empresa tiene la necesidad de analizar la información de las Cuentas
por Cobrar pero en forma estratificada. Es decir, en la actualidad el Sistema Integrado de la
empresa, brinda un lote de reportes tabulares, pero no son versátiles en el sentido de brindar
ventajas más allá que la información estática e impresa. La dirección de la empresa, requiere
Inteligencia de Negocios
5
acceder a dicha información en un contexto que permita visualizarla a través de las estructuras y
clasificaciones que se manejan en la Gerencia Financiera y en el Área Comercial.
Los reportes estáticos son antiguos, ofrecen solamente información básica pero útil, y ha quedado
relegada a reportar montos globales por cliente, pero, no se puede satisfacer consultas más
avanzadas. Estas consultas permitirán saber los niveles de morosidad por cliente, región, por tipo
de cliente, saber cómo se están comportando las cuentas por cobrar de clientes minoristas en el
tiempo, el monto total por cobrar de clientes de un país, etc.
Fuentes para obtener la información
La fuente única de donde se obtendrá la información será el sistema administrativo de la empresa
llamado “Sistema Integrado”. En dicho sistema se maneja toda la gestión administrativa y algunos
módulos usados en el área de producción, implementados hace 10 años para lograr un EEI a favor
de la empresa. Para la gestión administrativa el sistema cuenta con los siguientes módulos:
- Inventarios
- Ventas
- Cuentas por Cobrar
- Compras
- Cuentas por Pagar
- Caja y Bancos
- Activos Fijos
- Recursos Humanos
- Costos de Producción
- Contabilidad
Y para el área de producción textil, se cuenta con los siguientes módulos:
- Hilandería
- Tejeduría
1.3.1. Origen de Datos y Tablas
El “Sistema Integrado” de Perú Pima S.A. se basa en el ODS llamado UniData ® Relational
Database; soporta ANSI SQL y su propio lenguaje de programación, UniBasic. Está construido con
la herramienta de desarrollo 4GL llamada SystemBuilder ®. Ambos productos pertenecen a la
empresa norteamericana Rocket Software Inc., URL http://www.rocketsoftware.com. El anexo 01
contiene imágenes de captura de algunas pantallas de dicho sistema.
Inteligencia de Negocios
6
Los archivos de datos de dicho sistema y que son el origen de datos para nuestra solución, son los
siguientes:
Archivo: FAREGISTRO
Contiene: Movimiento de Facturación cabecera - Contiene los documentos de facturación (facturas y
boletas). Es archivo cabecera, contiene los datos básicos de la facturación.
Nombre_campo Tipo Longitud Descripción corta
Id_doc_venta A 15 Identificación del documento
Cd_tipo_doc A 2 Código de tipo de documento de operación
Nro_serie A 3 Número de serie del documento de ventas
Nro_correlativo A 7 Número de correlativo del documento
Fecha_Emision D 10 Fecha de emisión
Cd_cliente A 6 Código de cliente
Nro_pedido N 7 Número de pedido de ventas
Cd_vendedor A 5 Código de vendedor
Fecha_vcto D 10 Fecha de vencimiento
Cd_condicion_pago A 3 Código de condición de pago
Id_transaccion_inv A 13 Código de transacción de inventarios asociada a la venta
Estado A 1 Estado del documento
Cd_moneda A A Código de la moneda de facturación
Tipo_cambio N 8,4 Importe del tipo de cambio
Pct_descuento N 12,2 Porcentaje de descuento
Pct_iva N 12,2 Porcentaje del IVA
Importe_neto N 12,2 Importe neto de venta
Valor_iva N 12,2 Monto del impuesto a las ventas
Monto_nominal N 12,2 Monto total previo al descuento
Importe_descuento N 12,2 Importe del descuento
Monto_venta N 12,2 Monto total de la venta
Inteligencia de Negocios
7
Archivo: FAREGISTRODET
Contiene: Movimiento de Facturación detalle - Contiene los ítems de inventario facturados y
contenido documentos de facturación (facturas y boletas). Es archivo detalle, contiene los datos de
los productos facturados como precio unitario, cantidad, etc.
Nombre_campo Tipo Longitud Descripción corta
Id_doc_venta A 15 Identificación del documento
Nro_consecutivo N 6 Número consecutivo de producto dentro del documento
Cd_item A 8 Código del ítem de inventario
Cantidad N 12,3 Cantidad a facturar
Precio_unitario N 12,2 Precio unitario
Importe_unitario N 12,2 Importe unitario
Archivo: FACLIENTES
Contiene: Tabla maestra de clientes.
Nombre_campo Tipo Longitud Descripción corta
Cd_cliente A 6 Código identificatorio del cliente
Razon_social A 60 Razón social
Tipo_cliente A 3 Código de tipo de cliente
Estado A 1 Estado del registro
NIT A 11 Número de identificación tributaria
Tipo_documento A 2 Código de tipo de documento identificatorio
Nro_documento A 15 Número de documento identificatorio
Direccion A 160 Dirección del cliente
Cd_ubicacion A 7 Código de ubicación del cliente (Código de distrito)
Telefono1 A 12 Teléfono 1
Telefono2 A 12 Teléfono 2
Nombre_contacto A 40 Nombre del contacto
Cd_pais A 3 Código de país
Archivo: FATIPO_CLIENTE
Contiene: Tabla de tipos de clientes (nacionales, extranjeros, etc.)
Nombre_campo Tipo Longitud Descripción corta
Cd_tipo_cliente A 3 Código de tipo de cliente
Inteligencia de Negocios
8
Desc_tipo_cliente A 40 Descripción de tipo de cliente
Archivo: FACONDICION
Contiene: Tabla de las condiciones de pago de los comprobantes emitidos a los clientes.
Nombre_campo Tipo Longitud Descripción corta
Cd_condicion A 3 Código identificatorio de la condición de pago del documento de venta
Desc_condicion A 40 Descripción de la condición de pago
Nro_dias_plazo N 3 Número de días de plazo
Archivo: FAVENDEDOR
Contiene: Tabla maestra de vendedores
Nombre_campo Tipo Longitud Descripción corta
Cd_vendedor A 3 Código de vendedor
Nombre_vendedor A 70 Nombre del vendedor
Estado_vendedor A 1 Estado del vendedor
Archivo: FAUBICACION
Contiene: Tabla de ubicaciones geográficas (departamentos, provincias y distritos)
Nombre_campo Tipo Longitud Descripción corta
Cd_ubicacion A 7 Código de la ubicación
Desc_ubicacion A 80 Descripción de la ubicación
Cd_nivel A 1 Nivel del registro
Archivo: FAARTICULOS
Contiene: Tabla maestra de los ítems de inventarios (productos). Contiene la información de los
productos que se mueven en los almacenes.
Nombre_campo Tipo Longitud Descripción corta
Cd_item A 8 Código identificatorio del ítem de inventario
Descripcion_item A 120 Descripción del ítem de inventario
Cd_familia A 2 Código identificatorio de la familia de inventarios
Estado_item A 1 Estado del ítem de inventario
Precio_unitario N 12,2 Precio unitario de venta (sin IGV)
Cd_articulo A 16 Código de articulo textil
Inteligencia de Negocios
9
Cd_proceso A 6 Código de proceso textil
Nro_diseno A 5 Número de diseño (estampado)
Cd_color A 5 Código de color
Cd_combinacion A 3 Código de combinación
Cd_ancho A 2 Código de ancho
Cd_calidad A 1 Código de calidad
Unidad_medida A 4 Código de unidad de medida
Archivo: INFAMILIA
Contiene: Tabla maestra de familias de inventarios (TE=Telas / FE=Felpas /
CO=Confecciones, etc.)
Nombre_campo Tipo Longitud Descripción corta
Cd_familia A 2 Código identificatorio de la familia de inventarios
Desc_familia A 60 Descripción de la familia de inventarios
Archivo: INART.BASE
Contiene: Tabla maestra de artículos de productos (Código de que es un atributo de la tabla de
ítems de inventario). Los registros de esta tabla NO mueven inventarios.
Nombre_campo Tipo Longitud Descripción corta
Cd_articulo A 15 Código identificatorio de articulo base (conforma el ítem)
Desc_articulo A 60 Descripción del articulo base de inventarios
Cd_estado A 1 Código de estado
Hilos_trama N 6 Nro hilos trama
Hilos_urdimbre N 6 Nro hilos urdimbre
Archivo: PR.DISENO
Contiene: Tabla maestra de Diseños textiles (diseño es la figura que se estampa en la tela.
Usualmente un diseño está compuesto por varios colores diferentes)
Nombre_campo Tipo Longitud Descripción corta
Nro_diseno A 5 Número identificatorio de diseño
Desc_diseno A 60 Descripción del diseño
Nro_laminas N 3 Número de láminas del diseño
Inteligencia de Negocios
10
Archivo: PR.COLOR
Contiene: Tabla maestra de colores (cuando se trata de Teñido de las telas, aplicación de color
entero)
Nombre_campo Tipo Longitud Descripción corta
Cd_color A 5 Código identificatorio de Color
Desc_color A 80 Descripción del color
Archivo: PR.COMB
Contiene: Tabla maestra de combinaciones. Solo es útil para los Ítems que son estampados (tienen
Nro. de Diseño asignado)
Nombre_campo Tipo Longitud Descripción corta
Cd_combinacion A 4 Código identificatorio de la combinación
Desc_combinacion A 80 Descripción de la combinación
Archivo: INANCHO.TELAR
Contiene: Tabla maestra de anchos de las telas terminadas.
Nombre_campo Tipo Longitud Descripción corta
Cd_ancho A 2 Código identificatorio del ancho de la tela
Desc_ancho A 60 Descripción del ancho
Long_ancho N 12,2 Longitud del ancho del ítem tela / felpa
Archivo: PR.CALIDAD
Contiene: Tabla maestra de Códigos de Calidad (1=Primera / 2=Segunda / 3=Tercera)
Nombre_campo Tipo Longitud Descripción corta
Cd_calidad N 1 Código identificatorio de la calidad
Desc_calidad A 20 Descripción de la calidad
Archivo: INUNIDAD
Contiene: Tabla maestra de unidades de medida.
Nombre_campo Tipo Longitud Descripción corta
Cd_unidad A 4 Código identificatorio de la unidad de medida
Inteligencia de Negocios
11
Desc_unidad A 30 Descripción de la unidad de medida
Archivo: FIMONEDA
Contiene: Tabla maestra de Códigos de Monedas (D-Dólares / S-Nuevos Soles)
Nombre_campo Tipo Longitud Descripción corta
Cd_moneda A 1 Código de identificación de moneda
Desc_moneda A 30 Descripción de moneda
Archivo: FATIPO_DOC_ID
Contiene: Tabla maestra de tipos de documento de identidad de personas (01-DNI / 02-
CARNET DE EXTRANJERIA / etc.)
Nombre_campo Tipo Longitud Descripción corta
Cd_tipo_doc_id A 2 Código de tipo de documento de identificación
Nombre_doc A 40 Descripción de tipo de documento de identificación
Archivo: FATIPO_DOCUMENTO
Contiene: Tabla maestra de tipos de documentos que el sistema emite.
Nombre_campo Tipo Longitud Descripción corta
Cd_tipo_documento A 2 Código de tipo de documento de operación
Desc_tipo_documento A 40 Descripción de tipo de documento de operación
Archivo: FAESTADO_DOC
Contiene: Tabla maestra de Estados de los documentos emitidos / a emitir
Nombre_campo Tipo Longitud Descripción corta
Cd_estado_doc A 1 Código de estado
Desc_estado_doc A 60 Descripción del estado
Archivo: ADESTADO
Contiene: Tabla maestra de estados (de registros).
Nombre_campo Tipo Longitud Descripción corta
Cd_estado A 1 Código de estado
Inteligencia de Negocios
12
Desc_estado A 60 Descripción del estado
Archivo: FAPAIS
Contiene: Tabla maestra de países
Nombre_campo Tipo Longitud Descripción corta
Cd_pais A 3 Código de país
Desc_pais A 60 Descripción del país
1.4. Usuarios de la Información
Puesto Área Funciones
Gerente
General Gerencia General
Máximo ejecutivo de la organización, que dirige los
destinos de la empresa. Administra la organización a
través de las gerencias de áreas y es el representante
legal de la misma.
Gerente
Comercial Gerencia Comercial
Responsabilidad máxima en todas las actividades
relacionadas con los clientes: ventas, marketing,
canales de distribución.
Gerente de
Finanzas Gerencia Financiera
Máxima autoridad dentro de la organización en los
asuntos relativos a las finanzas; administración del
dinero. Dirige las actividades de planificación financiera,
contabilidad, tesorería y cobranzas.
Responsable de
Créditos y
Cobranzas
Gerencia Financiera
Gestionar y efectuar el cobro de las cuentas por cobrar,
producto de las ventas a clientes. Administrar la cartera
de clientes para garantizar la captación de recursos.
Analizar y otorgar créditos a clientes.
Gerente de
Producción
Gerencia de
Producción
Responsabilidad sobre el funcionamiento el área
productiva de la empresa, optimizar los recursos
productivos y organizar y hacer seguimiento de todos
los trabajos dentro del ciclo de producción.
Inteligencia de Negocios
13
Responsable de
Marketing Gerencia Comercial
Encargado de los planes de mercadotecnia, estudios de
mercado, imagen corporativa, promociones y estudios
de nuevos canales de ventas.
Vendedor Gerencia Comercial
Miembro de la organización dedicado a colocar los
productos terminados de la empresa en el mercado.
Negocia con los clientes la obtención de pedidos, hace
seguimiento a los mismos, coordina los despachos por
venta y entre sus responsabilidades está la de ampliar
la cartera de clientes.
Contador de
Costos Contabilidad
Miembro de la organización dedicado a realizar la
determinación de los costos de producción de los
productos terminados e intermedios, así como la
valorización de los inventarios de la empresa.
1.5. Definición de Antigüedad de Datos y Periodos de Actualización
Para efectos de este trabajo académico, la data a capturar comprenderá desde el 1ro de Enero de
2008 al 31 de diciembre de 2011. Los procesos de carga y transformación que serán
implementados, estarán diseñados para que la información sea actualizada diariamente.
Inteligencia de Negocios
14
2. SOLUCIÓN PROPUESTA
2.1. Características Generales de la Solución Propuesta
Implementar una solución de Data mart para el área de ventas.
La herramienta a utilizar debe permitir el manejo de OLAP para mostrar la información de
las dimensiones del modelo, generar reportes, gráficos, así como también, permitir la
elaboración de dashboards para mostrar indicadores de valor.
2.2. Beneficios a obtener al Implementar la Solución
La Gerencia de Ventas y la Gerencia General se verán muy beneficiadas por poder contar con una
herramienta de inteligencia de negocios a través de la cual van a poder visualizar y explotar la
información comercial de la empresa desde diferentes ángulos. En el pasado, estaban limitados a
visualizar la información en estructuras estáticas que le ofrecía el legacy (sistema transaccional que
tiene 10 años de funcionamiento). Con esta herramienta, la Direccion de la empresa podrá sacar
provecho de los diferentes enfoques de datos ofrecidos, pudiendo el mismo usuario construir
nuevas consultas, y obtener información pertinente y útil para su gestión.
Los beneficios son, evidentemente, mucho. Ya no va a depender del área IT para solicitarle nuevos
reportes estáticos, ni estará limitado a la capacidad de atención de dicha área. La herramienta de BI
empoderará al usuario del área comercial y podrá apreciar la información acorde a sus necesidades
de consolidación, selección de columnas a mostrar, selección de valores y rubros del movimiento
comercial, áreas regionales, agentes comerciales, clientes, condiciones de pago, etc., con lo cual se
podrá mejorar la gestión de venta de los productos, atención a los clientes, reducir, eliminar o
fortalecer determinadas familias de productos vendibles, etc.
Además, se podrá apreciar tendencias, y falencias en la gestión de ventas. Por ejemplo, comparar
productividad entre los vendedores.
El usuario será real dueño de su información, y se verá aun más satisfecho con la posibilidad que
sea visto por web, generar gráficos e impresiones de impacto y poder manipular dicha información,
usando todo el potencial de funcionalidades que proporcionan el potente DW Pentaho.
Los beneficios tangibles e intangibles de la implementación de este Data mart son:
2.2.1. Beneficios Tangibles
Información histórica que permita analizar la situación de la empresa en el área de ventas.
Reportes generados en el tiempo requerido por cada proceso del periodo.
Inteligencia de Negocios
15
Cuadros de información consolidada en gráficos que permitan tomar decisiones a nivel
gerencial.
Optimizar el uso de sus recursos vendedores de acuerdo a las decisiones que pueda
determinarse de la información analizada en ventas.
Incrementar las ventas en un 20% de acuerdo la evaluación de los productos por sus distintos
tipos de presentaciones.
2.2.2. Beneficios Intangibles
Satisfacción del gerente del área quien tendrá información de vital importancia para evaluar el
área a cargo.
Entrega de información a tiempo para sus evaluaciones propias como para la entrega de
informes a nivel gerencial.
Ahorro de tiempo en analizar datos centralizados en los cuadros que ofrecen una información
más clara y precisa.
Inteligencia de Negocios
16
2.3. Análisis Dimensional
2.3.1. Tablas Dimensionales
Table Name DIM_CLIENTE
Table Type Dimensión
View Name DIM_CLIENTE
Display Name DIM_CLIENTE
Description
Tabla dimensional que contiene los datos de los clientes.
Used in schemas Ventas
Target Source
Column Name Display Name Description Datatype Size Precision Key? FK To
NULL? Default Value
Example Values
SCD Type
Source System
Source Schema
Source Table Source Field Name
Source Datatype
ETL Rules Comments
ID_Cliente ID Cliente Identificador del cliente Int 11 PK N 3245 Sistema Integrado
N/A
Autogenerar en el insert
Cod_Cliente Cod_Cliente Código del cliente varchar 6
N C07999 Sistema Integrado
N/A FACLIENTES Cd_Cliente A(6)
Razon_Social Razon_Social Razón social varchar 80 N TEXTIL REAL SAC
Sistema Integrado
N/A FACLIENTES Razon_Social A(60)
Desc_Tipo_Cliente Desc_tipo_cliente Tipo de cliente natural o jurídico
varchar 30 N CLIENTE NACIONAL
Sistema Integrado
N/A FACLIENTES Tipo_Cliente A(3)
Desc_Tipo_Documento Desc_tipo_documento Descripción del tipo documento identificatorio
varchar 20 N DNI Sistema Integrado
N/A FACLIENTES Estado A(1)
Nro_Documento_Id Nro. Documento Número de documento identificatorio
varchar 15 N
09752620 Sistema Integrado
N/A FACLIENTES Nro_Documento A(15)
Estado Estado Estado del registro varchar 1
N
A
Sistema Integrado
N/A FACLIENTES Estado A(1)
País País Descripción del país del cliente
varchar 30
N
PERU
Sistema Integrado
N/A FAPAIS País A(30)
Ubicación_Dept Ubicación_Dept ID de la dimensión Ubicación Geográfica, jerarquía Departamento
varchar 15
N
Lima
Sistema Integrado
N/A FAUBICACION Ubicación_Dept A(15)
Ubicación_Prov Ubicación_Prov ID de la dimensión Ubicación Geográfica, jerarquía Provincia
varchar 20
N
Lima
Sistema Integrado
N/A FAUBICACION Ubicación_Prov A(20)
Ubicación_Dist Ubicación_Dist ID de la dimensión Ubicación Geográfica, jerarquía Distrito
varchar 30
N
San Miguel
Sistema Integrado
N/A FAUBICACION Ubicación_Dist A(30)
Inteligencia de Negocios
17
Table Name DIM_CONDICION_PAGO
Table Type DIM_CONDICION_PAGO View Name DIM_CONDICION_PAGO Display Name DIM_CONDICION_PAGO
Description Tabla dimensional que contiene los valores de condiciones de pago referenciadas en las transacciones de ventas.
Used in schemas
Ventas
Target Source
Column Name Display Name Description Datatype Size Precision Key? FK To
NULL? Default Value
Example Values
SCD Type
Source System
Source Schema
Source Table Source Field Name Source Datatype
ETL Rules Comments
ID_Condición_Pago ID_Condición_Pago Identificador de condición de pago
Int 11 PK 23
Autogenerar en el insert
Cod_Condición Cod_Condición Código de la condición de pago del documento
varchar 11
L60 Sistema Integrado
N/A FACONDICION Cd_condicion A(3)
Desc_Condición Desc_Condición Descripción de la condición de pago
varchar 52 LETRA A 60 DIAS
Sistema Integrado
N/A FACONDICION Desc_condicion A(40)
Nro_Días_Plazo Nro_Días_Plazo Número de días de plazo int 11 60 Sistema Integrado
N/A FACONDICION Nro_dias_plazo N(3)
Table Name DIM_VENDEDOR
Table Type Dimensión View Name DIM_VENDEDOR Display Name DIM_VENDEDOR
Description Tabla dimensional que contiene los Vendedores de la empresa
Used in schemas
Ventas
Target Source
Column Name Display Name Description Datatype Size Precision Key? FK To NULL? Default Value
Example Values SCD Type
Source System
Source Schema
Source Table Source Field Name
Source Datatype
ETL Rules Comments
ID_Vendedor ID_Vendedor Identificador del vendedor
Int 11 PK
Autogenerar en el insert
Cod_Vendedor Cod_Vendedor Código de vendedor varchar 4
V0014 Sistema Integrado
N/A FAVENDEDOR Cod_vendedor A(3)
Nombre_Vendedor Nombre_Vendedor Nombre del vendedor varchar 70 DANIEL PAREJA Sistema Integrado
N/A FAVENDEDOR Nombre_vendedor A(70)
Estado_Vendedor Estado_Vendedor Estado del vendedor varchar 1
Activo Sistema Integrado
N/A FAVENDEDOR Estado_vendedor A(1)
Inteligencia de Negocios
18
Table Name DIM_ITEM_INVENTARIO
Table Type Dimensión
View Name DIM_ITEM_INVENTARIO Display Name DIM_ITEM_INVENTARIO
Description Tabla dimensional que contiene los ítems de inventario
Used in schemas Ventas
Target Source
Column Name Display Name Description Datatype Size Precision Key? FK To
NULL? Default Value
Example Values
SCD Type
Source System
Source Schema
Source Table Source Field Name Source Datatype
ETL Rules Comments
ID_Item_Inventario ID_Item_Inventario ID de la dimensión ítem de inventario
int 11
PK
Autogenerar en el insert
Cod_Item Cod_Item Código identificatorio del ítem de inventario
Varchar 8
V0014 Sistema Integrado
N/A FAARTICULOS Cd_item A(8)
Descripción_Item Descripción_Item Descripción del ítem de inventario
Varchar 120
Sistema Integrado
N/A FAARTICULOS Descripción_item A(120)
Familia Familia Descripción de la familia de inventarios
Varchar 60
Sistema Integrado
N/A INFAMILIA Desc_familia A(60)
Estado_Item Estado_Item Estado del ítem de inventario
Varchar 1
Sistema Integrado
N/A ADESTADO Desc_estado A(60)
Precio_Unitario Precio_Unitario Precio unitario de venta (sin IGV)
Decimal 12,2
Sistema Integrado
N/A FAARTICULOS Precio_Unitario N(12,2)
Cod_Artículo Cod_Artículo Código de articulo base textil
varchar 16
Sistema Integrado
N/A INART.BASE Cd_Artículo A(15)
Desc_Artículo Desc_Artículo Descripción del artículo base textil
varchar 70
Sistema Integrado
N/A INART.BASE Desc_Artículo A(60)
Nro_Diseno Nro_Diseno Nro de diseño (estampado) varchar
5
Sistema Integrado
N/A PR.DISENO Nro_Diseno A(5)
Cod_Color Cod_Color Código de color varchar
5
Sistema Integrado
N/A PR.COLOR Cd_Color A(5)
Desc_Color Desc_Color Descripción del color varchar
80
Sistema Integrado
N/A PR.COLOR Desc_Color A(800)
Cod_Calidad Cod_Calidad Código de calidad varchar
1
Sistema Integrado
N/A PR.CALIDAD Cd_Calidad A(1)
Desc_Calidad Desc_Calidad Descripción de la calidad varchar
20
Sistema Integrado
N/A PR.CALIDAD Desc_Calidad A(20)
Unidad_Medida Unidad_Medida Descripción de la unidad de medida
varchar 30
Sistema Integrado
N/A FAARTICULOS Unidad_Medida A(4)
Inteligencia de Negocios
19
Table Name DIM_TIEMPO
Table Type Dimensión
View Name DIM_TIEMPO
Display Name DIM_TIEMPO
Description
Tabla dimensional que contiene los parámetros o intervalos de tiempos
Used in schemas
Ventas
Target Source
Column Name Display Name Description Datatype Size Precision Key? FK To NULL? Default Value
Example Values SCD Type
Source System
Source Schema
Source Table Source Field Name Source Datatype
ETL Rules Comments
ID_Tiempo ID_Tiempo Identificador de tiempo int 11 PK 16458
N/A N/A Hoja de cálculo en Excel
Fecha Fecha Fecha date 10 7 FEB 2012 N/A N/A Hoja de cálculo en Excel
Anyo Anyo Número de año int 11 23 N/A N/A Hoja de cálculo en Excel
Nro_Mes Nro_Mes Número del Mes int 11 6 N/A N/A Hoja de cálculo en Excel
Mes Mes Nombre del Mes varchar 10 Junio N/A N/A Hoja de cálculo en Excel
Nro_Semana_Anual Nro_Semana_Anual Número de semana anual
int 11 2 N/A N/A Hoja de cálculo en Excel
Bimestre Bimestre Número de bimestre int 11 1 N/A N/A Hoja de cálculo en Excel
Trimestre Trimestre Número de trimestre int 11 2 N/A N/A Hoja de cálculo en Excel
Semestre Semestre Número de semestre int 11
1
Inteligencia de Negocios
20
Tablas de Hechos
Table Name HECHO_VENTA
Table Type Fact
View Name HECHO_VENTA
Display Name HECHO_VENTA
Description Tabla de hechos que contiene información del movimiento de ventas
Target
Source
Column Name Display Name Description Datatype Size Precision
Key? FK To NULL?
Default Value
Example Values
Source System
Source Schema
Source Table Source Field Name
Source Datatype
Extraction/Transformation Rules
Comments
Key_venta Key_Ventas Clave única para los registros de ventas
Int 11
N
985654 BBDD MySql NA
Asignado por el auto generador de la base de datos
ID_Tiempo ID_Tiempo Identificador de la tabla dimensional tiempo
Int 11
FK DIM_TIEMPO
Sistema Integrado
N/A
Asignado por el sistema transaccional
ID_Cliente ID_Cliente Identificador de la tabla dimensional cliente
Int 11
FK DIM_CLIENTE
Sistema Integrado
N/A
Asignado por el sistema transaccional
iD_Condición_Pago iD_Condición_Pago Identificador de la tabla dimensional condición de pago
Int 11
FK DIM_CONDICION_PAGO
Sistema Integrado
N/A
Asignado por el sistema transaccional
ID_Vendedor ID_Vendedor Identificador de la tabla dimensional vendedor
Int 11
FK DIM_VENDEDOR
Sistema Integrado
N/A
Asignado por el sistema transaccional
ID_Item_inventario ID_Item_inventario Identificador de la tabla dimensional ítem de inventario
Int 11
FK DIM_ITEM_INVENTARIO
Sistema Integrado
N/A
Asignado por el sistema transaccional
Desc_Tipo_Doc Desc_Tipo_Doc Descripción del tipo de documento de operación
Varchar 10
Sistema Integrado
N/A FATIPO_DOCUMEN-TO
Desc_Tipo_Doc A (40)
Nro_Documento Nro_Documento Serie y número del documento de ventas
Varchar 12 001-1234567
Sistema Integrado
N/A FACLIENTES Nro_Documento Ar(15) Nro_serie + '-' + Nro_correlativo
Cantidad_Venta Cantidad_Venta Cantidad Vendida Decimal 12,3 5 Sistema Integrado
N/A FAREGISTRODET Cantidad N(12,3)
VentaNeta_MonLocal VentaNeta_MonLocal Venta neta moneda local (nuevos soles)
decimal 12,2
5,000.00
Sistema Integrado
N/A FAREGISTRODET (calculado por el ETL)
money FAREGISTRO.Imp_Unit_MN * (1 + FAREGISTRODET.Pct_iva)
VentaNeta_MonDolar VentaNeta_MonDolar Venta neta dólares decimal
12,2
1,600.00
Sistema Integrado
N/A FAREGISTRO, FAREGISTRODET
(calculado por el ETL)
money FAREGISTRO.Imp_Unit_ME * (1 + FAREGISTRODET.Pct_iva)
Iva_MonLocal Iva_MonLocal Monto impuestos a las ventas en moneda local (nuevos soles)
decimal 12,2 1,300.00
Sistema Integrado
N/A FAREGISTRO, FAREGISTRODET
(calculado por el ETL)
money VentaNeta_MonLocal * FAREGISTRODET.Pct_iva
Iva_MonDolar Iva_MonDolar Monto impuestos a las ventas en dólares
decimal 12,2 320.00
Sistema Integrado
N/A FAREGISTRO, FAREGISTRODET
(calculado por el ETL)
money VentaNeta_MonDolar * FAREGISTRODET.Pct_iva
VentaTotal_MonLocal VentaTotal_MonLocal Venta total en moneda local (nuevos soles)
decimal 12,2
6,300.00
Sistema Integrado
N/A FAREGISTRODET, INV.STK.CICLICO
(calculado por el ETL)
money VentaNeta_MonLocal + Iva_MonLocal
VentaTotal_MonDolar VentaTotal_MonDolar Venta total en moneda dólares
decimal 12,2 1,620.00
Sistema Integrado
N/A FAREGISTRODET, INV.STK.CICLICO
(calculado por el ETL)
money VentaNeta_MonDolar + Iva_MonDolar
Inteligencia de Negocios
21
2.3.2. Modelo Lógico
hecho_venta
ID_Tiempo (FK) ID_Cliente (FK) ID_Condición_Pago (FK) ID_Vendedor (FK) ID_Item_Inventario (FK) Desc_Tipo_Doc Nro_Documento Cantidad_Venta VentaNeta_MonLocal VentaNeta_MonDolar Iva_MonLocal Iva_MonDolar VentaTotal_MonLocal VentaTotal_MonDolar
dim_vendedor
ID_Vendedor Cod_Vendedor Nombre_Vendedor Estado_Vendedor
dim_condición_pago
ID_Condición_Pago Cod_Condición Desc_Condición Nro_Días_Plazo
dim_item_inventario
ID_Item_Inventario Cod_Item Descripcion_Item Familia Estado_Item Precio_Unitario Cod_Artículo Desc_Articulo Nro_Diseno Cod_Color Desc_Color Cod_Calidad Desc_Calidad Unidad_Medida
Fuente: propia
dim_tiempo
ID_Tiempo Fecha Anyo Nro_Mes Mes Nro_Semana_Anual Bimestre Trimestre Semestre
dim_cliente
ID_cliente Cod_cliente Razon_Social Desc_Tipo_Cliente Desc_Tipo_Documento Nro_documento_id Estado Direccion Pais Ubicación_Dept Ubicación_Prov Ubicación_Dist
Inteligencia de Negocios
22
2.4. Estimación de la Cantidad de Datos y Tamaño de BD
Tablas Dimensionales
Nombre de archivo Tamaño del registro en
bytes
Nro registros (Aprox.)
Total bytes MBytes
Dim_vendedor 86 20 1,720 0.1
Dim_cliente 258 4501 1’161,258 0.9
Dim_tiempo 97 3600 349,200 0.3
Dim_condición_pago 85 40 3400 0.1
Dim_item_inventario 440 7000 12’320,000 1.4
Tabla de Hecho:
Nombre de archivo Tamaño del registro en
bytes
Nro registros nuevos x
año (Aprox.)
Años Total bytes MBytes
Hecho_ventas 163 52800 4 34’425,600 28.33
Resumen del cálculo:
Tablas dimensionales: 1.4 Mb.
Tabla de hechos: 28.33 Mb.
2.5. Reportes y Consultas a Generar
Para Análisis de Ventas
Reporte de cantidad productos vendidos por país por periodo de tiempo
Reporte de las montos de venta total por moneda local por período de tiempo
Reporte de las montos de venta total por moneda en dólares por período de tiempo
Reporte de Cantidad de Ventas por Vendedor por periodo de tiempo y por país
Reporte del IGV a pagar en moneda local por período de tiempo
Reporte del IGV a cobrar en moneda dólares por período de tiempo
Reporte de Venta Neta en moneda local por período de tiempo
Reporte de Venta Neta en moneda local por período de tiempo.
Reporte utilidad operativa por familias de productos y productos
Inteligencia de Negocios
23
Reporte de margen de utilidad por familia de productos y calidad
Reporte de monto de ventas por diseño textil y combinación
Reporte de monto de ventas por color
Reporte de monto de ventas por proceso textil
Reporte de monto de ventas por ancho
Reporte de monto de ventas por vendedor y moneda
Reporte del movimiento en un periodo de tiempo de las ventas totales en moneda local
Reporte del movimiento en un periodo de tiempo de las ventas totales en moneda
dólares
Indicadores estadístico del desempeño de un vendedor con respecto a la cantidad
vendida por período de tiempo.
Reporte de análisis del movimiento de la familia de un producto en el tiempo.
Reporte de análisis de la cantidad vendida en el tiempo.
Reporte de análisis de la cantidad vendida por ubicaciones en el tiempo.
Reporte de análisis de la cantidad vendida por cliente y tipo de cliente en el tiempo.
Reporte de Análisis de Ventas por período y por Vendedores
Reporte de Análisis de Ventas por clientes y por el producto A
Reporte de Análisis de Ventas por clientes y por el producto B
2.6. Identificación de la infraestructura necesaria para el proyecto HW
y SW
La infraestructura necesaria para el proyecto se muestra a continuación:
Hardware
Servidor:
Se requiere 2 servidores con las siguientes características: (1 en spare)
Procesador Procesador Intel Xeon Quad Core
Memoria RAM 8 Gb
Disco Duro 3 de 500 Gb.
Raid 5
Inteligencia de Negocios
24
Terminal:
Procesador Procesador Intel® Core™i3
Memoria RAM (mínimo) 2 Gb
Disco Duro (mínimo) 100 Gb
Software
Servidor:
Sistema Operativo Microsoft Windows Server 2008 Standard
Edition
Servidor de Base de Datos SQL Server 2008 Enterprise Edition
Tipo de Licencia Enterprise
Terminal
Sistema Operativo Microsoft Windows XP SP3
SW Adicional Requerido:
Pentaho Data Integration (Kettle ETL)
Pentaho Open BI Suite
Mondrian
Java 6 Development Kit (JDK)
3. Desarrollo de la solución
Para el desarrollo del datamart se ha desarrollado lo siguiente:
PENTAHO BI SERVER
La plataforma de BI de Pentaho consiste en una aplicación de inteligencia de negocios J2EE
que incluye elementos como Pentaho Reporting y Pentaho Analysis. Pentaho es un framework,
el cual, crea, publica, almacena, comparte y gestión a través del Suite BI de Pentaho.
Para el presente proyecto se trabajará con la base de datos MySql, para lo cual, deberá estar
instalado previamente, asimismo, dicha BD será direccionado para acceso desde las
herramientas de pentaho.
Inteligencia de Negocios
25
Para instalar pentaho BI Server proceder de la siguiente forma:
1. Primeramente, deberá descargarse e instalarse JDK (versión 1.5 en adelante), el cual, se
puede efectuar ingresando a la página de Oracle.
2. Luego, proceder a descarga la herramienta Pentaho BI Server desde la siguiente
dirección:
http://community.pentaho.com/projects/bi_platform/
3. En seguida, proceder a desempaquetar el archivo .zip dentro de una carpeta, ejemplo:
“c:\pentaho”.
Mostrará las siguientes carpetas:
Administration-console: Para administración de usuario y base de datos
BIServer-ce: Para la gestión de reportes y análisis de datos.
4. Proceder a configurar el puerto de acceso a la página de pentaho del servidor Tomcat,
para ello editar el archivo web.xlm desde:
• tomcat\
◦ webapps\
▪ pentaho\
▪ WEB-INF\
▪ web.xml
Por defecto el puerto es 8080 para el aplicativo de pentaho y se puede proceder a
modificar ubicando el siguiente tag:
<param-value>http://localhost:8080/pentaho/</param-value>
5. Ahora, procedemos a iniciar el servicio del servidor, ingresando a la carpeta BI-server
y ejecutando el archivo: start-pentaho.bat
Inteligencia de Negocios
26
6. Mostrará la siguiente ventana, el cual, se procederá a cargar el servidor Tomcat, si el
servicio se levanta correctamente mostrar el mensaje de “servidor iniciado”:
7. Finalmente, procedemos a ingresar a la siguiente dirección para iniciar la consola de
administración de pentaho:
http://localhost:8080/pentaho
El usuario y contraseña de pentaho es “joe” y “password” por defecto.
Inteligencia de Negocios
27
Herramienta ETL
Spoon es el diseñador gráfico de transformaciones y trabajos del sistema de ETL de Pentaho
Data Integration (PDI), también conocido como Kettle (acrónimo recursivo: "Kettle Extraction,
Transformation, Transportation, and Load Environment ").
Está diseñado para ayudar en los procesos ETL, que incluyen la Extracción, Transformación,
Transporte y Carga de datos, facilitando así el mantenimiento de un Data Warehouses.
Pan es un motor de transformación de datos que realiza muchas funciones tales como lectura,
manipulación, y escritura de datos hacia y desde varias fuentes de datos.
Para iniciar Kettle proceder con lo siguiente:
1. Descargar la herramienta desde la siguiente dirección:
http://kettle.pentaho.com/
2. Descomprimir el archivo recientemente descargado, en un directorio de su elección. Por
ejemplo: "c:\pentaho".
3. En seguida, ingresar a la carpeta “C:\pentaho\data-integration” y ejecutar el archivo
“Spoon.bat”
Inteligencia de Negocios
28
Una vez dentro de la herramienta se procede a iniciar un trabajo de transformación:
1. Haciendo clic en el botón de la barra de herramientas y seleccionar la opción
Transformación.
2. Seleccionando en el menú principal la opción: Fichero -> Nuevo -> Transformación
3. Presionando las teclas CTRL-N
Cualquiera de estas acciones abre una pestaña nueva para comenzar a diseñar una
Transformación.
Luego, se procederá a configurar la conexión a la base de datos de MySQL, para el caso
práctico del proyecto se mostrará la extracción de datos de archivo .csv y como destino una
base de datos en MySQL:
Para crear una nueva conexión seleccionar en el panel izquierdo "Arbol Principal", hacer
clic derecho en "Conexiones a bases de datos" y seleccionar "Nuevo" o "Asistente Nueva
Conexión". También se puede hacer doble clic en "Conexiones a bases de datos", o
presionar F3.
Inteligencia de Negocios
29
En la ventana siguiente proceder a llenar información básica de conexión como nombre
de la conexión, tipo, método de acceso, nombre del servidor y acceso al mismo.
La herramienta ofrece una serie de opciones que permite adecuar y mejorar el performance de
la extracción y transformación de los datos uno de ellos es que Spoon utiliza una caché de
base de datos. Cuando los datos de la caché ya no coinciden con la base de datos en cuestión,
hacer clic derecho sobre la conexión en el Árbol Principal y seleccionar la opción 'Vaciar caché
de Base de Datos'. Este comando se usa generalmente cuando las tablas de las bases de
datos han sido cambiadas, creadas o eliminadas.
En seguida se procede a agrega pasos de transformación, para lo cual, haciendo uso de las
herramientas se arrastrarán al área de transformación los siguientes elementos:
Para la entra de datos desde un archivo de formato .csv
Para transformar los datos de entrada en salidas de acuerdo al
formato de los campos del archivo de salida.
Inteligencia de Negocios
30
Para cargar los datos proveniente del archivo de entrada o de
transformación.
Luego, realizar la integración del flujo, para obtener lo siguiente:
Para configurar los datos proceder a editar los pasos de transformación de cada uno de los
elementos asignando clic botón derecho y seleccionando la opción “Edit step”.
Para el elemento de entrada se registra el nombre del archivo que contiene el origen de
datos.
Inteligencia de Negocios
31
Para el elemento de salida se selecciona la base de datos y tabla donde se cargarán
los datos.
Y el elemento de “Select Values” para seleccionar y definir la transformación de los
campos entre la entrada de datos y la salida del mismo.
Inteligencia de Negocios
32
Finalmente, proceder a ejecutar el trabajo de transformación ( ), y en la ventana de “Execute
transformation” clic en la botón “Launch”, y mostrará el siguiente resumen de transformación
exitosa:
Inteligencia de Negocios
33
Herramienta Mondrian
Lo siguiente es para mostrar la construcción de un cubo utilizando el editor de cubos de
pentaho llamado Schema Workbench.
Para iniciar Schema Workbench proceder con lo siguiente:
1. Descargar la herramienta desde la siguiente dirección:
http://mondrian.pentaho.com/
2. Descomprimir el archivo recientemente descargado, en un directorio de su elección. Por
ejemplo: "c:\pentaho".
3. En seguida, ingresar a la carpeta “C:\pentaho\schema-workbench” y ejecutar el archivo
“workbench.bat”
En primer lugar, proceder a establecer la conexión con la base de datos, para ello seleccionar
la opción “Database connection” desde el menú “Options”.
Y se procede a configuración la conexión a la base de datos con el que se trabajará la creación
del cubo, por ejemplo: Conexión al servidor MySQL y base de datos DW_Perupima:
Inteligencia de Negocios
34
En seguida se procede a crear el cubo:
1. Seleccionar la opción “File\New\Schema” para crear un nuevo esquema.
2. En seguida se procede a asignar el nombre al esquema, luego se procede a agregar
3. un cubo asignando clic derecho sobre “Schema”, tal como se muestra a continuación:
Inteligencia de Negocios
35
4. Asimismo, se van agregando las tablas que hacen referencia a los datos, las
dimensiones, además, de campos calculados, en la siguiente ventana nuestra el cubo
para el análisis de ventas por periodo de los vendedores:
5. Luego, se procede a publica el cubo para visualizar a través del servidor de pentaho,
para ello ingresa a la opción “Publish…” dentro del menú “File”:
Inteligencia de Negocios
36
Se debe verificar la URL donde se encuentra instalado pentaho, para las credenciales
de Pentaho utilizar el usuario por defecto “joe” y la clave “password”, para establecer la
clave de publicación ingresar a la carpeta “…biserver-ce\pentaho-solutions\system” y
editar el archivo “Publisher_config.xml” y agregar la contraseña dentro del tag
“Publisher-config”:
Inteligencia de Negocios
37
Luego, clic en la OK y si la conexión al repositorio es correcto muestra la siguiente
pantalla:
Dentro de la ventana se registra:
La locación del esquema en este caso se va alojar en la nueva carpeta “be-
perupima”
Y para la configuración de publicación “Publish Settings” se indica el nombre
de la conexión a la base de datos que se encuentra configurado en el servidor
pentaho y se activa la opción “Register XMLA Data Source” para que el
sistema cree un archivo adicional XML que contendrá la configuración para la
conexión de datos y la estructura del cubo dimensional.
Y clic en el botón “Publish” para terminar la publicación.
Herramienta Pentaho BI Server
Pentaho Bi Server cuenta con funciones web para gestionar el sistema, así como también,
incluye una solución que integra reportes, análisis, dashboards y componente de Datamining.
En seguida, se muestra el uso de la herramienta para analizar datos de un cubo.
1. Para iniciar pentaho Server BI se procede de la siguiente forma:
Primero, ingresar a la carpeta “..\pentaho\ biserver-ce” y ejecutar el archivo “start-
pentaho.bat”.
Inteligencia de Negocios
38
Luego, ingresar a la dirección web de pentaho donde se encuentra instalado:
http://localhost:8087/pentaho/
Ingresar el usuario por defecto “joe” y la clave “password”
2. Dentro de la aplicación, ingresar a la opción “Analysis View”.
3. Luego, dentro de la ventana seleccionar el esquema y el cubo a analizar los datos, clic OK
Inteligencia de Negocios
39
4. En seguida, se mostrará el cubo:
Se podrá hacer uso de las distintas opciones de la barra de la vista de análisis para
filtrar datos, efectuar consultas MDX, ordenar, cambiar la perspectiva de los datos
entre horizontal / vertical, exportar a Excel, imprimir o incluso agregar un .
Por ejemplo, clic en el botón “Chart Config” y mostrará las siguiente opciones
desde donde podrá elegir las características del gráfico:
Elegir para el tipo de gráfica “Pie Charts by Row” y clic en OK, y se mostrará lo
siguiente:
Inteligencia de Negocios
40
Inteligencia de Negocios
41
Reportes realizados:
Reporte de Análisis de Ventas por período y por Vendedores
Se puede apreciar el reporte por año en este caso 2011 por mes y por condición de pago para
cada vendedor, donde podemos sacar indicadores de que vendedor es más productivo, bajo
que condición de pago es el más usado por el vendedor
Inteligencia de Negocios
42
Reporte de Análisis de Ventas por clientes y por el producto A
En este reporte podemos analizar las ventas por clientes por tipo de productos y por periodo de
tiempo de manera que podemos ver el comportamiento de un cliente en el tiempo, podemos
ver que productos son los más vendidos en determinados períodos de tiempo.
Inteligencia de Negocios
43
Reporte de Análisis de Ventas por clientes y por el producto B
En este reporte también podemos observar las ventas por clientes y por tiempo de un
determinado producto y poder analizar el comportamiento de este producto en el tiempo y que
tipo de clientes lo prefieren.
Inteligencia de Negocios
44
4. Administración del Proyecto
Inteligencia de Negocios
45
CONCLUSIONES
Las necesidades de información de la Dirección de la organización deben ser
analizadas para realizar un modelamiento dimensional preparado para necesidades y
crecimiento futuro de los SI de la empresa. Al diseñar el Datamart se debe pensar en
que será parte de un Data Warehousing para la empresa.
La tendencia actual es orientar las soluciones de Inteligencia de Negocios al nivel de
estrategias de la empresa. Por lo tanto, el equipo de proyecto de TI debe retroalimentar
las necesidades de la gerencia de Perú Pima S.A. para ayudar en las actividades de la
planificación estratégica.
Si bien es cierto que el proyecto se inicia con una solución BI para el área Comercial y
de Finanzas, es interesante colocar información que permita contrastar y generar
indicadores claves para dichas áreas como el comportamiento de las ventas de un
determinado producto en un periodo de tiempo o el comportamiento de un producto
específico por tipo de cliente en un periodo de tiempo. Hemos dirigido el modelamiento
dimensional en función a una visión macro. Un ejemplo de ello es el diseño de la tabla
de hechos de Ventas que incluye la utilidad y margen porcentual de utilidad por
producto; siendo esta información útil a la Contabilidad de Costos.
Un aporte efectivo en cuanto a requerimientos de información por parte de los usuarios
permitirá valor agregado en la solución BI del proyecto.
Es muy importante conocer las estructuras transaccionales y las necesidades de los
usuarios con respecto a la solución BI a implementar, para poder hacer un adecuado
modelamiento dimensional para implementar correctamente dicha solución.
En proyectos BI usualmente el usuario decide cuanto tiempo atrás abarcará la data
histórica. Para nuestro proyecto estimamos que 6 años es una cantidad de tiempo
adecuada para mostrar consistencia en la información a mostrar en las consultas.
Es importante incluir al sponsor en todo el desarrollo del proyecto del Datamart.
Es importante utilizar una metodología para los procesos del desarrollo del proyecto y
que sirva como guía en cada una de las etapas de la implementación del Datamart
para garantizar el éxito del mismo.
Inteligencia de Negocios
46
BIBLIOGRAFIA
CURTO DIAZ, Josep Y CONESA I CARALT, Jordi
2010 Introducción al Business Intelligence. Editorial UOC, 2010. Ramba del Poblenou 156,
08018. Barcelona.ISBN: 978-84-9788-886-8
SABHERWAL, Raijiv y BECERRA-FERNANDEZ, Irma
2007 Business Intelligence. Practices, Technologies and Management.
ISBN: 978-0-470-46170-9
KROENKE, David M.
2003 Procesamiento de bases de datos, 8va Edicion. Pearson Educación, México. 2003
ISBN 970-26-0325-0
INMON, W.H.
2005 Building the Data Warehouse, 4th Edition. Hoboken: John Wiley & Sons.
Inteligencia de Negocios
47
GLOSARIO
OLAP: Es el acrónimo en inglés de On-Line Analytical Processing. Es un modelo de solución
informática cuyo objetivo es visualizar y trabajar en forma ágil con grandes cantidades de
información. Para lograr ello trabaja con estructuras multidimensionales que contienen datos
resumidos extraídos de las bases de datos transaccionales.
Schema: palabra en inglés que literalmente significa “esquema”. Relacionado con la teoría de
BI, significa modelo lógico de definición de las estructuras de datos y sus relaciones dentro de
una solución de Datawarehouse.
Inteligencia de Negocios
48
SIGLARIO
BI: Business Intelligent
DSS: Decision Support Systems
EEI: Enterprise Information Integration
KPI: Key Performance Indicator
ODS: Operational Data Store
OLAP: On-Line Analytical Processing
SI: Sistemas de Informacion
SQL: Structured Query Language
TI: Tecnologías de la Informacion
URL: Uniform Resource Locator
Inteligencia de Negocios
49
ANEXOS
ANEXO 01. Imágenes de algunas pantallas capturadas del sistema transaccional.
Pantalla de registro de documentos de facturación. Archivos FAREGISTRO y
FAREGISTRODET.
Fuente: Perú Pima S.A.
Inteligencia de Negocios
50
Tabla maestra de Ítems de Inventario. Archivo FAARTICULOS.
Fuente: Perú Pima S.A.
Sub-ventana del mantenimiento de Ítems de Inventario donde se aprecia los atributos de los
productos terminados:
Fuente: Perú Pima S.A.
top related