-
1
PONTIFICIA UNIVERSIDAD CATLICA DEL PER
FACULTAD DE CIENCIAS E INGENIERA
ANLISIS, DISEO E IMPLEMENTACIN DE UN DATAMART
PARA EL SOPORTE DE TOMA DE DECISIONES Y EVALUACIN DE LAS ESTRATEGIAS SANITARIAS EN LAS
DIRECCIONES DE SALUD
Tesis para optar por el Ttulo de Ingeniero Informtico, que presenta el bachiller:
Carmen Pamela Rosales Sedano
ASESOR: Carla Basurto Figueroa
Lima, Enero del 2009
-
Resumen El presente proyecto de tesis tiene como objetivo la implementacin de un datamart
que permita apoyar la toma de decisiones necesarias para cumplir con los objetivos
especficos de cada estrategia sanitaria nacional dentro de las direcciones de salud.
Se tom como estrategia sanitaria piloto, la estrategia de Alimentacin y Nutricin
Saludable. Para ella, se realiz la captura de requerimientos, anlisis, diseo y
construccin del datamart.
Los resultados obtenidos son los reportes analticos tiles para tomar decisiones de
forma rpida y confiable.
-
Dedicatoria: Este proyecto de tesis est dedicado
a mis padres por brindarme su apoyo
incondicional y por creer en m cada
da.
-
Agradecimientos: A Dios, por acompaarme siempre
A mis padres Carmen y Vctor, por su
infinito amor y su confianza en m
A mis hermanos, por su comprensin
A mis profesores, por sus consejos
Y a mis mejores amigos, por
brindarme su amistad sincera.
-
Tabla de Contenido Resumen.................................................................................................................................. 2 Tabla de Contenido.................................................................................................................. 2 ndice de Figuras...................................................................................................................... 3 ndice de Cuadros.................................................................................................................... 4 Introduccin.............................................................................................................................. 1 1. Captulo 1: Generalidades ............................................................................................ 2
1.1. Definicin del Problema.......................................................................................... 2 1.2. Marco conceptual del problema ............................................................................. 4 1.2.1. Conceptos: Inteligencia de Negocios ..................................................................... 4 1.2.2. Conceptos: Anlisis Dimensional ........................................................................... 5 1.2.3. Conceptos: Software Libre ..................................................................................... 7 1.2.4. Conceptos: Sector Salud........................................................................................ 9 1.3. Plan de Proyecto .................................................................................................. 12 1.4. Estado del Arte ..................................................................................................... 17 1.4.1. Herramientas de extraccin de datos................................................................... 17 1.4.2. Herramientas de explotacin de datos................................................................. 23 1.4.3. Tesis y productos similares .................................................................................. 28 1.5. Descripcin y sustentacin de la solucin............................................................ 31
2. Captulo 2: Anlisis ..................................................................................................... 33 2.1. Definicin de la metodologa ................................................................................ 33
2.1.1. El modelo de Inmon ......................................................................................... 33 2.1.2. Metodologa de Ralph Kimball ......................................................................... 36 2.1.3. Eleccin de la metodologa .............................................................................. 38
2.2. Identificacin de Requerimientos ......................................................................... 41 2.2.1. Requerimientos Funcionales............................................................................ 41 2.2.2. Requerimientos no funcionales........................................................................ 44
2.3. Anlisis de la Solucin.......................................................................................... 45 2.3.1. Consideraciones sobre el sistema ................................................................... 45 2.3.2. Actores del sistema.......................................................................................... 46 2.3.3. Anlisis tcnico y econmico ........................................................................... 47 2.3.4. Definicin del sistema ...................................................................................... 47
3. Captulo 3: Diseo....................................................................................................... 51 3.1. Arquitectura de la solucin ................................................................................... 51 3.2. Proceso de Extraccin.......................................................................................... 52 3.3. Proceso de Explotacin........................................................................................ 57
4. Captulo 4: Construccin............................................................................................. 59 4.1. Configuracin del software ................................................................................... 59
4.1.1. Configuracin de la base de datos................................................................... 59 4.1.2. Configuracin de Pentaho................................................................................ 60
4.2. Construccin de procesos de carga..................................................................... 64 4.2.1. Carga de dimensin: ACTIVIDAD_ENFERMEDAD ........................................ 64
4.3. Construccin de reportes ..................................................................................... 65 4.3.1. Reporte: Prevalencia de Enfermedades .......................................................... 65
4.4. Ejecucin de pruebas de proceso de carga ......................................................... 67 4.5. Ejecucin de reportes........................................................................................... 68
5. Capitulo 5: Observaciones, conclusiones y recomendaciones................................... 70 5.1. Observaciones...................................................................................................... 70 5.2. Conclusiones ........................................................................................................ 71 5.3. Recomendaciones y trabajos futuros ................................................................... 71
Bibliografa ............................................................................................................................. 73
-
ndice de Figuras
Figura 1.1 Modelo Estrella ....................................................................................................... 7 Figura 1.2 Esquema Copo de Nieve........................................................................................ 7 Figura 1.3 Procesos de direccin de proyectos..................................................................... 13 Figura 1.4 reas de Conocimiento de la Direccin de Proyectos ......................................... 15 Figura 1.5 Proyecto de Tesis - WBS...................................................................................... 16 Figura 1.6: IBM WebSphere DataStage ................................................................................ 19 Figura 1.7: SQL Server Integration Services ......................................................................... 20 Figura 1.8: Transformation en Kettle-Pentaho (Data Integration) ......................................... 21 Figura 1.9: Ejemplo de Reporte de Anlisis Pentaho Anlisis. .......................................... 26 Figura 2.1 Estructura del DW\................................................................................................ 34 Figura 2.2. ERD ..................................................................................................................... 35 Figura 2.3. Relacin entre ERD y DIS ................................................................................... 35 Figura 2.4. Elementos bsicos del DWH segn Kimball ....................................................... 36 Figura 3.1 Arquitectura de extraccin.................................................................................... 52 Figura 3.2 Ejemplo de Reporte Diseo de Explotacin...................................................... 58 Figura 4.3. Kettle Pantalla Inicio ......................................................................................... 61 Figura 4.4. Kettle - Configuracin de Conexin..................................................................... 62 Figura 4.5. Cube Designer Descripcin del cubo ............................................................... 63 Figura 4.6. Cube Designer Conexin JNDI ........................................................................ 63 Figura 4.7. Kettle Carga dimensin ACTIVIDAD_ENFERMEDAD..................................... 65 Figura 4.8. Cube Designer Seleccin de dimensiones y tabla de hecho ........................... 66 Figura 4.9. Cube Designer Creacin de medidas............................................................... 66 Figura 4.10. Cube Designer Publicacin de Cubo.............................................................. 67 Figura 4.11. Kettle Ejecucin de carga............................................................................... 68 Figura 4.12. Kettle Resultado de ejecucin ........................................................................ 68 Figura 4.13. Reporte de Prevalencia de Enfermedades (1) .................................................. 69 Figura 4.14. Reporte de Prevalencia de Enfermedades (2) .................................................. 69
-
ndice de Cuadros Cuadro 1.1 Procesamiento OLAP............................................................................................ 9Cuadro 1.2 Estrategias Sanitarias Nacionales ...................................................................... 10Cuadro 1.3 Cuadro Comparativo Herramientas Extraccin . Error! Marcador no definido.Cuadro 1.4 Cuadro Comparativo Herramientas Explotacin ............................................. 28Cuadro 2.1 Facts vs Dimensiones......................................................................................... 50Cuadro 3.1 Dimensin Actividad_Enfermedad Descripcin de Tablas Fuentes................ 53Cuadro 3.2 Dimensin Actividad_Enfermedad Limpieza de Datos.................................... 53Cuadro 3.3 Dimensin Actividad_Enfermedad Tablas Fuentes......................................... 54Cuadro 3.4 Dimensin Actividad_Enfermedad Tabla Destino ........................................... 54Cuadro 3.5 Fact Table Alimentacion_PANTBC Tablas Fuentes........................................ 55Cuadro 3.6 Fact Table Alimentacion_PANTBC Limpieza de Datos................................... 55Cuadro 3.7 Fact Table Alimentacion_PANTBC Tablas Fuentes........................................ 56Cuadro 3.8 Fact Table Alimentacion_PANTBC Tabla Destino .......................................... 56
-
1
Introduccin
En nuestro pas, uno de los servicios importantes que, sin embargo, no cuenta con
el apoyo suficiente que debera recibir, es el rea de salud, en este hay tres
problemas principales que el estado debe afrontar: problemas sanitarios, del
sistema de salud y de los factores determinantes (medio ambiente, nutricin,
educacin, entre otros).
El ministerio de salud (MINSA) ha emprendido un nuevo plan concertado de salud para lograr disminuir y eliminar los problemas antes mencionados, parte del plan es
mejorar el sistema de salud all donde el adecuado manejo de informacin ayudara
al mejor control y seguimiento de acciones que se estn realizando. En general, el
MINSA tiene como obligacin establecer las polticas necesarias para llevar a cabo
todo tipo de acciones y adems ha establecido 10 estrategias sanitarias
nacionales con la finalidad de dar nfasis a temas fundamentales para la salud del
pas, a travs del abordaje, control, reduccin erradicacin o prevencin de los
daos-riesgos priorizados.
Uno de los objetivos principales del plan concertado es el de lograr la total
descentralizacin, es decir que cada gobierno regional vele por el cumplimiento del
plan y las estrategias sanitarias dentro de su jurisdiccin. Esta misin esta a cargo
de la Direccin de Salud (DISA), la cual controla y dirige a centros de salud
designados.
El proyecto se centra en el punto del manejo eficiente de informacin de cada
estrategia sanitaria dentro de cada una de las DISAs del pas.
-
2
1. Captulo 1: Generalidades Este captulo tratar sobre la definicin del problema que se desea solucionar,
marco conceptual necesario para entender el contexto, gestin del proyecto, estado
del arte y descripcin de la solucin.
1.1. Definicin del Problema El sistema de salud en el Per ha sido manejado de forma centralizada por muchos
aos, siendo el centro la capital, Lima, sin embargo esto ha demostrado que los
resultados no son satisfactorios sobretodo ha causado ineficiente distribucin de
recursos mdicos y personal. Como parte de la modernizacin del estado peruano,
se ha incluido la descentralizacin del sector de salud en respuesta al problema,
para llevarlo a cabo se ha tenido que realizar anlisis de ventajas y desventajas de
dicho proceso, as como la estimacin de costos y la anticipacin de problemas que
se pudieran presentar (problemas socio-econmicos, ambientales, polticos.).
Aunque la descentralizacin parece ser una buena solucin, no todas las
actividades pueden se descentralizadas, entre estas estn las que establecen
normas de control de calidad de servicios, de enfermedades transmisibles, de salud
ocupacional y otras polticas administrativas, en la actualidad el encargado de estas
actividades es el ministerio de salud (MINSA).
Aquellas actividades de salud que s son factibles de ser descentralizadas, sern
ejecutadas por cada uno de los gobiernos regionales, especficamente por las
-
3
Direcciones Regionales de Salud (DISA) que son encargadas de dicho sector.
El tema de descentralizacin se encuentra en el Plan Nacional Concertado de
Salud, en uno de sus lineamientos de poltica denominado La Descentralizacin
de la funcin salud a nivel del Gobierno Regional y Local seala que objetivo
estratgico es que los gobiernos regionales y locales ejerzan plenamente sus
funciones en materia de salud.
A continuacin se muestran las metas al 2011 del lineamiento:
- Culminar el proceso de transferencia de las funciones de salud a los
gobiernos regionales
- Incrementar las capacidades de gobierno suficientes y necesarias para la
gestin en salud en el nivel regional y local.
El estado ha iniciado el proceso de descentralizacin de salud siguiendo el
lineamiento mencionado, sin embargo an falta la total transferencia de funciones a
los gobiernos regionales y locales. Se muestra a continuacin aquellos puntos
importantes que todava no han sido totalmente implementados [ART01]:
- Formular, aprobar, ejecutar, evaluar, dirigir, controlar y administrar las
polticas de salud de la regin en concordancia con las polticas naciones y
los planes sectoriales.
- Coordinar las acciones de salud integral en el mbito regional
- Promover y ejecutar en forma prioritaria las actividades de promocin y
prevencin de la salud.
- Organizar, implementar y mantener los servicios de salud para la
prevencin, proteccin, recuperacin y rehabilitacin en materia de salud, en
coordinacin con los gobiernos locales.
- Conducir y ejecutar coordinadamente con los rganos competentes la
prevencin y control de riesgos y daos de emergencia y desastres.
El objetivo de la descentralizacin es hacer un estado al servicio de los ciudadanos
y que los servicios que presta sean cada vez mejores a travs del ejercicio del
gobierno en los niveles nacional, regional, local.
Como parte del desarrollo del objetivo, el MINSA ha definido las estrategias
sanitarias, las cuales se definirn en la seccin siguiente, las que debern ser
controladas y monitoreadas de forma descentralizada por cada DISA.
Actualmente cada DISA cuenta con un rea central de estadstica la cual
-
4
proporciona solo reportes estticos a todas las estrategias sanitarias que alberga.
Sin embargo el proceso de solicitud puede demorar cierto tiempo ya que el rea de
estadstica, adems, tiene que atender otras solicitudes de las dems reas que se
encuentran en la DISA. Es por ello que la toma de decisiones se ve retrasada por
no contar con los reportes en el tiempo estimado.
Para hacer posible que el objetivo y las metas del lineamiento se cumplan se
requiere un sistema de informacin que permita el monitoreo y la evaluacin de las
estrategias dentro de cada direccin regional siguiendo siempre las polticas fijadas
en el Plan Concertado, de esta manera se podr controlar los avances que se
realicen y el cumplimiento de las polticas. La inteligencia de negocios ser de
utilidad para la evaluacin de los resultados de cada estrategia sanitaria de las
DISAs.
Para el alcance del proyecto de fin de carrera, solamente se realizar la solucin
para la estrategia sanitaria de Alimentacin y Nutricin Saludable.
1.2. Marco conceptual del problema En esta seccin procederemos a explicar los conceptos mnimos requeridos para
llevar a cabo el presente trabajo de fin de carrera.
1.2.1. Conceptos: Inteligencia de Negocios
Inteligencia de Negocios Es un enfoque para la gestin empresarial que permite a una organizacin definir
que informacin es til y relevante para la toma de decisiones corporativas.
Inteligencia de Negocios es un esquema polifactico que fortalece a las
organizaciones para tomar mejores decisiones mas rpidamente, convertir los datos
en informacin y usar una estrategia inteligente para la gestin empresarial [BIB01].
Data Warehouse Es un almacn o repositorio para los datos. Muchos expertos definen el data
warehouse como un almacn de datos centralizados que introduce datos en un
almacn de datos especfico llamado datamart. Otros aceptan una amplia definicin
de data warehouse, como un conjunto integrado de datamarts.
Es utilizado para el proceso de toma de decisiones gerenciales. [BIB01]
-
5
Datamart Es un conjunto de datos que son estructurados de forma que facilite su posterior
anlisis. Un datamart contiene la informacin referente a un rea en particular, con
datos relevantes que provienen de las diferentes aplicaciones operacionales. Los
datamarts pueden ser de diversas bases de datos OLAP dependiendo del tipo de
anlisis que se quiera desarrollar
Explotacin de datos La explotacin de la informacin se realiza a travs de un amplio conjunto de
herramientas de consulta y anlisis de la informacin. Estas herramientas de
explotacin son sistemas que ayudan al usuario a la exploracin de los datos y
generacin de vistas de informacin. Se dividen en reporteadores, sistemas de
anlisis multidimensional, sistemas de apoyo a la toma de decisiones y sistemas de
informacin ejecutiva.
ETL (extract - transformation - load) ETL significa en espaol extraccin, transformacin y carga de los datos.
La extraccin es el primer paso en el proceso de obtencin de datos en el entorno
del data warehouse. Extraccin significa leer, entender los datos fuentes y copiar
los datos necesarios para el DWH en el Staging Area (rea de ETL) para su
manipulacin posterior.
Una vez que la data es extrada del Staging Area, hay numerosas y potenciales
transformaciones como la limpieza de datos (correccin de datos escritos de forma
errnea, resolviendo conflictos, colocacin en formatos nuevos, etc.), combinando
datos de mltiples fuentes, eliminando datos duplicados y asignando warehouse
keys (llaves primarias en el data warehouse).
Finalmente con todas las transformaciones, los datos son cargados en el rea de
presentacin del data warehouse [BIB01].
1.2.2. Conceptos: Anlisis Dimensional
Fact Table Es la tabla central del esquema en estrella que representa datos numricos en el
contexto de las entidades del negocio. La tabla de hechos esta constituida por
medidas y por foreign keys La fact table expresa la relacin muchos a muchos entre
las dimensiones dentro del modelo dimensional. [BIB01]
-
6
Dimensiones Son objetos del negocio con los cuales se puede analizar la tendencia y el
comportamiento del mismo. Las definiciones de las dimensiones se basan en
polticas de la compaa, e indican la manera en que la organizacin interpreta o
clasifica su informacin para segmentar el anlisis facilitando la observacin de los
datos. [BIB01]
Medidas o mtricas Son caractersticas cualitativas o cuantitativas de los objetos que se desean
analizar en las empresas. Las medidas cuantitativas estn dadas por valores o
cifras porcentuales. Por ejemplo las ventas en dlares, cantidad de unidades en
stock, cantidad de unidades de productos vendidos, etc. [BIB01]
Esquema Estrella Este esquema est formado por un elemento central que consiste en una tabla
llamada la Tabla de Hechos (Fact Table), que est conectada a varias tablas de
dimensiones.
Las tablas de hechos contienen los valores precalculados que surgen de totalizar
valorizar operacionales atmicos segn las distintas dimensiones, tales como
clientes, productos o periodos de tiempo. Se presenta un ejemplo, el cual
representa un evento crtico y cuantificable en el negocio como ventas o costos. Su
clave est compuesta por las claves primarias de las tablas de dimensin
relacionadas. [BIB01]
Esquema copo de nieve La figura que se muestra a continuacin, presenta una variante del esquema
estrella en el cual las tablas de dimensin estn normalizadas, es decir, pueden
incluir claves que apuntan a otras tablas de dimensin. Las ventajas de esta
normalizacin son la reduccin del tamao y redundancia en las tablas de
dimensin y un aumento de la flexibilidad en la definicin de dimensiones.
Sin embargo, el incremento en la cantidad de tablas hace que se necesiten ms
operaciones de unin para responder a las consultas, lo que empeora el
rendimiento, adems del mantenimiento que requieren las tablas adicionales.
[BIB01]
-
7
Figura 1.1 Modelo Estrella
Figura 1.2 Esquema Copo de Nieve
1.2.3. Conceptos: Software Libre Open Source Es el software que, una vez obtenido, puede ser usado, copiado, estudiado,
modificado y redistribuido libremente. El software libre suele estar disponible
gratuitamente, pero no se debe asociar software libre a software gratuito, o a precio
del costo de la distribucin a travs de otros medios; sin embargo no es obligatorio
que sea as y, aunque conserve su carcter de libre, puede ser vendido
comercialmente
-
8
Open Source Business Intelligence (OSBI) Es una solucin de Inteligencia de negocios basada en tecnologas open source
Sistemas OLTP vs sistemas OLAP Sistemas OLTP (On-Line Transaction Processing)
Mientras su tecnologa subyacente ha cambiado dramticamente con el tiempo, las
bases de datos operacionales mantienen su misma funcionalidad bsica: capturar,
actualizar, almacenar y recuperar archivos de datos, dichas base de datos estn
estructuradas con el propsito de dar apoyo a las operaciones diarias procesando
transacciones; ellas no han sido diseadas para desarrollar anlisis de negocio.
[BIB02]
Sistemas OLAP (On-Line Analytical Processing)
OLAP es una tecnologa de anlisis de datos que presenta una visin
multidimensional lgica de los datos en el data warehouse. La visin es
independiente de cmo se almacenan los datos, comprende siempre la consulta
interactiva y el anlisis de los datos con rapidez, de modo que el proceso de
anlisis no se vea interrumpido.
Los sistemas OLAP organizan los datos directamente como estructuras
multidimensionales, incluye herramientas fciles de usar por usuarios para
conseguir la informacin en mltiples y simultneas vistas dimensionales.
OLAP genera rpidos tiempos de respuesta los cuales permiten a los gerentes y
analistas preguntar y resolver ms situaciones en un corto perodo de tiempo
El motor de clculo de OLAP organiza los datos en una forma que permite a los
analistas escribir sencillas y directas frmulas que se ejecutan a travs de mltiples
dimensiones. Cuenta con tres formas principales de procesamiento: [CLA01]
Forma de Procesamiento Diagrama
MOLAP (Multidimensional OLAP) La data es pre-agregada y almacenada en estructuras propietarias conocidas como Cubos OLAP. Tiene un tiempo de respuesta muy bueno para consultas interactivas.
-
9
ROLAP (Relational OLAP) Obtiene los datos del data warehouse y los almacena en cubos temporales Su tiempo de respuesta es menor
HOLAP (Hybrid OLAP)
HOLAP consiste en diseminar los datos a travs de bases de datos relacionales y multidimensionales con la finalidad de obtener lo mejor de ambos sistemas
Cuadro 1.1 Procesamiento OLAP
1.2.4. Conceptos: Sector Salud
Direccin de Salud MINSA define a las Direcciones de Salud (DISAs) en [URL07] como los rganos
desconcentrados que ejercen la autoridad de salud por delegacin de la Alta
Direccin y tienen a su cargo, las siguientes funciones generales en sus respectivas
jurisdicciones:
a) Implementar la visin, misin, poltica, objetivos y normas sectoriales, en su
jurisdiccin.
b) Brindar, en forma eficaz y oportuna, la asistencia, apoyo tcnico y
administrativo a la gestin de las Direcciones de Red de Salud y de los
Hospitales bajo su dependencia y jurisdiccin.
c) Mantener informadas a las entidades pblicas y organizaciones en general,
que desarrollen actividades afines para el Sector Salud sobre los
dispositivos legales para la Salud, evaluando su cumplimiento.
Estrategias sanitarias La priorizacin de problemas especficos de salud requiere que se aborden por
estrategias sistematizadas con enfoque de Salud Pblica. La mayora de dichas
prioridades (riesgos y daos) son las Estrategias Sanitarias Nacionales.
Las estrategias sanitarias atraviesan todas las etapas de vida de la persona, no
tienen estructura orgnica, requieren de mecanismos propios para el seguimiento
de su evolucin epidemiolgica y de los procesos clave para la produccin de
-
10
servicios que se relacionan con estos problemas.
El desarrollo de las Estrategias Sanitarias considera:
- Definicin precisa de las prioridades sanitarias nacionales y regionales, a
partir de un anlisis cuidadoso de la salud nacional y regional.
- Identificacin del problema de salud, considerando todas las evidencias
disponibles de sus factores crticos que influyen en su origen y perpetuacin
- Plan de accin intersectorial, como producto del proceso de concertacin,
que incluye la definicin de responsabilidades a todo nivel. [ART03]
Las direcciones regionales deben aplicar dichas estrategias en la poblacin con sus
respectivas lneas de accin de cada una. [URL06]
El ministerio de salud ha establecido 10 estrategias sanitarias, se muestra un
cuadro con las respectivas estrategias y sus rganos responsables
Cuadro 1.2 Estrategias Sanitarias Nacionales
Estrategia de Alimentacin y Nutricin Saludable La Estrategia Sanitaria "Alimentacin y Nutricin Saludable" es una de las 10
estrategias del Ministerio de Salud que integra intervenciones (consejera
nutricional, sesiones demostrativas, campaas, charlas, talleres) y acciones
Estrategia Sanitaria Nacional rganos responsables
Inmunizaciones Direccin General de Salud de las Personas
Prevencin y Control de Enfermedades
Metaxnicas y otras Transmitidas por Vectores
Direccin General de Salud de las Personas
Prevencin y Control de Infecciones de
Transmisin Sexual y VIH-SIDA
Direccin General de Salud de las Personas
Prevencin y Control de Tuberculosis Direccin General de Salud de las Personas
Salud Sexual y Salud Reproductiva Direccin General de Salud de las Personas
Prevencin y Control de Daos No Transmisibles Direccin General de Salud de las Personas
Accidentes de Trnsito Oficina General de Defensa Nacional
Salud de los Pueblos Indgenas Centro Nacional de Salud Intercultural del
Instituto Nacional de Salud
Alimentacin y Nutricin Saludable Centro Nacional de Alimentacin y Nutricin
del Instituto Nacional de Salud
Salud Mental y Cultura de Paz Direccin General de Promocin de la Salud
-
11
priorizadas dirigidas a la reduccin de la morbi-mortalidad materna e infantil y a la
reduccin de las deficiencias nutricionales. Debe coordinar, supervisar y monitorear
las diversas actividades relacionadas a la alimentacin y nutricin que ejecutan los
establecimientos de salud. Su objetivo general mejorar el estado nutricional de la
poblacin peruana a travs de acciones integradas de salud y nutricin, priorizadas
los grupos vulnerables y en pobreza extrema y exclusin.
La estrategia de Alimentacin, se propone metas anuales las cuales deben intentar
cumplir.
El Modelo de Atencin Integral de Salud (MAIS) Es la forma de aplicar las acciones de salud tomando como eje central las
necesidades de salud de las personas en el contexto de la familia y de la
comunidad, antes que a los daos o enfermedades especficas. El modelo de
atencin integral establece la visin multidimensional y biosicosocial de las
personas e implica la provisin continua y coherente de acciones dirigidas al
individuo, a su familia y a su comunidad desarrollada en corresponsabilidad por el
sector salud, la sociedad y otros sectores, para la promocin, prevencin,
recuperacin y rehabilitacin de la salud, con la finalidad de mejorar el estado de
salud para el desarrollo sostenible.
Las estrategias sanitarias nacionales son parte del Modelo de Atencin Integral,
conforman uno de los ejes brindando los contenidos de la mayora de los cuidados
esenciales, resolviendo el qu y cmo lograr la meta.
Los Paquetes de Atencin Integral de Salud:
El Paquete de Atencin Integral de Salud, es un conjunto de cuidados esenciales
que requiere la persona para satisfacer sus necesidades de salud, brindados por el
personal de salud, la propia persona, familia, los agentes comunitarios y otros
actores sociales de la comunidad. [URL17]
Programa PANTBC Es el Programa de Alimentacin y Nutricin para el Paciente Ambulatorio con
Tuberculosis y Familia. Este programa forma parte del conjunto de intervenciones
del Estado Peruano para apoyar la alimentacin de grupos vulnerables de la
poblacin.
-
12
El Programa PANTBC permite ejecutar actividades de complementacin
alimentaria-nutricional y evaluacin nutricional, para contribuir a la recuperacin
integral del paciente ambulatorio con tuberculosis, y a la proteccin de su familia.
Este programa se integra y complementa con otras actividades que desarrollan los
establecimientos de salud en atencin a la enfermedad.
Tiene como objetivo principal: contribuir a la recuperacin del paciente tuberculoso
ambulatorio y proteger a su familia mediante el desarrollo de actividades
educativas, evaluacin nutricional y el aporte de una canasta de alimentos que
brinde el 28% de los requerimientos calricos y el 38% de los requerimientos
proticos de la familia compuesta por un paciente y dos contactos.
Apoya a los pacientes y familia (dos personas) con diagnstico de tuberculosis
pulmonar o extrapulmonar, que reciben tratamiento ambulatorio en el Programa de
Control de Tuberculosis (PCT), de los establecimientos de salud del MINSA.
HIS El sistema transaccional utilizado para el proyecto de fin de carrera es HIS (en el
idioma original, Health Information System).
HIS es una herramienta indispensable que garantiza, el adecuado registro de las
actividades de salud, contribuyendo a mejorar la calidad del registro de datos,
homogenizando criterios, incorporando nuevas formas de registro y consolidndolo
como nica fuente de informacin, con el propsito de instrumentalizar el soporte
para la toma de decisiones.
HIS, permite adecuarse a la situacin actual de la organizacin del Sistema de
Servicios de Salud, Estrategias Sanitarias Nacionales, Etapas de Vida y
Componentes Especiales.
Tiene como finalidad servir como fuente de informacin bsica de la atencin
ambulatoria diaria brindada a las personas que acuden a los establecimientos de
salud, de las Direcciones de Salud y Direcciones Regionales de Salud del Pas.
Tambin sirve de fuente bsica de informacin para la vigilancia epidemiolgica en
cuanto a morbilidad y de las actividades preventivo-promocionales, realizadas tanto
a nivel familiar como en grupos organizados de la comunidad. [ART07]
1.3. Plan de Proyecto En esta seccin se explicar los pasos a seguir para la planeacin del proyecto. Se
-
13
basa en las mejores prcticas establecidas en el PMBOK del PMI
Se definirn algunos conceptos respecto a la direccin de proyectos
Direccin de Proyectos (Project Management) Es la aplicacin de conocimientos, habilidades, herramientas y tcnicas con el fin
de cumplir los requerimientos de un proyecto. Se logra mediante los procesos de
direccin de proyectos: inicio, planeamiento, ejecucin, monitoreo y control, y cierre
- Iniciacin. Definen y autorizan el proyecto o una fase del proyecto. - Planificacin. Definen y refinan los objetivos y los planes de accin
requeridos para lograr los objetivos y el alcance del proyecto. - Ejecucin. Integra a las personas y otros recursos para llevar a cabo el plan
de proyecto. - Monitoreo y Control. Mide y monitorea el progreso para identificar
desviaciones del plan de proyecto, y as tomar acciones correctivas cuando
sea necesario. - Procesos de Cierre. Formaliza la aceptacin del producto, servicio o
resultado, y conduce al proyecto o una fase del proyecto a su final.
Fuente: A Guide to the Project Management Body of Knowledge (PMBOK Guide) - Third Edition
Figura 1.3 Procesos de direccin de proyectos
reas de Conocimiento. Para la direccin de proyectos se tiene 44 procesos agrupados en 9 reas de
conocimientos.
-
14
- Integracin del proyecto (Project Integration Management)
Consiste en los procesos para asegurar la coordinacin, unificacin y definicin de
elementos del proyecto.
- Alcance del proyecto (Project Scope Management)
Incluye los procesos para asegurar que el proyecto contiene todo el trabajo
necesario para completar el proyecto satisfactoriamente. En el proyecto a
desarrollar se estableci como alcance el anlisis, diseo, construccin y pruebas
del datamart para la estrategia sanitaria: Alimentacin y Nutricin Saludable, es
decir hasta obtener el producto que vendra a ser los reportes analticos segn los
requerimientos que solicita la estrategia.
Con respecto al tiempo, el proyecto tendr una duracin estimada de 12 meses.
- Costes del proyecto (Project Cost Management)
La direccin de costos del proyecto incluye los procesos de planeamiento,
estimacin y control de costos, de manera que se asegure que el proyecto sea
completado dentro del presupuesto establecido.
El proyecto a desarrollar ser utilizando en gran parte herramientas libres por lo que
no habra problemas por las licencias de estas herramientas y aquellas que
requieran de licencia, estas sern proporcionadas por la universidad.
- Calidad del proyecto (Project Quality Management)
La direccin de calidad del proyecto incluye los procesos necesarios para asegurar
que el proyecto satisfaga las necesidades para la que se ha llevado a cabo. Incluye
todas las actividades de la direccin que determinan las polticas de la calidad,
objetivos y responsabilidades, as como su desarrollo a travs de la planificacin, el
control y el aseguramiento de la calidad. Por ejemplo, las reuniones con el asesor
del tema sirven para realizar correcciones y/o modificaciones, esto es para
garantizar que se est cumpliendo con lo planeado en el proyecto.
- Comunicaciones del proyecto. (Project Communications Management)
La direccin de comunicaciones del proyecto incluye los procesos requeridos para
asegurar la precisa y apropiada generacin, recoleccin, distribucin,
almacenamiento y obtencin de la informacin del proyecto. Provee vnculos
crticos entre las personas y la informacin que son necesarios para una
comunicacin exitosa entre miembros del proyecto, usuarios, asesores, etc. En el
-
15
proyecto a realizar no se aplica esta rea del conocimiento.
- Riesgos del proyecto. (Project Risk Management)
La direccin de riesgos incluye los procesos relacionados con la identificacin,
anlisis y respuesta a los riesgos del proyecto. Su objetivo es incrementar los
efectos positivos de los distintos eventos y minimizar las consecuencias de sus
efectos negativos.
- Recursos Humanos del proyecto (Project Human Resource Management)
La direccin de recursos humanos del proyecto incluye los procesos que organizan
y administran al equipo del proyecto. Asigna roles y responsabilidades a los
miembros que conforman el equipo para lograr completar el proyecto. Debido a que
el proyecto ser realizado por una nica persona, esta rea de conocimiento no se
aplica.
Fuente: A Guide to the Project Management Body of Knowledge (PMBOK Guide) - Third Edition
Figura 1.4 reas de Conocimiento de la Direccin de Proyectos
- Aprovisionamiento del proyecto (Project Procurement Management)
La direccin de aprovisionamiento del proyecto incluye los procesos para comprar o
adquirir los productos, servicios o resultados necesarios para la realizacin del
-
16
trabajo. En el presente proyecto no se adquirir materiales extras, por lo tanto esta
rea del conocimiento no aplica.
- Plazos del proyecto (Project Time Management)
La direccin de plazos del proyecto incluye los procesos necesarios para asegurar
la conclusin del proyecto en los tiempos establecidos. Con ayuda de un diagrama
de Gantt se puede gestionar el tiempo para cada fase que ha sido definida en el
WBS (The Work Breakdown Structure).
WBS es una herramienta que define un proyecto en grupos de elementos de trabajo
(subdivisin del esfuerzo) para as organizar y definir el trabajo total del alcance del
proyecto a realizar.
A continuacin se presenta el diagrama WBS para el proyecto de tesis:
Figura 1.5 Proyecto de Tesis - WBS
Para poder realizar un correcto seguimiento a los plazos establecidos se ha
elaborado el Diagrama de Gantt, el cual se encuentra en el Anexo 1.
-
17
1.4. Estado del Arte Se presenta aqu las principales soluciones actuales en herramientas de extraccin
y explotacin de datos as como otros trabajos con datamarts.
1.4.1. Herramientas de extraccin de datos En esta seccin se expondrn los requisitos para la eleccin de la herramienta ETL
y luego realizar la comparacin de caractersticas y ventajas entre las herramientas
que existen en el mercado.
Requerimientos a cumplir:
1. Forma parte de una plataforma integrada de BI Forma parte de una plataforma integrada de BI.
2. Es multiplataforma. 3. Limpieza de datos. 4. Trabajo con ms de una fuente de datos. 5. Filtrado de datos 6. Interfaz grfica para el desarrollo del proceso ETL. 7. Monitoreo y diseo del proceso ETL. 8. Programacin del proceso ETL para que se ejecute
automticamente. 9. Trabajo con las principales bases de datos del mercado como:
Microsoft SQL Server, Oracle, PostgreSQL, MySQL entre otras. 10. Soporte de la herramienta.
Oracle Warehouse Builder
Descripcin
Oracle Warehouse Builder (OWS) es una herramienta grfica de Oracle destinada a
la extraccin, transformacin y carga de los datos (ETL); al modelamiento relacional
y dimensional; y a la administracin de todo el ciclo de vida de los datos y
metadatos.
OWS est diseado para base de datos Oracle.
Requerimientos de hardware y software
OWS est escrito en Java y actualmente se encuentra en la versin 11g.
Adems, OWS es multiplataforma, los sistemas operativos que soporta son:
Microsoft Windows, Linux/Unix y Solaris.
A continuacin se muestra los requerimientos de hardware para MS-Windows y
Linux/UNIX
-
18
Sistema Operativo Requerimiento
MS-Windows Las arquitecturas de 32bit y 64bit son soportadas.
Se requiere que la computadora cuente con un mnimo de
850MB de espacio de disco y 768MB de memoria disponible.
Linux/UNIX Se requiere que la computadora cuente con un mnimo de
1100MB de espacio de disco y 768MB de memoria disponible.
Cuadro 1.3 Requerimientos de HW y SW - OWS
Caractersticas y ventajas
Permite realizar las siguientes actividades:
- Data Profiling: Permite descubrir y cuantificar los defectos de los datos antes
y durante el proceso de creacin del data warehouse o aplicacin de
inteligencia de negocios.
- Modelado de datos relacionales y estructuras dimensionales
- Soporte para el manejo de las cambios: Permite almacenar y gestionar tanto
los datos actuales como histricos a travs del tiempo en el data warehouse.
- Integracin con Oracle OLAP: Permite cargar directamente la fuente de
datos desde la opcin OLAP, eliminando el uso de un rea temporal para
data relacional.
- Permite planificar la ejecucin automtica de los procesos ETL.
- Integracin con con los principales ERPs del mercado tales como SAP; E-
Business Suite y PeopleSoft.
- Administracin de Seguridad: Permite controlar la seguridad de acuerdo a la
metadata del perfil de usuario.
- Auditora de datos.
- Limpieza de datos para maximizar la calidad de la informacin
- Diseo y gestin de metadatos corporativos.
IBM Websphere DataStage
Descripcin
IBM WebSphere DataStage es una herramienta ETL que integra los datos de
mltiples y grandes volmenes de fuentes de datos y metadatos.
DataStage gestiona los datos que llegan en tiempo real, as como los datos
recibidos a diario, semanal o mensual
-
19
Requerimientos de software
IBM WebSphere DataStage es multiplataforma, soporta los sistemas operativos
Microsoft Windows, Linux (Red Hat).
Caractersticas y ventajas
- Brinda soporte para la extraccin, integracin y transformacin de grandes
cantidades de datos, con estructuras de datos que van desde simple a muy
complejas
- Ofrece una plataforma escalable que permite a las compaas resolver
grandes problemas de negocios a travs del alto rendimiento en
procesamiento de datos masivos.
- Usa notaciones grficas para construir la solucin de integracin de datos.
- Soporta un nmero ilimitado de fuentes de datos heterogneas,
prcticamente todas las bases de datos como Oracle, IBM DB2, IBM
Informix, Sybase, Teradata y Microsoft SQL Server, adems incluye otras
fuentes como: archivos de texto, complejas estructuras de datos en XML,
sistemas ERP como SAP y PeopleSoft. [URL10]
Fuente: http://www.mainstream.co.il/ComplexSortJob.jpg
Figura 1.6: IBM WebSphere DataStage
-
20
SQL Server Integration Services (SSIS)
Descripcin
SSIS es un componente de Microsoft SQL Server 2005 y 2008, est disponible
nicamente en sus versiones Estndar y Enterprise.
SSIS ha reemplazado a la caracterstica del SQL Server 2000, Data Transformation
Service (DTS). Provee una plataforma para disear y generar soluciones de
integracin de datos y aplicaciones workflows.
Su principal caracterstica es ser una herramienta flexible para el proceso de ETL.
Requerimientos de software
El sistema operativo que lo soporta es Microsoft Windows
Caractersticas y ventajas
- SSIS puede extraer y transformar datos de una amplia variedad de fuentes
como archivos XML, archivos planos y bases de datos relacionales para
luego cargar los datos en uno o ms destinos.
- SSIS posee un amplio rango de componentes como lookups, ordenamiento,
agregacin, combinaciones entre otros. Que son usados para el diseo del
ETL.
- Provee de modo debug grfico.[URL20]
Fuente: http://www.programminghelp.com/
Figura 1.7: SQL Server Integration Services
-
21
Kettle, Pentaho (Actualmente Data Integration)
Descripcin
Kettle Pentaho es una herramienta que permite implementar el proceso de ETL,
adems forma parte de la plataforma Open Source Pentaho Business Intelligence.
Requerimientos de software
Es multiplataforma, soporta sistemas operativos MS-Windows, Linux/UNIX.
Caractersticas y Beneficios:
- Soporta las siguientes base de datos, desde MySQL, Oracle, AS/400, MS
Access, MS SQL Server, IBM DB2, PostgreSQL, Intersystems, Cach,
Informix, Sybase, Gupta SQL Base, dBase III, IV o 5, Firebird SQL, MaxDB
(SAP DB), Hypersonic, Generic, CA Ingress, SAP R/3 System.
- La creacin de transformations o jobs (secuencia de pasos para realizar la
carga de una dimensin o tabla de hechos) se pueda realizar a travs del
mtodo drag-and-drop que provee el ambiente grfico de Kettle.
- Permite la migracin de datos entre diferentes bases de datos.
- Exporta e importa archivos Excel, txt, entre otros.
- Cuenta con licencia Open Source.
Fuente: http://www.pentaho.com/products/
Figura 1.8: Transformation en Kettle-Pentaho (Data Integration)
-
22
- Cuenta con cuatro herramientas indispensables para el desarrollo de los
procesos ETL:
o Spoon: Disea transformaciones ETTL usando el entorno grfico.
o PAN: ejecuta las transformaciones diseadas por Spoon. o CHEF: crea los jobs o trabajos de ETL. o Kitchen: ejecuta los jobs o trabajos ETL.
Anlisis y Comparacin
Luego de revisar las principales caractersticas de las herramientas de extraccin
candidatas: Oracle Warehouse Builder, IBM Websphere DataStage, SSIS y Kettle-
Pentaho, se realiz un cuadro comparativo (Cuadro 1.4) con los requerimientos
que debe cumplir la herramienta seleccionada.
Para ello se le ha asignado una calificacin a cada requerimiento que va de 0 (no
cumple) a 5 (cumple totalmente).
Se muestra que Pentaho Kettle obtuvo mayor puntaje adems tiene una ventaja
sobre las otras que es contar con licencia open source, a pesar que actualmente no
existe un vasto soporte, la documentacin que se encuentra disponible de forma
oficial cubre la mayor parte de las principales necesidades del proyecto de tesis.
Recientemente, el personal de Pentaho est brindando soporte tcnico,
actualizaciones y/o mejoras aunque no est cubierto por la licencia open source.
La herramienta Kettle, al igual que las otras herramientas, es intuitiva y de fcil
aprendizaje ya que presenta un entorno grfico para el diseo del ETL.
-
23
Cuadro 1.4 Cuadro Comparativo Herramientas Explotacin
1.4.2. Herramientas de explotacin de datos
Se tienen tambin diversas herramientas de explotacin. Desde el momento en que
la mayora de los ejecutivos estn aplicando sus propias pruebas y preparan sus
propios informes, es imperativo que estas herramientas sean, al mismo tiempo, de
Criterio Pentaho Kettle SSISIBM Websphere
DataStageOracle Warehouse
BuilderForma parte de una plataforma integrada de BI
5 5 5 5
Es multiplataforma 5 3 5 5
Limpieza de datos 5 5 5 5
Trabajo con ms de una fuente de datos. 4 5 5 5
Filtrado de datos 4 4 4 4
Interfaz grfica para el desarrollo del proceso ETL
5 4 5 3
Permitir el monitoreo del proceso ETL, as como el diseo del mismo.
4 3 3 3
Programacin del proceso ETL para que se ejecute automticamente
5 4 4 5
Trabajo con las principales bases de datos del mercado como: Microsoft SQL Server 2005 y Oracle Database9g.
5 5 4 5
Soporte de la herramienta. 4 5 5 5
Puntaje Total 46 43 45 45
-
24
fcil acceso y simples de usar para la exploracin de los datos.
A continuacin se muestran los requisitos necesarios para la eleccin de la
herramienta y luego una comparacin entre algunas de las principales
herramientas.
Requerimientos a cumplir:
o Anlisis de la informacin en todas las dimensiones o Generacin de reportes grficos en base a la informacin o Exportacin a archivos Excel para visualizar la informacin o Drill and Down: Detalle de los datos accediendo directamente a las
fuentes multidimensionales. o Filtros y bsquedas personalizables. o Slice and Dice: Operaciones de corte y rotacin de datos. o Soporte de la herramienta. o Ser multiplataforma.
Business Objects OLAP Intelligence Es una herramienta que permite acceder y analizar los datos almacenados
en el servidor OLAP.
Caractersticas:
- Provee una interfaz basada en web que permite a los usuarios seleccionar
dimensiones y miembros de un panel de consultas, dando la posibilidad
interactuar directamente con la informacin y generar consultas
espontneas que permitan descubrir anomalas.
- Provee una interfaz intuitiva y rica en funciones para catalogar, filtrar y
realizar rpidos clculos sobre la informacin. A su vez permite esconder
dimensiones que no sean relevantes para el anlisis de la informacin.
- Acceso a servidores OLAP de Microsoft, Hyperion y SAP, as como a
servidores de datos multidimensionales como Microsoft SQL Server Analysis
Services, Hyperion Essbase, IBM DB2 OLAP, y SAP BW.
- Entorno grfico y asistente para desarrollo de hojas de trabajo para OLAP,
donde se puede colocar la informacin en el formato que se crea
conveniente para luego ser publicada para otros usuarios del sistema.
- Opciones de drill-down de informacin sumarizada a reportes detallados.
Esto permite ampliar el nivel de anlisis de los usuarios, permitindoles
visualizar un mayor detalle de la informacin con que se cuenta para
descubrir alguna anomala en la misma.
-
25
- Interfaz con Excel para mostrar la informacin desde este sistema de hoja
de clculo. [URL21]
Microsoft AS (Analysis Services)
Es una aplicacin que permite ofrecer una visin unificada e integrada de
todos los datos del negocio como base para la elaboracin de todos los
informes y anlisis OLAP.
Caractersticas:
- Modelo Dimensional Unificado: El UDM (Unified Dimensional Model) es el
repositorio central de metadatos del Analysis Services. En este se definen
las entidades empresariales, lgica empresarial, clculos y medidas que
sirven de origen para todos los informes, hojas de clculo, exploradores
OLAP y aplicaciones de anlisis. Los usuarios pueden emitir consultas en el
UDM mediante diversas herramientas de cliente, como Microsoft Excel.
- Almacenamiento en cache proactivo: Cuenta con almacenamiento en cach
proactivo, que permite combinar las ventajas de las actualizaciones en
tiempo real con el rendimiento que brinda la arquitectura MOLAP. Esto
permite mantener automticamente la cach mientras los datos se van
modificando en los orgenes de datos subyacentes. Adems se logra
obtener un rendimiento sobresaliente en las consultas.
- Procesamiento analtico en lnea (OLAP): permite obtener acceso a datos
organizados y agregados de orgenes de datos empresariales, como por
ejemplo almacenamientos de datos, en una estructura multidimensional
denominada cubo. El Analysis Services proporciona herramientas y
caractersticas para OLAP que puede utilizar para disear, implementar y
mantener cubos y otros objetos compatibles. [URL18]
Pentaho Open BI Suite - Pentaho Analysis
Parte de la suite Pentaho BI.
Pentaho Anlisis suministra a los usuarios un sistema avanzado de anlisis
de informacin. Con uso de las tablas dinmicas (pivot tables, crosstabs),
generadas por Mondrian y JPivot, el usuario puede navegar por los datos,
ajustando la visin de los datos, los filtros de visualizacin, aadiendo o
quitando los campos de agregacin. [URL09]
-
26
Caractersticas:
- Genera informes de forma gil y permite a travs de Pentaho Reporting la
distribucin de los resultados del anlisis en mltiples formatos, incluyendo
la opcin de imprimir o exportar a formato PDF, XLS, HTML y texto.
- Para el anlisis toma en cuenta los 6 elementos bsicos del sistema OLAP:
Dimensiones, valores, jerarquas, niveles, atributos e indicadores.
- Al utilizar la arquitectura MOLAP esta permite tener datos agregados o pre-
calculados, ya que estos residen en el mismo formato multidimensional.
- Funcionalidad de procesamiento, donde dos aplicaciones ayudan a obtener
los procesos OLAP, estos son el servidor OLAP Mondrian, y el Jpivot,
gracias a estos se pueden realizar querys a Datamart, visualizacin de
resultados mediante un browser, permitir el drill-down.
Fuente: http://www.pentaho.com/images/snap_analysis_olap.png
Figura 1.9: Ejemplo de Reporte de Anlisis Pentaho Anlisis.
- Suministra a los usuarios un sistema avanzado de anlisis de informacin.
Con uso de las tablas dinmicas (pivot tables, crosstabs), generadas por
Mondrian (Servidor OLAP escrito en Java) y JPivot, el usuario puede
navegar por los datos, ajustando la visin de los datos, los filtros de
visualizacin, aadiendo o quitando los campos de agregacin.
- Permite trabajar sobre diferentes bases de datos, como Oracle, DB2, SQL-
Server, MySQL, PostgreSQL, etc., esto a travs de Mondrian.
-
27
- Puede ser utilizada en UNIX, LINUX y Microsoft Windows.
Anlisis y Comparacin
Se consideraron tres herramientas candidatas: Pentaho Analysis, Business Objects
OLAP y Microsoft Anlisis Services.
Al igual que para la seleccin de herramientas ETL, se ha asignado una calificacin
por cada requerimiento que debe cumplir la herramienta de 0 (no cumple) a 5
(cumple totalmente).
La herramienta que obtuvo ms puntaje, segn el cuadro comparativo (Cuadro 1.5),
fue Pentaho Anlisis y tiene la ventaja de formar parte de la plataforma integral
Pentaho BI Suite con licencia Open Source. Como las dems herramientas
comparadas, cuenta con una interfaz grfica para fcil manejo por parte de los
usuarios
Otra ventaja es que si se reduce la inversin en licencias, se puede destinar ese
dinero a mejorar el anlisis, el diseo, la formacin de usuarios, la toma de
decisiones. La DISA podr administrar el dinero ahorrado para enfocarse en
solucionar los verdaderos problemas, es decir los de salud.
Como una desventaja seria el tema del soporte tcnico, pues el que brinda Pentaho
tiene un costo y es este el que la DISA tendr que asumir en caso se presente
algn problema con el sistema.
-
28
Cuadro 1.5 Cuadro Comparativo Herramientas Explotacin
En el captulo 2, se realizar el anlisis tecnolgico, econmico y de tiempo de la
solucin y se comprobar la seleccin de la herramienta.
1.4.3. Tesis y productos similares A continuacin se muestran algunos trabajos de tesis con datamarts y productos
que existen en el mercado relacionadas a mejoras en el sector salud.
Tema: Una metodologa para sectorizar pacientes en el consumo de medicamentos aplicando datamart y datamining en un hospital Autores: Ivn Tapia Rivas, Maria Ruiz Rivera y Edgar Ruiz Lizama
Propone un mtodo para el anlisis de datos en la forma con que se consumen los
medicamentos en un hospital peruano a fin de poder identificar algunas realidades
o caractersticas no observables que produciran desabastecimiento o insatisfaccin
del paciente, el cual servir como una herramienta para la toma de decisin sobre
el abastecimiento de medicamentos en el hospital. Aqu se complementan tcnicas
Criterio PentahoAnalysis
BusinessObjects
AnalysisServices
Anlisis de la informacin en todas las dimensiones
5 5 5
Generacin de reportes grficos 5 5
5
Exportacin a archivos Excel para visualizar la informacin 5 5
5
Drill and Down 5 5 4
Filtros y bsquedas personalizables. 4 3 4
Slice and Dice: Operaciones de corte y rotacin de datos 5 5 5
Soporte de la herramienta 4 5 5
Ser Multiplataforma 5 4 3
Puntaje Total 38 37 36
-
29
de datamart, de extraccin y carga de datos, as como algoritmos de minera de
datos como K-means para sectorizar los consumos de medicamentos
mencionados. [TES02]
Tema: Anlisis, diseo e implantacin e impacto de un datamart para el rea de ventas de empresas de sector farmacutico Autor: Moro Ros, Christian.
El objetivo de esta tesis fue realizar un datamart en el rea de ventas de gran
facilidad de uso, aprendizaje, y que tena costos reducidos en aspectos de
hardware y software.
Dicho datamart se desarroll con el propsito de mejorar la toma de decisiones de
la alta gerencia ya que era indispensable contar con informacin altamente
disponible y de mejor calidad, que es normalmente brindado por sistemas de data
warehouse.
Como es sabido se haba desarrollado gran competitividad entre farmacuticas
transaccionales, as mismo se contaba con bajo presupuestos para proyectos
locales, debido a la baja rentabilidad de la industria farmacutica en nuestros
mercados comparativamente con otras zonas del mundo, tal como Europa o Asia.
Toda la compaa farmacutica, tena el gran compromiso de tomar las mejores
decisiones en sus distintas reas, eran operaciones de uno o varios pases en las
que no se poda tener conocimiento o cercana de los clientes por los escasos
recursos humanos y las grandes distancias.
Se determin que era indispensable informacin altamente disponible y de mejor
calidad, normalmente brindada por los sistemas de data warehouse.
Impacto estratgico luego de la implantacin del datamart:
Se obtuvo una organizacin muy gil donde el anlisis de informacin es
completamente asequible por los empleados de todo nivel, y este fue usado como
una ventaja competitiva en el muy gil mercado farmacutico.
Se mejor notablemente los procesos de toma de decisiones, la comprensin del
negocio, las reas de responsabilidad de los empleados, el control de gestin e
identificacin de las oportunidades de mercado que permitan mejorar la
rentabilidad y ventas de la compaa. [TES01]
-
30
Empresa: Med-Vantage Med-Vantage ha desarrollado varias aplicaciones complementarias y mtodos de
negocios. Adems proporciona aplicacin propietaria para realizar los procesos de
ETL (extraer, transformar y cargar datos) la cual mejora el rendimiento de la
produccin, validacin de datos y la transformacin de un gran conjunto de datos
administrativos en concretos resultados
Mtricas de acciones y resultados - Costo de atencin y reportes analticos de calidad con mltiple niveles,
adems de permitir manejar la informacin (drill and downs)
- Registro de pacientes y recordatorios para realizar seguimientos
Presentacin de resultados integrados y personalizados - Aplicaciones de soporte a decisiones de salud para mdicos y miembros
- Navegacin web personalizada
- Recopilacin de datos y la integracin de contenido de salud
- Informes de anlisis estadsticos [URL13]
Empresa: Planwatch Anlisis Completo del Plan de Beneficios de Salud Planwatch ofrece un anlisis financiero completo de los programas de beneficio de
salud (planes de salud) actualmente en curso (ofrecidos actualmente) incluyendo
los 25 reportes de nivel superior (top 25) acerca de datos demogrficos, diagnstico
/ indicadores de estilo de vida, uso del beneficio o plan, proveedor / utilizacin de la
red, y ms.
Modelamiento de Plan y Motor de Readjudicacin Calcule el impacto de las modificaciones propuestas al diseo de un plan con
cambios simulados con respecto al historial de reclamos y/o quejas. Readjudicacin
completa usando cantidades modificadas deducibles y co-pagos, porcentajes de co-
seguros, mximo nivel de beneficio, y ms.
Informes interactivos Enfoque orientado al informe de anlisis avanzado. Planwatch combina la
familiaridad de los reportes de negocios estndar con la potencia del software
inteligente para negocios modernos. El resultado: una herramienta prctica tanto
para informes simples como lo es para las tareas de anlisis puro.
Reclamos al Datamart, almacenado y gestionado plenamente La informacin se extrae de los sistemas de procesamiento de reclamos TPA,
-
31
transformado en una estructura optimizada para el anlisis, y se aloja en nuestro
centro de datos gestionados. Se ingresa de manera segura desde cualquier equipo
con conexin a Internet y navegador web. La gestin de servicios incluye la
supervisin, monitoreo, backup automtico y soporte. [URL12]
1.5. Descripcin y sustentacin de la solucin
La solucin al problema de la descentralizacin del sector salud con respecto al
manejo de informacin de las 10 estrategias sanitarias dentro de las direcciones de
salud es el desarrollo de un sistema de informacin que permita supervisar,
controlar, evaluar los avances y resultados de estas a travs del fcil acceso a los
datos provenientes de todos los centros de salud asignados a cada DISA. De esta
forma se llevara a cabo una estandarizacin, es decir que cada DISA del pas
presente la misma forma de manejo y control de las 10 estrategias.
El sistema de informacin del proyecto de fin de carrera consiste en una solucin
de inteligencia de negocios que es el anlisis, diseo y construccin de un datamart
para la evaluacin de resultados de las 10 estrategias sanitarias a travs de la
generacin de reportes segn requerimientos especficos para cada una de las
estrategias y con ello, como se mencion, permitir predecir que nuevas acciones
tomar para mejorar. La informacin inicial ser obtenida del sistema OLTP llamado
HIS (Health Information System) en la cual se recogen las consultas mdicas y sus
diagnsticos realizados en los centros de salud de cada direccin regional, dicha
informacin ser dividida y clasificada por estrategia sanitaria y posteriormente ser
evaluada segn sus lneas de accin (requerimientos y acciones).
Para el proyecto de fin de carrera, nicamente se realizar la implementacin de la
estrategia piloto (Alimentacin y Nutricin Saludable,) y esta hace uso de un
sistema transaccional adicional que maneja la informacin del programa PANTBC
mencionado en el punto 1.2.4.
En general, cada estrategia sanitaria ser analizada de forma independiente
siguiendo sus requerimientos especficos. La implementacin de las dems
estrategias se realizar tomando como base la estrategia piloto.
La herramienta que se utilizar para la implementacin del datamart, luego del
anlisis comparativo realizado en el punto 1.4, es Pentaho BI Suite versin 1.6 ya
-
32
que consta de licencia libre y todos los mdulos necesarios para la extraccin y
explotacin de datos.
-
33
2. Captulo 2: Anlisis En este captulo se tratar de la definicin de la metodologa para implementacin
de un proyecto de Inteligencia de negocios, adems de la determinacin de
requerimientos y anlisis dimensional.
2.1. Definicin de la metodologa A continuacin se explicar las dos metodologas ms utilizadas para la
construccin del datamart:
2.1.1. El modelo de Inmon Trata del manejo de una arquitectura de mltiples niveles en el cual el DWH
colecciona datos de diversas fuentes, luego estos son integrados y finalmente
distribuidos a subconjuntos denominados datamarts (enfoque Top Down).
Estructura del Data warehouse En la figura 2.1 se muestran diferentes niveles de detalle. Hay un antiguo y actual
nivel de detalle, un nivel de datos ligeramente sumarizados (nivel datamart) y un
nivel de datos altamente sumarizados.
-
34
Fuente: The Data Warehouse Toolkit The Complete Guide to Dimensional Modeling
Figura 2.1 Estructura del DW\
Orientacin por temas El DWH est orientado a la divisin por temas o reas que se han definido en el
modelo de datos del proyecto. Por ejemplo: cliente, producto, cuenta, transaccin o
actividad.
Diseo del Datawarehouse Granularidad
Es el aspecto ms importante en el diseo del DWH. El mayor detalle es el ms
bajo nivel de granularidad y el menor detalle es el ms alto nivel.
Es el tema ms crtico en el diseo del entorno del DWH porque afecta el volumen
de datos que residir en el DWH y el tipo de consultas que sern respondidas.
Modelo de Datos del Data Warehouse
Existen tres niveles de modelamiento de datos:
- Alto nivel, llamado ERD (Entity Relationship Diagram)
Consiste en entidades y relaciones. El nombre de la entidad est encerrada por un
valo, las relaciones entre entidades est representado por flechas. Un ERD
corporativo est compuesto por varios ERDs los cuales reflejan diferentes puntos
de vistas de las personas de la corporacin.
-
35
Fuente: The Data Warehouse Toolkit The Complete Guide to Dimensional Modeling
Figura 2.2. ERD
- Nivel Medio, llamado DIS (Data Item Set)
Luego de definir el alto nivel del modelo de datos, se establece el siguiente nivel:
DIS. Por cada rea principal o entidad identificada en el nivel anterior, se crea un
nivel medio para expandir los atributos.
Fuente: The Data Warehouse Toolkit The Complete Guide to Dimensional Modeling
Figura 2.3. Relacin entre ERD y DIS
- Nivel Bajo, llamado Modelo Fsico (Physical Model)
Creado a partir del nivel medio con la finalidad de extenderlo incluyendo llaves y
caractersticas fsicas del modelo. A este punto, el modelo de datos fsicos luce
como una serie de tablas llamadas tablas relacionadas.
Proceso de ETL
El DWH es cargado con los datos obtenidos en el entorno operaciones, mas antes
dichos datos deben pasar por un complejo proceso de conversin, reformato e
integracin para as recin ser parte del entorno del DWH. Acceso Indirecto al DWH
Un enfoque distinto para el diseo de base de datos en el contexto de data
warehousing es el enfoque multidimensional. Este enfoque es aplicado
exclusivamente en datamarts no datawarehouses..
Se deben obtener los datos del DWH para formar el datamart. En el DWH, los datos
-
36
son muy granulares, en cambio en el datamart son ms compactos y sumarizados.
2.1.2. Metodologa de Ralph Kimball El modelo de Kimball deja de lado la necesidad de un data warehouse debido a que
la mayora de usuarios desea obtener datos detallados, Kimball argumenta que es
mejor almacenar los datos en datamarts independientes y lgicamente conectados
usando dimensiones. Para la optimizacin de consultas y mejorar la facilidad de uso
de datamarts, Kimball propone el modelo de datos como esquema estrella.
Componentes del DWH
Existen cuatro componentes importantes para la creacin del entorno del DWH. Los
componentes se muestran en la figura 2.4, y estos son:
- Sistemas fuentes operacionales (Operational Source Systems)
- rea de limpieza de datos (Data Staging Area)
- rea de presentacin de datos (Data Presentation Area)
- Herramientas de acceso a datos (Data Access Tools)
Operational Source Systems (OLTP)
Son los sistemas de registro que capturan todas las transacciones del negocio. Sus
prioridades son el procesamiento y la disponibilidad. Consultas contra estos
sistemas son limitados.
Data Staging Area
rea de almacenamiento y conjunto de procesos ETL (extract- transformation-load)
Extraccin (1er Paso): Obtener datos para el DWH, significa leer y entender los
datos de las fuentes y luego copiar los necesarios para el DWH.
Figura 2.4. Elementos bsicos del DWH segn Kimball
-
37
Transformacin (2do Paso): Existen potenciales transformaciones (corregir errores
de escritura, conflictos de dominio, elementos perdidos, datos duplicados, asignar
DWH keys), combinando datos de mltiples fuentes.
Carga (3er Paso): La carga de datos en el DWH, usualmente toma la forma de
presentar tablas dimensionales que aseguren la calidad para cargar cada datamart.
Data Presentation Area
rea donde los datos estn organizados, almacenados y disponibles para consultas
de los usuarios, reportes y otras aplicaciones analticas
Es todo lo que los usuarios ven y tocan a travs de las herramientas de acceso.
Presenta una serie de datamarts integrados en el que cada uno presenta datos de
un solo proceso de negocio. Se utiliza el modelamiento dimensional como tcnica
para entregar los datos a los usuarios, aqu no se busca remover datos
redundantes sino ms bien rapidez de acceso en las consultas. Data Access Tools
Puede ser tan simple como un ad hoc query (consulta creada para obtener
informacin de acuerdo a la necesidad que surja.) hasta un complejo data mining.
Por definicin, todas las herramientas de acceso consultan los datos en el rea de
presentacin. El uso de estas herramientas permite a los usuarios tomar decisiones
analticas. Ejm : OLAP, MOLAP, datamart, ad hoc querys, etc.
Pasos para el proceso de diseo dimensional
Paso 1: Seleccin del proceso de negocio
El primer paso es decidir qu proceso o procesos de negocio se va a modelar para
combinar y entender los requerimientos con los datos disponibles.
Un proceso es una actividad normal de negocio realizada en la organizacin que
tpicamente est soportada por un sistema OLTP. Paso 2: Declarar la granularidad
Una vez que se ha identificado el proceso de negocio se debe definir la
granularidad. Qu nivel de detalle debera estar disponible en el modelo
dimensional?.
Este paso es sumamente importante ya que de l depender el modelo de datos y
-
38
la implementacin del datamart.
Paso 3: Eleccin de las dimensiones
Se deben elegir las dimensiones que se aplicarn para cada tabla de hechos, las
dimensiones deben responder a la pregunta: Cmo los usuarios describen los
datos que resultan del proceso de negocios?. Paso 4: Identificar los hechos
Identificar los hechos numricos que formarn parte de la tabla de hechos. Los
hechos son determinados por esta pregunta: Qu estamos midiendo?. Los
usuarios estn muy interesados en el anlisis de estas medidas de la ejecucin de
procesos de negocio.
Todos los hechos candidatos deben ser fieles al grano definido en el paso 2. Los
hechos que pertenecen a un grano diferente debern estar en una tabla de hechos
separada
2.1.3. Eleccin de la metodologa Para poder elegir la metodologa a seguir durante todo el proyecto es necesario
revisar las diferencias y semejanzas que existen.
A continuacin se presenta un cuadro comparativo entre la metodologa de Kimball
e Inmon.
Kimball Inmon Objetivo Todas las empresas necesitan almacenar, analizar e interpretar los datos
que van generando y acumulando, para luego tomar decisiones crticas que
les permitan maximizar la prosperidad. Para ello se necesita un sistema que
les ayude a entender los datos y logren cumplir sus objetivos, de esta forma
nace la idea de implementar un data warehouse.
Diseo del Data
Warehouse
Utiliza el enfoque Bottom Up Utiliza el enfoque Top Down
Enfoque Tiene un enfoque por procesos que
son manejados por las diferentes
reas del proceso. Trata de
responder necesidades especficas
segn el tema.
Tiene un enfoque global de toda la
empresa. No esta basado en
requerimientos especficos.
Tiempo de
implementacin
Ya que primero se implementan los
datamarts, el tiempo de
Debido a que se implementa por
completo el DWH se demanda
-
39
del DWH implementacin es rpido. Sin
embargo se tiene que tener cuidado
ya que si se trabaja de forma
independiente cada datamart el
entorno del DWH se desintegrara
rpidamente.
mucho ms tiempo.
Costos Implementar cada datamart permite
que la solucin no presente un alto
costo.
Se replican grandes cantidades de
datos por tanto los costos aumentan.
Modelo de Datos Kimball propone usar el
modelamiento dimensional:
Esquema estrella. Identificacin de
dimensiones y hechos.
Inmon propone tres niveles en el
modelo de datos del DWH:
-Alto nivel, ERD (Entity Relationship
Diagram)
-Nivel Medio, DIS (Data Item Set)
-Nivel Bajo, llamado Modelo Fsico
(Physical Model)
Sin embargo, menciona que para
implementar los datamarts debe
hacerse con modelamiento
dimensional.
La metodologa de Inmon tiene mayor alcance ya que es un enfoque global, sin
embargo para el presente proyecto de tesis solo se requiere la construccin de un
datamart que albergue datos acerca de las estrategias sanitarias es as que la
metodologa de Kimball es la que mejor se adapta a estas necesidades, adems el
tiempo y costos con los que se cuentan son limitados.
Luego de elegir la metodologa para la construccin, se decidi seguir la siguiente
estrategia para la ejecucin del proyecto la cual consiste en la realizacin de los
siguientes procesos: anlisis dimensional, diseo de extraccin y diseo de
explotacin.
Estos procesos se presentan como resumen tomando como referencia las mejores
prcticas recomendadas para la implantacin de soluciones de inteligencia de
negocios, al no existir un estndar para este tipo de implantaciones. Estos son:
Diagnstico A travs de este proceso se busca identificar la informacin necesaria para la toma
de decisiones, es decir los requerimientos tanto funcionales como no funcionales.
-
40
Corresponde al entregable de la etapa de assess de la figura 2.5.
En el proyecto, este diagnstico se realiz mediante entrevistas y revisin de
documentos de la estrategia piloto para determinar sus requerimientos.
Anlisis Dimensional Se detallan los elementos que contendrn el datamart de las estrategias sanitarias.
Corresponde al entregable de la etapa de plan de la figura 2.5
Esta etapa consisti en el anlisis de los diagramas y diccionarios de base de datos
de los sistemas transaccionales como HIS y del manejo del programa de PANTBC
para as identificar las dimensiones y las tablas de hechos tomando como base los
requerimientos solicitados por la estrategia piloto.
En esta fase se elaborar el Anexo de Anlisis (Anexo 2).
Diseo de extraccin Se realiza la carga de datos de los sistemas transaccionales mencionados en la
etapa anterior, archivos internos u otro tipo de fuentes externas.
En esta fase se elaborar el Anexo de Extraccin (Anexo 3).
Diseo de explotacin Se realiza el diseo que tendrn los reportes analticos como: filtros, grficos,
dimensiones y tablas de hechos involucrados.
Segn los requerimientos funcionales se elaborarn los reportes.
En esta fase se elaborar el Anexo de Explotacin (Anexo 4).
Implementacin Mediante de este proceso se logra la emisin de consultas y reportes que
presenten la informacin de manera integrada a travs de distintas reas de la
organizacin, lo cual sirva de ayuda para la toma de decisiones.
El usuario podr acceder a los datos manipulando los cubos OLAP generados para
obtener diferentes perspectivas de anlisis, los cuales se reflejan en los reportes
analticos.
En esta fase se elaborar el Anexo de Construccin (Anexo 5) que incluye las
pruebas de los reportes analticos.
-
41
2.2. Identificacin de Requerimientos Esta seccin corresponde a la etapa de diagnstico de la figura 2.5.
Los requerimientos deben ser identificados segn estrategia sanitaria nacional,
como se mencion en el captulo 1, existen 10 estrategias y cada una merece un
anlisis por separado.
La captura de requerimientos se hizo a travs de entrevistas a los encargados
principales de la estrategia a implementar tomando como direccin de salud piloto a
la DISA I del Callao, adems de documentacin acerca de los problemas
principales de salud.
Los requerimientos estn asociados a las necesidades de todos los actores de la
estrategia y se las ha asignado un nivel de prioridad con el fin de priorizar todos
aquellos que sean los ms importantes y solucionen los problemas encontrados.
2.2.1. Requerimientos Funcionales Requerimientos Generales
Aunque las estrategias sanitarias demanden requerimientos distintos, presentan
ciertos requerimientos generales:
- Toda estrategia est regida por lneas de accin establecidas por el
MINSA y deben ser cumplidas a cabalidad. Adems debe guiarse segn
los lineamientos del modelo integral de salud es decir que los
requerimientos que se indiquen para cada una de las estrategias deben
estar orientados a lograr una adecuada gestin de prestacin de salud.
- Para todas las estrategias se realizarn reportes que midan y evalen la
ganancia en salud y bienestar de las personas, de las familias y
comunidades. Comparacin entre valores de situacin inicial con
situacin deseada y real.
Requerimientos Estrategia Sanitaria Alimentacin y Nutricin Balanceada
Se listan los requerimientos que el sistema debe satisfacer para cumplir con el
objetivo de la estrategia:
Requerimiento Funcional Prioridad Dificultad
El sistema permitir generar un reporte en el que se 2 1
-
42
muestre la evolucin de nmero de casos de actividades o
enfermedades a travs del tiempo.
Es mostrar en el reporte Evolucin de actividades CIE 10
en el tiempo
El sistema permitir generar indicadores de desnutricin
segn establecimientos de salud.
1 2
El sistema permitir reflejar la cantidad total de personas
de la poblacin que padecen enfermedades relacionados a
la alimentacin como anemia, hipotiroidismo, bocio,
enanismo, desnutricin, retraso, sobrepeso, obesidad,
entre otras establecidas por el CIE 10, para cada
establecimiento de salud. (prevalencia)
Se mostrar a travs del reporte de Prevalencia de
Enfermedades
1 3
El sistema permitir comparar el estado de cada
establecimiento en el aspecto de nutricin para as saber
cuales son aquellos que se encuentra en riesgo o
necesitan ms apoyo.
1 2
El sistema permitir controlar la entrega de alimentos (en
unidades p.e. Kg) a los establecimientos de salud para los
pacientes que padecen de TBC (tuberculosis).
Se mostrar a travs del reporte de Evolucin de entrega
de alimento en el tiempo.
1 2
El sistema permitir controlar la cantidad de alimentos,
destinado a pacientes con TBC, segn estados (entregado,
deteriorado, robado, perdido) para cada establecimientos
de salud
Se mostrar a travs del reporte de Estado de alimentos entregados
1 2
El sistema permitir el anlisis de nmero de casos de
pacientes con TBC ingresantes al programa de PANTBC
segn su condicin nutricional (bajo peso, normal,
sobrepeso)
Se mostrar a travs del reporte de Condicin de pacientes segn IMC
1 3
El sistema permitir la comparacin entre nmero de 1 3
-
43
pacientes con TBC, pacientes que ingresan al programa de
PANTBC y pacientes estimados a ingresar al programa de
PANTBC. Adems muestra indicadores como Atendidos
por PANTBC / Estimados.
Se mostrar a travs del reporte de Consolidado de
atenciones PANTBC
El sistema permitir el anlisis del nmero de casos de
egresos de pacientes del programa de PANTBC segn
condicin (recuperado, abandono, fallecido, transferido)
Se mostrar a travs del reporte de Condicin de egresos
de pacientes
1 3
El sistema permitir controlar el nmero de intervenciones
realizadas para los pacientes con TBC como consejeras,
entrega de canastas de alimentos, charlas educativas y
visitas domiciliarias.
Se mostrar a travs del reporte Actividades realizadas
1 1
El sistema permitir controlar el total de pacientes
asistentes con TBC a las actividades realizadas por el
programa de PANTBC
Se mostrar a travs del reporte Asistencia de pacientes a
actividades
2 1
Leyenda Prioridad: Calificacin Significado
1 Importante
2 Regular
3 Prescindible
Leyenda Dificultad: Calificacin Significado
1 Fcil
2 Regular
3 Difcil
La dificultad esta medida por el tiempo que se requiere tanto para el anlisis como
para la elaboracin de la extraccin de los datos necesarios de los sistemas OLTP
(HIS y/o PANTBC) para generar el reporte analtico.
-
44
2.2.2. Requerimientos no funcionales
Cada usuario ser identificado segn estrategia sanitaria que tiene a su cargo,
adems tendr un determinado rol y privilegios con el fin de asegurar la
informacin.
La seguridad del sistema es un factor crtico pues la informacin que se maneja es
sensible es decir representa informacin acerca de la realidad de salud en la que se
encuentran las personas y no debe ser manipulada por usuarios no autorizados.
Como el software que se utilizar es de cdigo abierto, no se incurrir en gastos por
licencias de software; sin embargo se requiere un servidor de aplicaciones, un
servidor de base de datos y un dominio.
La pgina de administracin de Pentaho, herramienta de BI, consiste en un portal
web que se utilizar para anlisis en el datamart, es desde all que el usuario con
suficiente privilegio generar los reportes y realizar la evaluacin de las
estrategias.
El uso de la herramienta es intuitivo, debe cumplir:
- La herramienta de explotacin seleccionada debe permitir realizar las
tcnicas de consulta multidimensional como Slicing, Dicing, Drilling, etc.
Adems, debe permitir la creacin de reportes personalizados por el usuario
final.
- Exportacin de reportes a archivos de formatos estndar como archivo de
texto (.txt) o Excel (.xls).
- Mostrar la informacin del datamart en base a los siguientes 3 tipos:
Reportes tradicionales (basados en columnas), Tablas pivote (Matriz de
doble entrada) y Grficos.
Entre otros requerimientos no funciones de la herramienta se tiene:
- Disponibilidad: El sistema al ser de consultas y anlisis no impacta a las operaciones diarias que se realizan ya sea en la DISA como en los
establecimientos de salud, es por ello que su disponibilidad puede ser
menor a 24 horas los 7 das de la semana. Adems el sistema no se
-
45
encontrar disponible los das en los que se realice la actualizacin de datos
del datamart.
- Utilidad: El sistema ser apropiado para el uso de los distintos perfiles, de manera que sirvan como soporte de las labores de todas personas que
interacten con l.
- Escalabilidad: Las herramientas de negocios permiten cualquier tipo de consultas y reportes que ms adelante se podran solicitar.
2.3. Anlisis de la Solucin En esta fase luego de haber identificado los requerimientos para la estrategia piloto
se propone una solucin adecuada cuya implementacin conduzca a la solucin del
problema.
2.3.1. Consideraciones sobre el sistema Para el anlisis de la viabilidad del sistema se ha considerado tres factores
importantes:
Factor tecnolgico:
En la DISA donde se realiz la captura de informacin cuentan con computadoras
Pentium III y IV. Para Pentaho es necesario en caso el sistema operativo sea
Windows que sea XP o versin superior, para Linux o Mac de preferencia deberan
ser de las ltimas versiones, adems el equipo debe soportar JRE (Java Runtime
Environment) y poseer por recomendacin 1GB de memoria RAM.
Aquellos usuarios que realizarn el anlisis y toma de decisiones requerirn de
equipo con los requerimientos sugeridos para Pentaho, pues esto traer mejoras en
rapidez de obtencin de resultados.
Cada estrategia sanitaria cuenta con un rea propia o compartida con otra
estrategia sin embargo cada una tr