trabajo tutelado retos en la gestiÓn de proyectos de

38
1 UNIVERSIDAD POLITECNCIA DE MADRID FACULTAD DE INFORMÁTICA DEPARTAMENTO DE LENGUAJES Y SISTEMAS INFORMÁTICOS E INGENIERÍA DEL SOFTWARE Trabajo Tutelado RETOS EN LA GESTIÓN DE PROYECTOS DE DATA MINING Tutora : Dra. Ernestina Menasalvas Ruíz Alumno : Marco Antonio Gutiérrez F. Madrid, Agosto 2007

Upload: nguyenxuyen

Post on 11-Feb-2017

216 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Trabajo Tutelado RETOS EN LA GESTIÓN DE PROYECTOS DE

1

UNIVERSIDAD POLITECNCIA DE MADRID

FACULTAD DE INFORMÁTICA

DEPARTAMENTO DE LENGUAJES Y SISTEMAS

INFORMÁTICOS E INGENIERÍA DEL SOFTWARE

Trabajo Tutelado

RETOS EN LA GESTIÓN DE PROYECTOS DE

DATA MINING

Tutora : Dra. Ernestina Menasalvas Ruíz

Alumno : Marco Antonio Gutiérrez F.

Madrid, Agosto 2007

Page 2: Trabajo Tutelado RETOS EN LA GESTIÓN DE PROYECTOS DE

2

Índice

1 Introducción y Motivación...................................................................................................... 4

1.1 Relevancia de la gestión de proyectos de Data Mining .................................................. 4

1.2 Problemas de la gestión de proyectos de Data Mining .................................................. 6

1.3 Hechos y Casos de Fracasos .......................................................................................... 8

1.4 Objetivos del Trabajo Tutelado ................................................................................... 10

2 Related work ...................................................................................................................... 11

2.1 Gestión de Proyectos .................................................................................................. 11

2.1.1 Ciclo de vida del proyecto.................................................................................... 14

2.1.2 Áreas de conocimiento para la gestión de proyectos ........................................... 16

2.1.3 Framework para la gestión de proyectos ............................................................. 17

2.1.4 Elementos críticos en la gestión de proyectos...................................................... 17

2.2 Gestión de Proyectos de Software............................................................................... 20

2.2.1 Descripción de RUP ............................................................................................. 21

2.2.2 Dimensiones y disciplinas de RUP ........................................................................ 21

2.2.3 Ciclo de vida de RUP ............................................................................................ 23

2.2.4 Disciplina de gestión de proyectos de RUP........................................................... 23

2.2.5 Elementos críticos en la gestión de proyectos de software .................................. 23

2.3 Gestión de Proyectos de Data Mining.......................................................................... 25

2.3.1 Metodología CRISP-DM ....................................................................................... 25

2.3.2 Mapeo desde el modelo genérico al especializado.............................................. 26

2.3.3 Modelo de referencia CRISP-DM ......................................................................... 27

3 Conclusiones ...................................................................................................................... 30

3.1.1 En relación a la gestión de proyectos de data mining .......................................... 30

3.1.2 Análisis de metodologías hacia la gestión de proyectos de data mining ............... 31

3.1.3 Tendencias en la gestión de proyectos de data mining ........................................ 33

4 Referencias ........................................................................................................................ 35

Page 3: Trabajo Tutelado RETOS EN LA GESTIÓN DE PROYECTOS DE

3

Índices de Figuras

Figura 1-1 Industrias y Campos de Aplicación de Data Mining (basado en www.Kdnuggets.com) .................. 5 Figura 1-2 de proyectos CRM considerados Fallidos (KDnuggets.com, 2007) ............................................... 9 Figura 1-3 Grupo de procesos que interactúan en un proyecto ................................................................... 13 Figura 1-4 Detalle esquemático de cada nodo de la matriz ......................................................................... 14 Figura 1-5 Dimensiones de Competencias del Project Management ........................................................... 14 Figura 1-6 Ciclos de vida de proyectos de software .................................................................................... 15 Figura 1-7 Framework para la gestión de proyectos ................................................................................... 17 Figura 1-8 Rational Unified Process ........................................................................................................... 20 Figura 1-9 Roles, actividades y artefactos .................................................................................................. 22 Figura 1-10 Ciclo de vida de RUP .............................................................................................................. 24 Figura 1-11 Metodología Data Mining CRISP-DM ...................................................................................... 25 Figura 1-12 Fases de un proceso de Data Mining ...................................................................................... 28 Figura 1-13 Resolución de problemas y la técnica de fault-finding .............................................................. 32

Indices de Tablas

Tabla 1-1 Grupos de procesos y áreas de conocimiento ............................................................................. 13 Tabla 1-2 Tareas genéricas y salidas del modelo de referencia CRISP-DM ................................................ 30 Tabla 1-3 Mapeo de PMBOK, RUP, CRISP-DM ......................................................................................... 32 Tabla 1-4 Mapeo de procesos, disciplinas y fases ...................................................................................... 33

Page 4: Trabajo Tutelado RETOS EN LA GESTIÓN DE PROYECTOS DE

4

1 Introducción y Motivación

1.1 Relevancia de la gestión de proyectos de Data Mining

El éxito de las organizaciones en el siglo veintiuno esta cada vez más asociado al uso

eficiente del conocimiento y la información para el logro de sus objetivos, de ahí que a

este periodo de la historia se le conozca como la Era de la Información ó la Sociedad del

Conocimiento. La sobrevivencia en esta era, donde la competencia es un factor clave,

requiere de las organizaciones un conocimiento profundo de los patrones de

comportamiento de sus clientes y un acceso selectivo a aquella información oculta en la

gran cantidad de datos almacenados en sus repositorios [King, 2005]. La necesidad de

las organizaciones, de obtener un mayor conocimiento del mercado en general y de sus

clientes, las ha llevado al desarrollo de la disciplina conocida como “Data Mining” (DM).

En sus inicios, [Fayyad et al., 1996] se consideró al Data Mining como un paso crucial del

proceso de descubrimiento de conocimiento en bases de datos (KDD), sin embargo hoy

en día el término Data Mining es el proceso de KDD en si mismo [Wasilewska et al.,

2007].

El uso de Data Mining en organizaciones de diversa índole ha ido aumentando

gradualmente en la última década [Piatetsky-Shapiro, 2007] y ha pasado de ser una

herramienta utilizada para conocer más a los clientes a convertirse en el conductor de las

estrategias empresariales [Ingebretsen, 2003]. Data Mining ha sido introducida

exitosamente en el sector público y privado, en un amplio rango de aplicaciones. En el

sector público DM fue usado inicialmente para detectar abusos y fraudes financieros

[Chan et al, 99]; en la actualidad se utiliza en procesos que incluyen CRM, investigación

de mercado, análisis de la cadena de abastecimiento, análisis médico y diagnostico,

análisis financiero y detección de fraudes [KDNuggets, 2007]. Adicionalmente, es

interesante constatar como las áreas industriales y campos de aplicación del Data Mining

han experimentado una importante variación en los últimos 5 años. Al comparar las

estadísticas que presenta KDnuggets, en su sitio web, respecto a este tema es posible

ver el área de CRM ocupando un lugar muy importante en el 2006 versus su inexistencia

en el año 2001; así también el área de banking pasa de ser la más importante, a

convertirse en un área sin relevancia en el año 2006 (ver Figura 1-1).

Piatetsky-Shapiro en el 2007 sostiene que el uso de las herramientas de Data Mining se

ha potenciado en los últimos 10 años debido a factores tales como el fuerte surgimiento

del comercio electrónico, los progresos en biología y los requerimientos de la seguridad

antiterrorista entre otros. Asimismo, este autor enfatiza en un análisis de las 10 palabras

utilizadas con mayor frecuencia entre 1996 y 2005, por los especialistas en DM en el sitio

www.KDnuggets.com, que las palabras “data” y “Mining” ocupan el primer y segundo

lugar respectivamente. Sin embargo, la palabra que llega a ocupar el tercer lugar en

1996 es “universidad”, mientras que en el 2005 la nueva palabra que aparece en su

reemplazo es “negocios”, reflejando el cambio de enfoque de uso con fines de

investigación a utilización con fines comerciales [Piatetsky-Shapiro, 2007]. Asimismo, la

consultora Gartner, en diciembre de 2006, da a conocer el conjunto de tecnologías que

Page 5: Trabajo Tutelado RETOS EN LA GESTIÓN DE PROYECTOS DE

5

tendrían mayor impacto en el mediano y largo plazo, y considera la “Gestión de la

información Empresarial (GIE)” en el tercer lugar. Gartner destaca además, que para el

2007 el 20% de las principales empresas de Fortune utilizaran esquemas de

administración GIE en apoyo a la Arquitectura Orientada al Servicio (SOA).

Figura 1-1 Industrias y Campos de Aplicación de Data Mining (basado en www.Kdnuggets.com)

A pesar que las organizaciones ya han entendido la relevancia de los proyectos de data

mining para alcanzar un mejor posicionamiento competitivo, existen hoy serias

problemáticas asociadas a la puesta en marcha y administración de proyectos de esta

naturaleza [Brachman, 1996]; [Richardson and Butler 2006]; [Becker, 2005].

Investigadores del área de DM y personal de empresas están conscientes de las

problemáticas que se enfrentan en el desarrollo de proyectos de esta naturaleza; sin

embargo, no existe consenso entre los investigadores en el área de gestión de proyectos

de Tecnologías de Información acerca de lo que constituye un proyecto fallido, aunque

en general se distinguen dos tipos de problemáticas, las económicas y aquellas

relacionadas con los requerimientos, costos y parámetros de tiempo [Becker and

Ghedini, 2005]. Es decir, si un proyecto no genera el retorno esperado, si los costos

asociados a su implementación exceden lo presupuestado, constituiría una falla

económica; no obstante, aquel que no entrega las características prometidas a tiempo y

dentro de los presupuestos, también sería un proyecto fallido, cuya causa puede darse

por una mala implementación y gestión. Un reporte de Extreme Chaos [Standish

Group’s, 2004] manifiesta que en los Estados Unidos se gastan más de 250 billones de

dólares cada año en cerca de 175.000 proyectos de aplicaciones de tecnologías de la

información. Indica además, que el costo promedio de un proyecto en una compañía

grande es de aproximadamente 2,3 millones de dólares, en una compañía mediana de

1,3 millones de dólares y de 0,4 millones en una pequeña empresa. Pero, sin embargo,

Page 6: Trabajo Tutelado RETOS EN LA GESTIÓN DE PROYECTOS DE

6

muchos de estos proyectos fallan en sus resultados. Las estadísticas más abrumadoras

en este reporte señalan que el 31,1% de los proyectos serian cancelados antes de ser

completados, el 52,7% de los proyectos costarían 189% más que su presupuesto original

y eso no considera la pérdida del costo de oportunidad de los recursos. El mismo reporte

de Extreme Chaos en el año 2001, [Standish Group’s, 2001], indica que la tasa de éxito

de los proyectos de TI aumentó alrededor del 75% sobre la tasa del año 1994 y entre las

principales razones que se esgrimen fue el uso de: “Mejores herramientas” y “Monitoreo

y control del progreso de los proyectos y administradores de proyectos con mejores

habilidades”.

1.2 Problemas de la gestión de proyectos de Data Mining

A pesar del fuerte desarrollo de herramientas y técnicas de DM y del creciente uso en las

organizaciones públicas y privadas, para el logro de sus objetivos estratégicos, los

resultados obtenidos no reflejan la gran inversión y difusión de dichas herramientas.

Existen variadas razones que ayudan a explicar esta paradoja. [Becker ,2005] sostiene

que muchos de los problemas que enfrentan los proyectos de DM se pueden asociar a:

dificultades para definir objetivos compatibles con lo que pueden revelar los datos que se

encuentran disponibles; al esfuerzo concentrado en la fase de preparación de datos; la

experimentación con parámetros y transformaciones de datos en la fase de minería; falta

de apoyo metodológico, sobrecarga de rehacer el trabajo, dificultad de administrar y

relacionar recurso y resultados de una aplicación de DM. Adicionalmente, existen

problemas que se producen al inicio del proceso y se arrastran durante toda la ejecución

del proyecto. Jean Que Louie [Louie, 2003] Presidente de Nautilus Systems, Inc.,

menciona que los desarrolladores de proyectos en el área de DM cometen serios errores

al considerar válidas las siguientes cuatro falacias del Data Mining [Larose, 2005]:

Falacia 1: Hay herramientas de Data Mining que pueden convertir nuestros repositorios

de datos y dar respuestas a nuestros problemas.

Falacia 2: El proceso del Data Mining es autónomo, requiere poco o nada del cuidado

humano.

Falacia 3: El Data Mining se paga solo muy rápidamente.

Falacia 4: Los paquetes de software de Data Mining son intuitivos y fáciles de usar.

A la lista de arriba, el autor agrega dos falacias comunes adicionales:

Falacia 5: Data Mining identificará las causas de los problemas del negocio o de la

investigación.

Falacia 6: Data Mining limpiará una base de datos sucia automáticamente.

Las falacias presentadas por el autor [Larose, 2005] permiten entender las principales

problemáticas que conlleva un proyecto de Data Mining en la organización. Una buena

administración, gestión y puesta en marcha de los mismos permite evitar las pérdidas de

tiempo y recursos tras su implementación y permitirá obtener mejores resultados para las

metas propuestas por parte de la empresa.

Page 7: Trabajo Tutelado RETOS EN LA GESTIÓN DE PROYECTOS DE

7

Según señala [Pyle, 2004] en su artículo “This Way Failures Lies”, no todos los proyectos

de minería son exitosos y agrega además que aunque hay muchas vías hacia el éxito de

la minería de datos, las trayectorias a la fallas se siguen demasiado a menudo. Los

profesionales de la minería de datos que se dirigen hacia el fracaso, parecen seguir

patrones (reglas), o peores prácticas, así como quienes intentan seguir el éxito, buscan

las mejores prácticas. Existen nueve simples reglas, que se deben evitar, para no

fracasar en un proyecto de minería de datos:

Regla 1: Hacer Data Mining directamente de los datos que se recogen.

Regla 2: Modelar el problema en términos de datos.

Regla 3: Enfocarse solamente en la manera más obvia de enmarcar el problema.

Regla 4: Confiar en su propio juicio.

Regla 5: Encontrar los mejores algoritmos (no buscar el que se ajusta mejor al proyecto).

Regla 6: Confiar en la memoria (no documentar).

Regla 7: Utilizar la intuición como elemento fundamental en lugar de las prácticas

estándar.

Regla 8: Reducir al mínimo la interacción entre los profesionales de data mining y los

encargados del negocio.

Regla 9: Reducir al mínimo la preparación de los datos.

[Pyle, 2004] enfatiza que necesario entender que Data Mining es parte, y más aún, una

pequeña parte, de un proceso de negocios mucho mayor y que además puede ser una

parte esencial de un proyecto de Data Mining, pero al incorporar los resultados de la

minería de datos con todas las otras partes relacionadas del proyecto corporativo es

igualmente, sino la mas, importante para el éxito final.

Standish Group’s (2001), en el extreme report sostiene que los 10 principales factores

considerados más relevantes por los ejecutivos de IT, para el éxito de proyectos de data

mining son los siguientes: el involucramiento del usuario, el apoyo de los ejecutivos

máximos, un claro planteamiento de los requerimientos, una adecuada planificación,

expectativas realistas, pequeños hitos del proyecto, staff competente, apropiabilidad por

parte del equipo, visión y objetivos claros y un staff enfocado que trabaja duro. Asimismo,

[Becker, 2005], sostiene que una gestión efectiva del proyecto es una factor clave de

éxito de proyectos de KDD. En este sentido los mismos autores mencionan la

documentación sistemática de conocimientos, experimentos, datos y resultados previos

como un medio invaluable para mantener un seguimiento del estatus actual del proyecto.

La literatura destaca la importancia de la utilización de herramientas de aceptación

generalizada y profesionales para la gestión de proyectos en general y de proyectos de

data mining en particular. En dicho contexto se hace relevante la incorporación

sistemática y la adecuación de metodologías de gestión de proyectos integrales

aceptadas universalmente para la administración de proyectos de Data Mining. En este

Page 8: Trabajo Tutelado RETOS EN LA GESTIÓN DE PROYECTOS DE

8

sentido destacan como herramientas de uso generalizado para gestionar proyectos el

PMBOK y RUP.

1.3 Hechos y Casos de Fracasos

El desarrollo de proyectos de Data Mining ha evolucionado desde una disciplina

reservada al medio científico y universitario a constituirse en una de las armas

estratégicas más importantes en el mundo de los negocios. Esta evolución incluye

nuevas áreas de investigación, tales como Web Mining, Redes Sociales, y Multimedia

Mining [Piatesky, 2007]. Lo anterior, se puede observar a través de algunas de las

estadísticas obtenidas del sitio www.kdnuggets.com, que fueron presentadas por

Piatesky-Sahpiro en un artículo el año 2007, que se muestra que el número de trabajos

ofrecidos en KDnuggets (ver Figura N° 1.1) en el año 1997 se concentraban en el sector

académico, y que los trabajos solicitados para el sector Industrial comenzaron a ser

significativamente mayores a partir del año 2000 seguido de una baja y una importante

recuperación desde el 2003 en adelante.

Figura N° 1.1 Trabajos ofrecidos en KDnuggets (Extraído de Piatesky-Sahpiro, 2007)

Sin embargo, estos avances del Data Mining en las áreas de negocios no han estado

exentos de problemas, errores y fracasos. Es posible mencionar casos donde proyectos

de gran envergadura han fallado y debido a diversas problemáticas. [Kelley, 2003]

presenta también algunas de las principales fallas en proyectos de DataWarehouse y

Data Mining e identifica los once tipos de problemas que se pueden asociar a fallas de

proyectos de esta naturaleza:

1. El proyecto sobrepasa el presupuesto inicial

2. El proyecto se sale de la programación inicial

Page 9: Trabajo Tutelado RETOS EN LA GESTIÓN DE PROYECTOS DE

9

3. Funciones y capacidades no implementadas en el proyecto

4. Usuarios insatisfechos

5. Desempeño del proyecto inaceptable

6. Disponibilidad de las aplicaciones limitada y pobre

7. Inhabilidad para expandirse

8. Mala calidad de datos y reportes

9. Muy complejo para ser usado por los usuarios

10. Costos no justificados inicialmente en el proyecto

11. La administración no reconoce los beneficios del proyecto

Como ejemplo de las problemáticas que se enfrentan en la gestión de proyectos de Data

Mining es posible mencionar los variados intentos para desarrollar aplicaciones en áreas

comerciales, específicamente en la ejecución de proyectos de CRM. El sitio

KDnuggets.com realiza permanentemente encuestas a profesionales en Data Mining y

en el año 2001 consultó respecto a la experiencia con proyectos CRM y su percepción

sobre el porcentaje de fracasos. Como resultado alrededor del 73% de los que

respondieron consideran que entre el 40 y el 100% fueron proyectos fallidos y de ellos

un 11% respondió que entre un 81 y un 100% de los proyectos fallaron (ver Figura 1-2)

Encuesta KDnuggets

En su experiencia, que % de proyectos de CRM fallaron? [118 votes total]

0 - 20 (13) 11%

21 - 40 (19) 16%

41 - 60 (39) 33%

61 - 80 (34) 29%

81 - 100 (13) 11%

Figura 1-2 de proyectos CRM considerados Fallidos (KDnuggets.com, 2007)

En la actualidad existe una gran variedad de campos de aplicación de proyectos de Data

Mining y como mencionan Platetsky-Shapiro, Djeraba, Getoor, Grossman, Feldman y

Zaki (2006) los mayores desafíos se encuentran en dos grandes áreas de investigación

que involucran áreas de uso y datos: 1) Hacer minería del comportamiento de los

usuarios en la interacción con datos multimedia y el uso del conocimiento extraído en

este proceso para anticipar el futuro comportamiento o para diagnósticos médicos o

condiciones sicológicas de los usuarios es un tema que requiere de atención 2) Cruzar

la brecha semántica entre datos de multimedia y semánticos donde la dificultad es

Page 10: Trabajo Tutelado RETOS EN LA GESTIÓN DE PROYECTOS DE

10

extraer automáticamente el significado del contenido multimedia de manera que la

explotación usando información semántica pueda ser hecha a la medida de aplicaciones

individuales (ej. Seguridad, marketing, negocios, otras.) Estos autores también sugieren

que las investigaciones actuales se enfocan principalmente en tareas únicas tales como

ranking o predicción de links, pero en los escenarios reales de análisis de datos se

requieren una mezcla de todas las capacidades.

Finalmente, los desafíos que enfrenta el desarrollo de proyectos de Data Mining residen

en la necesidad de abordar problemáticas complejas que no se enfocan solo en áreas

tradicionales de los negocios sino que irán mas allá hacia temas que implican la esencia

del comportamiento social y humano y es aquí donde es necesario contar con

metodologías integrales y de un nivel multidimensional donde los errores y las fallas en la

gestión de los proyectos tienen un efecto catastrófico.

1.4 Objetivos del Trabajo Tutelado

Analizados los problemas que conlleva la gestión de los proyectos de data mining y

teniendo en cuenta las buenas prácticas, el tiempo de desarrollo y la aplicación de

metodologías en gestión de proyectos en dominios como la ingeniería del software, se

plantea como objetivo central de este trabajo tutelado el análisis de la gestión de

proyectos y su posible adaptación para la gestión de Proyectos DM. Este objetivo

considera la revisión de los avances y desarrollos en el área de la gestión de proyectos

con particular énfasis en proyectos de software. Asimismo, se estudiarán los fracasos y

las buenas prácticas en la gestión de proyectos de Data Mining.

Con el propósito de alcanzar el objetivo propuesto en este trabajo se plantea un análisis

en profundidad de la disciplina de gestión de proyectos basada fundamentalmente en los

conceptos del PMBOK y su aplicación en diversas areas del conocimiento.

Paralelamente, se estudiaran las herramientas y metodologías actualmente usadas para

gestionar proyectos de Data Mining y las principales problemáticas que se aprecian en

los procesos de concepción, diseño, implementación y puesta en marcha.

Consecuentemente, las siguientes secciones de este documento muestran en primer

lugar un análisis de la gestión de proyectos, su ciclo de vida, areas de conocimiento,

frameworks utilizadas y los elementos críticos en la gestión de proyectos. En segundo

lugar se presenta un análisis de la gestión de proyectos de software en el que se detalla

la metodología RUP, su ciclo de vida, las disciplinas de gestión de proyectos de RUP y

los elementos críticos en la gestión de proyectos de software. Posteriormente, se analiza

la gestión de proyectos de Data Mining considerando la metodología CRISP-DM, se

presenta el mapeo desde el modelo genérico al especializado y posteriormente se

presenta el modelo de referencia. El documento termina con las consecuencias extraídas

en relación ala gestión de proyectos de DM, un análisis comparativo de metodologías

hacia la gestión de proyectos de DM y finalmente las tendencias en la gestión de

proyectos de Data Mining.

Page 11: Trabajo Tutelado RETOS EN LA GESTIÓN DE PROYECTOS DE

11

2 Related work

2.1 Gestión de Proyectos

La práctica del Project Management ha evolucionado durante la mitad del último siglo

para formar parte de todas las industrias y gobiernos a nivel mundial. El trabajo

denominado “Project Management State of the Art” [Russell, 2004] presenta una visión

general de la disciplina, y ciertas tendencias de la gestión de proyectos, respecto de su

continua evolución.

Para poner un proyecto en perspectiva se requiere una definición [Charvat, 2003]. Una

de las definiciones de proyecto más aceptadas y utilizadas en la industria es la del

Project Management Institute (PMI) [PMBOK, 2004]. Organización que ha definido

Proyecto como “un esfuerzo temporal que se lleva a cabo para crear un producto,

servicio o resultado único”.

Adicionalmente, el PMI ha desarrollado el Project Management Body of Knowledge

[PMBOK, 2004], con la finalidad de identificar los fundamentos de la Gestión de

Proyectos generalmente reconocidos como buenas prácticas en las organizaciones. En

donde “identificar” significa proporcionar una descripción general en contraposición a una

descripción exhaustiva; por su parte, “generalmente reconocido” apunta a que los

conocimientos y las practicas descritos son aplicables a la mayoría de los proyectos, la

mayor parte del tiempo, y que existe un amplio consenso sobre su valor y utilidad; en

tanto que, “buenas prácticas” dice relación con que existe un acuerdo general en que la

correcta aplicación de estas habilidades, herramientas y técnicas puede aumentar las

posibilidades de éxito de una amplia gama de proyectos [Phillips, 2004].

Por otro lado, los autores de “Effective Project Management: Traditional, Adaptive,

Extreme” [Wysocki, 2003], definen que un proyecto “es una secuencia de actividades

únicas, complejas, y conectadas que tienen una meta o propósito y que se deben

terminar en un tiempo específico, dentro de presupuesto, y de acuerdo con las

especificaciones”.

Como señala el PMBOK® Guide, la gestión de proyectos es: “la aplicación de

conocimientos, habilidades, herramientas y técnicas a las actividades de un proyecto

para satisfacer los requisitos del proyecto”. La gestión de proyecto incluye: Identificar los

requerimientos, además supone establecer un equilibrio entre demandas contrapuestas

a través de objetivos claros y posibles de realizar, equilibrar demandas concurrentes de

calidad, alcance, tiempo y costo, y adaptar las especificaciones, los planes y el enfoque

de los stakeholder (necesidades y expectativas).

A partir de lo anterior y según [PMBOK, 2004], se desprende que los proyectos están

compuestos de procesos, en donde cada proceso es “una serie de acciones que

producen un resultado”, procesos que, a su vez, son realizados por personas. En

[Phillips, 2004] se ha identificado dos categorías que interactúan a lo largo del proyecto.

Los procesos de gestión de proyectos (universales a todos los proyectos y controlan

Page 12: Trabajo Tutelado RETOS EN LA GESTIÓN DE PROYECTOS DE

12

el ciclo de vida del proyecto), relacionados con la descripción y la organización del

trabajo del proyecto; y los procesos orientados al producto (son únicos al producto en

creación): relacionados con especificar y crear el producto del proyecto, que varían

según el campo de aplicación.

La Gestión de Proyectos se materializa mediante la aplicación e integración de los

siguientes cinco Grupos de Procesos de Gestión de Proyectos [Phillips, 2004]. Los

grupos de procesos tienen dependencias claras y se llevan a cabo siguiendo la misma

secuencia en cada proyecto. Son independientes de los enfoques de las áreas de

aplicación o de la industria.

Los cinco grupos de procesos componen proyectos y fases de proyectos. Cada uno tiene

un conjunto de acciones que llevan el proyecto a su finalización [PMBOK, 2004]:

Iniciación: reconocimiento de que un proyecto o una fase de un proyecto deben

comenzar; y compromiso de su puesta en marcha.

Planificación: inventar y mantener un esquema de trabajo para conseguir los objetivos

del negocio que motivaron la realización del proyecto.

Ejecución: coordinar a las personas y demás recursos para la puesta en marcha del

plan del proyecto.

Control: asegurar que los objetivos del proyecto están cumpliéndose, mediante la

supervisión y medición de los progresos y tomando acciones correctivas cuando es

necesario.

Finalización: aceptación formal de los resultados de un proyecto o fase y realización

ordenada de su cierre.

Dentro de los 5 grupos mencionados, hay 2 categorías de procesos: centrales (son

lógicos en orden y siguen una progresión algo rigurosa) y los facilitadores (son más

flexibles, apoyan los procesos centrales) [Phillips, 2004].

Al interior de cada uno de estos cincos grupos de procesos, se gestan procesos

adicionales que pertenecen a diversas áreas de conocimiento requeridas para la gestión

de proyectos. Estos procesos representan la utilización de las mejores prácticas en

materia de aplicación de métodos y técnicas para disminuir los riesgos y asegurar el

éxito del proyecto [Competency PMBOK, 2001].

Page 13: Trabajo Tutelado RETOS EN LA GESTIÓN DE PROYECTOS DE

13

Level

ofActivity

Phase Start Time Phase End

Planning

Executing

ClosingInitiating

Controlling

• Project Integration Mgmt• Project Plan Execution

• Project Quality Mgmt• Quality Assurance

• Project HR Mgmt• Team Development

• Project Communication Mgmt

• Information Distribution

• Project Procurement Mgmt

• Solicitation• Source Selection

• Contract Admin

Figura 1-3 Grupo de procesos que interactúan en un proyecto

Cada área del conocimiento está constantemente evolucionando respecto de sus

técnicas, métodos y aplicación, esto hace que la gestión de proyectos este en

mejoramiento permanente. En la Tabla 1-1 se presenta en forma matricial lo expuesto

anteriormente, y en la Figura 1-4 el detalle esquemático de cada nodo de la matriz.

Grupo de Procesos

de Iniciación

Grupo de Procesos

de Planificación

Grupo de Procesos

de Seguimiento y

Control

Grupo de Procesos

de Ejecución

Grupo de Procesos

de Cierre

• Desarrollar el acta de

constitución del Proyecto

• Desarrollar el enunciado de

alcance del proyecto

• Desarrollar el plan de gestión

del proyecto

• Dirigir y Gestionar la

Ejecución del Proyecto

• Supervisar y controlar el

trabajo del proyecto

• Control Integrado de

Cambios

• Cerrar el proyecto

• Planificar el alcance.

• Definir el alcance

• Crear EDT

• Verificar el alcance

• Controlar el alcance

• Definir las actividades.

• Establecer una secuencia de

las actividades.

• Estimar los recursos de las

actividades.

• Estimar la duración de las

actividades.

• Desarrollar el cronograma

• Controlar el cronograma

• Estimar los costos

• Preparar el presupuesto de

los costos

• Controlar los Costos

• Planificar la calidad • Realizar un aseguramiento

de la calidad

• Realizar un control de

calidad

• Planificar los RRHH • Adquirir al equipo del

proyecto

• Desarrollar al equipo del

proyecto

• Gestionar el equipo del

proyecto

• Planificar las comunicaciones • Distrinuir la información • Informar el rendimiento

• Gestionar a los interesados

• Planificar la gestión riesgos

• Identificar los riesgos

• Realizar un analisis

cualitativo de los riesgos

• Realizar un analisis

cuantitativo de los riesgos

• Planificar las respuestasa los

riesgos

• Realizar un seguimiento y

Control a los riesgos

• Planificar las compras y

adquisiones

• Planificar la contratación

• Solicitar respuestas de

vendedores

• Seleccionar vendedores

• Administrar el contrato • Cierre del contrato

Gestión de la

Integración del

Proyecto

Gestión del Alcance del

Proyecto

Gestión del Tiempo del

Proyecto

Gestión de los Costos

del Proyecto

Gestión de la Calidad

del Proyecto

Gestión de los RRHH

del Proyecto

Gestión de las

Comunicaciones del

Proyecto

Gestión de los Riesgos

del Proyecto

Gestión de las

Adquisiones del

Proyecto

Grupo deProcesosÁrea

del Conocimiento

Tabla 1-1 Grupos de procesos y áreas de conocimiento

Page 14: Trabajo Tutelado RETOS EN LA GESTIÓN DE PROYECTOS DE

14

Figura 1-4 Detalle esquemático de cada nodo de la matriz

Competency PMBOK, 2001] muestra en la ¡Error! No se encuentra el origen de la

referencia. las dimensiones de competencias del Project Management.

Figura 1-5 Dimensiones de Competencias del Project Management

2.1.1 Ciclo de vida del proyecto

Cada proyecto suele descomponerse temporalmente en “fases” o “etapas” [Phillips,

2004], [Charvat, 2003], [Wysocki, 2003], [Charvat, 2002], [Hughes, 1999], [Royce, 1998].

Con ello se busca: un mejor control de la gestión y adecuados enlaces con las

operaciones habituales de la organización. Además, cada fase supone la realización

completa de uno o varios entregables. Un entregable es un producto tangible y

comprobable [Guía PMBOK, 2004].

La conclusión de una fase supone revisar sus entregables y la ejecución del proyecto

para: determinar si el proyecto debe continuar y para detectar y corregir errores con un

costo aceptable.

Page 15: Trabajo Tutelado RETOS EN LA GESTIÓN DE PROYECTOS DE

15

De allí, que los proyectos se dividen en fases, puesto que en cada fase las personas

involucradas son diferentes [Competency PMBOK, 2001], y las actividades que se

ejecutan son también de diferentes índoles. Además, cada fase termina con un

“entregable” que es el inicio de la siguiente fase.

Los ciclos de vida de un proyecto generalmente se definen en función del trabajo técnico

que se debe realizar en cada etapa; cuándo se deben generar los productos entregables

en cada fase; cómo se revisa, verifica y valida cada producto entregable; y quién está

involucrado en cada fase para controlar y aprobar cada una de ellas. En la Figura 1-6 se

presenta una comparación de ciclos de vida de proyectos de software [McGilvray, 2007].

Typical Project

Life CycleJustification Planning

Requirements

and AnalysisDesign

Development

and TestingDeployment

Post

Production

Support

Rational Project

Process (RUP)Inception Elaboration TransitionConstruction

RUP Modified Inception Elaboration TransitionConstructionOperational

Support

Siebel eRoadmap

Implementation

Methodology

Define Discover ConfigureDesign Validate Deploy Sustain

Accelerated SAP

Methodology

(ASAP)

Project

Preparation

Business

BlueprintRealization

Final

Preparation

Go-Live and

Support

Oracle Application

Integration

Methodology (AIM)

DefinitionOperations

Analysis

Solution

DesignBuild Transition Production

Figura 1-6 Ciclos de vida de proyectos de software

Las fases siguen una secuencia lógica que asegura una adecuada definición del

producto del proyecto [Charvat, 2003]. Se debe diferenciar entre los objetivos del

proyecto y los objetivos del producto, servicio o resultado que dicho proyecto entrega

[PMBOK, 2004].

Objetivos del proyecto: son aquellos asociados a los parámetros de tiempo

(programa), costo (presupuesto y flujo de gastos) y calidad (aseguramiento de la

calidad de los procesos) y otros que se definan en el contrato.

Objetivo del producto, servicio o resultado: son aquellos asociados a los

requerimientos del Cliente y especificaciones técnicas que definen el producto,

servicio o resultado a entregar.

Page 16: Trabajo Tutelado RETOS EN LA GESTIÓN DE PROYECTOS DE

16

2.1.2 Áreas de conocimiento para la gestión de proyectos

Los grupos de procesos actúan recíprocamente el uno con el otro y con los procesos de

otras áreas del conocimiento (técnicos y de gestión). Generalmente cada proceso ocurre

por lo menos una vez en cada fase del proyecto [Charvat, 2003], [Phillips, 2004] y

[PMBOK, 2004].

1. Alcance (iniciación, planificación y definición; verificación - control de cambios).

Involucra los procesos necesarios para asegurar que el proyecto incluye todo el

trabajo requerido, y sólo el trabajo requerido para completar el proyecto

exitosamente.

2. Tiempo (definición -secuenciamiento- desarrollo cronograma- estimación duración de

actividades; control del cronograma). Involucra los procesos requeridos para

asegurar el oportuno término del proyecto.

3. Costos (planificación recursos- estimación- asignación del presupuesto; control de

costos). Involucra los procesos requeridos para asegurar que el proyecto es

completado dentro del presupuesto aprobado.

4. Calidad (planificación, aseguramiento, seguimiento y control). Involucra los procesos

requeridos para asegurar que el proyecto cumpla los objetivos para los cuales fue

emprendido.

5. Recursos humanos (planificación organización y asignación personal; desarrollo del

equipo). Involucra los procesos que organizan y dirigen el equipo del proyecto.

6. Comunicaciones (planificación, distribución de información, informes de realización,

cierre administrativo). Involucra los procesos relacionados con la generación,

recolección, distribución, almacenamiento y disposición final de la información del

proyecto, en tiempo y forma.

7. Riesgos (planificación de la gestión (identificación, análisis cualitativo y cuantitativo,

plan de respuesta; supervisión y control). Involucra los procesos relacionados con la

gestión de riesgos del proyecto.

8. Adquisiciones (planificación-petición ofertas, -selección proveedores- administración

del contrato; conclusión del contrato). Involucra los procesos requeridos para comprar

o adquirir bienes, servicios o resultados, así como para contratar procesos de

dirección.

9. Integración (Desarrollo, ejecución del plan, control integrado de cambios). Involucra

los procesos requeridos para asegurar que los distintos elementos del proyecto estén

adecuadamente coordinados.

Page 17: Trabajo Tutelado RETOS EN LA GESTIÓN DE PROYECTOS DE

17

2.1.3 Framework para la gestión de proyectos

Dentro de cada proceso, las herramientas y las técnicas, tales como juicio experto,

dirigen e influyen las salidas de un proceso. Una salida deficiente influenciará

probablemente todos los procesos hacia atrás negativamente. Los procesos de un

proyecto se pueden modificar para cumplir con los requisitos particulares y para resolver

las necesidades y las demandas del proyecto. Algunos procesos podrían no ser

considerados para mejorar las condiciones de integración y los requisitos de un proyecto

dado. A veces, un proceso se puede quitar de un proyecto. Un proceso que no se

termina no significa necesariamente que no era necesario [PMBOK, 2004] y [Phillips,

2004].

Process Groups Knowledge Areas PM Processes

Initiating

Planning

Executing

Controlling

Closing

Project Integration Management

Project Scope Management

Project Time Management

Project Cost Management

Project Quality Management

Project Procurement Management

Project Communications Management

Project Risk Management

Project Human Resource Management

Plan Development

Plan Execution

Change Control

Quality Planning

Quality Assurance

Quality Control

Organization Planning

Staff Acquisition

Team Development

Time

Figura 1-7 Framework para la gestión de proyectos

2.1.4 Elementos críticos en la gestión de proyectos

La metodología de PMBOK describe un conjunto de prácticas generalmente aceptadas

por los expertos y que utilizan para la gestión de todo tipo de proyectos, incluyendo el

desarrollo de software y el despliegue de proyectos [PMBOK, 2004]. Esta metodología

define un proyecto como “Un esfuerzo temporal emprendido para crear un único

producto o servicio”. Y la gestión de proyecto como “La aplicación de conocimientos,

habilidades, herramientas y técnicas a las actividades de un proyecto para responder a

sus requerimientos”. En forma resumida se puede decir que el PMBOK se estructura en

grupos lógicos de gestión de proyectos, donde una dimensión describe “Áreas de

conocimiento” mientras que en la otra se describen los 39 procesos de gestión de

Page 18: Trabajo Tutelado RETOS EN LA GESTIÓN DE PROYECTOS DE

18

proyectos organizados en cincos “grupos de procesos”. Una de las características de

esta metodología es que en ella cada área de conocimiento describe conocimientos y

prácticas de gestión de proyectos en término de uno o más procesos, a su vez, cada

proceso se describe en términos de entradas, salidas, herramientas y técnicas. Las

entradas y salidas son documentos y las herramientas y técnicas son mecanismos

aplicados a las entradas para crear salidas. PMBOK no prescribe un ciclo de vida

específico para los proyectos, sólo señala que el ciclo de vida de un proyecto se puede

dividir en fases, de acuerdo a su alcance y dominio de aplicación.

Un elemento que complica a las metodologías para la gestión de proyectos diferentes de

PMBOK es que ellas se orientan a un sólo proyecto, sin tomar en cuenta que muchos

otros proyectos de la organización compiten por los mismos recursos y atención.

Adicionalmente, de acuerdo al análisis y revisión realizado previamente, estas

metodologías en general son abstractas y de alto nivel, no contienen la suficiente

narrativa, no son funcionales ni se adaptan a las áreas operacionales, ignoran los

estándares de la industria y las buenas prácticas, lucen impresionantes pero les falta

integración con el negocio, utilizan terminologías no estándares, compiten por recursos

similares sin orientarse al problema, no tienen métricas de rendimiento y son difíciles de

completar debido a la burocracia y administración. Una metodología adecuada para la

gestión de proyectos debe proveer a los administradores de proyectos de la organización

de una perspectiva del framework para la gestión de proyectos y las metodologías

presentes en la misma.

La implantación exitosa de una metodología de gestión de proyecto es en sí un proyecto

y la parte más difícil es hacerla parte de la cultura organizacional, ya que no basta con

que toda la organización comience a utilizar una nueva metodología simplemente

pegando las planificaciones a un muro y esperando los resultados. La implantación de

una metodología puede tomar meses. Muchos ciclos de vida de los proyectos requieren:

Automatización y flujos de trabajo, facilidades de uso, apropiada metodología de

documentación, y la aceptación de toda la organización.

Uno de los pasos más importantes para una exitosa a implantación de una metodología

para la gestión de proyectos es la planificación y las siguientes preguntas pueden

permitir orientar una buena implantación en la etapa de la planificación:

¿Conseguiremos agregar valor con esta metodología?

¿Cómo construimos las competencias del proyecto?

¿Los procesos de gestión de proyecto y las prácticas son los apropiados?

¿Hemos elegido la metodología correcta?

¿Es lo bastante flexible para cualquier tamaño del proyecto?

¿Como la organización aprende y mejora continuamente desde la metodología?

Page 19: Trabajo Tutelado RETOS EN LA GESTIÓN DE PROYECTOS DE

19

¿Podremos medir los beneficios del proyecto? ¿Cómo los sabemos?

¿Obtenemos una productividad óptima durante el ciclo de vida?

Los expertos en gestión de proyectos sugieren tener una cierta modestia antes de poner

en marcha la metodología y ellos se preguntan ¿Quién puede hablar autoritariamente en

todos los asuntos que conciernen a la implantación de la metodología de proyecto?.

Respecto al punto anterior, ellos argumentan que el ciclo de vida del proyecto distingue

a un proyecto de un no-proyecto y que para comprender las disciplinas genéricas de

gestión de proyectos, los administradores de proyectos y los ejecutivos deben tratar con

todos los asuntos que afectan a las etapas de ciclo de vida en todo tipo de proyectos.

Por lo tanto ello será un reto que requiere de análisis y entendimiento y mantener una

visión conceptual coherente de las disciplinas que a este nivel es difícil.

La utilización de un framework para la gestión de proyecto permite que la gestión de

proyectos opere y fluctúe de organización en organización donde un proyecto siga la

cultura y practicas esperadas de la organización y opere para entregan soporte a la

organización y sus propósitos. Asimismo, un proyecto debería seguir una secuencia

lógica de fases hasta completarse. Las fases son diferentes de proyecto a proyecto ya

que el trabajo del proyecto se diferenciará de uno al siguiente. El proyecto se debería

segmentar en fases para tener secciones más pequeñas, manejables y proporcionar

entregables para apoyar las operaciones continuas.

Al conjunto de fases del proyecto (como un todo) se le denomina el ciclo de vida del

proyecto y este define el comienzo, medio y termino de un proyecto. En las fases

iniciales, un proyecto tiene más riesgos e incertidumbres, es más susceptible a cambios,

fallas e influencias de los stakeholder. Estos stakeholders son individuos, negocios o

comunidades que tienen un interés en el logro del proyecto. Típicamente, están

involucrados en el proceso del proyecto y sus expectativas conducen los requerimientos

del proyecto. Es esencial explorar los stakeholder tempranamente en el ciclo de vida del

proyecto para eliminar la necesidad de cambios cuando el stakeholder se incluya más

tarde en el proyecto. Los costos y demandas de recursos alcanzan son mínimos al inicio

y alcanzan su peak al final del trabajo del proyecto, para luego disminuir.

Un elemento fundamental que aparece en la gestión de proyectos es la estructura

organizacional, la que influye directamente a lo largo del proyecto ya que determina los

procedimientos que debe seguir el administrador de proyectos y el nivel de autoridad

(poder) que posee. Similarmente, un administrador de proyectos debe considerar las

influencias sociales, económicas y ambientales y debe tener orientación externa de estas

áreas (estándares y regulaciones). Los estándares son pautas que generalmente se

siguen pero no son impuestas. Las regulaciones son leyes y demandas de la industria,

que son impuestas por los gobiernos.

Page 20: Trabajo Tutelado RETOS EN LA GESTIÓN DE PROYECTOS DE

20

2.2 Gestión de Proyectos de Software

Muchas organizaciones desean estandarizar sus prácticas de ingeniería de software

[Luckey, 2006] y [Booch et al, 1998] al igual que sus prácticas en gestión de proyectos

[Phillips, 2004]. El Rational Unified Process o RUP [RationalUnifiedProcess, 2007],

presenta un enfoque prescriptivo para la estandarización de las mejores prácticas de la

ingeniería de software, y el Project Management Institute (PMI) Guide to the Project

Management Body of Knowledge [PMBOK, 2004] ofrece un enfoque descriptivo para

estandarizar las mejores prácticas en la gestión de proyectos en una organización.

Esencialmente RUP se enfoca en las mejores prácticas de la gestión de proyectos en el

contexto del desarrollo del software y del despliegue de proyectos; mientras que las

mejores prácticas del PMBOK son genéricas y aplicables para la gestión de proyectos en

cualquier domino de aplicación – desde el desarrollo de un proyecto de data mining

hasta la implementación de nuevos procesos de negocios en una organización. Así,

desde la perspectiva de un dominio de aplicación, la disciplina de gestión de proyectos

del RUP es una instancia especifica de las mejores prácticas de la gestión de proyectos

del PMBOK’s, [ePMbook, 2007].

Figura 1-8 Rational Unified Process

Las mejores prácticas en la gestión de proyectos del RUP identificadas en

[Charbonneau, 2004] son aquellas presentadas en la disciplina Project Management

(PM) del RUP (ver Figura 1-8); otras mejores prácticas más o menos relacionadas al PM

se describen en las otras disciplinas de RUP (tales como en el modelamiento del

Page 21: Trabajo Tutelado RETOS EN LA GESTIÓN DE PROYECTOS DE

21

negocio, análisis y diseño de requerimientos, implementación, pruebas, despliegue,

ambiente y administración de configuración y cambios).

2.2.1 Descripción de RUP

RUP es un proceso de ingeniería de software, que describe quién hace qué, cuándo y

cómo en el desarrollo de software y el despliegue del proyecto [Rational Unified Process,

2007]. Este proceso tiene la característica de ser conducido por los casos de uso, se

centrada en la arquitectura, se conduce por los riesgos [Ravindranath, 2007], y es

iterativo.

En el desarrollo de un proyecto guiado mediante RUP [Ambler et al., 2005], los

requerimientos funcionales están expresados en forma de casos de uso, los que

conducen al desarrollo de una arquitectura ejecutable de aplicaciones. Por lo tanto, el

proceso focaliza los esfuerzos del equipo en la construcción de los comportamientos más

importantes y los elementos estructurales de las aplicaciones (es decir, lo elementos de

la arquitectura), antes de construir los elementos menos importantes. La disminución de

los elementos de riesgos importantes conduce a una definición temprana del ámbito y de

las primeras iteraciones de su ciclo de vida. Por último, RUP realiza particiones del ciclo

de vida del desarrollo de software en iteraciones que producen versiones incrementales

ejecutables del software.

RUP implementa las siguientes mejores prácticas de ingeniería de software [Kroll, 2003]

y [RationalUnifiedProcess, 2007]:

1. Desarrollo iterativo

2. Gestión de requerimientos

3. Uso de arquitecturas componentes

4. Modelamiento visual

5. Calidad continuamente verificable

6. Gestión de cambio

2.2.2 Dimensiones y disciplinas de RUP

RUP implementa las mejores prácticas, presentadas anteriormente, en un proceso de bi-

dimensional. Una dimensión describe “Disciplinas” mientras que la otra dimensión

describe “Fases” dentro del ciclo de vida de los procesos (ver Figura 1-8).

Las disciplinas RUP representan roles individuales, para los miembros o subgrupos

dentro de equipo de desarrollo. Las disciplinas son: Modelamiento del negocio,

requerimientos, análisis y diseño, implementación, pruebas, despliegue, gestión de

proyecto, ámbito, gestión de la configuración y cambios [RationalUnifiedProcess, 2007].

Page 22: Trabajo Tutelado RETOS EN LA GESTIÓN DE PROYECTOS DE

22

PlaneamientoInicial

PlaneamientoRequerimientos

Análisis y Diseño

Implementación

Prueba

Distribución

Evaluación

AdministraciónDel Ambiente

Software Engineering Process

Organized by

Discipline

Concepts

Activity WorkGuideline

Role

ToolMentor

in out

Artifact

ArtifactGuideline

Checkpoints Template Report

De

scri

be

d b

y

Workflow Details

Workflow

Figura 1-9 Roles, actividades y artefactos

La Figura 1-9, grafica los roles, artefactos y actividades y además otros elementos

complementarios de RUP [RationalUnifiedProcess, 2007].

Dentro de RUP, cada disciplina se expresa en término de roles (quien desarrolla la

tarea), actividades (como ellos desarrollan las tareas) y artefactos (que actividades se

realizará). Un rol define el comportamiento y las responsabilidades de un individuo o un

grupo de individuos, responsables de las actividades y los artefactos. Una actividad es

una tarea de la cual un rol es responsable y se puede solicitar su desarrollo. Estas

también describen los pasos requeridos para crear o actualizar uno o muchos artefactos.

Un artefacto es una entrada y/o salida a una actividad [Ambler et al., 2005]. Otros

elementos complementarios a los tres primordiales son aquellos, tales como conceptos,

guías de trabajo, gestores de herramienta, reportes, guías de artefactos, plantillas y

puntos de control.

Page 23: Trabajo Tutelado RETOS EN LA GESTIÓN DE PROYECTOS DE

23

2.2.3 Ciclo de vida de RUP

El ciclo de vida de RUP es iterativo, y las dimensiones de su ciclo de vida se dividen en

cuatro fases: Concepción, Elaboración, Construcción y Transición.

Cada fase tiene una clara definición de un conjunto de objetivos y términos con hitos

principales. Los hitos al final de cada fase son:

1. Objetivo del ciclo de vida en el final de la Concepción.

2. Arquitectura del ciclo de vida en el final de la Elaboración.

3. Capacidad operacional inicial en el final de la Construcción.

4. Lanzamiento del producto en el final de la Transición.

El objetivo de la Concepción es definir el alcance del proyecto; El de la Elaboración es

construir una arquitectura ejecutable para la aplicación. El de la Construcción es dar

forma a lo que será sostenido por estructura de la arquitectura completando la mayoría

de las capacidades y características de la aplicación. Y finalmente, el objetivo de la

Transición es entregar la aplicación a los usuarios finales. A su vez, cada fase de RUP

se divide en iteraciones, cada una de las cuales finaliza con un hito menor.

2.2.4 Disciplina de gestión de proyectos de RUP

De las disciplinas del RUP señaladas anteriormente, son de mayor interés aquellas

relacionadas a las disciplinas de Project Management (PM).

RUP define su disciplina de gestión de proyecto de software como el arte de balancear

los objetivos contrapuestos, la gestión del riesgo, y la superación de apremios y

restricciones para la entrega exitosa de un producto que cumpla las necesidades de los

clientes (que son aquellos que han solicitado el desarrollo del software) y de los usuarios

del software.

La disciplina de gestión de proyecto de RUP provee: Un marco para la gestión de

proyectos orientados al desarrollo de software; guías prácticas para la planificación,

dirección de personal, ejecución, monitoreo y supervisión de proyectos; además, provee

un marco para la gestión de riesgos. Esta disciplina está enfocada principalmente en los

aspectos más importantes de un proceso de desarrollo iterativo: gestionar los riesgos;

planificar un proyecto iterativo, en todo su ciclo de vida y para cada una de las

iteraciones en particular; supervisar el progreso de un proyecto iterativo, y sus métricas.

2.2.5 Elementos críticos en la gestión de proyectos de software

La gestión de proyectos de software ha utilizado en los últimos años el framework RUP

que es una metodología de proyectos adaptable utilizada por las organizaciones para el

desarrollo de software. Los procesos derivados pueden ser muy livianos y hasta muy

Page 24: Trabajo Tutelado RETOS EN LA GESTIÓN DE PROYECTOS DE

24

complejos para grandes proyectos. Esta metodología promete aumentar la productividad

del equipo y proveer las mejores prácticas de desarrollo de software para el equipo del

proyecto, mediante un conjunto de componentes (pautas, plantillas y las mejores

prácticas de miles de proyectos de desarrollo) para el desarrollo de proyectos rápidos y

entregables de calidad. El framework lo componen 4 fases, 8 iteraciones (mínimas), 9

flujos de trabajo, 57 actividades, 270 actividades detalladas (aproximadamente), 114

artefactos y 38 roles (hasta 38 personas).

Una de las características relevantes de RUP es que provee una terminología común

para el equipo de proyecto.

WorkflowProject

ManagementEnvironment

ConfigurationAnd ChangeManagement

BusinessModeling

RequirementsAnalysis

and DesignImplementation Test Deployment

1. Conceive new project2. Evaluate project scope

and risk3. Develop software4. development plan5. Monitor and control6. project7. Plan for next iteration8. Manage iteration9. Close out phase10.Close out project

1. Prepare environment for project

2. Prepare environment for an iteration

3. Prepare guidelines for an iteration

4. Support environment during an iteration

1. Plan project configuration and change control

2. Create a project configuration management environment

3. Change and deliver configuration items

4. Manage baselines and releases

5. Monitor and report configuration status

6. Manage change requests

1. Assess business status2. Describe current business3. Identify business

processes4. Refine business process

definitions5. Design business process

realizations6. Refine roles and

responsibilities7. Explore process

automation8. Develop a domain

modeling

1. Analyze the problem2. Understand stakeholder

needs3. Define the system4. Manage the scope of the

system5. Refine the system

definition6. Manage changing

requirements

1. Define a candidate architecture

2. Refine the architecture3. Analyze behavior4. Design components5. Design real time

components6. Design the database7. Perform architectural

synthesis

1. Structure the implementation model

2. Plan the integration3. Implement components4. Integrate each subsystem5. Integrate the system

1. Plan test2. Design test3. Implement test4. Execute tests in

integration test stage5. Execute tests in system

test stage6. Evaluate test

1. Plan deployment2. Develop support material3. Manage acceptance tests4. Produce deployment unit5. Package product6. Provide access to

download site7. Beta test product

Activity(57)

Artifact(117)

1. Test plan2. Software architecture

document3. Iteration assessment4. Business case5. Software development

plan6. Iteration plan7. Problem resolution plan8. Risk management plan9. Product acceptance plan10.Measurement plan11.Work order12.Status assessment13.Project measurements14.Review record15.Requirements Attributes16.Vision17.Risk list18.Change requests

1. Development case2. Development organization

assessment3. Project specific templates4. Manual style guide5. Use case modeling

guidelines6. Requirements

management plan7. Business modeling

guidelines8. User interface guidelines9. Test guidelines10.Design guidelines11.Programming guidelines12.Tools13.Tool support assessment14.Tool guidelines15.Support environment

1. Project measurements2. Deployment unit3. Configuration audit

findings4. Configuration

management plan5. Project repository6. Change request7. Workspace (integration)8. Work order (completed)9. Workspace (development)

1. Support specifications2. Business glossary3. Business rules4. Business use case model5. Business object model6. Target organization

assessment7. Business vision8. Business architecture

document9. Supplementary business

specification10.Business use case11.Business use case

realization12.Organization unit13.Business entity14.Business worker15.Business modeling

guidelines16.Review record17.Analysis model

1. Software architecture document

2. Requirements management plan

3. Stakeholder requests4. Glossary5. Vision6. Use case model7. Supplementary

specifications8. Use case9. Software requirements

specification10.User interface prototype11.Use case storyboard

1. Component2. Reference architecture3. Software architecture

document4. Use case realization5. Analysis model6. Design model7. Design subsystem8. Design package9. Design class10.Interface11.Capsule12.Protocol13.Data model14.Deployment model15.Integration build plan16.Test component

1. Integration build plan2. Component3. Implementation

subsystem4. Software architecture

document5. Integration build plan6. Test component

1. Change requests2. Test plan3. Test model4. Test case5. Test procedure6. Test script7. Test class8. Test packages9. Test component10.Test subsystem11.Test results12.Test evaluation summary13.Workload analysis

document

1. Installation component2. End-user artifacts3. Support material4. Deployment plan5. Release notes6. Bill of materials7. Training material8. Test results9. Change request10.Development

infrastructure11.Deployment unit12.Product

Worker(38)

1. Project manager 1. Process engineer2. Technical writer3. System analyst4. Business process analyst5. User interface designer6. Test designer7. Architect8. Tool specialist9. System administrator

1. Configuration manager2. System integrator3. Change control manager4. Project member

1. Business process analyst2. Business designer3. Stakeholders4. Business reviewer

1. System analyst2. Use case specifier3. User interface designer

1. Architect2. Designer3. Database designer4. Capsule designer

1. Architect2. System integrator3. Code reviewer4. Implementer

1. Test designer2. Designer3. Implementer4. Tester

1. Implementer2. Technical writer3. Deployment manager4. Graphic artist5. Course developer

Rational Unified Process (RUP) Software Life Cycle

Figura 1-10 Ciclo de vida de RUP

RUP define la gestión de proyectos de software como el arte de balancear los objetivos,

administrar riesgos y superar restricciones para entregar un producto que cumpla con las

necesidades de los clientes y usuarios

Sin embargo están fuera del alcance de RUP los siguientes temas de gestión de

proyectos:

Administración de RRHH (Contrataciones, capacitación, entrenamiento)

Administración de presupuestos (definición, destinos y otros)

Administración de Contratos (con proveedores y clientes)

Para una correcta utilización de RUP, primero se debe determinar los requerimientos del

entorno de gestión de proyectos de la organización, y luego decidir los cambios posibles

de realizar.

Page 25: Trabajo Tutelado RETOS EN LA GESTIÓN DE PROYECTOS DE

25

2.3 Gestión de Proyectos de Data Mining

2.3.1 Metodología CRISP-DM

La metodología de Data Mining CRISP-DM que está definida en términos de un modelo

jerárquico de procesos, consiste de un conjunto de tareas descritas en 4 niveles de

abstracción (desde lo general a los especifico): Fases, Tareas Genéricas, Tareas

Especializadas e Instancias de procesos (ver ¡Error! No se encuentra el origen de la

referencia.)

Figura 1-11 Metodología Data Mining CRISP-DM

En el nivel superior, el proceso de Data Mining se organiza en cuatro fases, cada una de

ellas comprende varias tareas genéricas de segundo nivel. Este segundo nivel es

llamado genérico porque pretende ser lo más amplio posible de manera que cubra una

vasta gama de situaciones de Data Mining. A su vez las tareas deben ser lo más

completas y estables posible. Completa significa que cubre el proceso entero de Data

Mining y todas las posibles aplicaciones de Data Mining. Estable significa que el modelo

debe ser válido aun para desarrollos inesperados como nuevas técnicas de

modelamiento.

El tercer nivel comprende las tareas especializadas, se describen como las acciones de

las tareas genéricas se deben efectuar en situaciones específicas. Por ejemplo, en el

segundo nivel puede haber una tarea llamada limpiar datos, en cambio en el tercer nivel

se describe como esta tarea se lleva a cabo en diferentes situaciones, tales como limpiar

valores numéricos versus limpiar valores categóricos o si el tipo de problema es

clustering o modelamiento predictivo.

Page 26: Trabajo Tutelado RETOS EN LA GESTIÓN DE PROYECTOS DE

26

La descripción de fases y tareas como pasos discretos efectuados en orden específico

representa una secuencia idealizada de eventos. En la práctica, muchas de las tareas

pueden llevarse a cabo en distinto orden y a menudo será necesario volver atrás

repetidamente a las tareas previas (backtracking) y repetir ciertas acciones. Este modelo

de proceso no intenta capturar todas las posibles rutas a través del proceso de Data

Mining, porque esto requeriría un modelo de procesos demasiado complejo.

El cuarto nivel, la instancia de los procesos, es un registro de acciones, decisiones y

resultados del contrato actual de Data Mining. Una instancia de proceso es organizada

de acuerdo a las tareas definidas en los niveles superiores, pero grafica que está

ocurriendo realmente en un compromiso en particular, más que lo que pasa en general.

En el modelo de referencia y guía de usuario, considerado en a metodología CRISP-DM

distingue entre el modelo de referencia y la guía de usuario. El modelo de referencia

presenta una visión general de las fases, tareas y sus salidas y describe que hacer en un

proyecto de data mining. Por el contrario la guía de usuario es más detallada, y da

consejos para cada fase y cada tarea dentro de una fase y además explicita como hacer

un proyecto de Data Mining.

Este documento cubre, para el modelo de referencia y la guía de usuario, hasta el nivel

genérico.

2.3.2 Mapeo desde el modelo genérico al especializado

El contexto de Data Mining conduce a un mapeo entre el nivel genérico y el

especializado en CRISP-DM. Actualmente, se distinguen cuatro diferentes dimensiones

de contextos de data mining:

El dominio de la aplicación es el área específica de cómo toma lugar un

proyecto de data mining.

El tipo de problema de data mining describe las clases especificas de objetivos

que el proyecto debe tratar.

Los aspectos técnicos cubren temas específicos en data mining que describen

diferentes desafíos (técnicos) que usualmente ocurren durante data mining.

Las dimensión de las herramientas y técnicas, especifica que herramientas de

data mining y/o técnicas serán aplicadas durante el proyecto.

Mapeo con contexto

Se distinguen dos tipos de mapeos entre los niveles genéricos y especializados en

CRISP-DM:

Mapeo para el presente

Page 27: Trabajo Tutelado RETOS EN LA GESTIÓN DE PROYECTOS DE

27

Si sólo se aplica el modelo genérico de proceso para realizar un único proyecto de data

mining y se intenta mapear las tareas genéricas y sus descripciones como lo requiere el

proyecto; se trata entonces de un solo mapeo para un probable un uso único.

Mapeo para el futuro

Si sistemáticamente se especializa el modelo genérico de proceso de acuerdo a un

contexto pre-definido (o sistemáticamente se analiza y consolida experiencias de un

proyecto para especializar un modelo de procesos que se podría utilizar a futuro en

contextos comparables) se esta tratando explícitamente de escribir un proceso

especializado en términos de CRISP-DM.

Cual sea el tipo de mapeo más apropiado para sus propósitos, dependerá de su contexto

de data mining y las necesidades de la Organización.

¿Cómo mapear?

La estrategia básica para mapear el modelo de proceso genérico a nivel especializado es

el mismo para ambos tipos de mapeo y comprende:

Analizar su contexto específico.

Remover cualquier dato no aplicable en su contexto.

Agregar cualquier detalle específico a su contexto.

Especializar (o instanciar) contextos genéricos de acuerdo a las características

concretas de su contexto.

Posiblemente redefinir los contenidos genéricos para entregar significados más

explícitos en su contexto por el bien de la claridad.

2.3.3 Modelo de referencia CRISP-DM

El modelo de proceso actual para data mining entrega una visión general del ciclo de

vida de un proyecto de data mining. Contiene las fases de un proyecto, sus tareas

respectivas y relaciones entre estas.

En este nivel de descripción, no es posible identificar todas las relaciones que pueden

existir entre las tareas de data mining, dado que dependen de las metas, el background y

los intereses de los usuarios y en especial de los datos.

Page 28: Trabajo Tutelado RETOS EN LA GESTIÓN DE PROYECTOS DE

28

Figura 1-12 Fases de un proceso de Data Mining

El ciclo de vida de un proyecto de data mining comporta 6 fases. La Figura 1-12

muestra que las fases de un proceso de data mining no son secuenciales, dado que se

requiere una movilidad de avance y retroceso entre las diferentes fases. Depende de los

resultados de cada fase, la definición de que fase o que tarea en particular de cada fase

se realizará a continuación. Las flechas indican las dependencias más importantes y

frecuentes entre las fases.

El circulo externo en la figura, simboliza la naturaleza cíclica de data mining. Data mining

no es sólo una simple solución lineal. Las lecciones aprendidas durante el proceso y la

solución pueden gatillar nuevas preguntas enfocadas al negocio. Subsecuentemente, el

proceso de data mining traerá beneficios provenientes de experiencias de otros

proyectos.

En las siguientes líneas se describe cada fase brevemente:

Business understanding

Esta fase inicial se enfoca en el entendimiento del los objetivos del proyecto y los

requerimientos, desde una perspectiva de negocio, luego se convierte este conocimiento

en una definición de problema de data mining y un plan preliminar diseñado para

alcanzar estos objetivos.

Page 29: Trabajo Tutelado RETOS EN LA GESTIÓN DE PROYECTOS DE

29

Data understanding

La fase de data understanding comienza con una recolección inicial de los datos y

continúa con actividades de familiarización de los mismos, a fin de: identificar los

problemas de calidad de los datos; revelar los primeros “descubrimientos” en los datos o

detectar subconjuntos interesantes; y formar hipótesis de posible información oculta.

Data preparation

La fase de data preparation cubre todas las actividades de construcción del conjunto final

de datos (datos que se utilizarán en la herramienta de modelamiento) a partir de los

datos originales. Las tareas de data preparation pueden realizarse muchas veces y no en

un orden prescrito. Las tareas incluyen selección de tablas, registros y atributos; junto

con transformación y limpieza de datos para las herramientas de modelamiento.

Modeling

En esta fase, varias herramientas de modelamiento son seleccionadas y aplicadas, y sus

parámetros se ajustan para valores óptimos. Típicamente, hay muchas técnicas para el

mismo tipo de problema de data Mining, algunas de ellas tienen requerimientos

específicos en la forma de los datos; por eso, a veces es necesario volver a la fase de

data preparation.

Evaluation

En esta etapa del proyecto se ha construido un modelo (o modelos) de aparente alta

calidad desde la perspectiva del análisis de los datos. Antes de comenzar el deployment

final del modelo, es importante evaluar y revisar los pasos ejecutaros para construir el

modelo que busca alcanzar los objetivos del negocio. Un objetivo clave es determinar si

hay temas de negocio importantes que no han sido considerados. Al final de esta fase,

se tomará una decisión de cómo emplear los resultados de data mining.

Deployment

Generalmente la creación del modelo no es el fin del proyecto, aunque el propósito del

modelo es incrementar el conocimiento de los datos, el conocimiento ganado se debe

organizar y presentar de una forma que el cliente pueda usarlo. A veces involucra la

aplicación de modelos “vivos”, dentro los procesos de toma de decisiones de la

organización, por ejemplo, una personalización en tiempo real de un sitio Web. Sin

embargo, dependiendo de los requerimientos, la fase de deployment puede ser tan

simple como la generación de un reporte o tan compleja como la implementación de un

proceso de data mining repetible en la empresa. En muchos casos, es el cliente, no el

analista de datos, quien lleva a cabo los pasos de deployment. Sin embargo, aunque el

analista no lleve a cabo el deployement, es importante que el cliente entienda que

acciones debe ejecutar para hacer uso de los modelos creados.

En la tabla siguiente se presenta el resumen de las tareas genéricas y salidas del modelo

de referencia CRISP-DM.

Page 30: Trabajo Tutelado RETOS EN LA GESTIÓN DE PROYECTOS DE

30

Business

Understanding

Data

Understanding

Data

PreparationModelling Evaluation Deployment

Determine Business

Objectives

Background Business

objectives

Business success

criteria

Assess Situation

Inventory of resources

Requirements,

assumptions &

constraints

Risks & contingencies

Terminology

Costs & benef its

Determine Data

Mining

Goals

Data Mining goals

Data Mining success

criteria

Produce Project Plan

Project Plan

Initial assignment of

tools &

techniques

Collect Initial Data

Initial data collection

report

Describe Data

Data description report

Explore Data

Data exploration report

Verify Data Quality

Data quality report

Data set

Data set description

Select Data

Rationale for inclusion/

exclusion

Clean Data

Data cleansing report

Construct Data

Derived attributes

Generated records

Integrate Data

Merged data

Format data

Reformatted data

Select Modelling

Techniques

Modelling technique

Modelling assumptions

Generate Text Design

Text design

Build Model

Parameter settings

Models

Model description

Assess Model

Model assessment

Revised parameter

settings

Evaluate Results

Assessment of Data

Mining

results w.r.t. Business

Success Criteria

Approved models

Review Process

Review of process

Determine Next Steps

List of possible actions

Decision

Plan Deployment

Deployment plan

Plan Monitoring and

Maintenance

Monitoring &

maintenance

plan

Produce Final Report

Final report

Final presentation

Review Project

Experience

documentation

Tabla 1-2 Tareas genéricas y salidas del modelo de referencia CRISP-DM

3 Conclusiones

3.1.1 En relación a la gestión de proyectos de data mining

La gestión de proyectos es un área de creciente interés para los académicos y

profesionales del área tecnológica, sin embargo aun existen muchas dificultades para

lograr una gestión exitosa de proyectos [Schwalbe, 2007]. En este sentido es innegable

el aporte a la sistematización de la disciplina de gestión de proyectos de la metodologías

PMBOK [PMBOK, 2004] la que se ha constituido en el marco de referencia y estándar

para la gestión integral de proyectos.

Data Mining es un proceso creativo que requiere de un número significativo de diferentes

habilidades y conocimientos. Aunque actualmente se asocia la metodología CRISP-DM

con la gestión de proyectos de Data Mining, esta presenta problemas para gestionar

integralmente los proyectos. Por lo anterior, es posible decir que no hay un framework

estándar para desarrollar este tipo de proyectos, que el éxito o fracaso de un proyecto

depende altamente de la persona que lo lleva a cabo, y que su práctica exitosa no

necesariamente es repetible en la organización. Es posible decir también que un proceso

de Data Mining exitoso requiere una metodología y una efectiva gestión del proyecto, y

que esto va a depender de la mezcla apropiada de herramientas y analistas expertos.

El reto para este trabajo es proponer un framework unificado para la gestión de

proyectos de data mining, cuyo proceso sea altamente creativo e iterativo, y que posea

múltiples actividades paralelas. Lo anterior se fundamenta en las fallas que se han

Page 31: Trabajo Tutelado RETOS EN LA GESTIÓN DE PROYECTOS DE

31

producido en la gestión de proyectos de Data Mining al utilizar la metodología CRISP-

DM. Algunas de estas fallas son:

A veces los “expertos en Data Mining” obvian las fases de planificación y

documentación (porque consumen mucho tiempo).

Se presentan fallas de comunicación entre los miembros del equipo debido a que

se basan en falsos supuestos para realizar el trabajo o porque re-hacen algo que

estaba hecho.

Existen dificultades para trabajar con el modelo genérico propuesto por CRISP-

DM. Las fases no son estrictamente secuenciales.

Con CRISP-DM no resulta fácil evaluar la personas, los plazos y costos del

proyecto

Sin embargo, un punto a favor de CRISP es el modelo estructurado de documentación

(entregables) que propone y que resulta fácil escribir modelos de procesos

especializados basados en checklist genéricos.

El reto en el trabajo futuro está en proponer una framework unificado para la gestión de

proyectos de Data Mining cuyo proceso es altamente creativo, iterativo y que posee

muchas actividades paralelas.

.

3.1.2 Análisis de metodologías hacia la gestión de proyectos de data mining

Las metodologías analizadas en este trabajo presentan características diversas en su

planificación, organización, dirección, ejecución, control y seguimiento. Asimismo, sus

ámbitos de aplicación parecen ser diversos. A continuación se caracterizan y comparan

las metodologías principales analizadas en este estudio y se presentan los principales

resultados y conclusiones.

Problem resolution and fault-finding technique

La identificación de un problema en la gestión de proyectos de data mining requiere

conocer las causas que lo originaron y a partir de ello es posible, entonces encontrar

una solución. Si este análisis se realiza considerando los problemas que la literatura

tradicionalmente asocia a los proyectos de data mining es posible identificar posibles

soluciones. El cuadro siguiente (ver Figura 1-13) muestra como a partir de un conjunto

de problemas mencionados los investigadores de gestión de proyectos surgen

interesantes patrones que facilitan la identificación de soluciones.

Page 32: Trabajo Tutelado RETOS EN LA GESTIÓN DE PROYECTOS DE

32

Problems Identified Caused by Solved by

Requirements not included

Not a quality product

Product does not work

Too much maintenance

Difficult to use

Performance is poor

No user documentation

Client won’t accept product

Over schedule

Ineffective user requirements

Poor testing

Poor change control

Waterfall approach (i.e. lengthy)

Poor communications

No user involvement

Scope creep

No documentation developed

Training

Change control process

Test plan

User guides & documentation

Iterative methodology

Service level agreements

Figura 1-13 Resolución de problemas y la técnica de fault-finding

El cuadro de la Tabla 1-3 identifica los elementos fundamentales para realizar una

comparación de las tres principales metodologías para la gestión de proyectos

estudiadas en esta investigación y clasifica las características de cada metodología para

cada elemento.

ELEMENTOS PMBOK RUP CRISP-DM

Tipo de Proyecto Cualquier tipo de proyecto Proyectos de desarrollo de software proyectos de Data Mining

Project Lifecycle Dividido en fases. Tipicamente en 4 o 5, a

veces más de 9. El termino de cada fase

esta dado por uno o más entregables.

Dividido en 4 fases. Cada una de ellas

dividida en una o más iteraciones, que

incluyen actividades de todas las disciplinas

en distinta intensidad. Cada iteracion

produce una versión ejecutable del software,

aplicación o sistema.

Divido en 6 fases no secuenciales, se

requiere que se pueda mover entre las

diferentes fases. Dependiendo de las

resultados de cada fase, se define que

fase o que tarea en particular de cada fase

se realizará después.

End of Phase Hito (Milestone) Hito mayor Se puede pasar de una fase a otra, no hay

hitos de termino de fase.

End of Phase Artifact Entregable Artefacto Salida(Output)

Activity El proceso se describe en terminos de

entredas, salidas, herramientas y tecnicas.

Las actividades se describe en terminos de

artefactos de entrada, artifactos resultantes

y pasos con mentores de herramietnas y

pautas.

Tareas genericas que deben ser

instanciadas a un proyecto en particular.

Para cada tarea se definen las salidas

(output) y las actividades a realizar.

Input Artifact Entrada Artefacto de entrada -

Output Artifact Salida Artefacto resultante Salida(Output)

End of Phase Review Salida de la fase, Stage Gates o Kill Point Revisión de los hitos del ciclo de vida No existe un termino (hito) definitivo para

cada fase, ya que es posible devolverse y

volver a ejecutar una fase.

Structural Activity Grouping Area del Conocimiento Disciplina Fase

Temporal Activity Grouping Grupo de Procesos Workflow Secuencia entre fases.

Tabla 1-3 Mapeo de PMBOK, RUP, CRISP-DM

La Tabla 1-4, lista las areas de conocimiento del pmbok en comparación con las

disciplinas de RUP y las fases de Crisp-dm.

Page 33: Trabajo Tutelado RETOS EN LA GESTIÓN DE PROYECTOS DE

33

PMBOK Knowledge Area RUP Disciplines CRISP-DM Fases

Project Integration Management Project Management

Requirements

Deployment

Configuration & Change Management

Business Understanding

Evaluation

Deployment

Project Scope Management Project Management

Requirements

Configuration & Change Management

Business Understanding

Project Time Management Project Management Business Understanding

Project Time Management Project Management Business Understanding

Project Quality Management Project Management

Configuration & Change Management

Business Understanding

Data Understanding

Data Preparation

Modeling

Evaluation

Project Human Resource Management Project Management Business Understanding

Project Communications Management Project Management Business Understanding

Evaluation

Project Risk Management Project Management Business Understanding

Project Procurement Management Requirements Business Understanding

Tabla 1-4 Mapeo de procesos, disciplinas y fases

3.1.3 Tendencias en la gestión de proyectos de data mining

Un Proyecto de Data Mining debe dirigir las actividades, tanto de gestión como técnicas,

involucradas en el proceso de transformación de necesidades de conocimiento en

patrones de Data Mining, para que el conocimiento aporte valor al proceso operacional o

estratégico que lo requiera.

Cabe destacar, que el valor del conocimiento depende en cada momento de la misión del

área de negocio al que pertenece el proceso dentro de la organización. Por lo tanto, se

puede señalar que las actividades principales de un Proyecto de Data Mining involucran:

1. Descubrir los objetivos primordiales del área de negocio en la que se enmarca el

proyecto.

2. Establecer las actividades y las necesidades de conocimiento de esa área en un

particular momento del tiempo. Estos criterios nos permitirán evaluar los

resultados obtenidos y en todo caso marcan el fin del proyecto.

3. Transformar las necesidades de conocimiento, en conocimiento a través de un

proceso de descubrimiento del mismo. Las tareas técnicas involucradas en

este proceso vienen descritas por Crisp-dm.

4. Identificar los factores de éxito del Proyecto de Data Mining: requiere

establecimiento de metas y de requisitos. Evaluar si las metas requieren de un

proceso de gestión, que a lo largo del proyecto evalúe la factibilidad de

Page 34: Trabajo Tutelado RETOS EN LA GESTIÓN DE PROYECTOS DE

34

conseguir los resultados esperados. Esas actividades tienen que ser

definidas, y son: validación, verificación entre otras.

5. Establecer secuencialidad en las tareas: definir el ciclo de vida para el proyecto

que dependerá de las características del mismo en cada momento en

particular.

El presente documento corresponde al trabajo tutelado cuyo objetivo es ir a desarrollo de

una propuesta de tesis doctoral que denominaremos: Un framework unificado para la

gestión de proyectos de data mining.

Page 35: Trabajo Tutelado RETOS EN LA GESTIÓN DE PROYECTOS DE

35

4 Referencias

[Ravindranath, 2007] C. Ravindranath Pandian, Appliend Software Risk Management: A

guide for Software Project Manager, Auerbach, 2007.

[Luckey, 2006] Teresa Luckey,PMP,MBA, and Joseph Phillips,PMP, Software Project

Management for Dummies, Wiley Publishing, Inc., 2006.

[Guía PMBOK, 2004] Project Management Institute, Inc., Guía de los Fundamentos de la

Dirección de Proyectos, Tercera Edición, Project Management Institute Inc., 2004

[Phillips, 2004] Joseph Phillips, PMP Project Management Professional Study Guide,

McGraw-Hill, 2004.

[PMBOK, 2004] Project Management Institute, Inc., A Guide to the Project Management

Body of Knowledge (PMBOK® Guide) - Third Edition. Project Management Institute, Inc.,

2004.

[Charvat, 2003] Jason Charvat, Project Management Methodologies: Selecting,

Implementing, and Supporting Methodologies and Processes for Projects, John Wiley &

Sons, Inc., 2003.

[Wysocki, 2003] Robert K. Wysocki and Rudd McGary, Effective Project Management,

Third Edition, John Wiley & Sons, Inc., 2003.

[Charvat, 2002] Jason Charvat, Project Management Nation: Tools, Techniques, and

Goals for the New and Practicing IT Project Manager, John Wiley & Sons, Inc., 2002.

[Jalote, 2002] Pankaj Jalote, Software Project Management in Practice, Pearson

Education, Inc., 2002.

[Competency PMBOK, 2001] Project Management Institute Inc., Project Manager

Competency Development Framework Exposure Draft, Project Management Institute,

Inc., 2001.

[WBS PMBOK, 2001] Project Management Institute Inc., Practice Standard for Work

Breakdown Structures, Project Management Institute, Inc., 2001.

[Hughes, 1999] Bob Hughes and Mike Cotterell, Software Project Management, Second

Edition, McGraw-Hill, 1999.

[Royce, 1998] Walker Royce, Software Project Management: A unified Framework,

Addison-Wesley, 1998.

Page 36: Trabajo Tutelado RETOS EN LA GESTIÓN DE PROYECTOS DE

36

[PMBOK® Guide, 2004] Project Management Institute, Inc (2004): A Guide to the Project

Management Body of Knowledge (PMBOK® Guide) - Third Edition. Four Campus

Boulevard, Newtown Square, Pennsylvania USA, 2004 edition.

[Russell, 2004] Russell D. Archibald, Project Management State of the Art - 2004, Fellow

PMI and APM/IPMA, MSc, PMP PMB 90A, 521 Logan Ave., Laredo, TX 78040-6633

[Wysocki, 2003] Robert K. Wysocki, Ph.D. with contributions by Rudd McGary, Ph.D.,

PMP: “Effective Project Management Traditional, Adaptive, Extreme”. Third Edition,

Published by Wiley Publishing, Inc., Indianapolis, Indiana, 2003.

[Chapman, 2000] Pete Chapman, Julian Cliton, Randy Kerber, Thomas Khabaza,

Thomas Reinartz, Colin Shearer and Rüdiger Wirth: “CRISP-DM: Step-by-Step”. , 2000.

[Charvat, 2002] Janson Charvat: “Project Management Nation: Tools, Techniques and

Goals for the New and Practicing IT Project Manager”, John Wiley & Sons, Inc. 2002.

[Kappelman, 2006] Leon A Kappelman; Robert McKeeman; Lixuan Zhang: EARLY

WARNING SIGNS OF IT PROJECT FAILURE: THE DOMINANT DOZEN. Information

Systems Management; Fall 2006; 23, 4; ABI/INFORM Global pg. 31

[McGilvray, 2007] Danette McGilvray; Data Quality and the Project Life Cycle; Granite

Falls Consulting, Inc., Published: July 10, 2007, www.gfalls.com.

[Wasilewska et al., 2007] Wasilewska, Menasalvas, E, Scharff, A model PM fro

preprocessing and data Mining Proper Process. In Transacción on Rouge Sets VI, pp

397-399, Springer-verlag Berlin Heidelberg

[Fayyad et al., 1996] Fayyad, Piatetsky-Shapiro, Smyth, From Data Mining to Knowledge

Discovery: An Overview, Advances in Knowledge Discovery and Data Mining, Fayyad,

Piatetsky-Shapiro, Smyth, Uthurusamy, editors, AAAI Press / The MIT Press,Menlo Park,

CA, 1996, pp.1-34.

[Piatetsky-Shapiro, 2007] Gregory Piatetsky-Shapiro, Data mining and knowledge

discovery 1996 to 2005: overcoming the hype and moving from “university” to “business”

and “analytics”. Published online: 27 January 2007, Springer Science+Business Media,

LLC 2007.

[Ingebretsen, 2003] Ingebretsen, M. (2003) Mining for Gold, Using data resources to meet

key corporates objetives and Launch, PM Network, pp. 29 -34

[KDnuggets, 2007] Portal www.gartner.com [en línea] disponible en:

http://www.gartner.com/ [Consulta: 20 de agosto de 2007].

[Louie, 2003] Jen Que Louie, President of Nautilus Systems, Inc. (www.nautilus-

systems.com), testimony before the U.S. House of Representatives Subcommittee on

Page 37: Trabajo Tutelado RETOS EN LA GESTIÓN DE PROYECTOS DE

37

Technology, Information Policy, Intergovernmental Relations, and Census, Congressional

Testimony, March 25, 2003.

[Larose, 2005] Daniel T. Larose, Discovering Knowledge In Data: An Introduction to Data

Mining, John Wiley & Sons, Director of Data Mining, Central Connecticut State University,

2005.

[Gartner, 2007] Portal www.kdnuggets.com/ [en línea] disponible en:

http://www.kdnuggets.com/ [Consulta: 10 de agosto de 2007].

[Brachman, 1996] Brachman, R. & Anand, T. (1996) The process of knowledge discovery

in databases: a human-centered approach, in: U. Fayyad, et al. (Eds.), Advances in

Knowledge Discovery and Data Mining, AAAI Press, Menlo Park, 1996, pp. 36–57.

[Becker, 2005] Becker K. & Ghedini, C., A documentation infrastructure for the

management of data mining projects, Information and Software Technology 47 , pp. 95–

111, 2005

[Kelley, 2003] Kelley Ch, Adelman, S., Where can I find sources about failed data mining

projects and the reason for their failure?, DM Review Online Published in April 2003.

DMReview.com

[Pyle, 2004] Pyle, D. This Way Failure Lies, DB2 Magazine, Vol 1, issue1. 2004

[Richardson, 2006] Richardson G. & Butler, C., Readings in Information Technology

Project Management, Thomson Learning, United States, pp. 40-41, 2006

[Standish Group’s, 2004] Standish Group’s The Chaos Report 2004, Extreme CHAOS,

summary online at http://www.standishgroup.com/, retrieved 30 agosto 2007.

[Charbonneau, 2004] Serge Charbonneau, Software Project Management - A Mapping

between RUP and the PMBOK, Xelaration Software Corporation, IBM Corporation 2004

[ePMbook, 2007] Portal www.epmbook.com [en línea] disponible en:

http://www.epmbook.com/, Simon Wallace, 1999 – 2007 [Consulta: 30 de agosto de

2007].

[RationalUnifiedProcess, 2007] Portal www.ts.mah.se, [en línea] disponible en:

http://www.ts.mah.se/RUP/RationalUnifiedProcess/, [Consulta: 30 de agosto de 2007].

[Ambler et al., 2005] Scott W. Ambler, John Nalbone and Michael J. Vizdos, The

Enterprise Unified Process: Extending the Rational Unified Process, Prentice Hall PTR,

2005.

[Kroll, 2003] Per Kroll and Philippe Kruchten, Rational Unified Process Made Easy: A

Practitioner's Guide to the RUP, Addison Wesley, 2003.

Page 38: Trabajo Tutelado RETOS EN LA GESTIÓN DE PROYECTOS DE

38

[Booch et al, 1998] Grady Booch, Robert C, Martin and James Newkirk , ''Object Oriented

Analysis and Design with Applications'', 2d. ed., Addison Wesley Longman, Inc., 1998.

[Markov, 2007] Zdravko Markov and Daniel T. Larose, Data Mining The Web: Uncovering

Patterns in Web Content, Structure, and Usage, John Wiley & Sons, Inc., 2007.

[Myatt, 2007] Glenn J. Myatt, Making Sense of Data: A Practical Guide to Exploratory

Data Analysis and Data Mining, John Wiley & Sons, Inc., 2007.

[Larose, 2006] Daniel T. Larose, Data Mining Methods and Models, John Wiley & Sons,

Inc., 2006.

[Larose, 2005] Daniel T. Larose, Discovering Knowledge in Data An Introduction to Data

Mining, John Wiley & Sons, Inc., 2005.

[Berry, 2004] Michael J.A. Berry, Gordon S. Linoff, Data Mining Techniques: For

Marketing, Sales, and Customer Relationship Management, Second Edition, Wiley

Publishing, Inc., Indianapolis, Indiana, 2004.

[Kudyba, 2004] Stephan Kudyba Ph.D., Managing Data Mining: Advice from Experts,

CyberTech Publishing, 2004.

[Wang, 2003] John Wang, Data Mining: Opportunities and Challenges, Idea Group Inc.,

2003.

[Parr, 2001] Olivia Parr Rud, Data Mining Cookbook: Modeling Data for Marketing, Risk,

and Customer Relationship Management, John Wiley & Sons, Inc., 2001.

[Schwalbe, 2007] Kathy Schwalbe, Project Management, Information Technology, Fifth

Edition, Thomson Course Technolgy, 2007.