datamining_resultados

Upload: shaped

Post on 06-Jul-2018

222 views

Category:

Documents


0 download

TRANSCRIPT

  • 8/17/2019 datamining_resultados

    1/7

  • 8/17/2019 datamining_resultados

    2/7

    Simplifique el proceso de minería de datos

    La interfaz gráfica e intuitiva de Clementinepermite a los analistas visualizar cada paso delproceso de minería de datos como parte de una“ruta” (stream). Al interactuar con estas rutas, losanalistas y usuarios pueden colaborar agregando

    conocimiento al proceso de minería de datos. Losanalistas pueden concentrarse en el descubrimientode conocimientos más que en las tareas técnicascomo escribir códigos y también podrán explorar losdatos más profundamente y descubrir relacionesadicionales ocultas.

    Desde esta interfaz visual podrá acceder e integrarfácilmente datos de texto de diferente orígenes,datos de Web logs, y datos de los productos deinvestigación de mercados Dimensions™, hojas decálculo, o archivos de SPSS para Windows®, SAS yMicrosoft® Excel®. Ninguna otra solución de datamining ofrece esta versatilidad.

    Aproveche sus datos en modelos mejorados

    Solamente con Clementine usted podrá fácilmentetener acceso a datos de texto, Web, de encuestas eintegrarlos en su modelo predictivo. Los usuarios deSPSS han encontrado que utilizar diferentes tipos dedatos incrementa la precisión de los modelos.

    Con el módulo Clementine Text Mining podráextraer conceptos y opiniones de cualquier tipo detexto – como por ejemplo reportes internos, notas

    de call center, correo electrónico, artículos deprensa, blogs y mucho más. Y con el móduloClementine Web Mining podrá descubrir patrones enel comportamiento de los visitantes a un sitio Web.

    El acceso directo a los datos de encuestas realizadascon la plataforma Dimensions le permite incluirinformación demográfica y de comportamiento a susmodelos lo que cierra el círculo de información quea una compañía le gustaría tener sobre sus clientes.

    Elija entre una amplia gama de técnicas

    Clementine ofrece un amplio rango de técnicasdiseñadas para cubrir las necesidades de todas lasaplicaciones de minería de datos, ofreciendo lamejor plataforma del área. Es posible elegir entreun número de algoritmos de clustering,

    clasificación, asociación y predicción, así comotambién nuevos algoritmos para el modeladomúltiple automatizado, predicción de series detiempo y la construcción interactiva de reglas.

    Optimice la tecnología de información existente

    Clementine es una solución abierta basada enestándares que se integra con los sistemas deinformación existentes en su organización, tanto enel acceso de los datos como en la implantación delos resultados. No es necesario pasar los datos desdey hacia un formato propio. Esto ayuda a conservarlos recursos de personal y de redes, lo que genera

    resultados más rápidamente y reduce los costos deinfraestructura.

    Siga un proceso repetido de contraste

    Durante las fase del proceso de minería de datos,Clementine adopta la metodología estándar de laindustria CRISP-DM (Cross Industry Standard Processfor Data Mining). Esto significa que su compañíapuede centrarse en resolver los problemas delnegocio a través de minería de datos, en lugar detener que reinventar un nuevo proceso para cadaproyecto. Clementine puede organizar los proyectosindividuales eficientemente utilizando el

    administrador de proyectos de CRISP-DM .

    Agregue capacidad

    Clementine fácilmente puede analizar cantidades dedatos que típicamente se generan en pequeñas ymedianas empresas. Si su proyecto de minería dedatos necesita crecer en volumen y/o complejidad,SPSS le ofrece una versión servidor.

  • 8/17/2019 datamining_resultados

    3/7

    Utilizar la arquitectura cliente/servidor le permitetrabajar simultáneamente a varios analistas sin lanecesidad de consumir los recursos del equipo. ConClementine Server podrá extender los beneficios dela minería de datos demográficamente y ponerresultados en las manos de los tomadores dedecisiones.

    Extienda los beneficios de la minería de datos atoda su organización utilizando Clementine juntocon SPSS Predictive Enterprise Service. PredictiveEnterprise Services permite centralizar el almacén ymanejo de los modelos de minería de datos y todoslos procesos asociados. Con esta plataforma podrácontrolar las versiones de sus modelos, auditar a laspersonas que los modifican y utilizan, autentificar alos usuarios y automatizar la ejecución de modelos.Como resultado sus modelos predictivos seconvertirán en verdaderos activos de la compañía yasí la empresa obtendrá el mayor retorno en

    inversión de este proyecto.

    ¿Cuáles son las características de Clementine12.0?

    En esta versión, SPSS mantiene su compromiso deproveer una solución de minería de datos queofrezca la mayor eficiencia y flexibilidad posible enel desarrollo e implantación de los modelospredictivos.

    Clementine 12.0 presenta amplias mejoras en variasáreas clave para ayudar a su organización a

    incrementar el rendimiento, productividad y elretorno de la inversión en el área de minría dedatos.

    Técnicas unificadas para análisis de clientes

    Obtenga un conjunto de herramientas avanzadas ytécnicas tradiciones para analizar a sus clientes.

    ▪  Identifique a su mejor cliente utilizando latécnica de segmentación de clientes RFM

    ▪  Calcule de manera precisa la fuga de clientesutilizando análisis de supervivencia conRegresión de Cox

    ▪  Fácilmente combine estas técnicas conavanzados algoritmos de predicción ysegmentación

    Modelado automático

    Incremente la productividad y obtenga solucionesrápidas utilizando el modelado automático deClementine:

    ▪ 

    Encuentre el mejor modelo para predecirresultados binarios (si/no) y numéricosutilizando operaciones de modelado automáticoque crean y evalúan diferentes modelos en unsolo paso

    ▪  Seleccione el mejor modelo de manera sencillacon una evaluación visual de la información

    ▪  Obtenga mayor control del modelo automáticoutilizando frecuencias, ponderaciones yclasificación de costos

    Mejoras analíticas

    Desarrolle nuevas técnicas analíticas para mejorarla precisión de sus resultados.

    ▪  Obtenga predictores más precisos combinandodos o más modelos con el nuevo nodo deEnsamble

    ▪  Emplee técnicas de muestreo avanzado,incluyendo muestreo estratificado para obtenerresultados más representativos, y muestreo porconglomerados para asegurar que la muestraincluye todos los objetos que se relacionan

    ▪  Compare resultados fácilmente a través dediferentes algoritmos y técnicas utilizando

    resultados de propensión

    Un rango de algoritmos más amplio

    Resuelva más problemas de negocios y predigaresultados con mayor precisión utilizando nuevosalgoritmos.

    ▪  Realice predicciones precisas al trabajar con unaamplia gama de algoritmos utilizando el nodo deMáquina de Vectores (SVM)

    ▪  Obtenga mayor conocimiento con los gráficos delos modelos de redes Bayesianas

  • 8/17/2019 datamining_resultados

    4/7

     Mejor visualización y reportes

    Utilice las nuevas características de creación dereportes y de visualización de Clementine paraobtener un conocimiento y tener una comunicación

    más efectiva. Produzca la gráfica o el tipo de tablacorrecta, exporte a aplicaciones de terceros susresultados y comuníquelos de manera efectiva.

    ▪  Cree gráficos de compilación utilizando unasistente como interfaz para que lo guíe con eltipo de gráfico más apropiado para sus datos

    ▪  Interactúe con los gráficos con las herramientasde selección de datos

    ▪  Mejore sus reportes incluyendo tablaspersonalizadas de fácil creación. Desarrolletablas anidadas, apiladas o de múltiplesdimensiones para desplegar resúmenes de variosestadísticos y desplegar conjuntos de respuestas

    múltiples

    ▪  Descubra el mejor modelo y obtenga mejorespredictores con los cuadros de importancia devariables, los cuales acomodan las variablessegún su importancia relativa

    Mayor escalabilidad e integración

    Con Clementine 12.0 obtiene herramientas deescritorio y la base para una plataforma escalable yaltamente integrada.

    ▪  Optimice el uso de la base de datos para unmejor desempeño

    ▪  Obtenga mejores resultados en tiempo real

    ▪  Obtenga un mejor nivel de integración conclientes o con aplicaciones de terceros

    Los pilares de la empresa predictiva

    Clementine hace predictivos los datos y facilita laentrega de la información predictiva a las personasde su organización que toman decisiones y a lossistemas que manejan las interacciones diarias conel cliente.

    Si su organización tiene datos almacenados enarchivos de texto o Web logs, podrá aprovecharlosutilizando Clementine Text Mining o ClementineWeb Mining. También podrá entender las actitudes yopiniones que se esconden detrás delcomportamiento de los clientes, a través de laincorporación de los datos de encuestas decualquiera de los productos de investigación de laplataforma Dimensions.

    Gracias a su integración con las aplicacionespredictivas SPSS y otros sistemas de información,Clementine le permite guiar sus decisiones yrecomendaciones diarias, así como la planificación alargo plazo con la información sobre las condicionesactuales y futuras. Podrá lograr esto de formasegura y eficiente en toda su empresa con SPSSEnterprise Services.

    La funcionalidad de Clementine está soportada en lamayoría de las técnicas estadísticas y deaprendizaje automático más avanzadas. Como valorañadido es abierta a la operación e integración con

    sus sistemas de información actuales.

  • 8/17/2019 datamining_resultados

    5/7

     

    CaracterísticasA continuación se describen lasprincipales características deClementine en términos del proceso

    CRISP-DM.

    Comprensión del negocioLa interfaz visual de Clementinefacilita a su organización la aplicacióndel conocimiento del negocio a losproyectos de Data Mining.Adicionalmente, las plantillasopcionales de aplicacionesClementine (CATs) están disponiblespara ayudarle a obtener resultadosmás rápidamente. Las CATs incluyendatos de muestra que puedeninstalarse como archivos planos ocomo tablas en un esquema de basesde datos relacionales.

    ▪  CRM CAT*

    ▪ 

    Telco CAT*

    ▪  Fraud CAT*

    ▪  Microarray CAT*

    ▪  Web Mining CAT* (requiere lacompra de Web Mining paraClementine)

    Comprensión de los datos

    ▪  Obtenga una primera vistaexhaustiva de sus datos utilizandoel nodo de auditoria de datos

    ▪  Visualice los datos rápidamente através de los gráficos, resúmenesestadísticos o una evaluación dela calidad de los datos 

    ▪ 

    Genere gráficos básicos comohistogramas, distribuciones,diagramas de línea y de puntos 

    ▪  Cree un amplio rango de gráficosavanzados y básicos con laasistencia del nodo de gráficos 

    ▪  Cree reportes tabulares complejosfácilmente utilizando el nodo detablas personalizadas 

    ▪  Edite sus gráficos para comunicarlos resultados más claramente 

    ▪  Utilice el análisis de vinculaciónvisual para ver las asociaciones ensus datos 

    ▪  Interactúe con los datos

    seleccionado regiones u objetosen un gráfico y visualice suselección 

    ▪  Acceda a estadísticos de SPSS,gráficos y herramientas dereportes directamente desdeClementine 

    Preparación de datos

    ▪  Acceso a los datos- Datos estructurados (tabulares)

    - Acceda a fuentes de datos

    compatibles ODBC con elmódulo de middlewareincluido en SPSS Data AccessPack. Los controladores deeste paquete admiten basesde datos IBM DB2®, Oracle,Microsoft SQL Server™,Informix® y Sybase®- Importe archivos de textodelimitados o de ancho decolumna fijo, archivos SPSSy SAS® 6, 7, 8 y 9- Especifique hojas decálculo y rangos de datoscuando acceda a Excel

    - Datos no estructurados- Extraiga automáticamenteconceptos desde cualquiertipo de texto utilizando TextMining de Clementine*

    - Datos de páginas Web- Extraiga eventos de

    páginas Webautomáticamente de losWeb logs utilizando WebMining para Clementine*

    - Datos de encuestas- Acceda directamente a los

    datos almacenados enDimensions Data Model o enlos archivos de datos de losproductos Dimensions*

    - Exportación de datos

    - Trabaje con archivos detexto delimitados y deancho de columna fijo,archivos ODBC, de MicrosoftExcel, de SPSS u de SAS 6,7, 8 y 9- Exporte al formato XLS conExcel Output Node- Exporte datos deDimensions

    ▪  Elija entre varias opciones delimpieza de datos- Eliminar o reemplazar datosinválidos- Utilizar el modelado predictivopara asignar los valores perdidos

    - Generar automáticamente lasoperaciones para la detección ymanejo de valores atípicos yexternos

    ▪  Manipulación de datos- Trabaje con operaciones decampo y registro completo, queincluyen:

    - Filtrado de campo, asignaciónde nombres, derivación, re-categorización, reemplazamientode valores y ordenación decampos

    - Selección de registros,muestreo, fusión (unionesinteriores, unión exterior parcial yanti-uniones), concatenación,ordenación, agrupación yequilibrado

    - Reestructuración de datosincluyendo transposición

    - División de registrosnuméricos en sub-rangosoptimizados para predicción

    - Funciones de cadenas detexto de gran alcance: creaciónde cadenas, sustitución, búsqueday emparejamiento, eliminación deespacios en blanco y truncado

    - Preparación de datos para elanálisis de series de datos con elnodo Time Plot- Partición de datos en conjuntosde entrenamiento, prueba yvalidación- Transformación de datos deforma automática para múltiplesvariables

    - Visualización detransformaciones estándar

    - Acceso a la gestión y

    transformación de los datosrealizados en SPSS directamentedesde Clementine

    - Calificación RFM:

    ModeladoEmpleé una amplio rango dealgoritmos de data mining paraobtener el mejor de los resultados

    ▪  Modelos interactivos, buscadoresde ecuaciones y estadísticosavanzados

    ▪  Muestran el impacto relativo delos atributos de diferentes datos yla importancia de variables demanera gráfica

    ▪ 

    Combinación de modelos con elmeta-modelado- Múltiples modelos pueden sercombinados, o un modelo puedeser utilizado para analizar unsegundo modelo- En nodo de ensamble combinapredictores automáticamente

    ▪  Importe modelos PMML desdeotras herramientas como AnswerTree y SPSS para Windows

  • 8/17/2019 datamining_resultados

    6/7

     

    ▪  Utilice el Clementine ExtensionFramework (CLEF) para algoritmospersonalizados

    Los algoritmos de Clementine sonorganizados en un modulo base yopcionalmente cuenta con módulosadiciones para obtener másalgoritmos. El módulo base incluye:

    ▪  C&RT, CHAID & QUEST – losalgoritmos de árboles declasificación incluyen laconstrucción de árbolesinteractivos

    ▪  Clusters de K-medias

    ▪  Algoritmo de asociación GRI

    ▪  Factor/PCA – reducción de datosutilizando factor de análisis y losprincipales componentes delanálisis

    ▪ 

    Regresión lineal

    El módulo de Clasificación incluye:

    ▪  Clasificación binaria y numérica –automatiza la creación yevaluación de múltiples modelos

    ▪  Modelo de respuesta de auto-enseñanza – modelo Bayesiano conaprendizaje incremental

    ▪  Series de tiempo – genera yautomáticamente seleccionamodelos para pronósticos de seriede tiempo

    ▪  Arboles de decisión C5.0

    ▪  Redes neuronales - perceptores

    multicapas y redes de funciónradial

    ▪  Máquina de Vectores – Avanzadosalgoritmos con desempeño precisopara bases de datos grandes

    ▪  Redes Bayesianas - Modelosgráficos probabilísticos

    ▪  Regresión de Cox – Calcule eltiempo de un evento

    ▪  Regresión logística y binomial ymultinomial

    ▪  Análisis discriminante

    ▪  Modelo lineal generalizado (GLM)

    El módulo de Segmentación incluye:

     

    Redes de Kohonen – redesneuronales cluster

    ▪  Conglomerado Bietápico –seleccione el número correcto declusters automáticamente

    ▪  Detección de anomalías – detecterecords inusuales utilizandoalgoritmos cluster

    El módulo de Asociación incluye:

    ▪  Algoritmos de asociación A priori

    ▪  CARMA - Algoritmo de asociacióncon consecuentes múltiples 

    ▪ 

    Algoritmos secuenciales –Algoritmos de asociacionessecuenciales para análisissensitivo al orden 

    Evaluación

    ▪  Evalúe modelos fácilmenteutilizando gráficos de elevación,ganancias, beneficio y repuesta- Utilice un proceso de un pasoque acorta el tiempo de proyectocuando se evalúan modelosmúltiples- Defina condiciones de acierto yla puntuación asignada al aciertopara interpretar el rendimiento

    del modelo▪  Utilice los resultados de

    propensión para un despliegueconsistente y una fácilcomparación entre diferentesmodelos

    Distribución de los resultadosClementine ofrece diferentesalternativas para distribuir losresultados que satisfacen lasnecesidades de su organización

    ▪  Clementine Solution Publisher(opcional)- Automatice la exportación detodas las operaciones: acceso y

    manipulación de texto, textmining, puntuación de modelos(incluyendo combinaciones demodelos) y post-procesamiento,entre otras- Utilice un ambiente runtimepara ejecutar archivos deimágenes en plataformas objetivo

    ▪  Exporte las rutasautomáticamente a lasaplicaciones de análisis predictivode SPSS- Combine las rutas exportadascon los modelos predictivos,reglas de negocio y exclusionespara optimizar las interacciones

    con el cliente▪  Cleo (opcional)

    - Implante una solución basada enWeb para una rápida distribucióndel modelo- Permita que múltiples usuariosaccedan simultáneamente y queinmediatamente puntúen unregistro en particular, múltiplesregistros o una base de datosentera a través de una interfazpersonalizada tipo browser

    ▪  Scripting- Utilice scripts para automatizartareas repetitivas complejas

    Clementine Server (opcional)Clementine Server lo provee de todaslas capacidades de data mining denuestra versión cliente más elincremento en desempeño y otrasfuncionalidades. Algunascaracterísticas de Clementine Serverson:

    ▪  Utilice data mining in-databasepara aprovechar las bases dedatos de alto rendimiento

    ▪  Construya modelos en la base dedatos con el modelado in-database utilizando lastecnologías lideres de bases dedatos

    - Se incluyen algoritmosadicionales suministrados por susrespectivos proveedores paraMicrosoft SQL Server 2005, IBM DBDWE y Oracle Data Mining

    ▪  Mejore el desempeño de suhardware, disminuya el tiempopara solucionar sus problemas ymejore el retorno en la inversión

    ▪  Envíe datos confidenciales entreClementine Client y ClementineServer a través de la encriptaciónSSL

  • 8/17/2019 datamining_resultados

    7/7

     

    SPSS Predictive Enterprise Services(opcional)SPSS Predictive Enterprise Services esuna plataforma que le permite

    manejar y automatizar el procesoanalítico y fácilmente distribuir susresultados en toda su organizaciónpara incrementar la productividad y elvalor de la inversión analítica. SPSSPredictive Enterprise Services le ayudaa:

    ▪  Centralizar y administrar susactivos analíticos paraincrementar el conocimiento delnegocio y proporcionarlepoderosas habilidades paracambiar la administración

    ▪  Automatizar el proceso analíticopara incrementar la productividady asegurar resultados confiables

     

    Distribuir resultados con unainterfaz personalizada tipobrowser 

    El adaptador de Clementine versiónpara cliente para Predictive EnterpriseServices le permite a los analistasinteractuar directamente con los

    servicios Base para almacenar,recuperar y buscar sus activosanalíticos; a los administradores deprocesos les permite controlar lastareas de Clementine. Si deseaobtener más información de SPSSPredictive Enterprise Servicescontacte a su ejecutivo.

    Las características pueden variar en la versión final del producto

    SPSS México, S.A. de C.V.Insurgentes Sur 933, piso 5Col. NápolesMéxico, D.F. 03810

    Tel. (55)56 82 87 68 y 56 82 17 [email protected]