sistemas inteligentes y la ciencia del dato (y ii)
DESCRIPTION
Segundo bloque de la sesión que impartí en la asignatura "Sistemas de información avanzados (comercio electrónico)" del Master de estudios avanzados en dirección de empresasTRANSCRIPT
Sistemas Inteligentes y la Ciencia del DatoRetos para las empresas
Sistemas de Información Avanzados (Comercio electrónico)Máster de estudios avanzados en dirección de empresas
Joaquín Borrego DíazGrupo Lógica, Computación e Ingeniería del Conocimiento PAIDI TIC-137
Departamento de Ciencias de la Computación e Inteligencia [email protected], Twitter:jborrego
Parte II: Algunos (nuevos) modelos de negocio basados en información y redes
• Nuevo modelo de negocio: big data trading & processing. Ejemplos
• Modelos crowdsourcing. Ejemplos
• Modelos disruptivos
• Capitalismo Indie
Parte I: Datos, Información, Conocimiento
• Open Data
• La ciencia del dato
• Procesamiento de eventos complejos
• Complejidad económica
• Cloud Computing
Parte III (cont): Otros casos de estudio
• Caso II: Minería de opiniones y sentimientos
• Caso III: Predicción bajo racionalidad acotada
• Caso IV: Servicios en movilidad basados en conocimiento
• Caso V: Informática urbana. SmartCities
• Caso VI: Content Curation
Preliminares
• Prospección...
• Tecnologías relacionadas con la IA
• Información en Internet y en sus aledaños
• Big Data
Parte III: Casos de estudio de tratamiento de la información
• Caso I, especial: Interoperabilidad Semántica para la empresa
Contenido
Bloque II
Parte III:Casos de estudio
Caso I, especial: Interoperabilidad Semántica para la
empresa
Objetivo primario de una ontología: Facilitar la
interoperabiliad a nivel semántico
Ontología
Aplicación básica: B2C mediante ontologías
Campos de aplicación
Interoperabilidad entre los
módulos de transacciones
Tratamiento de información no
interpretable por todos
Veremos algunos ejemplos
Argumentación homogénea a
travésde Ontologías y
metadatos
bottom-upestructuración
(semántica)Externalización
del conocimiento
InteroperabilidadB2B (¿B2C?)
http://csdb.wilshireconferences.com/forms/download/guide_to_semantics
Casos interesantes:
Externalización del conocimiento en empresas
Interoperabilidad semántica y comercio electrónico
Tendencias ____________________
Oportunidades• Software de gestión
inteligente del conocimiento para la empresa usando estándares como ontologías empresariales
• Integración de la información de la empresa y de servicios mediante tecnología Web Semántica
Índice:
• Aplicaciones en:
• Comercio electrónico
• Explotación del “grafo social” y de objetos
• Externalización del conocimiento en empresas
• Interfaces inteligentes para la documentación
Comercio electrónicoCaso 1(a)
• GoodRelations is a standardized vocabulary for product, price, and company data that
• can be embedded into existing static and dynamic Web pages and that
• can be processed by other computers.
• This increases the visibility of your products and services in the latest generation of search engines, recommender systems, and novel mobile or social applications.
Comercio electrónico
Año 2010
¿Cómo usarlo?: Mirarhttp://searchengineland.com/make-yourself-findable-in-the-global-graph-of-commerce-135082
http://wiki.goodrelations-vocabulary.org/Tools
Herram
ientas
Mini-tutorial de Rich snippets:
http://www.ebusiness-unibw.org/tools/grsnippetgen/
Extendiendo con nuevas ontologías
Caso I(c):Externalización Inteligente
Dimensión I: Ingeniería Ontológica
Ontología
Es un caso particular de:
• Conocimiento entre pares
• ¡¡No procesable!!
• Conocimiento entre pares y “tangible” (datos, información)
• ¡¡Procesable!!
¿Qué sistemas?
Brecha Semántica
Ciclo de Nonaka & Takeuchi
• Cuatro actividades
• ¿Quién las gobierna?
• ¿Pueden ser gobernadas mediante tecnologías 2.0?
Proyección del ciclo de
Nonaka & Takeuchi
Conocimiento
externalizado
Externalización
Caso I(d): Confianza, interfaces• Ontologías como teorías
formales del conocimiento
• Ventajas:
• Confianza en el resultado
• Interoperabilidad semántica
• Desventaja: ¿alfabetización del usuario?
El problema de la representación del conocimiento mediante
ontologías
Una solución: Paella• Metáforas espaciales de los conceptos
implicados en la ontología
• Razonamiento visual
• comprensión de las relaciones
• Implementada como plug-in de Protégé
• Interfaz de usuario: transparente de formalismos ontológicos
Ontology AutomatedReasoner RCC8 CSP
Solver Drawing
Arquitectura de Paella
Interfaz
Tres módulos
Interfaz de Paella
Visualización de anomalías
• Una anomalía NO implica una inconsistencia lógica
• Paella muestra anomalías de carácter mereotopológico
{Ontologíade
seguridad
Casos de éxito
• NASA
• Vodafone
• Renault
• Reegle
• BBC
Casode éxito I
Caso de éxito II:Integración semántica
en movilidad
• Se facilita el intercambio de información entre los repositorios de información sobre sus automóviles
• La modelización realizada se puede compartir con otros servicios de la empresa (por. ej. compra de repuestos)
• Unifican los datos para toda la empresa, que usa un entorno distribuido
• Facilita el prototipado y el desarrollo
Caso de éxito III:Integración semántica
en la industria
Caso de éxito IV: Reegle
Caso de éxito V:BBC y las olimpiadas de
Londres 2012
http://www.w3.org/2001/sw/sweo/public/UseCases/BBC/
Ontologías
• Ontología para las olimpiadas:
Anotación (interfaz)
Publicación de contenidos
• Razonamiento hacia delante en el grafo RDF
Creación “dinámica” de portales
http://www.bbc.co.uk/sport/football/teams/chelsea
Caso II:Minería de conocimiento, opiniones y sentimientos:
Social media
Flujos en Social Media
Blogging corporativo
Compañía
Análisis
¿Extracción de conocimiento?
Oportunidades:
• Diseño de aplicaciones semánticas para enriquecer la experiencia de usuario en la Web 2.0
• Twitter Semántico
• Navegación conceptual
• Trust-based Computing
• Detección de tendencias extraídas de redes sociales
• Opinion analysis
• Análisis inteligente de twitts para
• predecir y estimar epidemias de gripe. consiguieron aproximar la evolución de la gripe mejor y antes que el tradicional método de recolectar la información de los hospitales.
• para predecir el éxito de una película. HP labs: monitorizando twitter pueden predecir si el éxito de un film
Ejemplo
¿Para qué se usa?
Nuestra semantización (ontología)
Representación del conocimiento
OportunidadesServicios personalizados
TecnologíaLinked/Open
data
Smart Cities
Geolocalización de la publicidad
Marketing geolocalizado
Aplicaciones hiperlocales
Gráficas de http://networkedneighbourhoods.com/wp-content/uploads/2011/11/2011-Online-Nhood-Networks-final.pdf
Minería en social media
http://buzztalkmonitor.com/blog/bid/136718/The-business-value-of-sentiment-analysis
• Mide “sentimientos” de cada tweet que analiza
IBM has established the IBM Social Sentiment Index to aggregate and gauge public opinion from a range of social media. The software used can distinguish between sarcasm and sincerity, and applies machine learning to identify which social media commentary is important—and which is just background noise. Through this sentiment analysis, IBM creates real-time public opinion snapshots, identifying trends and gauging how consumers feel about a variety of topics from retail and sports, to movies and urban traffic.
¿Materia Prima? social big data
Ofrecerá 2 años de twitters almacenados
http://datasift.com/
http://www.engagedc.com/inside-the-cave/
Finalmente... un caso de estudio: Elecciones USA 2012: ¿extrapolable a empresas?
Usaron CrowdFounding
Caso III: predicción bajo racionalidad acotada
• Los humanos no razonamos “lógicamente”
• El comportamiento colectivo, de manera emergente, es mejor que el individual en muchas ocasiones
• Seleccionamos, razonamos rápido (fast & frugal)
• Aunque argumentamos, no analizamos todos los argumentos o posibilidades
• Los esquemas de razonamiento experimentados con éxito son interesantes
• Conclusión: NO despreciamos nuestros esquemas “no lógicos”
Agentes para trabajar con conocimiento
Ecosis
tema
Web
Semántico
¡Argumento!
Ejemplo de argumentación:Inference Web: Inferencia bajo argumentación
Una demo
Documentación de la deducción
Documentación del razonador usado
Detalle del paso de inferencia
Oportunidades
• Minería de conocimiento (en contraposición a la minería de datos) realizada por agentes
• Análisis de las actividades en redes sociales. Agentes proactivos para personalizar la “vida” en la Web 2.0
• Delegación del comercio electrónico a agentes racionales
Predicción bajo racionalidad acotada versus big data
Ejemplo: predecir las apuestas más populares
Modelo Monstruo(retículo de conceptos)
(una temporada)
Sistema
Resultados
Comparación
Otra aproximación (más global)Más información... Más acierto
¿Aplicaciones del modelo?• A cualquier sistema experto con observaciones
discretizables adecuadamente
• Apuestas deportivas
• Ecología
• Economía (mercados de valores, etc.)
• etc.
• Conjetura: sistemas en el que el conocimiento exhiba una capa epistemológica con cierta estructura (libre de escala)
La hipótesis del residuo libre de escala(Aranda, Borrego y Galán 2012)
• If the attribute set selected to observe the Complex System is computable, objective and induces a Concept Lattice which provides a sound analysis of the CS (from the point of view of BR), then its degree-distribution is scale-free
Scale-Free Structure in Concept Lattices Associatedto Complex Systems
Caso IVServicios en movilidad
basados en conocimiento
http://www.visionmobile.com/product/developer-economics-2013-the-tools-report/
¿Pub
licid
ad?
Móviles y conocimiento
• Representación del conocimiento móvil
• Razonamiento contextual
• Inteligencia ambiental
• Geolocalización
• ¿Foursquare como ejemplo de socialización?
• Informática Urbana (móvil)
Realidad aumentada para traspasar la membrana
Inteligencia Ambiental
Apps para “añadir información a la
realidad”
Razonamiento contextual en NFC
Phonedero
Oportunidades
• Aplicaciones basadas en el conocimiento
• para las apps stores
• Teleasistencia. Telediagnosis
• Aplicaciones hiperlocales
• Espacios transducidos
• Calle como API
• Gestión inteligente del idle screen
Caso V:Informática urbana
ySmartCities
http://www.mckinsey.com/Insights/MGI/Research/Urbanization/Urban_world
Informática Urbana & SmartCities
• Campo de investigación emergente
• Uso (y generación) de información física y digital sobre la ciudad como fuente de nuevas aplicaciones que puedan ser usadas por el ciudadano
In 2050 80% of the world’s population will live in cities
Sensores
Información, media
Capas digitales
OPEN DATA
Local
Global
UrbanInformaticsArquitectura Urbanismo
Social Media
Med
ia A
rt
Mark
etin
g
Telecom
unicacio
nes
Web 2
.0
Location Based
services
• Flujo I2U (instituciones y empresas a usuarios)
• Flujo P2P
• Pieles digitales
• Inter-cities
Fuentes de información
Internet of ThingsSensor Semantic Web
On the Rise
• Wireless Electric Vehicle Charging
• Smart Governance Operating Framework
• Electric Vehicle Charging Infrastructure
• Information Semantic Services
• Intelligent Lamppost
• "Big Data" and Extreme Information Processing and Management
• Hydrogen Economy
• Sustainable Performance Management
• Internet of Things
• Smart Fabrics
At the Peak
• Home Energy Management/Consumer Energy Management
• Water Management
• Data Stewardship Applications
• Sustainability Business Operations Consulting Services
• Web 2.0 for Utilities
• Location-Based Services in Automotive
• Plug-In Hybrid Electric Vehicles/Electric Vehicles
• Vehicle Information Hub
• Augmented Reality
• Cloud Computing
• Microgrids
• Thermal (or Concentrated) Solar Power
• Distributed Generation
• Integrated and Open Building Automation and Control Systems
• Mobile Health Monitoring
• Combined Heat and Power
Sliding Into the Trough
• Master Data Management
• Machine-to-Machine Communication Services
• Customer Gateways
• Near Field Communication
• Advanced Metering Infrastructure
• Car-to-Infrastructure Communications
• Electric Vehicles
Climbing the Slope
• Consumer Telematics
Tecnologías emergentespara
Smart Cities, 2011
Dos iniciativas interesantes
PostMates
Gamification (mobile app)The Urbanopoly app is a social, mobile and location-basedGame with a Purpose designed around the idea of the \monopoly" board game. Urbanopoly consumes and generates geo-spatial linked and open data; through a Human Computation mechanisms, those data are validated and enriched; new information is published as linked data. Players are thus involved in the geo-spatial data collection according to the “citizens as sensors" approach and the Urbanopoly game is the entertaining expedient to assess and improve geo-spatial linked data quality.
Caso VI: Content Curation
Cinco pasos...
• ¿Cuáles son semantizables?
Algunos ejemplosCategorías, búsquedas dirigidas a fuentes
Semántica
“Aprende” de tus lecturas
Bottlenose
Social Content Curator
Creas “perlas”Añades las de otrosRedes de conocimiento
Todos los usuarios aportanAlgunos vendenFancy vendeSubscripción a “fancybox”
Crowd content curator+ Un modelo de negocio
Content Curator Semántico: SmartTimes
(PFC de Abel Sayago, en el departamento)
“Entiende” la noticia
¿Cómo lo hace?Fuentes (RSS)
Análisis Formalde Conceptos
Interfaz de
usuario
Fuentes (RSS)Fuentes (RSS)
Categorizaciónfinal
Aprendede
la ejecución
Análisis de Conceptos
• Retículo de conceptos
• generado a partir de las noticias y anotación OpenCalais
RetroalimentaciónAlimentando el módulo
de aprendizaje
Otra aproximación
Para sentimientos
Para el contenido(noticia)
Anotación con respecto a ontología en Opendover
Anotación con respecto a ontología+sentimiento en opendover
Conclusiones
Conclusiones• Ingeniería del conocimiento y grandes conjuntos de datos
• Sistemas complejos: Paradigma para entender el big-data como observaciones de un sistema
• La minería de datos no es suficiente
• Nuevos retos:
• hiperlocalización
• geolocalización,
• confianza en la computación sobre grandes conjuntos de datos
• ...
• Modelos de negocio disruptivos
• Nuevos sistemas de información en la empresa
• Big analytics
• Sentiment Analysis
• Semantic interoperability
BIG DATA
Data Science
Sistemas Inteligentes y la Ciencia del DatoRetos para las empresas
Sistemas de Información Avanzados (Comercio electrónico)Máster de estudios avanzados en dirección de empresas
Joaquín Borrego DíazGrupo Lógica, Computación e Ingeniería del Conocimiento PAIDI TIC-137
Departamento de Ciencias de la Computación e Inteligencia [email protected], Twitter:jborrego