j.9. prospectiva de la web semántica: divergencia ......keywords: semantic web, linked open data,...

7
Anuario ThinkEPI 2012 269 ?????????????????????????????????????????????????????????????????????? J.9. Prospectiva de la web semántica: divergencia tecnológica y creación de mercados linked data Juan-Antonio Pastor-Sánchez 20 diciembre 2011 Pastor-Sánchez, Juan-Antonio. “Prospectiva de la web semántica: divergencia tecnológica y creación de mercados linked data”. Anuario ThinkEPI, 2012, v. 6, pp. 269-275. Resumen: Se presentan algunas tendencias en el entorno de la web semántica: Schema.org, un proyecto desarrollado por Google, Yahoo y Bing para el marcado se- mántico mediante microdatos; Freebase, un banco de conocimiento para la estruc- turación de datos y Kasabi, una plataforma que opera en la modalidad “software as a service” para la publicación y comercialización de datos semánticos. Se observa cierta divergencia tecnológica en la aplicación de estándares de la web semántica con el desarrollo de nuevas propuestas como los microdatos, así como el surgimien- to de un mercado linked data a través de plataformas de publicación que facilitan su comercialización. Palabras clave: Web semántica, Linked open data, Microdatos, RDFa, Schema.org, Kasabi, Freebase, SaaS, Mercado de datos semánticos, Divergencia tecnológica. Title: Prospective for the semantic web: technological divergence and linked data markets cre- ation Abstract: This paper shows some trends that are currently occurring in the environment of the semantic web. More specifically it presents schema.org, a project developed by Google, Yahoo and Bing for se- mantic markup using microdata, Freebase, a knowledge bank for structured information and Kasabi,a platform that operates into the modality of “Software as a Service” for the publication and commercial distribution of semantic data. It is possible see some technological divergence in the application of seman- tic Web standards with the development of new proposals as microdata, and the emergence of a market for linked data through publishing platforms that facilitate commercialization. Keywords: Semantic web, Linked open data, Microdata, RDFa, Schema.org, Kasabi, Freebase, SaaS, Se- mantic data market, Technological divergence. Prospectiva de la web semántica: divergencia tecnológica y creación de mercados linked data – Juan-Antonio Pastor-Sánchez El progresivo despliegue de la web semántica en los últimos años está produciendo nuevos servicios en la Web. Buena muestra de ello son las soluciones planteadas al amparo de la corriente linked open data, la progresiva adop- ción de RDF y de servicios web basados en Sparql Endpoint. La elaboración y publicación de estos datos se realiza por parte de especialistas e instituciones, dentro del ámbito de proyectos de gran enver- gadura o sobre temas concretos. Es relevante el documento sobre vocabularios y conjuntos de datos enlazados bibliotecarios (Isaac et al., 2011) 1 , el catálogo “The datahub” de CKAN 2 o el “Opening up government” del Reino Unido 3 . Existe un interés creciente por parte de orga- nismos y empresas para publicar datos utilizando técnicas que incrementen la interoperabilidad de los mismos (Heath y Bizer, 2011), con vistas a su aplicación y explotación en futuros servicios. Otro tipo de iniciativas se centran en experimen- tar aspectos relacionados con la disponibilidad y reutilización de cantidades masivas de datos, tal y como se hace desde el proyecto DBpedia. Experi- mentar y “jugar” con las nuevas ideas y propues- tas es un paso indispensable para el desarrollo de nuevas tecnologías en la Web (Saorín, 2011). Las iniciativas anteriores comparten una mis- ma premisa: la publicación de datos “ad-hoc” para la web semántica, ya sea a partir de bases de datos de aplicaciones (catálogos, directorios, fondos documentales), vocabularios controlados (Agrovoc, Rameau, Lcsh, STW, LEM) u otro tipo de productos resultado del procesamiento de datos y fuentes de información de diversa índole, siendo DBpedia el núcleo central de la nube de interrelaciones en el ecosistema de linked open data (Bizer et al., 2009). Otros enfoques se centran en: – “semantización” de contenidos de sitios web creados para su publicación y consulta para el usuario final;

Upload: others

Post on 01-Oct-2020

3 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: J.9. Prospectiva de la web semántica: divergencia ......Keywords: Semantic web, Linked open data, Microdata, RDFa, Schema.org, Kasabi, Freebase, SaaS, Se-mantic data market, Technological

AnuarioThinkEPI2012

269

??????????????????????????????????????????????????????????????????????

J.9.Prospectivadelawebsemántica:divergenciatecnológicaycreacióndemercadoslinked data

Juan-AntonioPastor-Sánchez

20diciembre2011

Pastor-Sánchez,Juan-Antonio.“Prospectivadelawebsemántica:divergenciatecnológicaycreacióndemercadoslinkeddata”.AnuarioThinkEPI,2012,v.6,pp.269-275.

Resumen: Se presentan algunas tendencias en el entorno de la web semántica:Schema.org,unproyectodesarrolladoporGoogle,YahooyBingparaelmarcadose-mánticomediantemicrodatos;Freebase,unbancodeconocimientoparalaestruc-turacióndedatosyKasabi,unaplataformaqueoperaenlamodalidad“softwareasaservice”paralapublicaciónycomercializacióndedatossemánticos.Seobservaciertadivergenciatecnológicaenlaaplicacióndeestándaresdelawebsemánticaconeldesarrollodenuevaspropuestascomolosmicrodatos,asícomoelsurgimien-todeunmercadolinkeddataatravésdeplataformasdepublicaciónquefacilitansucomercialización.

Palabrasclave:Websemántica,Linkedopendata,Microdatos,RDFa,Schema.org,Kasabi,Freebase,SaaS,Mercadodedatossemánticos,Divergenciatecnológica.

Title:Prospectiveforthesemanticweb:technologicaldivergenceandlinkeddatamarketscre-ation

Abstract:Thispapershowssometrendsthatarecurrentlyoccurringintheenvironmentofthesemanticweb.Morespecifically itpresentsschema.org,aprojectdevelopedbyGoogle,YahooandBing for se-manticmarkupusingmicrodata,Freebase,aknowledgebankforstructuredinformationandKasabi,aplatformthatoperatesintothemodalityof“SoftwareasaService”forthepublicationandcommercialdistributionofsemanticdata.Itispossibleseesometechnologicaldivergenceintheapplicationofseman-ticWebstandardswiththedevelopmentofnewproposalsasmicrodata,andtheemergenceofamarketforlinkeddatathroughpublishingplatformsthatfacilitatecommercialization.

Keywords:Semanticweb,Linkedopendata,Microdata,RDFa,Schema.org,Kasabi,Freebase,SaaS,Se-manticdatamarket,Technologicaldivergence.

Prospectivadelawebsemántica:divergenciatecnológicaycreacióndemercadoslinkeddata–Juan-AntonioPastor-Sánchez

Elprogresivodesplieguedelawebsemánticaen los últimos años está produciendo nuevosservicios en la Web. Buena muestra de elloson las soluciones planteadas al amparo de lacorrientelinkedopendata,laprogresivaadop-cióndeRDFydeservicioswebbasadosenSparqlEndpoint.

Laelaboraciónypublicacióndeestosdatosserealizaporpartedeespecialistaseinstituciones,dentro del ámbito de proyectos de gran enver-gadura o sobre temas concretos. Es relevanteel documento sobre vocabularios y conjuntosde datos enlazados bibliotecarios (Isaac et al.,2011)1,elcatálogo“Thedatahub”deCKAN2oel“Openingupgovernment”delReinoUnido3.

Existeuninteréscrecienteporpartedeorga-nismosyempresasparapublicardatosutilizandotécnicas que incrementen la interoperabilidadde los mismos (Heath yBizer, 2011), con vistasasuaplicaciónyexplotaciónenfuturosservicios.Otrotipodeiniciativassecentranenexperimen-

taraspectosrelacionadosconladisponibilidadyreutilizacióndecantidadesmasivasdedatos,talycomosehacedesdeelproyectoDBpedia.Experi-mentary“jugar”conlasnuevasideasypropues-tasesunpasoindispensableparaeldesarrollodenuevastecnologíasenlaWeb(Saorín,2011).

Las iniciativas anteriores comparten una mis-ma premisa: la publicación de datos “ad-hoc”para laweb semántica, ya seaapartirdebasesde datos de aplicaciones (catálogos, directorios,fondos documentales), vocabularios controlados(Agrovoc, Rameau, Lcsh, STW, LEM) u otro tipode productos resultado del procesamiento dedatosyfuentesdeinformacióndediversaíndole,siendoDBpedia elnúcleocentralde lanubedeinterrelaciones en el ecosistema de linked opendata(Bizeretal.,2009).

Otrosenfoquessecentranen:– “semantización” de contenidos de sitios

webcreadosparasupublicaciónyconsultaparaelusuariofinal;

Page 2: J.9. Prospectiva de la web semántica: divergencia ......Keywords: Semantic web, Linked open data, Microdata, RDFa, Schema.org, Kasabi, Freebase, SaaS, Se-mantic data market, Technological

AnuarioThinkEPI2012

270

???????????????????????????????????????????????????????????????????Prospectivadelawebsemántica:divergenciatecnológicaycreacióndemercadoslinkeddata–Juan-AntonioPastor-Sánchez

– servicios orientados a la publicación cola-borativa de datos para la creación de bases deconocimientoestructurado;

– plataformas para la gestión de conjuntosdedatos.

Son aproximaciones cuyo uso está abierto alpúblico y están centradas en la descripción decontenidos, recursos y objetos desde una pers-pectivasemántica.

Schema.org

Comenzósuandadurael2de juniode2011.EstádesarrolladodeformaconjuntaporGoogle,YahooyBing.Aprimeravistapuedesorprenderque estos tres motores de búsqueda, aparente-mente competidores, colaboren para crear unproyecto.Laexpansióndelasaplicacionesyser-viciosdelaweb2.0hacomplicadoelpanoramade las búsquedas en la Web. Los motores debúsquedahantenidoqueadaptarseaestanuevarealidad,modificandosusalgoritmosderelevan-cia, detectando duplicaciones, evitando técnicasdecloackingostuffing,promocionandoconteni-dos de calidad contrastada o filtrando según lanaturalezadelrecurso.Todoellosinentrarenlafiabilidad, la calidad o la usabilidad de los con-tenidos. La solución es obvia: incluir metadatosdentrodelospropioscontenidosweb.

Sin embargo, anexar metadatos sobre aspec-tosgeneralesdeunapágina(descripción,autoría,palabras clave) tieneuna importante limitación:no permite describir semánticamente aspectosdetalladosdelcontenido,peseaqueenmuchasocasiones contenga información altamenteestructurada,originalmentealmacenadaenbasesdedatos.Unapáginawebconinformaciónsobrela cartelera de cine incluye información sobrepelículas,horariode sesiones,precios,ubicacióndelasala,etc.Generalmentelainformaciónestamarcadaparaobtenerunformatoadecuadoparasuvisualizacióny lecturaporpartedepersonas.Pero también sería de gran utilidad que dichapáginatuvieraunmarcadosemántico,enelquetodos esos datos estuvieran descritos de formaexplícita y detallada, para su posterior procesa-mientoporpartedeotrasaplicaciones.

De este modo, sería muy sencillo plantear yresolverunaconsultaparaconocerquépelículasseproyectanentrelas18:00ylas21:00horasenun radio de 1.500 metros del lugar en el quereside el usuario. Otro ejemplo: los diferentesmediosdetransporte(autobuses,trenes,aviones)disponendepáginasdondesemuestranhorariosdesaliday llegada,precioorecorrido.Estetipode información es una muestra más de infor-mación altamente estructurada y susceptible derepresentarsemediantealgúntipodeontología

para su procesamiento y posterior ejecución deinferencias: en este caso, podría ser el trayectoóptimoentredosciudades.

Precisamente,esoloqueofreceSchema.org4,unapseudo-mega-ontología,enformadeesque-madecaráctergeneral,queintentarepresentaruna amplia variedad de hechos: obras, eventos,intangibles, organizaciones, personas, lugares yproductos.Partiendodelasuperclase“thing”,sedefinenvarioscientosdeclasesysubclases(tipos),conmultituddepropiedades,quepermitenreali-zardescripcionesdetalladasyespecíficassobreundeterminadoelementoinformativo5.

El modelo de datos utilizado deriva de RDF,de manera que: los tipos se estructuran en unajerarquíamúltiple(untipopuedesersubclasedemásdeuntipo)dotadadeherenciadepropieda-des,altiempoqueeldominioyelrangodeéstaspuedenestarconstituidospormásdeuntipo.Elesquema general no puede modificarse por losusuarios,peroseproporcionaunmecanismoparasu extensión mediante la derivación de tipos ypropiedadesgeneralesy,portanto,laadaptaciónanecesidadesconcretas6.

LaaplicacióndeSchema.orgestá íntimamen-te ligada al desarrollo de html5, puesto que sebasaenelusodemicrodatosparalainclusióndeinformaciónsemántica.Elresultadofinal,esunapáginawebquepuedeserutilizadaporunaapli-caciónoagenteinformáticoparalaextraccióndeinformaciónsemánticamenterelevantedeformamuchomásprecisayexactaqueotrotipodetéc-nicascomoelscreenscrapingoelwebminning.

ElobjetivodeSchema.orgesofrecerunmeca-nismoparaelmarcadosemánticodelcódigohtml,haciendoqueunapáginawebseaunobjetopro-cesableparalaextraccióndeinformaciónsemán-

Page 3: J.9. Prospectiva de la web semántica: divergencia ......Keywords: Semantic web, Linked open data, Microdata, RDFa, Schema.org, Kasabi, Freebase, SaaS, Se-mantic data market, Technological

AnuarioThinkEPI2012

271

??????????????????????????????????????????????????????????????????????Prospectivadelawebsemántica:divergenciatecnológicaycreacióndemercadoslinkeddata–Juan-AntonioPastor-Sánchez

tica.Lasimplicacionesdeestetipodesoluciónenel funcionamiento de los motores de búsquedason considerables: puesto que estos funcionanmejor con información estructurada, las bús-quedas serían más precisas, las posibilidades defiltrado aumentarían la versatilidad del procesode recuperación de información, los resultadospodríanvisualizarsedeformamáspersonalizadaalosgustosdeusuario,etc.Almismotiemposeabren nuevos horizontes en la reutilización dedichoscontenidosporpartedeterceros.

Freebase

Su objetivo es la creación de una gran basedeconocimientoyno,comoenelcasodeSche-ma.org, el marcado semántico de páginas html.Cualquiera puede registrarse como usuario eintroducir datos siguiendo un esquema propiooreutilizaralgunoyaexistenteenFreebase.Losesquemas incluyentiposypropiedadesqueper-mitendescribirobjetosdeinformación,queenlaterminologíadeFreebasesedenominan“topics”.Los datos pueden introducirse manualmente outilizaralgunasherramientasparasucargamasi-va(Bollacker,2008).

Trashabituarsealentorno,terminologíayfun-cionesdeFreebase,setienelasensacióndeestartrabajando en una wiki de carácter semántico,en la que los “topics” desempeñan el papel delosartículosdeWikipedia yen laquecualquiermiembrodelacomunidadpuederealizaraporta-cionesycorreccionessobrelosdatos.Actualmen-te contiene más de 20 millones de “topics”. LalicenciadeusodedichoscontenidosesCreativeCommonsAttribution(CC-BY).

UnodelosaspectosmásinteresantesdeFree-baseeselenormepotencialpara lacreacióndeaplicaciones,encualquierplataforma,quepermi-talaexplotacióndesusdatos.Existeunaapifor-madaporunconjuntodeservicioswebRESTmuysencillos,quepermiten laconsultay laescritura(previa identificación como usuario autorizado)de datos. Freebase utiliza Json (como formatoparael intercambiodedatos)yMQL,comolen-guajedeconsulta8.Estamosanteunservicioquenosóloaportaunaplataformaparalagestiónyconsultadelosdatos,sinoqueademásofreceunampliosoportealdesarrollodeaplicaciones.

Se ofrece un soporte muy básico para RDF,permitiendo acceder a la descripción de cada“topic”medianteRDF/XML.Tambiénpuededes-cargarse un volcado completo de Freebase enformatoTSV.

UnindiciodelimpactoqueestáteniendoestetipodeservicioseslaadquisicióndeMetaweb(lacompañíaquedesarrollóFreebase)porpartedeGoogleen2010.

Kasabi

FreebaseySchema.orgtienenaproximacionespropias,quedifierenenmuchosaspectosde lassoluciones desarrolladas para la web semánticaenel senodelW3C.NingunadeellasutilizadeunmodoclaroelmodelodedatospropuestoporRDF(esencialenlawebsemántica)nihaceusodeotrastecnologíasquepodríanseraplicadas,comoRDFa(enelcasodeSchema.org)oSparql(enelcasodeFreebase).

Ambasofrecenunaaplicacióninmediataysen-cilladealgunosplanteamientosdelawebsemán-

tica, y ofrecen meca-nismos para extenderlos esquemas de des-cripción generales. Sinembargo, suénfasisensimplificar los procesosdegestiónyusodelosdatos les hace optarpor no utilizar ciertosaspectosnormativosdelW3C.

Otrostiposdeusua-rios tal vez prefieranatenersealasdiferentesrecomendaciones delW3C y puedan gene-rarsuspropiosdatosenunformatoquecumpladichas especificaciones.Estos usuarios podríangenerarsalidasenRDF/XML o Turtle a partir

Page 4: J.9. Prospectiva de la web semántica: divergencia ......Keywords: Semantic web, Linked open data, Microdata, RDFa, Schema.org, Kasabi, Freebase, SaaS, Se-mantic data market, Technological

AnuarioThinkEPI2012

272

???????????????????????????????????????????????????????????????????Prospectivadelawebsemántica:divergenciatecnológicaycreacióndemercadoslinkeddata–Juan-AntonioPastor-Sánchez

de bases de datos propias, y precisarían de unaplataforma software as a service (SaaS)9 paragestionar dichos datos, visualizarlos o definirSparql Endpoints (Heath, 2008). Esto es lo queofreceKasabi10:unaplataformaparalagestiónydiseminacióndedatosRDF.

KasabiestábasadoenlaplataformaTalis11y,ademásdeofrecersoporteparaelalmacenamien-tode conjuntosdedatos (datasets), disponedeuncompletorepertoriodeapis(supuntofuerte)para lagestiónyaccesoa losdatos.Dichasapisson muy flexibles, siendo posible personalizarciertosparámetrosdefiniendovistas, filtros, for-matosyestilosdevisualización.Lasapissebasanen la definición servicios web REST o de SparqlEndpoints.Elaccesoa lasapis,yportantoa losdatosparasuexplotaciónyreutilización,serea-lizaatravésdeunaclaveasociadaalconjuntodedatosencuestión12.

Trasregistrarsecomousuarioesposiblecrearnuevos conjuntos de datos (hasta cinco en estaversión beta), configurar ciertos aspectos (esta-dodepublicación, categorías temáticas, tipodelicenciade losdatos,etc.)ymantener losdatos.Éstospuedenañadirsedirectamenteaundataset,indicandounauriomedianteextracciónRDFadeunurlconcreto.ElmodeloutilizadoesRDF.Kasa-bisiguelasrecomendacionesdelW3Cencuantoalusodetecnologíasdelawebsemántica.

Divergenciatecnológica

Uno de los aspectos más llamativos de Sche-ma.org y Freebase es el planteamiento de unadivergenciaenrelaciónconciertosplanteamien-

tosdelW3C.ElmodeloRDFprácticamentenosecontemplay,sisehace–visualizaciónRDFdelos“topics” en Freebase–, es mediante una aplica-ciónmuygeneral.

EnelcasodeSchema.orgelmodelodedescrip-ciónesjerárquico.ElusodemicrodatosfrenteaRDFasuponeunmotivodeconfusión.Estepuntoresultauntantopolémicopuestoqueseplanteaunaposiblebarreraentrehtmlyxhtml,deformaque los microdatos se utilicen en html5 y RDFaenxhtml13.

Esto puede resultar problemático debido alasdiferenciasdemodeloentreambasopciones:mientrasquelosmicrodatostienenunaestructurajerárquica,RDFautilizaelmodelogeneraldeRDFbasadoengrafos(Sporny,2011).PorestemotivoesposiblerealizarelmapeadodeunaestructurademicrodatosaRDFa,peronoalainversa.RDFaes mucho más flexible ya que permite la com-binación de múltiples vocabularios y esquemasRDF,mientrasqueSchema.org secentraenunaestructuraad-hocdetiposypropiedades.

Asípues,elusodelosmicrodatosysucapaci-daddeinteroperabilidadenelfuturoesincierta.Lasencillezdesusintaxis,frentealamayorcom-plejidaddeRDFa,aducidaporlosresponsablesdeSchema.org, no es motivo suficiente para optarpor dicha solución. Sobre todo si se tiene encuentaqueelusodeunauotratecnologíaestarámediadoporunsistemadegestióndecontenidos(CMS),querealizaráelmapeadoentrelasestruc-turas internasde loscontenidosy loselementosdelosesquemasdemetadatoscorrespondientes,ylaconsiguientegeneraciónautomáticadecódi-gohtml/xhtml.

Seríarecomendablequeenunfuturosealcan-zarantresobjetivos:

– separar las especificaciones de microdatosyRDFadeunlenguajedemarcadoconcreto;deestaformaambasopcionespodríanusarsetantoenhtml5comoenxhtml;

– losmotoresdebúsquedadeberíanconside-rarambasopciones;

– irmásalládelesquemapropuestoenSche-ma.org; además de no obligar a adoptar unesquemaconcreto,podríanincorporarsedescrip-cionesderecursosconvocabulariosRDFconunasemánticabiendefinida.

Otro punto de separación lo constituyen losmecanismos de extensión de los esquemas pro-puestos tanto por Freebase como por Schema.org. La capacidad de ultra-personalización queofrecenambas iniciativasconstituyeunarmadedoblefilo:porunladoofrecelibertadtotalparaladerivacióndeelementosdelesquema,peroporotropuedesucederqueserepresenteciertotipode información con elementos definidos por elusuario,enlugardeconlostiposypropiedadespropiosdeSchema.orgparaello.

Page 5: J.9. Prospectiva de la web semántica: divergencia ......Keywords: Semantic web, Linked open data, Microdata, RDFa, Schema.org, Kasabi, Freebase, SaaS, Se-mantic data market, Technological

AnuarioThinkEPI2012

273

??????????????????????????????????????????????????????????????????????Prospectivadelawebsemántica:divergenciatecnológicaycreacióndemercadoslinkeddata–Juan-AntonioPastor-Sánchez

Los esquemas propuestos por Schema.org yFreebasesonrealmenteextensos,sucomprensiónescompleja,yelámbitodeaplicacióndealgunoselementosdescriptivospuederesultarconfuso.Siunwebmasternocomprendeunelemento–onolocalizaalgunoqueleresulteapropiado–definiráuno nuevo. Esto puede producir una dispersiónsemánticaenladescripciónderecursosquepuedeprovocarresultadosnodeseadosenlosprocesosdebúsqueda.Elusodeesquemasmáspequeñosysencillosproporcionaunavisiónmodulardelawebsemánticaqueresultamuchomásadecuadaenladescripciónderecursos.

En el caso de Freebase encontramos otroaspecto que se separa de las tecnologías de lawebsemántica:MQL.AunqueenalgunospuntosMQLessimilaraSparql,susintaxisestotalmentedistintayaque sebasaen Json, y supotenciali-dades inferiora lade Sparql. En realidadMQL(metaweb query language) no es un lenguajepropiamentedichosetratadeunaapiquepermi-tedefinirciertospatronescomocondicionesquedebencumplirlosdatosarecuperar.Elgradodeinteroperabilidadde losdatosdeFreebase seríamayorsicadaconjuntodedatoscontaraconunSparqlendpoint.

Mercadolinked data,SaaSyapis:evolucionesnecesarias

Lawebsemánticaprecisadeciertoselementosqueaumentensuradiodeacciónycontribuyanaincrementarsudespliegue.Kasabisugiereyllevaalaprácticaalgunasideasyconceptosquepue-denresultardegraninterésalosprofesionalesyusuariosqueoperenenesteentorno.

Hablar de un mercado de datos a partir dela web semántica y de linked open data puederesultar un contrasenti-do, pero resulta nece-sario hacerlo y referir-se a linked data (sin el“open”)paracrearnue-vosmodelosdenegocioyoportunidades.

Dichomercadopodríamatizarse, así como losservicios y productosobjeto de la compra-venta:podríancomprar-se los datos en su tota-lidad o parte de ellos,conmayoromenornivelde granularidad (con laconsiguiente diferenciade tarifas), ofrecer unproductobásicogratuitoy otro producto comer-

cial mucho más avanzado, con datos añadidosproductodeunprocesamientodelosdatosorigi-nales.Comparandoestenuevomercadoconeldelosmediosdecomunicaciónen internet,esfácilllegara laconclusióndequeelcaminoaseguirsería muy similar. Evidentemente hay aspectosquehabríaqueafinarenestemodelo:derechosdeexplotacióndedatosenfuncióndesuorigen,licenciasdeuso,inclusióndepublicidad,etc.

Laaportacióndeconjuntosdedatosdeorga-nismoseinstitucionespúblicasdesempeñaríaunpapel fundamental, constituyendo núcleos dedatosenlazadosabiertosa suusoyexplotaciónpúblicos.Lasociedadinvierteenlagestióndigitalycotidianadedichosdatos,yenunfuturoinme-diatodeberáserobligacióndelasadministracio-nespúblicas ladifusiónde losmismosdeformadesagregada, no en forma de documentos, yaquedeestemodoseconsiguemayorversatilidadparasureutilización.

El uso de dichas aportaciones por parte deorganizaciones privadas para su procesamientoconvistasa incorporarvalorañadido,generaríanuevos focos de negocio y por tanto empleo ycrecimiento económico, además de difundir lasactividades de las administraciones públicas enestesentido14.

En este modelo de negocio resulta funda-mentallaexistenciadeplataformasSaaSdeusogratuitoconciertaslimitacionesyquecubriríanlas necesidades de gestión y publicación dedatos de la mayor parte de entidades públicaso de cualquier otra procedencia, siempre ycuando tuvieran licencias de uso tipo CreativeCommons. Para otro tipo de requisitos asocia-dos a la explotación comercial de dichos datosmedianteaccesorestringidoaestasplataformas,sepodríadisponerdeserviciosdepagoconunampliocatálogodeapis:limitacióndelaccesoa

http://kasabi.com

Page 6: J.9. Prospectiva de la web semántica: divergencia ......Keywords: Semantic web, Linked open data, Microdata, RDFa, Schema.org, Kasabi, Freebase, SaaS, Se-mantic data market, Technological

AnuarioThinkEPI2012

274

???????????????????????????????????????????????????????????????????Prospectivadelawebsemántica:divergenciatecnológicaycreacióndemercadoslinkeddata–Juan-AntonioPastor-Sánchez

datasetsmedianteclavesdeautenticación,apli-cacióndeestilosvisuales,sistemasdebúsquedaavanzados, incorporación de fuentes de datosexternas,definicióndeontologías,ejecucióndeinferenciasetc.

En cuanto a las apis para la reutilización dedatos, también puede observarse que se estánincorporando los principios de crowdsourcingpara su desarrollo. Este modelo no es nuevo,puesto que, en gran medida, la implantación yevolucióndelosCMSsedebealdesarrollodesucatálogo de plugins y módulos (mediante estemodelo(Leimeisteretal.,2009).

Enelcasodelasplataformasparalapublica-ción de datos semánticos, se debería seguir unmodelosimilar,queenriquecieralasaplicacionesyconcapacidaddereutilizacióndelosdatos.Deestemodo,seríanlospropioseditoresyusuariosdedatos(ynoúnicamentelosprogramadores)losquemarcaríanlastendenciasynecesidadesenelámbitodelawebsemántica.

Conclusiones:apertura,semantizacióneintegración

El conocimiento estratégico del momentumactualdelawebsemánticapuedeayudaradeci-direlmodoenelqueunacomunidad,proyectouorganizaciónpuedeparticiparenesteentornoaportando datos o dotando a sus proyectos deciertas características que pueden ayudar a unmejorposicionamientoydifusióndesusconteni-dosyactividades.

Losproyectosanalizados, aunquemejorables(en especial Schema.org y Freebase), constitu-yen aportaciones de gran interés. Schema.orgmuestra la relevancia que tendrán los procesosde “semantización” de la Web convencional,y por tanto la creación de vínculos, y la consi-

guienteintegración,conconjuntosdedatosRDF.Freebase muestra unposible camino evoluti-vo del modelo wiki, endonde comunidades deusuarios participan enlagestióndescriptivadeobjetos de informacióndemaneraestructurada,y tal vez podría ser unreferente para Wikipe-dia. Kasabi ofrece unavisión esquemática decómoseríanlasplatafor-mas de publicación dedatos semánticos, conlasquepuedendesarro-llarse nuevos modelosdenegocio.

Hay una tendencia general a facilitar lapublicacióndedatossemánticos,yunescenarioen el que surgen tecnologías divergentes conenfoques alternativos sobre la Web semántica.Lasorganizacionesdebenencontrarsuposiciónenestanuevawebsemánticamásabierta,mien-trasquelosdesarrolladoresdebenconsiderarlaaplicación o evolución de tecnologías ya exis-tentesparanovolverapasarporuncaminoyarecorrido.

Resulta imprescindible abrir nuevos focos dedebateydesarrollosobretecnologíasyaplicacio-nesdelaWebsemánticaylinkeddata,porquelawebsemánticaesdetodos.

Referenciasbibliográficas

D’Aquin,Mathieuetal.“Towardanewgenerationof semantic web applications”. Intelligent systems,IEEE,mayode2008,v.23,n.3,pp.20-28.http://dx.doi.org/10.1109/MIS.2008.54

Bizer,Christianetal.“DBpedia:Acrystallizationpo-int for the web of data”. Journal of web semantics:science, services and agents on the world wide web,2009,v.7,n.3pp.154–165.http://dx.doi.org/10.1016/j.websem.2009.07.002

Bollacker, Kurt et al. “Freebase: a collaborativelycreated graph database for structuring humanknowledge”.En:Procs.of the2008ACMSigmod intlconfonmanagementofdata.http://147.46.216.176/w/images/9/98/SC17.pdfhttp://dx.doi.org/10.1145/1376616.1376746

Franklin, Michael; Halevy, Alon; Maier, David.“Fromdatabasestodataspaces:anewabstractionforinformationmanagement”.ACMSigmodRecord,dic.2005,v.34,n.4,pp.27-33.http://www.cs.washington.edu/homes/alon/files/dataspacesDec05.pdfhttp://dx.doi.org/10.1145/1107499.1107502

http://www.talis.com/platform

Page 7: J.9. Prospectiva de la web semántica: divergencia ......Keywords: Semantic web, Linked open data, Microdata, RDFa, Schema.org, Kasabi, Freebase, SaaS, Se-mantic data market, Technological

AnuarioThinkEPI2012

275

??????????????????????????????????????????????????????????????????????

2. http://thedatahub.org

3. http://data.gov.uk

4. http://schema.org

5. Elesquemacompletopuedeconsultarseen:http://schema.org/docs/full.html

6. http://schema.org/docs/documents.html

7. http://freebase.com

8. El manual de MQL también constituye una buenareferenciadelaarquitecturadeFreebase/Metaweb:http://wiki.freebase.com/wiki/MQL_Manual

9. Másinformaciónsobresoftwareasaserviceen:http://en.wikipedia.org/wiki/Software_as_a_service

10. http://kasabi.com

11. http://www.talis.com/platform

12. http://kasabi.com/doc/api

13. http://www.w3.org/html/wg/tracker/issues/76

14. Laclasepolíticay la sociedadengeneral,yaestáhaciéndoseecodeestanecesidad:http://www.elmundo.es/elmundo/2011/12/19/navegante/1324300705.html

***

Supermercadosdelinked dataTomásSaorín

No me convence la tra-ducción de “mercadoslinked data”. Entendemos“mercado” como un con-cepto económico con unasleyes, agentes y dinámicasdeinteracción.

El término original es“marketplace”, que es mástangible: la plaza del mer-cado, el mercado de abas-

tos.Quizáempleando“supermercadosdelinkeddata”nosacercamosmejoralaidea:lugaresfácil-menteaccesiblesalconsumidor,conunapolíticade precios clara y barata, con mucho trasiego yunaofertasurtida.

Elconceptoesclave:losdatosquepuedenseradquiridasdeformacómodaytransparenteparaproducirservicios.

[email protected]

Prospectivadelawebsemántica:divergenciatecnológicaycreacióndemercadoslinkeddata–Juan-AntonioPastor-Sánchez

Heath,Tom.“HowwillweinteractwiththeWebofdata?”Internetcomputing,IEEE,sept.-oct.,2008,v.12,n.5,pp.88-91.http://tomheath.com/papers/heath-2008-how-will-we-interact-with-the-web-of-data.htmlhttp://dx.doi.org/10.1109/MIC.2008.101

Heath,Tom;Bizer,Christian.“Linkeddata:evolvingtheWebintoaglobaldataspace”.Synthesis lecturesonthesemanticweb:theoryandtechnology,2011,v.1,n.1,pp.1-136.http://linkeddatabook.com/book

Isaac,Antoineetal.“LibraryLinkedData IncubatorGroup:datasets,valuevocabularies,andmetadataele-mentsets”.W3CIncubatorGroupReport,25deoctu-brede2011.http://www.w3.org/2005/Incubator/lld/XGR-lld-vocabdataset-20111025

Leimeister,JanMarcoetal.“Leveragingcrowdsour-cing: activation-supporting components for IT-basedideascompetition”.Journalofmanagement informa-tionsystems,2009,v.26,n.1,pp.197-224.http://www.uni-kassel.de/fb7/ibwl/leimeister/pub/JML_124.pdfhttp://dx.doi.org/10.2753/MIS0742-1222260108

Manku, Gurmeet-Singh; Jain, Arvind; Sarman,Anish-Das. “Detecting near-duplicates for webcrawling”. En: Proceedings of the 16th intl conf onWorldWideWebACMNewYork,2007.http://static.googleusercontent.com/external_content/untrusted_dlcp/research.google.com/es/ /pubs/archive/33026.pdfhttp://dx.doi.org/10.1145/1242572.1242592

Pastor-Sánchez, Juan-Antonio. Tecnologías de lawebsemántica.ColecciónElprofesionaldelainforma-ción,n.1,Barcelona:EditorialUOC,2011.ISBN:9788497884747

Saorín, Tomás. “Cómo Linked open data impactaráen las bibliotecas a través de la innovación abierta”.AnuarioThinkEPI,2012,v.6.http://www.thinkepi.net/como-linked-open-data-impactara-en-las-bibliotecas-a-traves-de-la-innovacion-abierta

Sporny,Manu.“Anuber-comparisonofRDFa,micro-dataandmicroformats”.Thebeautiful,tormentedma-chine,25junio,2011.http://manu.sporny.org/2011/uber-comparison-rdfa-md-uf

notas

1. Puede consultarse una traducción de dicho docu-mentoen:http://skos.um.es/Incubator/lld/XGR-lld-vocabdataset