j.9. prospectiva de la web semántica: divergencia ......keywords: semantic web, linked open data,...
TRANSCRIPT
AnuarioThinkEPI2012
269
??????????????????????????????????????????????????????????????????????
J.9.Prospectivadelawebsemántica:divergenciatecnológicaycreacióndemercadoslinked data
Juan-AntonioPastor-Sánchez
20diciembre2011
Pastor-Sánchez,Juan-Antonio.“Prospectivadelawebsemántica:divergenciatecnológicaycreacióndemercadoslinkeddata”.AnuarioThinkEPI,2012,v.6,pp.269-275.
Resumen: Se presentan algunas tendencias en el entorno de la web semántica:Schema.org,unproyectodesarrolladoporGoogle,YahooyBingparaelmarcadose-mánticomediantemicrodatos;Freebase,unbancodeconocimientoparalaestruc-turacióndedatosyKasabi,unaplataformaqueoperaenlamodalidad“softwareasaservice”paralapublicaciónycomercializacióndedatossemánticos.Seobservaciertadivergenciatecnológicaenlaaplicacióndeestándaresdelawebsemánticaconeldesarrollodenuevaspropuestascomolosmicrodatos,asícomoelsurgimien-todeunmercadolinkeddataatravésdeplataformasdepublicaciónquefacilitansucomercialización.
Palabrasclave:Websemántica,Linkedopendata,Microdatos,RDFa,Schema.org,Kasabi,Freebase,SaaS,Mercadodedatossemánticos,Divergenciatecnológica.
Title:Prospectiveforthesemanticweb:technologicaldivergenceandlinkeddatamarketscre-ation
Abstract:Thispapershowssometrendsthatarecurrentlyoccurringintheenvironmentofthesemanticweb.Morespecifically itpresentsschema.org,aprojectdevelopedbyGoogle,YahooandBing for se-manticmarkupusingmicrodata,Freebase,aknowledgebankforstructuredinformationandKasabi,aplatformthatoperatesintothemodalityof“SoftwareasaService”forthepublicationandcommercialdistributionofsemanticdata.Itispossibleseesometechnologicaldivergenceintheapplicationofseman-ticWebstandardswiththedevelopmentofnewproposalsasmicrodata,andtheemergenceofamarketforlinkeddatathroughpublishingplatformsthatfacilitatecommercialization.
Keywords:Semanticweb,Linkedopendata,Microdata,RDFa,Schema.org,Kasabi,Freebase,SaaS,Se-manticdatamarket,Technologicaldivergence.
Prospectivadelawebsemántica:divergenciatecnológicaycreacióndemercadoslinkeddata–Juan-AntonioPastor-Sánchez
Elprogresivodesplieguedelawebsemánticaen los últimos años está produciendo nuevosservicios en la Web. Buena muestra de elloson las soluciones planteadas al amparo de lacorrientelinkedopendata,laprogresivaadop-cióndeRDFydeservicioswebbasadosenSparqlEndpoint.
Laelaboraciónypublicacióndeestosdatosserealizaporpartedeespecialistaseinstituciones,dentro del ámbito de proyectos de gran enver-gadura o sobre temas concretos. Es relevanteel documento sobre vocabularios y conjuntosde datos enlazados bibliotecarios (Isaac et al.,2011)1,elcatálogo“Thedatahub”deCKAN2oel“Openingupgovernment”delReinoUnido3.
Existeuninteréscrecienteporpartedeorga-nismosyempresasparapublicardatosutilizandotécnicas que incrementen la interoperabilidadde los mismos (Heath yBizer, 2011), con vistasasuaplicaciónyexplotaciónenfuturosservicios.Otrotipodeiniciativassecentranenexperimen-
taraspectosrelacionadosconladisponibilidadyreutilizacióndecantidadesmasivasdedatos,talycomosehacedesdeelproyectoDBpedia.Experi-mentary“jugar”conlasnuevasideasypropues-tasesunpasoindispensableparaeldesarrollodenuevastecnologíasenlaWeb(Saorín,2011).
Las iniciativas anteriores comparten una mis-ma premisa: la publicación de datos “ad-hoc”para laweb semántica, ya seaapartirdebasesde datos de aplicaciones (catálogos, directorios,fondos documentales), vocabularios controlados(Agrovoc, Rameau, Lcsh, STW, LEM) u otro tipode productos resultado del procesamiento dedatosyfuentesdeinformacióndediversaíndole,siendoDBpedia elnúcleocentralde lanubedeinterrelaciones en el ecosistema de linked opendata(Bizeretal.,2009).
Otrosenfoquessecentranen:– “semantización” de contenidos de sitios
webcreadosparasupublicaciónyconsultaparaelusuariofinal;
AnuarioThinkEPI2012
270
???????????????????????????????????????????????????????????????????Prospectivadelawebsemántica:divergenciatecnológicaycreacióndemercadoslinkeddata–Juan-AntonioPastor-Sánchez
– servicios orientados a la publicación cola-borativa de datos para la creación de bases deconocimientoestructurado;
– plataformas para la gestión de conjuntosdedatos.
Son aproximaciones cuyo uso está abierto alpúblico y están centradas en la descripción decontenidos, recursos y objetos desde una pers-pectivasemántica.
Schema.org
Comenzósuandadurael2de juniode2011.EstádesarrolladodeformaconjuntaporGoogle,YahooyBing.Aprimeravistapuedesorprenderque estos tres motores de búsqueda, aparente-mente competidores, colaboren para crear unproyecto.Laexpansióndelasaplicacionesyser-viciosdelaweb2.0hacomplicadoelpanoramade las búsquedas en la Web. Los motores debúsquedahantenidoqueadaptarseaestanuevarealidad,modificandosusalgoritmosderelevan-cia, detectando duplicaciones, evitando técnicasdecloackingostuffing,promocionandoconteni-dos de calidad contrastada o filtrando según lanaturalezadelrecurso.Todoellosinentrarenlafiabilidad, la calidad o la usabilidad de los con-tenidos. La solución es obvia: incluir metadatosdentrodelospropioscontenidosweb.
Sin embargo, anexar metadatos sobre aspec-tosgeneralesdeunapágina(descripción,autoría,palabras clave) tieneuna importante limitación:no permite describir semánticamente aspectosdetalladosdelcontenido,peseaqueenmuchasocasiones contenga información altamenteestructurada,originalmentealmacenadaenbasesdedatos.Unapáginawebconinformaciónsobrela cartelera de cine incluye información sobrepelículas,horariode sesiones,precios,ubicacióndelasala,etc.Generalmentelainformaciónestamarcadaparaobtenerunformatoadecuadoparasuvisualizacióny lecturaporpartedepersonas.Pero también sería de gran utilidad que dichapáginatuvieraunmarcadosemántico,enelquetodos esos datos estuvieran descritos de formaexplícita y detallada, para su posterior procesa-mientoporpartedeotrasaplicaciones.
De este modo, sería muy sencillo plantear yresolverunaconsultaparaconocerquépelículasseproyectanentrelas18:00ylas21:00horasenun radio de 1.500 metros del lugar en el quereside el usuario. Otro ejemplo: los diferentesmediosdetransporte(autobuses,trenes,aviones)disponendepáginasdondesemuestranhorariosdesaliday llegada,precioorecorrido.Estetipode información es una muestra más de infor-mación altamente estructurada y susceptible derepresentarsemediantealgúntipodeontología
para su procesamiento y posterior ejecución deinferencias: en este caso, podría ser el trayectoóptimoentredosciudades.
Precisamente,esoloqueofreceSchema.org4,unapseudo-mega-ontología,enformadeesque-madecaráctergeneral,queintentarepresentaruna amplia variedad de hechos: obras, eventos,intangibles, organizaciones, personas, lugares yproductos.Partiendodelasuperclase“thing”,sedefinenvarioscientosdeclasesysubclases(tipos),conmultituddepropiedades,quepermitenreali-zardescripcionesdetalladasyespecíficassobreundeterminadoelementoinformativo5.
El modelo de datos utilizado deriva de RDF,de manera que: los tipos se estructuran en unajerarquíamúltiple(untipopuedesersubclasedemásdeuntipo)dotadadeherenciadepropieda-des,altiempoqueeldominioyelrangodeéstaspuedenestarconstituidospormásdeuntipo.Elesquema general no puede modificarse por losusuarios,peroseproporcionaunmecanismoparasu extensión mediante la derivación de tipos ypropiedadesgeneralesy,portanto,laadaptaciónanecesidadesconcretas6.
LaaplicacióndeSchema.orgestá íntimamen-te ligada al desarrollo de html5, puesto que sebasaenelusodemicrodatosparalainclusióndeinformaciónsemántica.Elresultadofinal,esunapáginawebquepuedeserutilizadaporunaapli-caciónoagenteinformáticoparalaextraccióndeinformaciónsemánticamenterelevantedeformamuchomásprecisayexactaqueotrotipodetéc-nicascomoelscreenscrapingoelwebminning.
ElobjetivodeSchema.orgesofrecerunmeca-nismoparaelmarcadosemánticodelcódigohtml,haciendoqueunapáginawebseaunobjetopro-cesableparalaextraccióndeinformaciónsemán-
AnuarioThinkEPI2012
271
??????????????????????????????????????????????????????????????????????Prospectivadelawebsemántica:divergenciatecnológicaycreacióndemercadoslinkeddata–Juan-AntonioPastor-Sánchez
tica.Lasimplicacionesdeestetipodesoluciónenel funcionamiento de los motores de búsquedason considerables: puesto que estos funcionanmejor con información estructurada, las bús-quedas serían más precisas, las posibilidades defiltrado aumentarían la versatilidad del procesode recuperación de información, los resultadospodríanvisualizarsedeformamáspersonalizadaalosgustosdeusuario,etc.Almismotiemposeabren nuevos horizontes en la reutilización dedichoscontenidosporpartedeterceros.
Freebase
Su objetivo es la creación de una gran basedeconocimientoyno,comoenelcasodeSche-ma.org, el marcado semántico de páginas html.Cualquiera puede registrarse como usuario eintroducir datos siguiendo un esquema propiooreutilizaralgunoyaexistenteenFreebase.Losesquemas incluyentiposypropiedadesqueper-mitendescribirobjetosdeinformación,queenlaterminologíadeFreebasesedenominan“topics”.Los datos pueden introducirse manualmente outilizaralgunasherramientasparasucargamasi-va(Bollacker,2008).
Trashabituarsealentorno,terminologíayfun-cionesdeFreebase,setienelasensacióndeestartrabajando en una wiki de carácter semántico,en la que los “topics” desempeñan el papel delosartículosdeWikipedia yen laquecualquiermiembrodelacomunidadpuederealizaraporta-cionesycorreccionessobrelosdatos.Actualmen-te contiene más de 20 millones de “topics”. LalicenciadeusodedichoscontenidosesCreativeCommonsAttribution(CC-BY).
UnodelosaspectosmásinteresantesdeFree-baseeselenormepotencialpara lacreacióndeaplicaciones,encualquierplataforma,quepermi-talaexplotacióndesusdatos.Existeunaapifor-madaporunconjuntodeservicioswebRESTmuysencillos,quepermiten laconsultay laescritura(previa identificación como usuario autorizado)de datos. Freebase utiliza Json (como formatoparael intercambiodedatos)yMQL,comolen-guajedeconsulta8.Estamosanteunservicioquenosóloaportaunaplataformaparalagestiónyconsultadelosdatos,sinoqueademásofreceunampliosoportealdesarrollodeaplicaciones.
Se ofrece un soporte muy básico para RDF,permitiendo acceder a la descripción de cada“topic”medianteRDF/XML.Tambiénpuededes-cargarse un volcado completo de Freebase enformatoTSV.
UnindiciodelimpactoqueestáteniendoestetipodeservicioseslaadquisicióndeMetaweb(lacompañíaquedesarrollóFreebase)porpartedeGoogleen2010.
Kasabi
FreebaseySchema.orgtienenaproximacionespropias,quedifierenenmuchosaspectosde lassoluciones desarrolladas para la web semánticaenel senodelW3C.NingunadeellasutilizadeunmodoclaroelmodelodedatospropuestoporRDF(esencialenlawebsemántica)nihaceusodeotrastecnologíasquepodríanseraplicadas,comoRDFa(enelcasodeSchema.org)oSparql(enelcasodeFreebase).
Ambasofrecenunaaplicacióninmediataysen-cilladealgunosplanteamientosdelawebsemán-
tica, y ofrecen meca-nismos para extenderlos esquemas de des-cripción generales. Sinembargo, suénfasisensimplificar los procesosdegestiónyusodelosdatos les hace optarpor no utilizar ciertosaspectosnormativosdelW3C.
Otrostiposdeusua-rios tal vez prefieranatenersealasdiferentesrecomendaciones delW3C y puedan gene-rarsuspropiosdatosenunformatoquecumpladichas especificaciones.Estos usuarios podríangenerarsalidasenRDF/XML o Turtle a partir
AnuarioThinkEPI2012
272
???????????????????????????????????????????????????????????????????Prospectivadelawebsemántica:divergenciatecnológicaycreacióndemercadoslinkeddata–Juan-AntonioPastor-Sánchez
de bases de datos propias, y precisarían de unaplataforma software as a service (SaaS)9 paragestionar dichos datos, visualizarlos o definirSparql Endpoints (Heath, 2008). Esto es lo queofreceKasabi10:unaplataformaparalagestiónydiseminacióndedatosRDF.
KasabiestábasadoenlaplataformaTalis11y,ademásdeofrecersoporteparaelalmacenamien-tode conjuntosdedatos (datasets), disponedeuncompletorepertoriodeapis(supuntofuerte)para lagestiónyaccesoa losdatos.Dichasapisson muy flexibles, siendo posible personalizarciertosparámetrosdefiniendovistas, filtros, for-matosyestilosdevisualización.Lasapissebasanen la definición servicios web REST o de SparqlEndpoints.Elaccesoa lasapis,yportantoa losdatosparasuexplotaciónyreutilización,serea-lizaatravésdeunaclaveasociadaalconjuntodedatosencuestión12.
Trasregistrarsecomousuarioesposiblecrearnuevos conjuntos de datos (hasta cinco en estaversión beta), configurar ciertos aspectos (esta-dodepublicación, categorías temáticas, tipodelicenciade losdatos,etc.)ymantener losdatos.Éstospuedenañadirsedirectamenteaundataset,indicandounauriomedianteextracciónRDFadeunurlconcreto.ElmodeloutilizadoesRDF.Kasa-bisiguelasrecomendacionesdelW3Cencuantoalusodetecnologíasdelawebsemántica.
Divergenciatecnológica
Uno de los aspectos más llamativos de Sche-ma.org y Freebase es el planteamiento de unadivergenciaenrelaciónconciertosplanteamien-
tosdelW3C.ElmodeloRDFprácticamentenosecontemplay,sisehace–visualizaciónRDFdelos“topics” en Freebase–, es mediante una aplica-ciónmuygeneral.
EnelcasodeSchema.orgelmodelodedescrip-ciónesjerárquico.ElusodemicrodatosfrenteaRDFasuponeunmotivodeconfusión.Estepuntoresultauntantopolémicopuestoqueseplanteaunaposiblebarreraentrehtmlyxhtml,deformaque los microdatos se utilicen en html5 y RDFaenxhtml13.
Esto puede resultar problemático debido alasdiferenciasdemodeloentreambasopciones:mientrasquelosmicrodatostienenunaestructurajerárquica,RDFautilizaelmodelogeneraldeRDFbasadoengrafos(Sporny,2011).PorestemotivoesposiblerealizarelmapeadodeunaestructurademicrodatosaRDFa,peronoalainversa.RDFaes mucho más flexible ya que permite la com-binación de múltiples vocabularios y esquemasRDF,mientrasqueSchema.org secentraenunaestructuraad-hocdetiposypropiedades.
Asípues,elusodelosmicrodatosysucapaci-daddeinteroperabilidadenelfuturoesincierta.Lasencillezdesusintaxis,frentealamayorcom-plejidaddeRDFa,aducidaporlosresponsablesdeSchema.org, no es motivo suficiente para optarpor dicha solución. Sobre todo si se tiene encuentaqueelusodeunauotratecnologíaestarámediadoporunsistemadegestióndecontenidos(CMS),querealizaráelmapeadoentrelasestruc-turas internasde loscontenidosy loselementosdelosesquemasdemetadatoscorrespondientes,ylaconsiguientegeneraciónautomáticadecódi-gohtml/xhtml.
Seríarecomendablequeenunfuturosealcan-zarantresobjetivos:
– separar las especificaciones de microdatosyRDFadeunlenguajedemarcadoconcreto;deestaformaambasopcionespodríanusarsetantoenhtml5comoenxhtml;
– losmotoresdebúsquedadeberíanconside-rarambasopciones;
– irmásalládelesquemapropuestoenSche-ma.org; además de no obligar a adoptar unesquemaconcreto,podríanincorporarsedescrip-cionesderecursosconvocabulariosRDFconunasemánticabiendefinida.
Otro punto de separación lo constituyen losmecanismos de extensión de los esquemas pro-puestos tanto por Freebase como por Schema.org. La capacidad de ultra-personalización queofrecenambas iniciativasconstituyeunarmadedoblefilo:porunladoofrecelibertadtotalparaladerivacióndeelementosdelesquema,peroporotropuedesucederqueserepresenteciertotipode información con elementos definidos por elusuario,enlugardeconlostiposypropiedadespropiosdeSchema.orgparaello.
AnuarioThinkEPI2012
273
??????????????????????????????????????????????????????????????????????Prospectivadelawebsemántica:divergenciatecnológicaycreacióndemercadoslinkeddata–Juan-AntonioPastor-Sánchez
Los esquemas propuestos por Schema.org yFreebasesonrealmenteextensos,sucomprensiónescompleja,yelámbitodeaplicacióndealgunoselementosdescriptivospuederesultarconfuso.Siunwebmasternocomprendeunelemento–onolocalizaalgunoqueleresulteapropiado–definiráuno nuevo. Esto puede producir una dispersiónsemánticaenladescripciónderecursosquepuedeprovocarresultadosnodeseadosenlosprocesosdebúsqueda.Elusodeesquemasmáspequeñosysencillosproporcionaunavisiónmodulardelawebsemánticaqueresultamuchomásadecuadaenladescripciónderecursos.
En el caso de Freebase encontramos otroaspecto que se separa de las tecnologías de lawebsemántica:MQL.AunqueenalgunospuntosMQLessimilaraSparql,susintaxisestotalmentedistintayaque sebasaen Json, y supotenciali-dades inferiora lade Sparql. En realidadMQL(metaweb query language) no es un lenguajepropiamentedichosetratadeunaapiquepermi-tedefinirciertospatronescomocondicionesquedebencumplirlosdatosarecuperar.Elgradodeinteroperabilidadde losdatosdeFreebase seríamayorsicadaconjuntodedatoscontaraconunSparqlendpoint.
Mercadolinked data,SaaSyapis:evolucionesnecesarias
Lawebsemánticaprecisadeciertoselementosqueaumentensuradiodeacciónycontribuyanaincrementarsudespliegue.Kasabisugiereyllevaalaprácticaalgunasideasyconceptosquepue-denresultardegraninterésalosprofesionalesyusuariosqueoperenenesteentorno.
Hablar de un mercado de datos a partir dela web semántica y de linked open data puederesultar un contrasenti-do, pero resulta nece-sario hacerlo y referir-se a linked data (sin el“open”)paracrearnue-vosmodelosdenegocioyoportunidades.
Dichomercadopodríamatizarse, así como losservicios y productosobjeto de la compra-venta:podríancomprar-se los datos en su tota-lidad o parte de ellos,conmayoromenornivelde granularidad (con laconsiguiente diferenciade tarifas), ofrecer unproductobásicogratuitoy otro producto comer-
cial mucho más avanzado, con datos añadidosproductodeunprocesamientodelosdatosorigi-nales.Comparandoestenuevomercadoconeldelosmediosdecomunicaciónen internet,esfácilllegara laconclusióndequeelcaminoaseguirsería muy similar. Evidentemente hay aspectosquehabríaqueafinarenestemodelo:derechosdeexplotacióndedatosenfuncióndesuorigen,licenciasdeuso,inclusióndepublicidad,etc.
Laaportacióndeconjuntosdedatosdeorga-nismoseinstitucionespúblicasdesempeñaríaunpapel fundamental, constituyendo núcleos dedatosenlazadosabiertosa suusoyexplotaciónpúblicos.Lasociedadinvierteenlagestióndigitalycotidianadedichosdatos,yenunfuturoinme-diatodeberáserobligacióndelasadministracio-nespúblicas ladifusiónde losmismosdeformadesagregada, no en forma de documentos, yaquedeestemodoseconsiguemayorversatilidadparasureutilización.
El uso de dichas aportaciones por parte deorganizaciones privadas para su procesamientoconvistasa incorporarvalorañadido,generaríanuevos focos de negocio y por tanto empleo ycrecimiento económico, además de difundir lasactividades de las administraciones públicas enestesentido14.
En este modelo de negocio resulta funda-mentallaexistenciadeplataformasSaaSdeusogratuitoconciertaslimitacionesyquecubriríanlas necesidades de gestión y publicación dedatos de la mayor parte de entidades públicaso de cualquier otra procedencia, siempre ycuando tuvieran licencias de uso tipo CreativeCommons. Para otro tipo de requisitos asocia-dos a la explotación comercial de dichos datosmedianteaccesorestringidoaestasplataformas,sepodríadisponerdeserviciosdepagoconunampliocatálogodeapis:limitacióndelaccesoa
http://kasabi.com
AnuarioThinkEPI2012
274
???????????????????????????????????????????????????????????????????Prospectivadelawebsemántica:divergenciatecnológicaycreacióndemercadoslinkeddata–Juan-AntonioPastor-Sánchez
datasetsmedianteclavesdeautenticación,apli-cacióndeestilosvisuales,sistemasdebúsquedaavanzados, incorporación de fuentes de datosexternas,definicióndeontologías,ejecucióndeinferenciasetc.
En cuanto a las apis para la reutilización dedatos, también puede observarse que se estánincorporando los principios de crowdsourcingpara su desarrollo. Este modelo no es nuevo,puesto que, en gran medida, la implantación yevolucióndelosCMSsedebealdesarrollodesucatálogo de plugins y módulos (mediante estemodelo(Leimeisteretal.,2009).
Enelcasodelasplataformasparalapublica-ción de datos semánticos, se debería seguir unmodelosimilar,queenriquecieralasaplicacionesyconcapacidaddereutilizacióndelosdatos.Deestemodo,seríanlospropioseditoresyusuariosdedatos(ynoúnicamentelosprogramadores)losquemarcaríanlastendenciasynecesidadesenelámbitodelawebsemántica.
Conclusiones:apertura,semantizacióneintegración
El conocimiento estratégico del momentumactualdelawebsemánticapuedeayudaradeci-direlmodoenelqueunacomunidad,proyectouorganizaciónpuedeparticiparenesteentornoaportando datos o dotando a sus proyectos deciertas características que pueden ayudar a unmejorposicionamientoydifusióndesusconteni-dosyactividades.
Losproyectosanalizados, aunquemejorables(en especial Schema.org y Freebase), constitu-yen aportaciones de gran interés. Schema.orgmuestra la relevancia que tendrán los procesosde “semantización” de la Web convencional,y por tanto la creación de vínculos, y la consi-
guienteintegración,conconjuntosdedatosRDF.Freebase muestra unposible camino evoluti-vo del modelo wiki, endonde comunidades deusuarios participan enlagestióndescriptivadeobjetos de informacióndemaneraestructurada,y tal vez podría ser unreferente para Wikipe-dia. Kasabi ofrece unavisión esquemática decómoseríanlasplatafor-mas de publicación dedatos semánticos, conlasquepuedendesarro-llarse nuevos modelosdenegocio.
Hay una tendencia general a facilitar lapublicacióndedatossemánticos,yunescenarioen el que surgen tecnologías divergentes conenfoques alternativos sobre la Web semántica.Lasorganizacionesdebenencontrarsuposiciónenestanuevawebsemánticamásabierta,mien-trasquelosdesarrolladoresdebenconsiderarlaaplicación o evolución de tecnologías ya exis-tentesparanovolverapasarporuncaminoyarecorrido.
Resulta imprescindible abrir nuevos focos dedebateydesarrollosobretecnologíasyaplicacio-nesdelaWebsemánticaylinkeddata,porquelawebsemánticaesdetodos.
Referenciasbibliográficas
D’Aquin,Mathieuetal.“Towardanewgenerationof semantic web applications”. Intelligent systems,IEEE,mayode2008,v.23,n.3,pp.20-28.http://dx.doi.org/10.1109/MIS.2008.54
Bizer,Christianetal.“DBpedia:Acrystallizationpo-int for the web of data”. Journal of web semantics:science, services and agents on the world wide web,2009,v.7,n.3pp.154–165.http://dx.doi.org/10.1016/j.websem.2009.07.002
Bollacker, Kurt et al. “Freebase: a collaborativelycreated graph database for structuring humanknowledge”.En:Procs.of the2008ACMSigmod intlconfonmanagementofdata.http://147.46.216.176/w/images/9/98/SC17.pdfhttp://dx.doi.org/10.1145/1376616.1376746
Franklin, Michael; Halevy, Alon; Maier, David.“Fromdatabasestodataspaces:anewabstractionforinformationmanagement”.ACMSigmodRecord,dic.2005,v.34,n.4,pp.27-33.http://www.cs.washington.edu/homes/alon/files/dataspacesDec05.pdfhttp://dx.doi.org/10.1145/1107499.1107502
http://www.talis.com/platform
AnuarioThinkEPI2012
275
??????????????????????????????????????????????????????????????????????
2. http://thedatahub.org
3. http://data.gov.uk
4. http://schema.org
5. Elesquemacompletopuedeconsultarseen:http://schema.org/docs/full.html
6. http://schema.org/docs/documents.html
7. http://freebase.com
8. El manual de MQL también constituye una buenareferenciadelaarquitecturadeFreebase/Metaweb:http://wiki.freebase.com/wiki/MQL_Manual
9. Másinformaciónsobresoftwareasaserviceen:http://en.wikipedia.org/wiki/Software_as_a_service
10. http://kasabi.com
11. http://www.talis.com/platform
12. http://kasabi.com/doc/api
13. http://www.w3.org/html/wg/tracker/issues/76
14. Laclasepolíticay la sociedadengeneral,yaestáhaciéndoseecodeestanecesidad:http://www.elmundo.es/elmundo/2011/12/19/navegante/1324300705.html
***
Supermercadosdelinked dataTomásSaorín
No me convence la tra-ducción de “mercadoslinked data”. Entendemos“mercado” como un con-cepto económico con unasleyes, agentes y dinámicasdeinteracción.
El término original es“marketplace”, que es mástangible: la plaza del mer-cado, el mercado de abas-
tos.Quizáempleando“supermercadosdelinkeddata”nosacercamosmejoralaidea:lugaresfácil-menteaccesiblesalconsumidor,conunapolíticade precios clara y barata, con mucho trasiego yunaofertasurtida.
Elconceptoesclave:losdatosquepuedenseradquiridasdeformacómodaytransparenteparaproducirservicios.
Prospectivadelawebsemántica:divergenciatecnológicaycreacióndemercadoslinkeddata–Juan-AntonioPastor-Sánchez
Heath,Tom.“HowwillweinteractwiththeWebofdata?”Internetcomputing,IEEE,sept.-oct.,2008,v.12,n.5,pp.88-91.http://tomheath.com/papers/heath-2008-how-will-we-interact-with-the-web-of-data.htmlhttp://dx.doi.org/10.1109/MIC.2008.101
Heath,Tom;Bizer,Christian.“Linkeddata:evolvingtheWebintoaglobaldataspace”.Synthesis lecturesonthesemanticweb:theoryandtechnology,2011,v.1,n.1,pp.1-136.http://linkeddatabook.com/book
Isaac,Antoineetal.“LibraryLinkedData IncubatorGroup:datasets,valuevocabularies,andmetadataele-mentsets”.W3CIncubatorGroupReport,25deoctu-brede2011.http://www.w3.org/2005/Incubator/lld/XGR-lld-vocabdataset-20111025
Leimeister,JanMarcoetal.“Leveragingcrowdsour-cing: activation-supporting components for IT-basedideascompetition”.Journalofmanagement informa-tionsystems,2009,v.26,n.1,pp.197-224.http://www.uni-kassel.de/fb7/ibwl/leimeister/pub/JML_124.pdfhttp://dx.doi.org/10.2753/MIS0742-1222260108
Manku, Gurmeet-Singh; Jain, Arvind; Sarman,Anish-Das. “Detecting near-duplicates for webcrawling”. En: Proceedings of the 16th intl conf onWorldWideWebACMNewYork,2007.http://static.googleusercontent.com/external_content/untrusted_dlcp/research.google.com/es/ /pubs/archive/33026.pdfhttp://dx.doi.org/10.1145/1242572.1242592
Pastor-Sánchez, Juan-Antonio. Tecnologías de lawebsemántica.ColecciónElprofesionaldelainforma-ción,n.1,Barcelona:EditorialUOC,2011.ISBN:9788497884747
Saorín, Tomás. “Cómo Linked open data impactaráen las bibliotecas a través de la innovación abierta”.AnuarioThinkEPI,2012,v.6.http://www.thinkepi.net/como-linked-open-data-impactara-en-las-bibliotecas-a-traves-de-la-innovacion-abierta
Sporny,Manu.“Anuber-comparisonofRDFa,micro-dataandmicroformats”.Thebeautiful,tormentedma-chine,25junio,2011.http://manu.sporny.org/2011/uber-comparison-rdfa-md-uf
notas
1. Puede consultarse una traducción de dicho docu-mentoen:http://skos.um.es/Incubator/lld/XGR-lld-vocabdataset