000008795 001__ 8795
000008795 005__ 20150325140121.0
000008795 037__ $$aTAZ-PFC-2012-532
000008795 041__ $$aspa
000008795 1001_ $$aEsteban Pérez, Guillermo
000008795 24500 $$aSistema de extracción de información semántica de la DBpedia
000008795 260__ $$aZaragoza$$bUniversidad de Zaragoza$$c2012
000008795 506__ $$aby-nc-sa$$bCreative Commons$$c3.0$$uhttp://creativecommons.org/licenses/by-nc-sa/3.0/
000008795 520__ $$aHoy en día, nos podemos encontrar cada vez con más información en la Web. Los usuarios, con la llamada Web 2.0, se han vuelto también proveedores de información y cada vez son más los datos disponibles en Internet. La Web Semántica dota toda ésta información de semántica y relaciones, de manera que éstos recursos, hasta ahora sólo consumibles por seres humanos, pueden ser entendidos y tratados por máquinas. Para poder dar formato semántico a los recursos presentes en la Web se usan ontologías, que denen de una manera exhaustiva y rigurosa el modelo conceptual de uno o varios dominios dados. Éstas son utilizadas para etiquetar distintos tipos de recursos de manera que los contenidos pasen a ser procesables por los computadores, pasando a formar parte de esta forma de la Web Semántica, donde los recursos se encuentran estructurados según dichas ontologías. La aparición de estos datos estructurados abre un nuevo camino para las técnicas de Information Retrieval (IR). En este momento, estas técnicas básicamente se realizan como búsquedas sintácticas y probabilísticas, buscando exclusivamente por lexemas y realzando el peso de los resultados más populares en cada búsqueda. El objetivo de este proyecto ha sido el diseño e implementación de una solución de búsqueda híbrida basada en keywords que utiliza la semántica de los recursos para enfocar la búsqueda y posibilitar la búsqueda sobre datos estructurados. Llamamos a este tipo de búsqueda híbrida ya que utiliza técnicas sintácticas y semánticas. Esto se ha implementado sobre un servicio web con los métodos necesarios para poder realizar búsquedas sobre el dominio denido por el usuario. El sistema permite al usuario realizar búsquedas de este tipo sin necesidad de disponer del conocimiento sobre lenguajes de consulta formales que este tipo de búsqueda normalmente requieren. Para realizar tales búsquedas ha sido necesario realizar el aprendizaje de diversas tecnologías hasta ahora no utilizadas durante la carrera. Entre estas tecnologías destacan primero los lenguajes de modelado semántico propuestos por el W3C: OWL y RDF. OWL es un lenguaje para la representación de ontologías basado en Lógicas Descriptivas (Description Logics, DL), mientras que RDF es un lenguaje de modelado de conocimiento con menor expresividad destinado a describir recursos de acuerdo a vocabularios u ontologías externas. El lenguaje RDF ha sido tomado como estándar por la iniciativa Linked Data para la publicación de datos. Dicha iniciativa propone la publicación de datos de manera que éstos queden vinculados semánticamente entre sí. Después de estudiar la relación entre RDF y OWL y su correcto uso, se estudió el lenguaje de consultas SPARQL, sucesor semántico de SQL y lenguaje estándar del W3C para la consulta sobre RDF. Las consultas SPARQL en este proyecto se realizan sobre uno de los puntos de acceso a la DBPedia. Dicho proyecto se dedica a la extracción automática de información semántica de la Wikipedia y actualmente es un referente por la cantidad de datos de los que dispone. Aunque DBPedia dispone de una cantidad de datos considerable, estos están etiquetados según varias ontologías, proporcionando cada una una visión distinta de los contenidos o, como ocurre a menudo, la misma visión doblemente etiquetada o con sutiles diferencias; el estudio de este problema para poner en valor la cantidad de datos que proporciona la iniciativa Linked Data también forma parte del proyecto con objeto de conseguir una recuperación de datos más útil de datos. Por las especificaciones de un proyecto paralelo, el cual requería de este PFC como punto para recuperar información, y con los conocimientos adquiridos durante la fase de aprendizaje, se ha decidido crear un servicio web con diversos métodos que permitan la realización de estas búsquedas de manera desacoplada y general, de manera que el sistema desarrollado no sólo sirviese como punto de acceso para el proyecto paralelo y en el dominio particular especicado (en este caso, el dominio de la mecánica de uidos), sino que este pudiese ser usado en cualquier otro dominio y en otras herramientas con diversos propósitos.
000008795 521__ $$aIngeniero en Informática
000008795 540__ $$aDerechos regulados por licencia Creative Commons
000008795 6531_ $$aontologías
000008795 6531_ $$alinked data
000008795 6531_ $$aweb semántica
000008795 6531_ $$abúsqueda por palabras clave
000008795 700__ $$aBobed Lisbona, Carlos$$edir.
000008795 7102_ $$aUniversidad de Zaragoza$$bInformática e Ingeniería de Sistemas$$cLenguajes y Sistemas Informáticos
000008795 7202_ $$aSerón Arbeloa, Francisco José$$eponente
000008795 8560_ $$f529679@celes.unizar.es
000008795 8564_ $$s1452385$$uhttps://zaguan.unizar.es/record/8795/files/TAZ-PFC-2012-532.pdf$$yMemoria (spa)
000008795 8564_ $$s1493810$$uhttps://zaguan.unizar.es/record/8795/files/TAZ-PFC-2012-532_ANE.pdf$$yAnexos (spa)
000008795 909CO $$ooai:zaguan.unizar.es:8795$$pdriver$$pproyectos-fin-carrera
000008795 950__ $$a
000008795 980__ $$aTAZ$$bPFC$$cEINA
Universidad de Zaragoza Repository