000096267 001__ 96267
000096267 005__ 20201120151202.0
000096267 037__ $$aTAZ-TFM-2020-1093
000096267 041__ $$aspa
000096267 1001_ $$aLiñayo Vega, Verónica
000096267 24200 $$aAnonymization for data mining in medical environments
000096267 24500 $$aAnonimización para minería de datos en entornos médicos
000096267 260__ $$aZaragoza$$bUniversidad de Zaragoza$$c2020
000096267 506__ $$aby-nc-sa$$bCreative Commons$$c3.0$$uhttp://creativecommons.org/licenses/by-nc-sa/3.0/
000096267 520__ $$aEste trabajo es un estudio sobre la anonimización de datos en contextos médicos, partiendo del estado del arte y las diversas técnicas y herramientas disponibles para anonimizar datos hoy en día, en donde se seleccionan y evalúan conjuntos de datos médicos con el fin de comparar diversas técnicas y su impacto. <br />Para agilizar la evaluación sobre los datos se desarrolla una aplicación basada en Java, mediante la cual a través de la integración con la API de Weka (herramienta para minería de datos) y mediante el uso de herramientas externas como R, se genera una herramienta que permita la comparación entre diversas técnicas de anonimización seleccionadas, con lo cual se puede observar el impacto que dichas técnicas pueden tener sobre los conjuntos de datos estudiados.<br />Mediante la aplicación desarrollada en la elaboración de este trabajo es posible  realizar un análisis en el cual se estudia la posible relación entre el impacto generado por la anonimización y las diversas técnicas aplicadas, permitiendo estudiar así el nivel de compromiso privacidad-precisión que se obtiene tras aplicar las técnicas de anonimización. De esta forma se demuestra que las diversas técnicas de anonimización estudiadas pueden tener mayor o menor impacto en el nivel de compromiso privacidad-precisión obtenido para los conjuntos de datos estudiados, y que dicho impacto depende de varios factores, como el tipo de anonimización aplicada, el tipo de clasificador usado, el conjunto de datos, los diversos tipos de atributos encontrados dentro del conjunto de datos, entre otros.<br />Se espera que el trabajo desarrollado sirva como base para futuros trabajos e investigaciones llevadas a cabo por grupos de investigación de la Universidad de Zaragoza, en particular el grupo COSMOS (Computer Science for Complex System Modelling). Además, podría servir también de aplicación en contextos docentes, como base de estudio en asignaturas como Manipulación y Análisis de Grandes Volúmenes de Datos del Máster Universitario en Ingeniería Informática.<br /><br />
000096267 521__ $$aMáster Universitario en Ingeniería Informática
000096267 540__ $$aDerechos regulados por licencia Creative Commons
000096267 700__ $$aIlarri Artigas, Sergio$$edir.
000096267 7102_ $$aUniversidad de Zaragoza$$bInformática e Ingeniería de Sistemas$$cLenguajes y Sistemas Informáticos
000096267 8560_ $$f742505@unizar.es
000096267 8564_ $$s9270195$$uhttps://zaguan.unizar.es/record/96267/files/TAZ-TFM-2020-1093.pdf$$yMemoria (spa)
000096267 909CO $$ooai:zaguan.unizar.es:96267$$pdriver$$ptrabajos-fin-master
000096267 950__ $$a
000096267 951__ $$adeposita:2020-11-20
000096267 980__ $$aTAZ$$bTFM$$cEINA
000096267 999__ $$a20200922183351.CREATION_DATE