TAZ-TFM-2020-1093


Anonimización para minería de datos en entornos médicos

Liñayo Vega, Verónica
Ilarri Artigas, Sergio (dir.)

Universidad de Zaragoza, EINA, 2020
Departamento de Informática e Ingeniería de Sistemas, Área de Lenguajes y Sistemas Informáticos

Máster Universitario en Ingeniería Informática

Resumen: Este trabajo es un estudio sobre la anonimización de datos en contextos médicos, partiendo del estado del arte y las diversas técnicas y herramientas disponibles para anonimizar datos hoy en día, en donde se seleccionan y evalúan conjuntos de datos médicos con el fin de comparar diversas técnicas y su impacto.
Para agilizar la evaluación sobre los datos se desarrolla una aplicación basada en Java, mediante la cual a través de la integración con la API de Weka (herramienta para minería de datos) y mediante el uso de herramientas externas como R, se genera una herramienta que permita la comparación entre diversas técnicas de anonimización seleccionadas, con lo cual se puede observar el impacto que dichas técnicas pueden tener sobre los conjuntos de datos estudiados.
Mediante la aplicación desarrollada en la elaboración de este trabajo es posible realizar un análisis en el cual se estudia la posible relación entre el impacto generado por la anonimización y las diversas técnicas aplicadas, permitiendo estudiar así el nivel de compromiso privacidad-precisión que se obtiene tras aplicar las técnicas de anonimización. De esta forma se demuestra que las diversas técnicas de anonimización estudiadas pueden tener mayor o menor impacto en el nivel de compromiso privacidad-precisión obtenido para los conjuntos de datos estudiados, y que dicho impacto depende de varios factores, como el tipo de anonimización aplicada, el tipo de clasificador usado, el conjunto de datos, los diversos tipos de atributos encontrados dentro del conjunto de datos, entre otros.
Se espera que el trabajo desarrollado sirva como base para futuros trabajos e investigaciones llevadas a cabo por grupos de investigación de la Universidad de Zaragoza, en particular el grupo COSMOS (Computer Science for Complex System Modelling). Además, podría servir también de aplicación en contextos docentes, como base de estudio en asignaturas como Manipulación y Análisis de Grandes Volúmenes de Datos del Máster Universitario en Ingeniería Informática.


Tipo de Trabajo Académico: Trabajo Fin de Master

Creative Commons License



El registro pertenece a las siguientes colecciones:
Trabajos académicos > Trabajos Académicos por Centro > Escuela de Ingeniería y Arquitectura
Trabajos académicos > Trabajos fin de máster



Volver a la búsqueda

Valore este documento:

Rate this document:
1
2
3
 
(Sin ninguna reseña)