000064198 001__ 64198
000064198 005__ 20171221155213.0
000064198 037__ $$aTAZ-TFG-2017-2848
000064198 041__ $$aspa
000064198 1001_ $$aFernández Poza, Alejandro
000064198 24200 $$aComparison between anonymization algorithms: Mondrian and Datafly
000064198 24500 $$aComparación de algoritmos de anonimización: Mondrian y Datafly
000064198 260__ $$aZaragoza$$bUniversidad de Zaragoza$$c2017
000064198 506__ $$aby-nc-sa$$bCreative Commons$$c3.0$$uhttp://creativecommons.org/licenses/by-nc-sa/3.0/
000064198 520__ $$aEl presente trabajo muestra una comparación de dos algoritmos para lograr la k-anonimización de un conjunto de datos. El primero es Datafly (1997-1998), un algoritmo heurístico cuyas principales herramientas son la generalización y la supresión de tuplas. El segundo algoritmo es Mondrian (2005), de desarrollo  posterior, que basa su estrategia en la partición multidimensional de los datos, perdiendo en cierto modo el clásico enfoque tabular (filas-individuos y columnas-atributos). 	Ambos algoritmos se han implementado desde cero, en un mismo lenguaje de programación (Java) y siguiendo lo más fielmente posible la idea expresada en los trabajos originales. Todo ello para poder realizar una comparación lo más justa posible. Como ambos algoritmos tienen algunas partes sin detallar, se han tomado ciertas decisiones de diseño e implementación que podrían afectar a la comparación, por ello se describen en este trabajo para que se pueda tener en cuenta a la hora de sacar las conclusiones oportunas. Entre las medidas utilizadas están: el coste temporal asintótico, el número de combinaciones totales finales, la k-anonimización media lograda y la varianza respecto a dicha media. No se ha tenido en cuenta en la comparativa el tiempo medido durante las pruebas, ya que se han ejecutado en una máquina multitarea y la carga de la misma podría afectar a la medición por ello se puede considerar una medida menos normalizada que las indicadas. 	Cabe destacar el diseño e implementación de varios scripts para la herramienta MATLAB capaces de generar conjuntos de datos sintéticos con ciertas características modificables y para representar las estadísticas de los resultados obtenidos mediante gráficas. 	Tras las pruebas realizadas se ha podido observar como Mondrian consigue mejores resultados en general, y con mayor regularidad de tuplas en cada una de las combinaciones finales. Sin embargo, Datafly a pesar de ser uno de los primeros algoritmos de k-anonimización consigue acercarse a los resultados de Mondrian en algunos de los conjuntos de datos, dependiendo de los valores y la distribución de estos.
000064198 521__ $$aGraduado en Ingeniería Informática
000064198 540__ $$aDerechos regulados por licencia Creative Commons
000064198 700__ $$aMayordomo Cámara, Elvira$$edir.
000064198 7102_ $$aUniversidad de Zaragoza$$bInformática e Ingeniería de Sistemas$$cLenguajes y Sistemas Informáticos
000064198 8560_ $$f679890@celes.unizar.es
000064198 8564_ $$s1962552$$uhttps://zaguan.unizar.es/record/64198/files/TAZ-TFG-2017-2848.pdf$$yMemoria (spa)
000064198 909CO $$ooai:zaguan.unizar.es:64198$$pdriver$$ptrabajos-fin-grado
000064198 950__ $$a
000064198 951__ $$adeposita:2017-12-21
000064198 980__ $$aTAZ$$bTFG$$cEINA