000146078 001__ 146078 000146078 005__ 20241122150934.0 000146078 037__ $$aTAZ-TFM-2014-847 000146078 041__ $$aspa 000146078 1001_ $$aNavarro Gómez, Miguel Ángel 000146078 24500 $$aComparación y desarrollo de filtros anti-spam basados en minería de datos 000146078 260__ $$aZaragoza$$bUniversidad de Zaragoza$$c2014 000146078 506__ $$aby-nc-sa$$bCreative Commons$$c3.0$$uhttp://creativecommons.org/licenses/by-nc-sa/3.0/ 000146078 520__ $$aEl correo electrónico es un medio de comunicación eficiente y cada vez más popular. Desafortunadamente, esto ha causado que vendedores de todo tipo bombardeen los buzones de correo con mensajes no solicitados conocidos como spams. Como las medidas legales contra el spam no han tenido mucho efecto, la respuesta a este problema se encuentra en los filtros anti-spam, que ayudan a los destinatarios a identificar o eliminar automáticamente estos mensajes. Recientemente se han utilizado métodos de aprendizaje supervisado, que aprenden a identificar el spam después de recibir una muestra de mensajes de entrenamiento que han sido manualmente clasificados como spam o legítimos. En este trabajo se ha desarrollado un sistemas de preprocesamiento de la información y selección de atributos as ́ı como la implementación de distintos filtros compatibles, tanto en el entrenamiento como en el filtrado, con el sistema de correo de unizar. Los clasificadores desarrollados se basan en 2 algoritmos, naive bayes (desde distintas aproximaciones) y randomforest. Los filtros bayesianos, por su simplicidad y eficacia han sido los m ́as implementados en los sistemas anti-spam, proyectos como bogofilter (usado en Unizar) o spamassesin son muestra de ello. Por otro lado estudios recientes est ́ an demostrando buenos resultados en la clasificación de textos usando la aproximación randomforest. Se ha analizado el rendimiento y precisión para cada caso se ha calculado el umbral para el cual se minimiza los costes causados por los fallos de clasificación. 000146078 521__ $$aMáster en Modelización Matemática, Estadística y Computación 000146078 540__ $$aDerechos regulados por licencia Creative Commons 000146078 6531_ $$afiltros anti-spam 000146078 6531_ $$anaive bayes 000146078 6531_ $$aramdonforest 000146078 6531_ $$apython 000146078 700__ $$aAlcalá Nalvaiz, José Tomás$$edir. 000146078 7102_ $$aUniversidad de Zaragoza$$b $$c 000146078 8560_ $$f326361@celes.unizar.es 000146078 8564_ $$s1681802$$uhttps://zaguan.unizar.es/record/146078/files/TAZ-TFM-2014-847_ANE.pdf$$yAnexos (spa) 000146078 8564_ $$s671608$$uhttps://zaguan.unizar.es/record/146078/files/TAZ-TFM-2014-847.pdf$$yMemoria (spa) 000146078 909CO $$ooai:zaguan.unizar.es:146078$$pdriver$$ptrabajos-fin-master 000146078 950__ $$a 000146078 951__ $$adeposita:2024-11-22 000146078 980__ $$aTAZ$$bTFM$$cCIEN