Resumen: En los últimos años, el crecimiento exponencial de los sistemas de videovigilancia CCTV ha evidenciado la necesidad de métodos automáticos de detección de anomalías para garantizar la seguridad en espacios públicos y privados. Esta tesis busca mejorar la precisión y eficiencia de dichos métodos, haciéndolos prácticos para escenarios reales. El desequilibrio entre eventos normales y anómalos, la diversidad de contextos y las altas demandas computacionales de los modelos de aprendizaje profundo son retos clave, especialmente en entornos con recursos computacionales limitados, como CPUs. Hemos evaluado tres algoritmos de detección de anomalías débilmente supervisados —PEL4VAD, UR-DMU y BN-WVAD— utilizando la base de datos UCF-Crime. Estos métodos, que solo necesitan etiquetas a nivel de video durante el entrenamiento, fueron seleccionados por sus buenos resultados. Sin embargo, nuestros experimentos han revelado que la métrica estándar ROC AUC utilizada puede no reflejar adecuadamente su buen funcionamiento en conjuntos desbalanceados. Hemos propuesto en su lugar el uso de la métrica Precision-Recall AUC (PR AUC), que equilibra mejor la precisión y la sensibilidad. Para mejorar la eficiencia computacional, hemos implementado técnicas de reducción de la tasa de muestreo y optimizado la extracción de características con I3D, reduciendo tiempos de procesamiento sin comprometer la precisión. Además, introdujimos estrategias como el uso de contexto y funciones de pérdida balanceadas, como la entropía cruzada binaria balanceada y la pérdida focal Tversky.