Home > Análisis filogenético molecular : diseño e implementación de algoritmos escalables y fiables y verificación automática de propiedades de una filogenia
TAZ-TFM-2011-073
Análisis filogenético molecular : diseño e implementación de algoritmos escalables y fiables y verificación automática de propiedades de una filogenia
Abstract: La filogenética es la ciencia que estudia las relaciones entre organismos basándose en lo cercano que están unos de otros. La forma más visual y conveniente de representar estas relaciones evolutivas entre un grupo de organismos es a través de los árboles filogenéticos. La secuenciación de cadenas biológicas es un proceso mecanizado que permite obtener las secuencias biológicas que se utilizarán para construir estos árboles, que se desarrollan a partir de modelos evolutivos: modelos matemáticos que intentan explicar de la forma más fiel posible la evolución real de dichas secuencias. El análisis filogenético es un proceso formado por distintas etapas, que pueden variar según los objetivos, pero cuya finalidad es siempre la misma: poder reconstruir el árbol filogenético. Estas etapas pueden incluir: estudio de modelos evolutivos, análisis estadístico, alineamiento de secuencias, \ldots Esta tesis de máster tiene como objetivo principal el desarrollo del criterio teórico y herramientas prácticas que permitan llevar a cabo un análisis filogenético completo. Los procesos de secuenciación de cadenas biológicas no están exentos de errores, los cuales pueden aparecer en cualquier parte de la secuencia. Hasta la fecha, todo proceso de verificación de la secuencia requiere la actuación manual de un experto en el campo, lo que, sin duda, es un proceso muy costoso. Por otro lado, actualmente el coste computacional limita de forma práctica tanto la realización de filogenias extensivas (tratando miles y decenas de miles de secuencias) como la aplicación de modelos evolutivos más generales, interesantes y explicativos que el modelo uniforme (que únicamente se utilizan en tamaños de problema reducidos). Las aportaciones de este trabajo abordan tres aspectos específicos: por un lado el desarrollo e implementación de un sistema de inferencia filogenética que concentra varios métodos sobre análisis de secuencias y estudio de filogenias que no se habían unido hasta el momento; por otro lado el desarrollo e implementación de una aplicación para la detección automática de errores de las cadenas obtenidas en los procesos de secuenciación; y por último el estudio teórico de nuevos algoritmos para la caracterización de problemas entre aquellos que se consideran como no resolubles en la actualidad. Los resultados de todo este trabajo han concluido en la creación de dos artículos (uno publicado y otro en fase de revisión). Adicionalmente, hay un tercero que está en fase de desarrollo, lo que refleja el amplio interés en estos temas por la comunidad científica y su utilidad práctica.