Mostra el registre complet de l'element
Amadoz Navarro, Alicia
González Candelas, Fernando (dir.) Universitat de València. Departament de Bioquímica i Biologia Molecular |
|
Aquest document és un/a tesi, creat/da en: 2011 | |
La investigación genética y epidemiológica de las enfermedades infecciosas requiere
actualmente grandes cantidades de datos. En un laboratorio de tamaño medio, la
información necesaria para realizar estudios de investigación suele almacenarse de forma
independiente en diferentes formatos y lugares, lo que dificulta su gestión y análisis. Esta
organización de la información conlleva que el trabajo habitual en un laboratorio se realice
de forma lenta y desordenada. En esta situación, la integración de la información es de
vital importancia para poder llevar a cabo estos trabajos de forma eficiente, sistematizada
y común a todos los investigadores del laboratorio.
La principal motivación de esta tesis fue cubrir la necesidad de un sistema de gestión y
análisis de datos de forma sencilla, flexible y fiable. El objetivo principal de esta tesis
consistió en el desarrollo de un sistema de info...
[Llegir més ...]
[-]
La investigación genética y epidemiológica de las enfermedades infecciosas requiere
actualmente grandes cantidades de datos. En un laboratorio de tamaño medio, la
información necesaria para realizar estudios de investigación suele almacenarse de forma
independiente en diferentes formatos y lugares, lo que dificulta su gestión y análisis. Esta
organización de la información conlleva que el trabajo habitual en un laboratorio se realice
de forma lenta y desordenada. En esta situación, la integración de la información es de
vital importancia para poder llevar a cabo estos trabajos de forma eficiente, sistematizada
y común a todos los investigadores del laboratorio.
La principal motivación de esta tesis fue cubrir la necesidad de un sistema de gestión y
análisis de datos de forma sencilla, flexible y fiable. El objetivo principal de esta tesis
consistió en el desarrollo de un sistema de información orientado al área de epidemiología
molecular de patógenos infecciosos, que permitiese almacenar y analizar de forma
centralizada la información clínica de pacientes junto con la información molecular de los
patógenos de interés.
En los últimos años, la bioinformática se ha convertido en una parte esencial de las
soluciones eficientes de integración, transformación y creación de nueva información.
epiPATH, la plataforma bioinformática que presentamos en esta tesis, consta de dos
grupos de herramientas diferenciadas pero, a su vez, diseñadas para interactuar entre sí
facilitando el manejo y análisis de grandes cantidades de datos. Por un lado, diseñamos y
desarrollamos una base de datos junto con varias aplicaciones que facilitan su gestión y,
por otro lado, integramos y desarrollamos diferentes aplicaciones de análisis que
permitiesen realizar estudios epidemiológicos, evolutivos y poblacionales de las
secuencias moleculares de los patógenos.
El almacenamiento conjunto de datos clínicos de pacientes y de datos moleculares de
patógenos en una base de datos centraliza la búsqueda y la gestión de información,
facilitando comparaciones entre ellos y estudios sobre infecciones múltiples. Además,
permite el estudio de la variación que existe dentro de los distintos patógenos y los
cambios que registran a lo largo de su evolución, hasta su distribución en distintos
pacientes con diferentes afecciones y cuadros clínicos. En este sentido, epiPATH también
facilita la vigilancia epidemiológica basada en señales específicas de la enfermedad,
mediante la identificación de regiones patógenas a través de la comparación de
secuencias cuyos pacientes tengan un perfil clínico determinado.
epiPATH incluye información desde el momento en que un paciente acude a un centro de
salud hasta el análisis molecular del patógeno en el laboratorio. La información que
recoge esta base de datos comienza en los lugares donde se puede encontrar un
patógeno. Después, se puede recoger información clínica del paciente cuando acude al
médico, se le realizan pruebas clínicas y se puede obtener información sobre el tipo de
transmisión. Posteriormente, se aplica un tratamiento y se recogen muestras del patógeno
que siguen un procesado de laboratorio. En el laboratorio, se obtienen secuencias que
corresponden a un patógeno determinado asociado, en algunos casos, a un brote
epidemiológico. Por otro lado, las secuencias pueden analizarse con métodos
filogenéticos y publicarse en distintos trabajos generando una bibliografía.
La integración de herramientas de análisis junto con la información almacenada en la
base de datos facilita las tareas del flujo de trabajo habitual en un laboratorio y en
colaboraciones con otras instituciones, preservando la información del acceso público.
Además, los programas de análisis de genética poblacional y evolutiva desarrollados en
esta tesis (epiPATH-tools) son de gran utilidad y permiten el análisis masivo de datos. Las
epiPATH-tools incluyen el cálculo de parámetros relevantes en el estudio de la
divergencia, posiciones sinónimas y no-sinónimas, pruebas de neutralidad y estudio de
polimorfismos.Large volumes of data are currently needed in genetics research and infectious diseases
epidemiology studies. In a medium size laboratory, information needed in research studies
is usually stored independently within different formats and places, which makes
information management and data analysis a difficult task. This organization of information
involves that the common laboratory workflow is made in a slow and disorganized way. In
this situation, information integration is of vital importance to perform these kind of studies
in an efficient, systematized and common manner for all the researchers in a laboratory.
The main aim of this thesis was to cover the necessity of a data management and analysis
system for molecular epidemiology studies of infectious diseases, that allow researchers to
store and analyze clinical information of patients together with molecular data of
pathogens in a centralized way.
epiPATH, the bioinformatics platform that is presented in this thesis, has two different
groups of tools designed to interact between them in order to ease the management and
analysis of huge amounts of data. We designed and developed a database together with
data management applications, and we also integrated and developed different analysis
applications to perform molecular epidemiology, population and evolutionary genetics
studies.
From the moment a patient arrives to a hospital until the processing and analysis of
molecular sequences obtained from infectious pathogens in the laboratory, lots of
information is collected from different sources. Our database covers many aspects of
samples, laboratory processes, molecular sequences, clinical information, treatments,
pathogens, transmissions and outbreaks information.
epiPATH allows researchers to perform comparisons between pathogens and multiple
infections studies. Moreover, it allows studies from variability within pathogens and
evolutionary changes to their distribution among patients with different clinical conditions.
In this respect, our platform is also useful for the facilitation of surveillance based on either
syndromic or disease-specific signals.
We also developed the epiPATH-tools, a group of applications for population and
evolutionary genetics that calculate parameters relating to a large amount of sequences.
They include parameters of interest in the study of population divergence, synonymous
and non-synonymous positions, neutrality tests and polymorphism studies.
|
|
Veure al catàleg Trobes |