Mostra el registre complet de l'element
Galan Chilet, Inmaculada
Chaves Martínez, Felipe Javier (dir.) Departament de Bioquímica i Biologia Molecular |
|
Aquest document és un/a tesi, creat/da en: 2015 | |
Identificación de variantes genéticas poco frecuentes y raras en
diabetes mellitus tipo 2 mediante secuenciación de exoma.
La diabetes mellitus tipo 2 (DM2) se ha convertido en una epidemia global que
contribuye significativamente a la morbi-mortalidad prematura. La DM2 es resultado de
múltiples factores, incluyendo ambientales, genéticos y adquiridos. Se ha demostrado
que la heredabilidad de la DM2 se encuentra alrededor del 70%. No obstante, los
estudios realizados sólo han podido identificar una pequeña proporción del componente
genético de la enfermedad. El resto del componente podría residir, en parte, en variantes
genéticas poco frecuentes (MAF <0,05) o variantes raras (MAF <0,01). Sin embargo, la
implicación de estas últimas en la enfermedad no ha sido determinada por las
limitaciones de los estudios genéticos realizados hasta el momento. Además, más del
90% de las mut...
[Llegir més ...]
[-]
Identificación de variantes genéticas poco frecuentes y raras en
diabetes mellitus tipo 2 mediante secuenciación de exoma.
La diabetes mellitus tipo 2 (DM2) se ha convertido en una epidemia global que
contribuye significativamente a la morbi-mortalidad prematura. La DM2 es resultado de
múltiples factores, incluyendo ambientales, genéticos y adquiridos. Se ha demostrado
que la heredabilidad de la DM2 se encuentra alrededor del 70%. No obstante, los
estudios realizados sólo han podido identificar una pequeña proporción del componente
genético de la enfermedad. El resto del componente podría residir, en parte, en variantes
genéticas poco frecuentes (MAF <0,05) o variantes raras (MAF <0,01). Sin embargo, la
implicación de estas últimas en la enfermedad no ha sido determinada por las
limitaciones de los estudios genéticos realizados hasta el momento. Además, más del
90% de las mutaciones y polimorfismos asociados a enfermedades se sitúan en las
regiones codificantes de proteínas, y por tanto, en el exoma. Por ello, una fracción
importante de las variantes de baja frecuencia y raras puede localizarse en el exoma.
Finalmente, este proyecto representa un trabajo pionero en cuanto a la técnica empleada
y población a la que se dirige.
Objetivos: Identificar variantes genéticas presentes en el exoma, incluyendo
variantes poco frecuentes y raras, en relación a la DM2 en población española.
Metodología: Secuenciación del exoma (cobertura: 20x) en 200 pacientes con
DM2 y 200 controles sanos de población española; todos con un índice de masa corporal
de 25 a 34,9 kg/m2 y una edad comprendida entre 40 y 65 años. Las regiones exónicas
fueron capturadas y secuenciadas empleando el sistema de secuenciación de nueva
generación HiScanSQ de Illumina, generando lecturas de 2x100 pares de bases en cada
dirección (paired-end). A continuación, mediante el análisis bioinformático se realizaron
los controles de calidad, el alineamiento de las lecturas contra el genoma de referencia
y la identificación de las variantes genéticas. Se seleccionaron aquellas variantes con un
MAF <20% presentes en controles o en casos, una calidad de genotipado (Q) >20 y con
valores predictivos de alteración de la funcionalidad, SIFT y PoliPhen, significativos.
Posteriormente, se estudiaron las variantes genéticas de mayor impacto funcional que
estuvieran presentes en controles o en casos; centrándonos en las variantes de codón de stop o parada, variantes de splicing, variantes de cambio de sentido o missense, y
variantes en regiones codificantes para microARNs. Finalmente, las variantes de codón
de stop o parada fueron verificadas mediante el método de secuenciación de Sanger.
Resultados: La secuenciación del exoma generó aproximadamente 1.000 GB de
datos iniciales que tras el análisis bioinformático se convirtieron en unos 2.000 GB en
total. Se identificaron 21.822 SNPs en controles y 17.238 SNPs en casos con efecto
funcional, presentes únicamente en uno de los grupos y cumpliendo con los criterios de
filtrado establecidos. En concreto, 160 y 132 SNPs fueron identificados como variantes
de splicing, en controles y casos, respectivamente. Mientras, 1.817 y 1.614 SNPs fueron
identificados como variantes missense para el grupo control y diabéticos,
respectivamente. Además, 23 SNPs fueron identificados en secuencias codificantes para
microARNs en controles y 11 en casos. Finalmente, 102 variantes de codón de stop
fueron identificadas en controles y 50 en casos.
Conclusiones: Se han identificado un gran número de variantes genéticas que
pueden estar implicadas en el desarrollo de DM2 o en la protección frente a la misma,
incluyendo nuevas variantes genéticas de baja frecuencia y raras. Con la finalidad de
identificar variantes genéticas válidas será necesario validar los resultados obtenidos
mediante otras estrategias, su replicación en un amplio número de muestras de
pacientes control y diabéticos así como el diseño de experimentos funcionales.Identification of low-frequency and rare genetic variants related to
type 2 diabetes mellitus by exome sequencing.
Type 2 diabetes mellitus (T2DM) has become a global epidemic contributing
significantly to morbidity and premature mortality. T2DM is the result from the interaction
of different factors, including environmental, genetic and acquired. It has shown that the
heredability of T2DM is around 70%. Thus far genetic studies can explain only a fraction
of the estimated genetic component of the disease. The rest of it could be explained in
low-frequency variants (MAF <0,05) and rare variants (MAF <0,01). However, the
implications of these variants in the disease have not been determined yet due to the
limitations of genetic studies conducted. Moreover, more than 90% of mutations and
polymorphisms associated with diseases are in the protein coding region, the exome.
Therefore, an important fraction of low-frequency and rare variants could be found in the
exome. Finally, this project represents a novel study because of the approach and
population used.
Objectives: To identify genetic variants in the exome, including low-frequency and
rare variants, in relation to T2DM in a Spanish population.
Methodology: Exome sequencing (coverage: 20x) in 200 patients with T2DM and
200 Spanish healthy controls; all subjects had a body mass index between 25-34.9 kg/m2
and were 40 to 65 years old. Exome regions were captured and sequenced by nextgeneration
sequencing technology using Illumina HiScanSQ system to generate
2x100 bp paired end reads. A bioinformatic analysis pipeline was used to perform quality
controls, to align the reads to a reference genome and identify genetic variants. We
selected variants with MAF <20%, present in controls or cases, with genotyping quality
(Q) >20 and significative effect predictors, SIFT and PolyPhen. We analysed genetic
variants with an important functional consequences which were present in controls or
cases. Specifically, we focused in the analysis of splicing variants, missense variants,
variants in mature microRNAs coding sequences and stop variants. Finally, we verified
the stop variants by Sanger sequencing.
Results: Exome sequencing approximately generated 1,000 GB data which after
the bioinformatics analysis became around 2,000 GB in total. It was identified 21,822
SNPs in controls and 17,238 in cases with a functional effect, present only in controls or
cases that meet quality criteria. In particular, 160 and 132 SNPs were splicing variants
which were identified in controls and cases, respectively. While 1,817 and 1,614 SNPs
were missense variants in controls and cases, respectively. Furthermore, 23 SNPs were
identified as mature microRNA variants in controls and 11 SNPs in cases. Finally, we
identified 102 SNPs as stop variants in controls and 50 SNPs in cases.
Conclusions: We have identified a large number of genetic variants, including lowfrequency
and rare variants, which may be involved in the development of T2DM or in the
protection from it. In order to stablish the true genetic variants involved in the disease we
will need to validate them by different strategies, replication in a large sample of controls
and diabetics as well as carrying out functional studies.
|
|
Veure al catàleg Trobes |