Mostra el registre complet de l'element
Pruñonosa Reverter, Jose Vicente
Sendra Pina, Mario (dir.) Universitat de València - ESTADÍSTICA I INVESTIGACIÓ OPERATIVA |
|
Aquest document és un/a tesi, creat/da en: 2003 | |
The basic supposition of the method is that the categorical variables come from underlying ones, mixtures of normals, discretized in permuted intervals at the marginals. The effort was directed in reproducing the more exactly possible underlying continuous probability distribution and later to apply a methodology of discrimination with continuous variables. In order to obtain this reconstruction, two phases were developed: In first, a multiple correspondence analysis, properly adapted to the discriminant objective, looked for quantifications, and secondly, a procedure of smoothing based on algorithm EM, complemented the reproduction applying a dispersion around these values. In Chapter 1 the basic definitions of the discriminant analysis are analyzed and the existing methods had been revised with the mentioned objective. The second and third chapter make the equivalent with the correspo...
[Llegir més ...]
[-]
The basic supposition of the method is that the categorical variables come from underlying ones, mixtures of normals, discretized in permuted intervals at the marginals. The effort was directed in reproducing the more exactly possible underlying continuous probability distribution and later to apply a methodology of discrimination with continuous variables. In order to obtain this reconstruction, two phases were developed: In first, a multiple correspondence analysis, properly adapted to the discriminant objective, looked for quantifications, and secondly, a procedure of smoothing based on algorithm EM, complemented the reproduction applying a dispersion around these values. In Chapter 1 the basic definitions of the discriminant analysis are analyzed and the existing methods had been revised with the mentioned objective. The second and third chapter make the equivalent with the correspondence analysis and the methods of smoothing (Kernel and EM) like elements to combine to obtain the reconstruction. Chapter 4 makes the methodologic proposal and a generalization of Lancasters theorem is demonstrated for its mathematical foundation. Finally, in chapter 5, the results with simulated and real data are discussed, reaching the following conclusions: The test of the method with underlying normal simulated data using a model with common variance by class was positive since the method improved the other procedures which it has been compared with. On the other hand if the multinormal supposition of an underlying variable is interpreted like the end of a research when finally we are able to separate the significants factors affecting the average whereas the nonsignificant ones determine a gaussian dispersion is not surprising that a method based on these premises obtains good practical results, as it happens in real complex examples analyzed.RESUMEN
El punt de partida del mètode que es presenta en aquest treball és la suposició que les variables discretes procedeixen dunes subjacents, mixtures de normals, que han estat tallades en intervals a cada marginal i permutades posteriorment.
Daquesta manera podem considerar, com és habitual a la literatura, que els factors significatius afecten a la mitjana de les variables subjacents mentre que els no significatius determinen una dispersió gaussiana arreu dels valors centrals de classe. La discretització serà, al seu torn, producte bé de fenòmens dacumulació-umbralització, típics de molt processos biològics, bé de la imprecisió inherent a laparell de mesura.
Lesforç es va centrar, com a conseqüència, en retrobar el més acuradament possible la distribució de probabilitat contínua subjacent i posteriorment aplicar una metodologia de discriminació amb variables contínues.
Per tal d'aconseguir aquest objectiu reconstructor , es van desenvolupar dues fases: A la primera, i mitjançant una anàlisi de correspondències múltiples convenientment adaptada a lobjectiu discriminant, se cercaren quantificacions que aproximessin les mitjanes de les celles i a la segona, emprant, un procediment de suavització basat en lalgorisme EM, es va completar la reproducció de la distribució subjacent aplicant una dispersió al voltant daquestes mitjanes.
Al Capítol 1 sanalitzen les definicions bàsiques de lanàlisi discriminant i es fa una revisió dels mètodes existents amb lobjectiu esmentat.
El segon i el tercer capítol se centren a fer lequivalent amb lanàlisi de correspondències i els mètodes de suavització (fonamentalment kernel i EM) com a elements bàsics a combinar per tal daconseguir l'esmentada reconstrucció.
Al Capítol 4 es fa la proposta metodològica i es demostra el resultat que li dóna fonament matemàtic.
Finalment, al capítol 5, es discuteixin els resultats amb dades simulades i reals, arribant a les següents conclusions:
La prova del mètode amb dades simulades utilitzant un model de normals subjacents amb mitjana diferent per classe i variància comuna pot valorar-se com positiva ja que els seus resultats superen els altres procediments amb què sha comparat.
Es considera que aquests esperançadors resultats es deuen a la solidesa del resultat matemàtic provat al capítol 4, el qual ens garanteix que la reconstrucció de les dades subjacents contínues es realitza en la direcció correcta.
Daltra banda si la suposició duna multinormal subjacent s'interpreta com el final dun ampli ventall de processos investigadors quan finalment saconsegueix destriar la part rellevant de la que no ho és (en termes de distribució de probabilitat) no resulta sorprenent que un mètode basat en aquestes premisses obtingui bons resultats pràctics, tal i com succeeix als dos exemples reals, de molt diferent procedència, però duna elevada complexitat, analitzats.
__________________________________________________________________________________________________
|
|
Veure al catàleg Trobes |