An ensemble of one class domain descriptors for imbalanced classification

Por: Ramírez González, FelipeColaborador(es): Allende Olivares, Héctor (Comisión de tesis) [, prof. guía] | Monge Anwandter, Raúl Patricio (Comisión de tesis) [, prof.corref.] | UTFSM. Departamento de Informática (1994-) Departamento de Informática (1994 -) | UTFSM. Dirección General de Investigación y Postgrado. Programas de MagísterTipo de material: TextoTextoDetalles de publicación: Valparaíso : UTFSM, 2012Descripción: 60 h. : ilTipo de contenido: text Tipo de medio: unmediate Tipo de portador: volumeClasificación CDD: M INF Nota de disertación: Tesis (Magíster en Ciencias de la Ing. Informática) -- Prof. Guía: Héctor Allende ; prof. corref.: Raúl Monge Resumen: En los þultimos a?nos los algoritmos de reconocimiento de patrones han hecho posible un creciente nþumero de aplicaciones en el þambito de la ingenierþıa biomþedica, tales como el anþalisis de mamografþıas para la detecciþon de cþancer, el anþalisis de se?nales electrocardiogrþaficas para el diagnþostico de enfermedades cardiovasculares, el anþalisis de imþagenes de resonancia magnþetica para la segmentaciþon de tumores cerebrales, entre muchas otras. Dada la infrecuencia con la que algunas clases de patologþıas se manifiestan en la vida real, los casos observables estþan altamente subrepresentados, muchas veces contando por menos del 1% del total de los datos disponibles. Bajo estas condiciones, un examen automþatico que incondicionalmente emita un diagnþostico negativo estarþa en lo correcto el 99% de las veces, pero serþa incapaz de detectar aquellos casos realmente importantes donde la enfermedad estþa presente. Este simple ejemplo revela que cuando se describen casos infrecuentes el error empþırico del examen es una medida de desempe?no inadecuada, y en consecuencia, los modelos de aprendizaje basados en su minimizaciþon tambiþen lo son. Esta situaciþon es comþunmente conocida como el problema de desequilibrio de clases, suele presentarse en aplicaciones donde se describe un fenþomeno altamente infrecuente pero de vital importancia, y deteriora significativamente el desempe?no de los algoritmos de reconocimiento de patrones basados en la minimizaciþon del error. Por este motivo surge la necesidad de desarrollar algoritmos capaces de compensar este deterioro, ya sea aplicando algþun esquema de remuestreo de datos, o haciendo alguna modificaciþon a algoritmos tradicionales. Esta disciplina en la literatura recibe el nombre de class imbalanced learning o aprendizaje de clases desequilibradas. En esta tesis se propone un nuevo algoritmo para resolver problemas de clasificaciþon desequilibrada, especialmente dise?nado para mejorar la exactitud de la clase minoritaria, mejorando asþı el desempe?no total del clasificador. Simulaciones computacionales muestran que la estrategia propuesta, a la cual se le ha denominado Dual Support Vector Domain Description, tiene mejor desempe?no que mþetodos relacionados de la literatura en instancias del problema especialmente interesantes.
Etiquetas de esta biblioteca: No hay etiquetas de esta biblioteca para este título. Ingresar para agregar etiquetas.
Valoración
    Valoración media: 0.0 (0 votos)

incluye anexos

DISPONIBLE SOLO A TRAVES DE ACCESO ELECTRONICO DEL CATALOGO. --

Tesis (Magíster en Ciencias de la Ing. Informática) -- Prof. Guía: Héctor Allende ; prof. corref.: Raúl Monge

En los þultimos a?nos los algoritmos de reconocimiento de patrones han hecho posible un creciente nþumero de aplicaciones en el þambito de la ingenierþıa biomþedica, tales como el anþalisis de mamografþıas para la detecciþon de cþancer, el anþalisis de se?nales electrocardiogrþaficas para el diagnþostico de enfermedades cardiovasculares, el anþalisis de imþagenes de resonancia magnþetica para la segmentaciþon de tumores cerebrales, entre muchas otras. Dada la infrecuencia con la que algunas clases de patologþıas se manifiestan en la vida real, los casos observables estþan altamente subrepresentados, muchas veces contando por menos del 1% del total de los datos disponibles. Bajo estas condiciones, un examen automþatico que incondicionalmente emita un diagnþostico negativo estarþa en lo correcto el 99% de las veces, pero serþa incapaz de detectar aquellos casos realmente importantes donde la enfermedad estþa presente. Este simple ejemplo revela que cuando se describen casos infrecuentes el error empþırico del examen es una medida de desempe?no inadecuada, y en consecuencia, los modelos de aprendizaje basados en su minimizaciþon tambiþen lo son. Esta situaciþon es comþunmente conocida como el problema de desequilibrio de clases, suele presentarse en aplicaciones donde se describe un fenþomeno altamente infrecuente pero de vital importancia, y deteriora significativamente el desempe?no de los algoritmos de reconocimiento de patrones basados en la minimizaciþon del error. Por este motivo surge la necesidad de desarrollar algoritmos capaces de compensar este deterioro, ya sea aplicando algþun esquema de remuestreo de datos, o haciendo alguna modificaciþon a algoritmos tradicionales. Esta disciplina en la literatura recibe el nombre de class imbalanced learning o aprendizaje de clases desequilibradas. En esta tesis se propone un nuevo algoritmo para resolver problemas de clasificaciþon desequilibrada, especialmente dise?nado para mejorar la exactitud de la clase minoritaria, mejorando asþı el desempe?no total del clasificador. Simulaciones computacionales muestran que la estrategia propuesta, a la cual se le ha denominado Dual Support Vector Domain Description, tiene mejor desempe?no que mþetodos relacionados de la literatura en instancias del problema especialmente interesantes.