Carregando ...
Visualização do Trabalho Acadêmico
Repositório Institucional - UECE
Título:
REVISITANDO O PROBLEMA DE CLASSIFICAÇÃO DE PADRÕES NA PRESENÇA DE OUTLIERS USANDO TÉCNICAS DE REGRESSÃO ROBUSTA

Autor(es):
BARROS, ANA LUIZA BESSA DE PAULA

Palavras Chaves:
Não informado

Ano de Publicação:
2013

Resumo:
Nesta tese, aborda-se o problema de classificação de dados que estão contaminados com padrões
atípicos. Tais padrões, genericamente chamados de outliers, são onipresentes em conjunto
de dados multivariados reais, porém sua detecção a priori (i.e antes de treinar um classificador)
é uma tarefa de difícil realização. Como conseqüência, uma abordagem reativa, em que se
desconfia da presença de outliers somente após um classificador previamente treinado apresentar
baixo desempenho, é a mais comum. Várias estratégias podem então ser levadas a cabo
a fim de melhorar o desempenho do classificador, dentre elas escolher um classificador mais
poderoso computacionalmente ou promover uma limpeza dos dados, eliminando aqueles padrões
difíceis de categorizar corretamente. Qualquer que seja a estratégia adotada, a presença
de outliers sempre irá requerer maior atenção e cuidado durante o projeto de um classificador
de padrões. Tendo estas dificuldades em mente, nesta tese são revisitados conceitos e técnicas
provenientes da teoria de regressão robusta, em particular aqueles relacionados à estimação
M, adaptando-os ao projeto de classificadores de padrões capazes de lidar automaticamente
com outliers. Esta adaptação leva à proposição de versões robustas de dois classificadores de
padrões amplamente utilizados na literatura, a saber, o classificador linear dos mínimos quadrados
(least squares classifier, LSC) e a máquina de aprendizado extremo (extreme learning
machine, ELM). Através de uma ampla gama de experimentos computacionais, usando dados
sintéticos e reais, mostra-se que as versões robustas dos classificadores supracitados apresentam
desempenho consistentemente superior aos das versões originais.
Palavras-chave: Classificação de padrões, outliers,mínimos quadrados ordinário, regressão
robusta, estimação-M, máquina de aprendizado extremo.

Abstract:
This thesis addresses the problem of data classification when they are contaminated with
atypical patterns. These patterns, generally called outliers, are omnipresent in real-world multivariate
data sets, but their a priori detection (i.e. before training the classifier) is a difficult task
to perform. As a result, the most common approach is the reactive one, in which one suspects
of the presence of outliers in the data only after a previously trained classifier has achieved a
low performance. Several strategies can then be carried out to improve the performance of the
classifier, such as to choose a more computationally powerful classifier and/or to remove the detected
outliers from data, eliminating those patterns which are difficult to categorize properly.
Whatever the strategy adopted, the presence of outliers will always require more attention and
care during the design of a pattern classifier. Bearing these difficulties in mind, this thesis revisits
concepts and techniques from the theory of robust regression, in particular those related to
M-estimation, adapting them to the design of pattern classifiers which are able to automatically
handle outliers. This adaptation leads to the proposal of robust versions of two pattern classifiers
widely used in the literature, namely, least squares classifier (LSC) and extreme learning
machine (ELM). Through a comprehensive set of computer experiments using synthetic and
real-world data, it is shown that the proposed robust classifiers consistently outperform their
original versions.
Key words: Pattern classifiers, outliers, ordinary least squares, robust regression,M-estimation,
extreme learning machine.

Tipo do Trabalho:
Tese

Referência:
BARROS, ANA LUIZA BESSA DE PAULA. REVISITANDO O PROBLEMA DE CLASSIFICAÇÃO DE PADRÕES NA PRESENÇA DE OUTLIERS USANDO TÉCNICAS DE REGRESSÃO ROBUSTA. 2013. 152 f. Tese (Doutorado em 2013) - Universidade Estadual do Ceará, , 2013. Disponível em: Acesso em: 21 de maio de 2024

Universidade Estadual do Ceará - UECE | Departamento de Tecnologia da Informação e Comunicação - DETIC
Política de Privacidade e Segurança
Build 1