Discretizador heurístico para o contexto de classificação hierárquica.
dc.contributor.advisor | Merschmann, Luiz Henrique de Campos | pt_BR |
dc.contributor.author | Galvão, Leandro Ribeiro | |
dc.contributor.referee | Silla Júnior, Carlos Nascimento | pt_BR |
dc.contributor.referee | Pappa, Gisele Lobo | pt_BR |
dc.contributor.referee | Ferreira, Almeida Ferreira | pt_BR |
dc.date.accessioned | 2016-06-16T13:34:26Z | |
dc.date.available | 2016-06-16T13:34:26Z | |
dc.date.issued | 2016 | |
dc.description | Programa de Pós-Graduação em Ciência da Computação. Departamento de Ciência da Computação, Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto. | pt_BR |
dc.description.abstract | Diferentes tipos de problemas de classificação podem ser encontrados na literatura, cada qual possuindo seu nível de complexidade. Diversos algoritmos de aprendizado de máquina requerem atributos discretos e nesses casos o pré-processamento da base de dados né necessário. Na literatura, os trabalhos apresentam diversos métodos de discretização, porém até o momento, não há nenhum método de discretização supervisionado projetado para ser utilizada em conjunto com classificadores hierárquicos globais. Neste trabalho é proposto um método supervisionado de discretização capaz de lidar com bases do contexto de classificação hierárquica. Esse método corresponde a uma heurística, denominada Agglomerative Discretization Heuristic for Hierarchical Classification - ADH2C, que foi projetada para ser utilizada em conjunto com classificadores hierárquicos globais. A avaliação da qualidade da discretização realizada pela heurística ADH2C foi feita a partir de experimentos comparativos com métodos de discretização não-supervisionados Equal-Width (EW) e Equal-Frequency (EF). A qualidade da discretização foi medida por meio do desempenho preditivo pelo classificador hierárquico Global Model Naive Bayes (GMNB) utilizando-se 9 bases de dados de bioinformática pré-processadas pelos métodos de discretização EW, EF e ADH2C. Os experimentos realizados neste trabalho mostraram que para a maioria das bases de dados utilizadas, o classificador GMNB alcançou o melhor desempenho preditivo (hF) quando utilizou as bases de dados pré-processadas pela heurística ADH2C. A melhora no desempenho preditivo do GMNB, utilizando as bases de dados pré-processadas pela heurística ADH2C, evidencia sua aplicabilidade no contexto de classificação hierárquica monorrótulo. | pt_BR |
dc.description.abstracten | Several classification tasks in different application domains can be seen as hierarchical classification problems. Many machine learning algorithms require discrete data. Then, it is mandatory the use of a discretization method. In order to be used together with global hierarchical methods, the use of the existing supervised flat discretization methods is not appropriate. For this reason, there has been used unsupervised discretization methods which ignores the class attribute. In this work, we propose a supervised discretization method for hierarchical classification scenario. The proposed heuristic, known as Agglomerative Discretization Heuristic for Hierarchical Classification - ADH2C, is able to deal with hierarchical class structure and can be used with global hierarchical classifiers. Experimental evaluation is performed through the preprocessing of 9 bioinformatics datasets. The hierarchical classification method Global Model Naive Bayes - GMNB, was adopted to measure the quality of the discretization. As far as we known, there is no supervised discretization method able to be used with hierarchical classification methods. Due to it, as baseline methods for experimental comparison, we adopted the unsupervised methods Equal-Frequency and Equal-Width. Analyses of the experimental results showed that, for most of datasets, the GMNB classifier achieved higher predictive performance when they were preprocessed using ADH2C method. The proposed supervised discretization method has shown good performance in the hierarchical classification scenario and, therefore, can be used together with global hierarchical classification methods. | |
dc.identifier.citation | GALVÂO, Leandro Ribeiro. Discretizador heurístico para o contexto de classificação hierárquica. 2016. 54 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2016. | pt_BR |
dc.identifier.uri | http://www.repositorio.ufop.br/handle/123456789/6538 | |
dc.language.iso | pt_BR | pt_BR |
dc.rights | aberto | pt_BR |
dc.rights.license | Autorização concedida ao Repositório Institucional da UFOP pelo(a) autor(a) em 13/06/2016 com as seguintes condições: disponível sob Licença Creative Commons 4.0 que permite copiar, distribuir e transmitir o trabalho desde que sejam citados o autor e o licenciante. Não permite o uso para fins comerciais nem a adaptação. | pt_BR |
dc.subject | Distribuição - probabilidades | pt_BR |
dc.subject | Classificação - computadores | pt_BR |
dc.subject | Programação heurística | pt_BR |
dc.title | Discretizador heurístico para o contexto de classificação hierárquica. | pt_BR |
dc.type | Dissertacao | pt_BR |
Files
Original bundle
1 - 1 of 1
No Thumbnail Available
- Name:
- DISSERTAÇÃO_DiscretizadorHeurísticoContexto.pdf
- Size:
- 9.78 MB
- Format:
- Adobe Portable Document Format
License bundle
1 - 1 of 1
No Thumbnail Available
- Name:
- license.txt
- Size:
- 924 B
- Format:
- Item-specific license agreed upon to submission
- Description: