Início: 01/2019 Fim: 0/0
A classificação hierárquica vem sendo bastante utilizada em diversas áreas como na categorização de textos, predição de proteínas, classificação de gêneros musicais, imagens entre outras. Um exemplo típico de uma hierarquia de classe estruturada, como uma árvore, é a classificação funcional de enzimas. Cada enzima é nomeada como uma classe de acordo com seu código EC (Enzyme Commission). Já um exemplo de classificação funcional de proteína estruturada como um grafo acíclico dirigido (Directed Acyclic Graph - DAG) é a Ontologia Gênica (Gene Ontology - GO) (GENE ONTOLOGY, 1998). Nessa área, uma grande motivação da utilização da classificação hierárquica é o diagnóstico e tratamento de doenças e o desenvolvimento de medicamentos através do conhecimento descoberto. Outra motivação diz respeito a classificação multirrótulo. Esse tipo de problema ainda é pouco explorado e consequentemente classificadores que sejam capazes de predizer várias classes para uma mesma instância são poucos na literatura. Sendo assim, pesquisas nessa área são importantes, pois vários são os problemas que precisam ser tratados dessa maneira, inclusive os dados provenientes da base de dados GO (Gene Ontology). Um grande problema que se tem quando trabalha com bases de dados hierárquicas é quantidade de classes da hierárquica, que são da ordem de milhares. Sendo assim, este projeto tem como objetivo a remoção de classes da hierarquia de classes nas bases de dados hierárquicas e avaliar o desempenho preditivo do classificador.