SELEÇÃO DE ATRIBUTOS USANDO A ABORDAGEM WRAPPER PARA CLASSIFICAÇÃO HIERÁRQUICA MULTIRRÓTULO

Categorias Dissertação

O avanço tecnológico traz como consequência um grande desafio, que é o de encontrar uma forma de armazenar e extrair conhecimento útil de uma massa de dados. Uma alternativa para esse cenário é a utilização de ferramentas da Mineração de Dados, sendo uma das técnicas empregadas, a Seleção de Atributos. A Seleção de Atributos é uma das técnicas que podem ser utilizadas para a redução de dimensionalidade de base de dados, tendo como objetivo principal identificar os atributos relevantes aumentando assim o poder preditivo do classificador. Basicamente, são três as abordagens para a Seleção de Atributos: Embutida, Filtro e Wrapper. No contexto de classificação hierárquica multirrótulo, onde as classes a serem preditas estão estruturadas de acordo com uma hierarquia, poucos trabalhos na literatura apresentam propostas de técnicas de seleção de atributos. Desse modo, neste trabalho propõe-se um novo método de seleção de atributos baseado na abordagem Wrapper para classificação hierárquica multirrótulo global. Para a realização dos experimentos são utilizados dados biológicos de 10 bases de dados da Ontologia Gênica, sendo que as classes das mesmas estão estruturadas em uma hierarquia no formato de um Grafo Acíclico Direcionado (DAG). A análise estatística demonstrou que o método proposto conseguiu encontrar um subconjunto que representa a base de dados hierárquica com uma medida de avaliação preditiva igual ou superior em todos os conjuntos de dados.

Participantes

Thissiany Beatriz Almeida

Link acessado 163 vezes

Projetos relacionados

REDUÇÃO DE DIMENSIONALIDADE EM BASES DE DADOS

Um dos problemas enfrentados por pesquisadores da área de mineração é que as bases de dados são formadas por uma grande quantidade de atributos, e que muitas vezes acabam atrapalhando o processo de aprendizagem dos algoritmos. Técnicas de redução de dimensionalidade, tais como a seleção e a extração de atributos, são usadas para diminuir a dimensão desses dados, removendo atributos irrelevantes ou irredundantes e que podem atrapalhar o processo de mineração. A finalidade desse projeto consiste em aplicar técnicas de redução de dimensionalidade em bases de dados.

Laboratório de Engenharia de Software e Inteligência Computacional

Siga-nos