Dimensionality Reduction Approach using Attributes Extraction and Attributes Selection in Gene Expression Databases

The gene expression databases are formed by a high number of attributes. To deal with this amount, data dimensionality reduction is used in order to minimize the volume of data to be treated regarding the number of attributes, and to increase the generalization capability of learning methods by eliminating irrelevant and/or redundant data. This paper proposes an approach to means of dimensionality reduction, which joins attribute extraction and attributes selection. For this, we used the Random Projection method and the filter and wrapper approaches for the attribute selection. The experiments are realized in five gene expression microarray databases. The results of the experiments showed that join of those approaches can provide promising results.

Participantes

Simone Nasser Matos

Helyane Bronoski Borges

Raimundo Osvaldo Vieira

Rafael Tasaka

Júlio Cesar Nievola

Link acessado 164 vezes

Projetos relacionados

REDUÇÃO DE DIMENSIONALIDADE EM BASES DE DADOS

Um dos problemas enfrentados por pesquisadores da área de mineração é que as bases de dados são formadas por uma grande quantidade de atributos, e que muitas vezes acabam atrapalhando o processo de aprendizagem dos algoritmos. Técnicas de redução de dimensionalidade, tais como a seleção e a extração de atributos, são usadas para diminuir a dimensão desses dados, removendo atributos irrelevantes ou irredundantes e que podem atrapalhar o processo de mineração. A finalidade desse projeto consiste em aplicar técnicas de redução de dimensionalidade em bases de dados.

Laboratório de Engenharia de Software e Inteligência Computacional

Siga-nos