BASES DE DADOS DE CLASSIFICAÇÃO HIERÁRQUICA MULTIRRÓTULO COM VALORES IMPUTADOS

Categorias Bases de Dados

A imputação de valores pode permitir uma melhor eficiência do algoritmo. Porém, uma imputação errada pode gerar mais problemas do que os resolver. Para isso, existem várias técnicas que podem ser usadas nesse processo, tais como: substituir os valores faltantes por uma constante, substituir os valores faltantes pela média, pelo valor mais comum, entre vários outros. O critério usado para imputar os valores ausentes foi calcular a média aritmética de todos os ancestrais mais próximos da classe à qual pertence a amostra. Nas amostras multirrótulos é feita a média aritmética também sobre a quantidade de rótulos da amostra.

Informações adicionais sobre as bases de dados podem ser encontradas nas Seções 6.2 e 6.3 da Tese.

Anexo baixado 236 vezes

Links relacionados

Projetos relacionados

IMPUTAÇÃO DE VALORES FALTANTES EM BASES DE DADOS

A falta de dados é um processo que dificulta a extração de informações importantes presentes em bases de dados. Esse problema pode ocorrer por diversos motivos, como: falhas de digitação, falha nos instrumentos de coleta de dados, erros no preenchimento, perda de dados ao longo dos anos, entre outros. Determinar valores para um conjunto de dados omissos não é uma tarefa simples, pois valores atribuídos a esses dados podem ser inadequados, causar a discrepância das estimativas, e se isto acontecer o resultado pode ser afetado, já que os valores substituídos são diferentes do conjunto de dados original. Dessa forma, a imputação de dados tem sido para resolver ou amenizar esse problema, visto que muitos algoritmos de aprendizagem de máquina não trabalham com dados faltantes. A imputações de valores são procedimentos de tratamento de dados que substituem os valores omissos de uma base de dados por valores obtidos específicos por diferentes técnicas matemáticas, estatísticas e até mesmos alguns algoritmos de aprendizagem de máquina. O objetivo deste projeto é estudar e aplicar técnicas de imputação de valores faltantes em bases de dados.

Laboratório de Engenharia de Software e Inteligência Computacional

Siga-nos