Produtos gerados: Bases de Dados - 2012
BASES DE DADOS DE CLASSIFICAÇÃO HIERÁRQUICA MULTIRRÓTULO COM VALORES IMPUTADOS
A imputação de valores pode permitir uma melhor eficiência do algoritmo. Porém, uma imputação errada pode gerar mais problemas do que os resolver. Para isso, existem várias técnicas que podem ser usadas nesse processo, tais como: substituir os valores faltantes por uma constante, substituir os valores faltantes pela média, pelo valor mais comum, entre vários outros. O critério usado para imputar os valores ausentes foi calcular a média aritmética de todos os ancestrais mais próximos da classe à qual pertence a amostra. Nas amostras multirrótulos é feita a média aritmética também sobre a quantidade de rótulos da amostra.