Magna Concursos
3307977 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TCE-PA

Ao se utilizar bancos de dados reais no treinamento de métodos de aprendizado de máquina é normal se deparar com entradas que possuem um ou mais parâmetros (campos) ausentes.

Com relação às estratégias para lidar com dados ausentes, analise as afirmativas a seguir.

I. Só é possível realizar imputation quando o atributo (feature) ausente é numérico.

II. Ao utilizar o k-nearest neighbors (KNN) para fazer o imputation é uma boa estratégia primeiro fazer a normalização ou padronização dos dados.

III. Ao se trabalhar com bancos de dados com poucas amostras (itens), uma estratégia usualmente utilizada para lidar com as amostras) que possuem valores ausentes é a remoção.

Está correto o que se afirma em

 

Provas

Questão presente nas seguintes provas