Assinale a alternativa que apresenta o método de mineração
de dados que é especificamente associado a tarefas
de classificação, cujo objetivo é classificar as instâncias
em classes predefinidas com base em características
ou atributos.
No modelo de referência CRISP-DM, a fase que é
geralmente executada em várias iterações, nas quais os
analistas de dados executam vários modelos, utilizando as
configurações padrão, e vão ajustando os parâmetros para
valores otimizados é a(o)
No contexto do Processamento de Linguagem Natural, assinale a
opção que apresenta o principal objetivo da stemização e sua
diferença em relação à lematização.
A geração e o acúmulo contínuo de dados dos últimos anos
impulsionaram o desenvolvimento de diversas tecnologias Big
Data.
Uma das principais características de um banco de dados Big Data é:
Uma das etapas mais importantes do processo de Mineração de
Dados é o pré-processamento dos dados das fontes que,
normalmente, apresentam diversos tipos de heterogeneidade. A
operação de pré-processamento que transforma dados
quantitativos (contínuos) em dados qualitativos, ou seja,
atributos numéricos em atributos discretos ou nominais com um
número finito de intervalos, obtendo uma partição não
sobreposta de um domínio contínuo, é a:
O Data Warehouse do TJSE armazena um grande cubo de dados
contendo diversas métricas e dimensões, como: DIM_TEMPO,
DIM_LOCAL e DIM_PROCESSO. A analista Julia precisa extrair um
subconjunto deste cubo de dados contendo apenas os fatos do
primeiro trimestre de 2023 e processos com a situação
“arquivado”.
Para obter esse subconjunto de dados, Julia utilizou uma
ferramenta OLAP e executou a seguinte operação:
Observe o profile das seguintes fontes de dados do Data Warehouse JusDW.
FONTE DE DADOS 1: Tabela TB_PROC
Atributo: ID_P
Descrição: Identificador único da tabela TB_PROC
Quantidade de Registros: 3.250
Valor Inicial: 1
Valor Final: 3.250
Valores Nulos: 0
FONTE DE DADOS 2: Tabela TAB_P
Atributo: ID_PROC
Descrição: Identificador único da tabela TAB_P
Quantidade de Registros: 250
Valor Inicial: 1
Valor Final: 250
Valores Nulos: 0
Para integrar e armazenar os 3.500 registros das Fontes de Dados 1 e 2 na Dimensão DIM_PROC do JusDW, identificando unicamente cada novo registro criado da DIM_PROC, é necessário criar uma:
Durante a Mineração dos Dados sobre a tramitação dos
processos eletrônicos do TJSE, o analista Pedro não estava
chegando a resultados compreensíveis e resolveu verificar se
havia anomalias nos dados.