3270554 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: IF-MT
Orgão: IF-MT

Provas:

Professor PEBTT - Engenharia da Computação
Provas ×

Data Mining

Considere as afirmativas acerca de Mineração de Dados:

I - As soluções para resolver o problema de valores ausentes são diversas, sendo as mais comuns: remoção do exemplar em que ocorre a falta do valor, preenchimento manual dos valores e preenchimento automático dos valores.

II - Os valores ruidosos referem-se a modificações dos valores originais e que, portanto, consistem em erros de medidas ou em valores consideravelmente diferentes da maioria dos outros valores do conjunto de dados, os chamados outliers. Há duas abordagens para o tratamento destes dados: inspeção e correção manual; e identificação e limpeza automática.

III - Procedimentos para integração de dados consistem em realizar ações que permitam integrar, adequadamente, dados provenientes de diversas fontes de dados. Geralmente, quando os dados provêm de diferentes fontes, os valores assumidos por atributos não possuem o mesmo domínio ou não estão formatados sob o mesmo tipo de dado, ainda que digam respeito à mesma descrição de uma entidade do mundo real. As principais motivações para a aplicação de procedimentos de integração de dados são, portanto, a presença de valores inconsistentes e a presença de valores redundantes.

De acordo com Silva, Peres e Boscarioli (2016), é CORRETO afirmar que:

Provas

Questão presente nas seguintes provas

3270553 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: IF-MT
Orgão: IF-MT

Provas:

Professor PEBTT - Engenharia da Computação
Provas ×

Data Mining

Avalie as sentenças sobre Mineração de Dados:

I - A mineração de dados é uma disciplina exclusiva da engenharia da computação, utilizada como ferramenta por demais áreas de conhecimento.

II- As tarefas descritivas da mineração de dados fazem inferência a partir dos dados e possuem o objetivo de realizar predições.

III - Durante as tarefas de mineração de dados, os valores de dados outliers não podem ser descartados, para garantir a fidedignidade do modelo em uso.

Conforme Castro e Ferrari (2016), é CORRETO afirmar que:

Provas

Questão presente nas seguintes provas

3270161 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: CESGRANRIO
Orgão: CPNU/CNU

Provas:

CNU - Bloco 2
Provas ×

Análise de DadosAnálise Exploratória

Considere a seguinte Tabela de valores críticos da estatística \( \chi^2 \) ao nível de significância 5%:

Graus de liberdade	\( \chi^2 \) crítico para \( \alpha \) = 5%
1	3,8
2	6,0
3	7,8
4	9,5
280	320,0

Uma política pública visava capacitar profissionais em situação de desemprego, para facilitar-lhes a reinserção no mercado de trabalho.

Um estudo acerca da efetividade dessa política tomou uma amostra aleatória de 100 profissionais desempregados que foram capacitados no âmbito dessa política e outros 200 profissionais desempregados que, embora elegíveis para serem capacitados, não o foram.

A análise descritiva da amostra concluiu que, um ano após o término do curso, 80 profissionais dentre os 100 profissionais que foram capacitados estavam empregados e 100 profissionais dentre os 200 profissionais que não foram capacitados também estavam empregados.

Com o intuito de avaliar a efetividade dessa política pública, faz-se, dentre outras análises, um teste de independência \( \chi^2 \) que verifica se há (ou não) relação entre ter realizado a capacitação profissional e ser reinserido no mercado de trabalho.

Ao nível de significância de 5%, conclui-se que a política pública

A

foi efetiva em reinserir seus beneficiários no mercado de trabalho, já que a estatística do teste foi superior ao seu valor crítico.

B

foi efetiva em reinserir seus beneficiários no mercado de trabalho, já que a estatística do teste foi inferior ao seu valor crítico.

C

não foi efetiva em reinserir seus beneficiários no mercado de trabalho, já que a estatística do teste foi superior ao seu valor crítico.

D

não foi efetiva em reinserir seus beneficiários no mercado de trabalho, já que a estatística do teste foi inferior ao seu valor crítico.

E

não foi efetiva, tendo em vista que há mais profissionais recolocados que não fizeram a capacitação do que profissionais recolocados que fizeram a capacitação.

Provas

Questão presente nas seguintes provas

3270160 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: CESGRANRIO
Orgão: CPNU/CNU

Provas:

CNU - Bloco 2
Provas ×

Inteligência ArtificialMachine LearningTipos de AprendizadoSupervisionado
Inteligência ArtificialMachine LearningTipos de AprendizadoNão Supervisionado

Considere as duas situações a seguir.

Situação 1

Um órgão do governo está lidando com um grande conjunto de dados contendo informações sobre as declarações fiscais históricas dos cidadãos, bem como erros e discrepâncias que tenham eventualmente sido encontrados nessas declarações. O órgão deseja desenvolver um modelo que possa prever se uma nova declaração fiscal provavelmente contém erros ou discrepâncias, auxiliando na identificação de casos potenciais para investigação adicional.

Situação 2

O departamento de transporte de uma cidade tem acesso a uma grande quantidade de imagens de câmeras de tráfego e deseja entender padrões e pontos de congestionamento na rede viária da cidade, sem categorias ou rótulos predefinidos.

Os modelos que endereçam a situação 1 e a situação 2 são:

Provas

Questão presente nas seguintes provas

3270159 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: CESGRANRIO
Orgão: CPNU/CNU

Provas:

CNU - Bloco 2
Provas ×

Big DataHadoopHDFS

Um empreendimento de alta tecnologia pretende trabalhar com o framework Hadoop para o armazenamento e processamento de dados em larga escala. Pretende-se configurar o Sistema de Arquivos Distribuídos do Hadoop (HDFS), de modo que ele atue como um sistema de arquivos bem distribuídos, atuando na camada de armazenamento do Hadoop.

A configuração adequada para esse sistema HDFS ser mais tolerante a falhas é aquela na qual o sistema se encarrega de

A

criar um diretório no cluster master, para servir de apoio aos dados de armazenamento temporário do sistema distribuído, formando um bloco de arquivos de 64MB associado às aplicações dos clientes, com cada bloco manipulado pelo HDFS.

B

designar as estruturas de dados como nós, associados às funções de monitoração e execução de dados, pretendendo, com isso, checar falhas de acesso aos nós e permitir o reacesso a um nó perdido.

C

estruturar os dados recebidos em blocos de 64 MB, de forma a estabelecer uma coleção de pares com a chave de identificação e o valor, que é o dado propriamente dito, sendo a manipulação realizada por funções construídas com linguagens específicas.

D

particionar os arquivos em blocos de 64 MB e replicar os blocos em três cópias no modo cluster e uma cópia no modo local, alocando os mesmos em servidores diferentes.

E

providenciar, para cada estrutura de dados, uma conexão ao nó ao qual ela está ligada por meio de um link utilizando o protocolo SSH, de modo a manter uma estrutura básica master-slave entre os nós do sistema distribuído de dados, facilitando a localização dos dados no cluster.

Provas

Questão presente nas seguintes provas

3270158 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: CESGRANRIO
Orgão: CPNU/CNU

Provas:

CNU - Bloco 2
Provas ×

BI: Business Intelligence

Em um esforço para melhorar a análise e a tomada de decisão no setor agrícola, um órgão governamental brasileiro implementou um sistema OLAP para monitorar a produção agrícola nacional. O cubo OLAP foi estruturado para incluir as dimensões Tempo (Ano, Mês), Produto (Tipo de Cultura, Variedade) e Região (Estado, Cidade), com medidas de Área Plantada (hectares) e Produção (toneladas). Em um certo momento de sua análise, um analista estava vendo a produção total de soja do estado de Mato Grosso em 2023, mas decidiu que desejava ver apenas a produção da cidade de Sorriso, também em 2023.

Considerando-se esse contexto, qual sequência de operações OLAP o analista deverá realizar para, a partir da visão em que estava, obter a visão desejada?

Provas

Questão presente nas seguintes provas

3270157 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: CESGRANRIO
Orgão: CPNU/CNU

Provas:

CNU - Bloco 2
Provas ×

Análise de DadosAnálise Exploratória

Um órgão governamental precisa analisar a distribuição da população por faixa salarial, a partir de dados individuais do imposto de renda anonimizados. Para isso, dividirá os salários em faixas, para gerar um gráfico que indique a quantidade de contribuintes cujo salário está dentro de cada uma dessas faixas.

Para esse fim, a visualização gráfica mais adequada é o

Provas

Questão presente nas seguintes provas

3270156 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: CESGRANRIO
Orgão: CPNU/CNU

Provas:

CNU - Bloco 2
Provas ×

Inteligência ArtificialMachine Learning

Em um projeto de desenvolvimento de um sistema de visão computacional para identificar e classificar diferentes tipos de objetos em imagens de tráfego urbano, uma equipe de engenheiros optou por utilizar uma rede neural. Para garantir eficiência computacional e uma eficaz propagação do gradiente durante o treinamento do modelo, cada nó da rede foi implementado utilizando a função de ativação ReLU.

A propriedade principal da função ReLU é

Provas

Questão presente nas seguintes provas

3266980 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: IADES
Orgão: BRB

Provas:

Analista de TI
Provas ×

Inteligência ArtificialMachine Learning

Texto hipotético para responder às questões 37 e 38.

João foi selecionado por sua chefia para liderar um projeto de criação de uma inteligência artificial que fosse capaz de classificar, a partir de fotos obtidas pelas câmeras de segurança de cada agência, se, ao entrar na agência, a pessoa está utilizando algum tipo de chapéu, óculos, ambos ou nenhum acessório. Uma base de dados com amostras em quantidade e qualidade suficientes foi fornecida para João. Sendo assim, ele optou por seguir com uma abordagem baseada em modelos de redes neurais.

Ao analisar a base de dados, João notou que havia imagens anotadas com a classe esperada (target preenchido) e também algumas imagens que possuíam o campo de classe esperada vazio. Primeiramente, ele considerou descartar as imagens que não possuíam a classe esperada preenchida, mas, após breve reflexão e muitas pesquisas, decidiu adotar a seguinte estratégia: utilizar as imagens que possuíam a classe esperada para treinar um modelo inicial de classificação. Esse modelo seria usado para predizer as classes das imagens com tal campo vazio. A partir desse ponto, todas as imagens teriam uma classe associada e, assim, todas poderiam ser utilizadas para treinar o modelo final. Essa abordagem é conhecida como aprendizado