Foram encontradas 5.143 questões.
Considere as afirmativas acerca de Mineração de Dados:
I - As soluções para resolver o problema de valores ausentes são diversas, sendo as mais comuns: remoção do exemplar em que ocorre a falta do valor, preenchimento manual dos valores e preenchimento automático dos valores.
II - Os valores ruidosos referem-se a modificações dos valores originais e que, portanto, consistem em erros de medidas ou em valores consideravelmente diferentes da maioria dos outros valores do conjunto de dados, os chamados outliers. Há duas abordagens para o tratamento destes dados: inspeção e correção manual; e identificação e limpeza automática.
III - Procedimentos para integração de dados consistem em realizar ações que permitam integrar, adequadamente, dados provenientes de diversas fontes de dados. Geralmente, quando os dados provêm de diferentes fontes, os valores assumidos por atributos não possuem o mesmo domínio ou não estão formatados sob o mesmo tipo de dado, ainda que digam respeito à mesma descrição de uma entidade do mundo real. As principais motivações para a aplicação de procedimentos de integração de dados são, portanto, a presença de valores inconsistentes e a presença de valores redundantes.
De acordo com Silva, Peres e Boscarioli (2016), é CORRETO afirmar que:
Provas
Avalie as sentenças sobre Mineração de Dados:
I - A mineração de dados é uma disciplina exclusiva da engenharia da computação, utilizada como ferramenta por demais áreas de conhecimento.
II- As tarefas descritivas da mineração de dados fazem inferência a partir dos dados e possuem o objetivo de realizar predições.
III - Durante as tarefas de mineração de dados, os valores de dados outliers não podem ser descartados, para garantir a fidedignidade do modelo em uso.
Conforme Castro e Ferrari (2016), é CORRETO afirmar que:
Provas
Considere a seguinte Tabela de valores críticos da estatística \( \chi^2 \) ao nível de significância 5%:
|
Graus de liberdade |
\( \chi^2 \) crítico para \( \alpha \) = 5% |
|
1 |
3,8 |
|
2 |
6,0 |
|
3 |
7,8 |
|
4 |
9,5 |
|
280 |
320,0 |
Uma política pública visava capacitar profissionais em situação de desemprego, para facilitar-lhes a reinserção no mercado de trabalho.
Um estudo acerca da efetividade dessa política tomou uma amostra aleatória de 100 profissionais desempregados que foram capacitados no âmbito dessa política e outros 200 profissionais desempregados que, embora elegíveis para serem capacitados, não o foram.
A análise descritiva da amostra concluiu que, um ano após o término do curso, 80 profissionais dentre os 100 profissionais que foram capacitados estavam empregados e 100 profissionais dentre os 200 profissionais que não foram capacitados também estavam empregados.
Com o intuito de avaliar a efetividade dessa política pública, faz-se, dentre outras análises, um teste de independência \( \chi^2 \) que verifica se há (ou não) relação entre ter realizado a capacitação profissional e ser reinserido no mercado de trabalho.
Ao nível de significância de 5%, conclui-se que a política pública
Provas
- Inteligência ArtificialMachine LearningTipos de AprendizadoSupervisionado
- Inteligência ArtificialMachine LearningTipos de AprendizadoNão Supervisionado
Considere as duas situações a seguir.
Situação 1
Um órgão do governo está lidando com um grande conjunto de dados contendo informações sobre as declarações fiscais históricas dos cidadãos, bem como erros e discrepâncias que tenham eventualmente sido encontrados nessas declarações. O órgão deseja desenvolver um modelo que possa prever se uma nova declaração fiscal provavelmente contém erros ou discrepâncias, auxiliando na identificação de casos potenciais para investigação adicional.
Situação 2
O departamento de transporte de uma cidade tem acesso a uma grande quantidade de imagens de câmeras de tráfego e deseja entender padrões e pontos de congestionamento na rede viária da cidade, sem categorias ou rótulos predefinidos.
Os modelos que endereçam a situação 1 e a situação 2 são:
Provas
Um empreendimento de alta tecnologia pretende trabalhar com o framework Hadoop para o armazenamento e processamento de dados em larga escala. Pretende-se configurar o Sistema de Arquivos Distribuídos do Hadoop (HDFS), de modo que ele atue como um sistema de arquivos bem distribuídos, atuando na camada de armazenamento do Hadoop.
A configuração adequada para esse sistema HDFS ser mais tolerante a falhas é aquela na qual o sistema se encarrega de
Provas
Em um esforço para melhorar a análise e a tomada de decisão no setor agrícola, um órgão governamental brasileiro implementou um sistema OLAP para monitorar a produção agrícola nacional. O cubo OLAP foi estruturado para incluir as dimensões Tempo (Ano, Mês), Produto (Tipo de Cultura, Variedade) e Região (Estado, Cidade), com medidas de Área Plantada (hectares) e Produção (toneladas). Em um certo momento de sua análise, um analista estava vendo a produção total de soja do estado de Mato Grosso em 2023, mas decidiu que desejava ver apenas a produção da cidade de Sorriso, também em 2023.
Considerando-se esse contexto, qual sequência de operações OLAP o analista deverá realizar para, a partir da visão em que estava, obter a visão desejada?
Provas
Um órgão governamental precisa analisar a distribuição da população por faixa salarial, a partir de dados individuais do imposto de renda anonimizados. Para isso, dividirá os salários em faixas, para gerar um gráfico que indique a quantidade de contribuintes cujo salário está dentro de cada uma dessas faixas.
Para esse fim, a visualização gráfica mais adequada é o
Provas
Em um projeto de desenvolvimento de um sistema de visão computacional para identificar e classificar diferentes tipos de objetos em imagens de tráfego urbano, uma equipe de engenheiros optou por utilizar uma rede neural. Para garantir eficiência computacional e uma eficaz propagação do gradiente durante o treinamento do modelo, cada nó da rede foi implementado utilizando a função de ativação ReLU.
A propriedade principal da função ReLU é
Provas
Texto hipotético para responder às questões 37 e 38.
João foi selecionado por sua chefia para liderar um projeto de criação de uma inteligência artificial que fosse capaz de classificar, a partir de fotos obtidas pelas câmeras de segurança de cada agência, se, ao entrar na agência, a pessoa está utilizando algum tipo de chapéu, óculos, ambos ou nenhum acessório. Uma base de dados com amostras em quantidade e qualidade suficientes foi fornecida para João. Sendo assim, ele optou por seguir com uma abordagem baseada em modelos de redes neurais.
Ao analisar a base de dados, João notou que havia imagens anotadas com a classe esperada (target preenchido) e também algumas imagens que possuíam o campo de classe esperada vazio. Primeiramente, ele considerou descartar as imagens que não possuíam a classe esperada preenchida, mas, após breve reflexão e muitas pesquisas, decidiu adotar a seguinte estratégia: utilizar as imagens que possuíam a classe esperada para treinar um modelo inicial de classificação. Esse modelo seria usado para predizer as classes das imagens com tal campo vazio. A partir desse ponto, todas as imagens teriam uma classe associada e, assim, todas poderiam ser utilizadas para treinar o modelo final. Essa abordagem é conhecida como aprendizado
Provas
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: SEPLAG-CE
No que se refere a Big Data e analytics, julgue o item a seguir.
Nas técnicas de classificação e clusterização de dados, as classes, ou categorias, devem existir previamente à sua aplicação.
Provas
Caderno Container