Magna Concursos

Foram encontradas 5.143 questões.

A popularização da Internet permitiu que grande parcela da população pudesse expressar suas opiniões na forma de fóruns, blogs, avaliações de produtos, entre outros. Assim, deixou de ser necessário que empresas conduzam enquetes ou pesquisas para que possam saber a opinião dos consumidores sobre seus produtos ou de concorrentes. O volume de textos opinativos disponíveis é tal, que a tarefa de ler, sumarizar e organizar de forma útil essas informações é desafiadora. O campo da análise de sentimento, no processamento de linguagem natural, trata justamente dessa necessidade, da automatização da descoberta e da sumarização de opiniões.
Considerando este tema, avalie as afirmativas a seguir.

I. A análise de sentimentos pode ser tratada como um problema de classificação de textos, onde é importante definir se o texto é objetivo ou subjetivo. Textos subjetivos são os de principal interesse nesse campo de pesquisa.

II. A análise de sentimentos pode ser usada para a identificação de avaliações falsas em sites de e-commerce. Uma limitação para essa aplicação é a dificuldade de obtenção de dados para treinamento de modelos, uma vez que a marcação manual de avaliações com opiniões falsas ou enganosas é muitas vezes difícil.

III. Um exemplo de algoritmo supervisionado de análise de sentimentos para avaliações de produtos pode ser resumido nos seguintes passos: extração de frases com padrões predeterminados de opinião; cálculo de um indicador de orientação de cada frase; obtenção da orientação média da avaliação como um todo; e determinação se é positiva ou negativa.

Está correto o que se afirma em
 

Provas

Questão presente nas seguintes provas
3556313 Ano: 2025
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TCE-RR

No contexto de ferramentas de integração de ambientes de Big Data e Banco de Dados relacionais, associe cada descrição a seguir à respectiva ferramenta.

1. Apache Kafka.

2. Apache Sqoop.

( ) Muito usado para transferência de dados entre bancos relacionais para o ecossistema Hadoop.

( ) Suas transferências de dados são baseadas em lotes, focando em transferências programadas ou sob demanda.

( ) Muito usado para streaming de dados em tempo real.

( ) Trabalha com mensageria distribuída, baseada no conceito de tópicos, permite que produtores enviem mensagens e consumidores as processem de forma assíncrona.

A associação correta, na ordem apresentada, é

 

Provas

Questão presente nas seguintes provas
3556312 Ano: 2025
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TCE-RR

As organizações públicas podem se beneficiar do uso de Big Data para auditar grandes volumes de informações de maneira eficiente.

Sobre os 5Vs que caracterizam o Big Data, assinale a afirmativa correta.

 

Provas

Questão presente nas seguintes provas

No contexto de auditoria e compliance, a pilha ELK Stack (Elasticsearch, Logstash e Kibana) é amplamente usada para analisar e monitorar atividades nos sistemas, especialmente no que se refere à integridade e à segurança de dados.

Sobre as funcionalidades dessa pilha, assinale a afirmativa correta.

 

Provas

Questão presente nas seguintes provas
3555875 Ano: 2025
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TCE-RR

As Redes Neurais Convolucionais (Convolutional Neural Network - CNNs) são amplamente utilizadas em tarefas de reconhecimento de imagens.

Sobre as características e as arquiteturas das CNNs, avalie as afirmativas a seguir.

I. Uma camada que compõe uma CNN é a camada convolucional. Nela ocorre a subamostragem da imagem, com o objetivo de se diminuir a carga computacional, o uso de memória e o número de parâmetros necessários.

II. LeNet-5, AlexNet e ResNet são exemplos de arquiteturas CNN.

III. A arquitetura de uma CNN é composta exclusivamente por camadas convolucionais e camadas de pooling.

Está correto o que se afirma em

 

Provas

Questão presente nas seguintes provas
3555873 Ano: 2025
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TCE-RR

Marcelo, auditor especializado em Análise de Dados, está estudando o uso de algoritmos de aprendizado de máquina (Machine Learning) para a detecção de fraudes em contas públicas. Como parte de seus experimentos, ele dividiu seu conjunto de dados em treinamento e teste. Após treinar um modelo, percebeu que os resultados apresentavam indícios de underfitting.

O underfitting ocorre

 

Provas

Questão presente nas seguintes provas
3555872 Ano: 2025
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TCE-RR

Algoritmos de Aprendizado de Máquina (Machine Learning) podem ser classificados quanto ao tipo de aprendizado. Em relação ao tema, avalie as afirmações a seguir e assinale (V) para a verdadeira e (F) para a falsa.

( ) Tarefas de classificação e regressão são exemplos típicos de aprendizado supervisionado.

( ) No aprendizado não supervisionado, os dados de treinamento não estão rotulados.

( ) SVM, árvores de decisão e regressão logística são exemplos de algoritmos de aprendizado supervisionado.

As afirmativas são, respectivamente,

 

Provas

Questão presente nas seguintes provas
3555871 Ano: 2025
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TCE-RR

Você, como analista de dados do TCE-RR, pode ser incumbido de utilizar um cubo OLAP para avaliar as auditorias do tribunal pelas dimensões cidade, tempo e custo.

Considere que a análise possua a seguinte cadeia de ações: filtro para apenas considerar o último ano, detalhamento de ano para mês e agregação de mês para trimestre.

A sequência de ações OLAP será:

 

Provas

Questão presente nas seguintes provas
3555870 Ano: 2025
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TCE-RR

O Apache Spark é um mecanismo de análise unificado para processamento de dados em grande escala com diversas aplicações em ciência de dados, machine learning e processamento de gráficos.

Considerando essa ferramenta, julgue as afirmativas a seguir.

I. O Spark pode ser executado no Apache Hadoop, Kubernetes, por conta própria, na nuvem, em máquinas isoladas ou em clusters.

II. DataFrames, SQL e Structured Streaming são exemplos de APIs do Spark.

III. Uma diferença entre o Spark e o MapReduce é que o Spark processa e mantém os dados na memória para as etapas subsequentes, sem gravar ou ler do disco, gerando maior velocidade de processamento.

Está correto o que se afirma em

 

Provas

Questão presente nas seguintes provas
3555869 Ano: 2025
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TCE-RR

Sobre algoritmos de mineração de dados, avalie as afirmativas a seguir e assinale (V) para a verdadeira e (F) para a falsa.

( ) K-means, também conhecido como K-NN, é um algoritmo baseado na ideia de que objetos semelhantes estão próximos uns dos outros.

( ) Árvore de decisão é uma estrutura hierárquica constituída por nós. Nela, o coeficiente de Gini de um nó é sempre maior do que o do seu nó pai.

( ) O algoritmo SVM, utilizado apenas para a tarefa de classificação, emprega classificadores lineares que separam o conjunto de dados por meio de hiperplanos, não sendo possível seu uso com problemas não linearmente separáveis.

As afirmativas são, respectivamente,

 

Provas

Questão presente nas seguintes provas