3557968 Ano: 2025
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TCE-PI

Provas:

Auditor de Controle Externo - TI/Sistemas, Engenharia de Dados e Ciência de Dados
Provas ×

Inteligência Artificial

A popularização da Internet permitiu que grande parcela da população pudesse expressar suas opiniões na forma de fóruns, blogs, avaliações de produtos, entre outros. Assim, deixou de ser necessário que empresas conduzam enquetes ou pesquisas para que possam saber a opinião dos consumidores sobre seus produtos ou de concorrentes. O volume de textos opinativos disponíveis é tal, que a tarefa de ler, sumarizar e organizar de forma útil essas informações é desafiadora. O campo da análise de sentimento, no processamento de linguagem natural, trata justamente dessa necessidade, da automatização da descoberta e da sumarização de opiniões.
Considerando este tema, avalie as afirmativas a seguir.

I. A análise de sentimentos pode ser tratada como um problema de classificação de textos, onde é importante definir se o texto é objetivo ou subjetivo. Textos subjetivos são os de principal interesse nesse campo de pesquisa.

II. A análise de sentimentos pode ser usada para a identificação de avaliações falsas em sites de e-commerce. Uma limitação para essa aplicação é a dificuldade de obtenção de dados para treinamento de modelos, uma vez que a marcação manual de avaliações com opiniões falsas ou enganosas é muitas vezes difícil.

III. Um exemplo de algoritmo supervisionado de análise de sentimentos para avaliações de produtos pode ser resumido nos seguintes passos: extração de frases com padrões predeterminados de opinião; cálculo de um indicador de orientação de cada frase; obtenção da orientação média da avaliação como um todo; e determinação se é positiva ou negativa.

Está correto o que se afirma em

Provas

Questão presente nas seguintes provas

3556313 Ano: 2025
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TCE-RR

Provas:

Analista Administrativo - TI/Banco de Dados
Provas ×

Big DataHadoop

No contexto de ferramentas de integração de ambientes de Big Data e Banco de Dados relacionais, associe cada descrição a seguir à respectiva ferramenta.

1. Apache Kafka.

2. Apache Sqoop.

( ) Muito usado para transferência de dados entre bancos relacionais para o ecossistema Hadoop.

( ) Suas transferências de dados são baseadas em lotes, focando em transferências programadas ou sob demanda.

( ) Muito usado para streaming de dados em tempo real.

( ) Trabalha com mensageria distribuída, baseada no conceito de tópicos, permite que produtores enviem mensagens e consumidores as processem de forma assíncrona.

A associação correta, na ordem apresentada, é

Provas

Questão presente nas seguintes provas

3556312 Ano: 2025
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TCE-RR

Provas:

Analista Administrativo - TI/Banco de Dados
Provas ×

Big DataConceitos e Fundamentos de Big Data

As organizações públicas podem se beneficiar do uso de Big Data para auditar grandes volumes de informações de maneira eficiente.

Sobre os 5Vs que caracterizam o Big Data, assinale a afirmativa correta.

A

O “volume” refere-se à diversidade de fontes de dados utilizadas no Big Data.

B

A “veracidade” refere-se à necessidade de adaptar sistemas para processar dados provenientes de fontes variadas.

C

A “variedade” está associada à dificuldade em lidar com o grande volume de dados gerados em um curto período.

D

Os 5Vs de Big Data são: volume, variedade, validade, valor e verificação.

E

O “valor” de um conjunto de dados está diretamente ligado à capacidade de extrair informações úteis e significativas.

Provas

Questão presente nas seguintes provas

3556018 Ano: 2025
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TCE-RR

Provas:

Analista Administrativo - TI/Desenvolvimento de Sistemas
Provas ×

BI: Business IntelligenceETL/ELT

No contexto de auditoria e compliance, a pilha ELK Stack (Elasticsearch, Logstash e Kibana) é amplamente usada para analisar e monitorar atividades nos sistemas, especialmente no que se refere à integridade e à segurança de dados.

Sobre as funcionalidades dessa pilha, assinale a afirmativa correta.

A

O Elasticsearch é o componente responsável pela coleta de logs em tempo real, permitindo que os dados sejam enviados diretamente para o Kibana para análise visual.

B

O Logstash é responsável por realizar a visualização de dados e criação de dashboards interativos a partir dos logs coletados.

C

A pilha ELK Stack é limitada à análise de logs de bancos de dados e não é adequada para sistemas de monitoramento de redes ou aplicativos.

D

O Logstash coleta, processa e armazena dados, mas não permite que transformações sejam aplicadas aos logs antes de serem enviados para o Elasticsearch.

E

O Kibana oferece uma interface gráfica para análise e visualização dos dados processados pelo Logstash e armazenados no Elasticsearch.

Provas

Questão presente nas seguintes provas

3555875 Ano: 2025
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TCE-RR

Provas:

Auditor de Controle Externo - TI/Análise de Dados
Provas ×

Inteligência ArtificialMachine LearningAlgoritmosKNN

As Redes Neurais Convolucionais (Convolutional Neural Network - CNNs) são amplamente utilizadas em tarefas de reconhecimento de imagens.

Sobre as características e as arquiteturas das CNNs, avalie as afirmativas a seguir.

I. Uma camada que compõe uma CNN é a camada convolucional. Nela ocorre a subamostragem da imagem, com o objetivo de se diminuir a carga computacional, o uso de memória e o número de parâmetros necessários.

II. LeNet-5, AlexNet e ResNet são exemplos de arquiteturas CNN.

III. A arquitetura de uma CNN é composta exclusivamente por camadas convolucionais e camadas de pooling.

Está correto o que se afirma em

Provas

Questão presente nas seguintes provas

3555873 Ano: 2025
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TCE-RR

Provas:

Auditor de Controle Externo - TI/Análise de Dados
Provas ×

Inteligência ArtificialMachine Learning

Marcelo, auditor especializado em Análise de Dados, está estudando o uso de algoritmos de aprendizado de máquina (Machine Learning) para a detecção de fraudes em contas públicas. Como parte de seus experimentos, ele dividiu seu conjunto de dados em treinamento e teste. Após treinar um modelo, percebeu que os resultados apresentavam indícios de underfitting.

O underfitting ocorre

A

quando o modelo se ajuste bem ao conjunto de treinamento, mas acaba por capturar não apenas os padrões, mas também os ruídos, comprometendo sua capacidade de generalização.

B

apenas quando o conjunto de treinamento não contém exemplos de todas as classes, prejudicando o desempenho do modelo em classes minoritárias.

C

quando o modelo não consegue capturar adequadamente os padrões nos dados do conjunto de treinamento, resultando em um desempenho insuficiente.

D

quando a taxa de aprendizado do modelo é muito baixa, prolongando por exemplo o tempo necessário para que o modelo convirja.

E

quando o modelo apresenta uma complexidade muito maior do que o necessário, levando por exemplo ao uso ineficiente de recursos computacionais.

Provas

Questão presente nas seguintes provas

3555872 Ano: 2025
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TCE-RR

Provas:

Auditor de Controle Externo - TI/Análise de Dados
Provas ×

Inteligência ArtificialMachine Learning

Algoritmos de Aprendizado de Máquina (Machine Learning) podem ser classificados quanto ao tipo de aprendizado. Em relação ao tema, avalie as afirmações a seguir e assinale (V) para a verdadeira e (F) para a falsa.

( ) Tarefas de classificação e regressão são exemplos típicos de aprendizado supervisionado.

( ) No aprendizado não supervisionado, os dados de treinamento não estão rotulados.

( ) SVM, árvores de decisão e regressão logística são exemplos de algoritmos de aprendizado supervisionado.

As afirmativas são, respectivamente,

Provas

Questão presente nas seguintes provas

3555871 Ano: 2025
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TCE-RR

Provas:

Auditor de Controle Externo - TI/Análise de Dados
Provas ×

BI: Business IntelligenceOLAP e OLTP

Você, como analista de dados do TCE-RR, pode ser incumbido de utilizar um cubo OLAP para avaliar as auditorias do tribunal pelas dimensões cidade, tempo e custo.

Considere que a análise possua a seguinte cadeia de ações: filtro para apenas considerar o último ano, detalhamento de ano para mês e agregação de mês para trimestre.

A sequência de ações OLAP será:

Provas

Questão presente nas seguintes provas

3555870 Ano: 2025
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TCE-RR

Provas:

Auditor de Controle Externo - TI/Análise de Dados
Provas ×

Big DataHadoop

O Apache Spark é um mecanismo de análise unificado para processamento de dados em grande escala com diversas aplicações em ciência de dados, machine learning e processamento de gráficos.

Considerando essa ferramenta, julgue as afirmativas a seguir.

I. O Spark pode ser executado no Apache Hadoop, Kubernetes, por conta própria, na nuvem, em máquinas isoladas ou em clusters.

II. DataFrames, SQL e Structured Streaming são exemplos de APIs do Spark.

III. Uma diferença entre o Spark e o MapReduce é que o Spark processa e mantém os dados na memória para as etapas subsequentes, sem gravar ou ler do disco, gerando maior velocidade de processamento.

Está correto o que se afirma em

Provas

Questão presente nas seguintes provas

3555869 Ano: 2025
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TCE-RR

Provas:

Auditor de Controle Externo - TI/Análise de Dados
Provas ×

Inteligência ArtificialMachine LearningTipos de AprendizadoNão Supervisionado

Sobre algoritmos de mineração de dados, avalie as afirmativas a seguir e assinale (V) para a verdadeira e (F) para a falsa.

( ) K-means, também conhecido como K-NN, é um algoritmo baseado na ideia de que objetos semelhantes estão próximos uns dos outros.

( ) Árvore de decisão é uma estrutura hierárquica constituída por nós. Nela, o coeficiente de Gini de um nó é sempre maior do que o do seu nó pai.

( ) O algoritmo SVM, utilizado apenas para a tarefa de classificação, emprega classificadores lineares que separam o conjunto de dados por meio de hiperplanos, não sendo possível seu uso com problemas não linearmente separáveis.

As afirmativas são, respectivamente,