4016109 Ano: 2026
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TJ-RJ

Provas:

Analista Judiciário - TI/Ciência de Dados
Provas ×

Big Data

Diferentes sistemas produzem dados em formatos variados, que podem ser classificados em dados estruturados, semiestruturados ou não estruturados.
Nesse contexto, relacione os tipos de dados às suas respectivas descrições.
1. Dados estruturados
2. Dados semiestruturados
3. Dados não estruturados
( ) Gravações em áudio e vídeo de audiências públicas, armazenadas em arquivos MP4, acompanhadas apenas de nome do arquivo e data de criação.
( ) Registros de protocolo eletrônico armazenados em tabelas de banco de dados relacional, com campos bem definidos (número do processo, data, unidade, assunto) e chaves primárias/estrangeiras.
( ) Arquivos de log de acesso ao portal de serviços do governo, registrados em formato JSON, contendo campos como timestamp, user_id, endpoint, status_code, com alguns campos opcionais variando conforme o tipo de requisição.
A sequência correta é:

Provas

Questão presente nas seguintes provas

4016107 Ano: 2026
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TJ-RJ

Provas:

Analista Judiciário - TI/Arquitetura de Dados
Provas ×
Analista Judiciário - TI/Ciência de Dados
Provas ×
Analista Judiciário - TI/Inteligência Artificial
Provas ×

Uma fintech desenvolveu um pipeline ponta a ponta (end-to-end) de machine learning para detecção de fraudes em transações financeiras.
O pipeline inclui as seguintes etapas:
(1) ingestão de dados em tempo real via streaming;
(2) feature engineering com agregações temporais (médias móveis de 7 e 30 dias);
(3) predição usando um modelo de gradient boosting;
(4) deployment em arquitetura de microsserviços.
Após três meses em produção, o time de MLOps observou degradação gradual no F1-score de 0.89 para 0.72, enquanto o monitoramento revelou que as distribuições das features agregadas apresentavam mudanças estatisticamente significativas (p < 0.01 no teste de Kolmogorov-Smirnov), embora as features brutas individuais permanecessem estáveis.
Considerando as melhores práticas de pipelines de ML em produção e estratégias de deployment, a equipe deve:

A

descartar as features agregadas temporais do pipeline, pois são a causa do data drift observado, e retreinar o modelo usando apenas as features brutas individuais que permaneceram estáveis;

B

implementar apenas alertas de monitoramento mais sensíveis para detectar drift precocemente, mantendo o pipeline atual inalterado, pois o F1-score de 0.72 ainda é considerado aceitável para aplicações de detecção de fraudes em produção;

C

adotar estratégia de deployment blue-green para testar um novo modelo treinado com dados recentes em paralelo com o modelo atual, direcionando gradualmente o tráfego para o novo modelo enquanto monitora métricas de desempenho e features drift;

D

implementar um sistema de retreinamento automático com janela deslizante que periodicamente atualiza o modelo com dados recentes, mantendo as features agregadas mas recalculando-as sobre períodos mais curtos para reduzir latência conceitual;

E

aumentar a complexidade do modelo substituindo gradient boosting por deep learning com redes neurais recorrentes, pois modelos mais complexos são mais robustos a drift e podem capturar padrões temporais automaticamente sem feature engineering.

Provas

Questão presente nas seguintes provas

4016106 Ano: 2026
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TJ-RJ

Provas:

Analista Judiciário - TI/Arquitetura de Dados
Provas ×
Analista Judiciário - TI/Ciência de Dados
Provas ×
Analista Judiciário - TI/Inteligência Artificial
Provas ×

Uma empresa de e-commerce implantou um modelo de machine learning para prever a probabilidade de churn, métrica que indica a rotatividade ou evasão de clientes. Após seis meses em produção, a equipe de dados observou que, embora as distribuições estatísticas das features de entrada permanecessem estáveis (mesmas médias, mesmos desvios-padrão e mesmas distribuições), o relacionamento entre essas features e a variável-alvo (churn) havia mudado significativamente devido a alterações no comportamento dos consumidores causadas por novas políticas de fidelização da empresa.
Diante desse cenário, é correto afirmar que o modelo:

A

requer apenas ajustes nos hiperparâmetros através de validação cruzada com os dados históricos originais, mantendo a mesma arquitetura e features do pipeline de produção atual;

B

está sofrendo de concept drift, uma vez que a relação entre as features e o target mudou, requerendo retreinamento do modelo com dados recentes que reflitam o novo comportamento dos clientes;

C

não apresenta problemas, pois as distribuições estatísticas das features permanecem estáveis, e mudanças em políticas internas da empresa não afetam a capacidade preditiva de modelos já treinados;

D

está sofrendo de data drift, pois as características dos dados de entrada mudaram ao longo do tempo, sendo necessário realizar feature engineering adicional para capturar as novas políticas de fidelização;

E

apresenta tanto data drift quanto concept drift simultaneamente, sendo necessário reprojetar completamente o pipeline de machine learning incluindo nova coleta de dados e arquitetura de modelo.

Provas

Questão presente nas seguintes provas

4016105 Ano: 2026
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TJ-RJ

Provas:

Analista Judiciário - TI/Arquitetura de Dados
Provas ×
Analista Judiciário - TI/Ciência de Dados
Provas ×
Analista Judiciário - TI/Inteligência Artificial
Provas ×

Inteligência ArtificialMachine LearningAvaliação de ModelosOverfitting e Underfitting

O desempenho de modelos de aprendizado de máquina está intrinsecamente relacionado ao equilíbrio entre viés e variância. Modelos com alto viés tendem a simplificar excessivamente o problema, resultando em subajuste (underfitting), enquanto modelos com alta variância podem capturar ruído nos dados de treinamento, levando ao sobreajuste (overfitting). Para mitigar esses problemas, diversas técnicas de regularização podem ser empregadas, ajustando a complexidade do modelo e melhorando sua capacidade de generalização.
Considerando os conceitos de compensação viés-variância, sobreajuste, subajuste e técnicas de regularização, é correto afirmar que:

A

o aumento do parâmetro de regularização (lambda ou alpha) reduz o viés do modelo ao permitir que ele capture padrões mais complexos, sendo recomendado para corrigir problemas de underfitting em redes neurais profundas;

B

a regularização L1 (Lasso) e a regularização L2 (Ridge) produzem resultados idênticos em termos de seleção de features, diferindo apenas na velocidade de convergência do algoritmo de otimização durante o treinamento;

C

a validação cruzada (cross-validation) é uma técnica de regularização que modifica a função de perda adicionando um termo de penalização aos coeficientes do modelo, reduzindo assim a variância sem alterar o viés;

D

modelos com sobreajuste apresentam alto viés e baixa variância, razão pela qual técnicas de regularização são aplicadas para aumentar a complexidade do modelo e melhorar seu desempenho no conjunto de treinamento;

E

o aumento do parâmetro de regularização (lambda ou alpha) em modelos regularizados reduz a complexidade efetiva do modelo, aumentando o viés e reduzindo a variância, sendo uma estratégia eficaz contra overfitting, mas que pode levar a underfitting se aplicado excessivamente.

Provas

Questão presente nas seguintes provas

4016104 Ano: 2026
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TJ-RJ

Provas:

Analista Judiciário - TI/Arquitetura de Dados
Provas ×
Analista Judiciário - TI/Ciência de Dados
Provas ×
Analista Judiciário - TI/Inteligência Artificial
Provas ×

O aprendizado de máquina (machine learning) é frequentemente categorizado em diferentes paradigmas, dependendo da natureza dos dados disponíveis e do problema a ser resolvido. Dois dos tipos mais comuns são o aprendizado supervisionado e o aprendizado não supervisionado.
A principal diferença conceitual entre essas duas abordagens reside no fato de que, no aprendizado supervisionado:

A

o algoritmo opera sobre dados que não possuem classificação prévia, buscando encontrar padrões ou estruturas ocultas por conta própria;

B

o conjunto de dados de treinamento contém pares de dados de entrada e seus respectivos rótulos (labels) ou respostas corretas desejadas;

C

o sistema aprende através da interação com um ambiente dinâmico, recebendo sinais de recompensa ou punição baseados em suas ações;

D

o objetivo principal é sempre reduzir a dimensionalidade dos dados para facilitar a visualização, ignorando as variáveis de saída;

E

não é necessário separar os dados em conjuntos de treino e teste, visto que a validação ocorre simultaneamente ao processamento.

Provas

Questão presente nas seguintes provas

4016103 Ano: 2026
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TJ-RJ

Provas:

Analista Judiciário - TI/Arquitetura de Dados
Provas ×
Analista Judiciário - TI/Ciência de Dados
Provas ×
Analista Judiciário - TI/Inteligência Artificial
Provas ×

BI: Business IntelligenceData Warehouse

Um time está iniciando a migração de dados de um sistema transacional (OLTP) legado para um novo Data Warehouse (DW) corporativo. O sistema legado possui um modelo de dados altamente normalizado, atendendo à Terceira Forma Normal (3FN), o que garante a integridade das transações diárias. No entanto, para o novo ambiente analítico, cujo foco é a geração de relatórios gerenciais e painéis de BI (Business Intelligence) com alto volume de leitura, o arquiteto decidiu aplicar técnicas de desnormalização intencional em algumas tabelas, consolidando dados de produtos e categorias em uma única estrutura dimensional.
Considerando os impactos dessa decisão de projeto e os fundamentos da modelagem de dados, é correto afirmar que:

A

a desnormalização tem como objetivo principal otimizar as operações de escrita (inserts e updates), pois, ao repetir os dados em uma única tabela, o banco de dados elimina a necessidade de verificar restrições de integridade referencial em múltiplas tabelas;

B

a estratégia adotada visa a reduzir a quantidade de junções (joins) necessárias durante as consultas analíticas, melhorando o desempenho de leitura, embora isso acarrete aumento do espaço de armazenamento e risco de anomalias de atualização;

C

a manutenção do modelo na Terceira Forma Normal (3FN) seria a escolha ideal para o Data Warehouse, pois a normalização maximiza a performance de consultas de agregação ao garantir que os dados não estejam duplicados, facilitando a leitura sequencial do disco;

D

desnormalização é um requisito obrigatório para bancos de dados NoSQL, mas é tecnicamente inviável em bancos de dados relacionais (SQL), visto que estes não suportam a existência de redundância de dados dentro de uma mesma tabela;

E

ao desnormalizar as tabelas, o arquiteto está transformando o modelo em um esquema floco de neve (Snowflake), que é caracterizado justamente pelo uso de tabelas de dimensão únicas e planas, contendo todos os atributos descritivos sem relacionamentos hierárquicos externos.

Provas

Questão presente nas seguintes provas

4016102 Ano: 2026
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TJ-RJ

Provas:

Analista Judiciário - TI/Arquitetura de Dados
Provas ×
Analista Judiciário - TI/Ciência de Dados
Provas ×
Analista Judiciário - TI/Inteligência Artificial
Provas ×

BI: Business IntelligenceData Warehouse

Um arquiteto de dados está projetando o Data Warehouse (DW) de uma grande rede de varejo. A tabela de fatos de vendas (Fato_Vendas) deverá ser conectada a uma dimensão de produtos. A hierarquia dos produtos é complexa e profunda: Departamento → Divisão → Categoria → Subcategoria → Produto.
O administrador de banco de dados (DBA), preocupado com a integridade dos dados e o espaço de armazenamento, propôs que essa hierarquia fosse modelada seguindo os princípios da normalização. Segundo a proposta, a tabela de produtos conteria apenas o ID da subcategoria, que apontaria para uma tabela de subcategorias, que, por sua vez, apontaria para uma tabela de categorias, e assim sucessivamente, evitando a repetição de textos descritivos (como o nome do departamento) em milhões de linhas de produtos.
Considerando os conceitos de modelagem dimensional (Ralph Kimball) e o impacto dessa decisão na performance de consultas analíticas (OLAP), é correto afirmar que:

A

a proposta do DBA configura um esquema floco de neve (Snowflake Schema); embora economize espaço em disco e facilite a manutenção da integridade referencial, essa abordagem prejudica o desempenho das consultas de Business Intelligence (BI) ao exigir múltiplas junções (joins) para recuperar a descrição completa dos atributos hierárquicos;

B

a abordagem sugerida caracteriza um esquema estrela (Star Schema), que é o padrão recomendado pela metodologia Kimball, pois a normalização das dimensões garante que o motor de banco de dados utilize índices bitmap de forma mais eficiente, acelerando o filtro de consultas agregadas;

C

a desnormalização completa da dimensão, consolidando todos os níveis hierárquicos em uma única tabela Dim_Produto (esquema estrela), deve ser evitada em Data Warehouses modernos baseados em armazenamento colunar, pois a redundância de dados textuais impede a compressão eficiente e aumenta o I/O de disco;

D

a proposta do DBA visa a transformar o modelo dimensional em um modelo relacional de Terceira Forma Normal (3FN), o que inviabiliza o uso de ferramentas de visualização de dados (como Power BI ou Tableau), visto que essas ferramentas são tecnicamente incompatíveis com tabelas normalizadas;

E

a tabela fato, tanto no esquema estrela quanto no floco de neve, deve ser normalizada para evitar a duplicação de métricas; a diferença reside apenas no fato de que o esquema floco de neve utiliza chaves naturais (CPF, CNPJ) nas junções, enquanto o esquema estrela exige o uso de chaves substitutas (Surrogate Keys).

Provas

Questão presente nas seguintes provas

4016101 Ano: 2026
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TJ-RJ

Provas:

Analista Judiciário - TI/Arquitetura de Dados
Provas ×
Analista Judiciário - TI/Ciência de Dados
Provas ×
Analista Judiciário - TI/Inteligência Artificial
Provas ×

Big Data

Uma corporação multinacional do setor de varejo está unificando suas plataformas de dados. O cenário atual apresenta dois desafios distintos, indicados a seguir.
• Transacional e BI: o sistema de vendas gera registros financeiros que exigem consistência estrita (ACID). A equipe de analistas de negócios consome esses dados via painéis de BI que demandam baixa latência em consultas complexas com múltiplas junções (joins).
• Big Data e IA: o sistema de e-commerce gera petabytes de logs de navegação (clickstream) e dados de sensores IoT das lojas físicas (dados semiestruturados). A equipe de ciência de dados precisa acessar esses dados em seu formato bruto para treinar modelos preditivos, sem a perda de informações causada por agregações prematuras.
O arquiteto de dados precisa propor uma solução única que evite a duplicação de dados entre silos (um Data Warehouse para o BI e um Data Lake para a IA) e reduza o custo de armazenamento, mantendo a governança.
Considerando os requisitos apresentados e as características das arquiteturas modernas de dados, a abordagem arquitetural e de modelagem adequada é:

A

implementar um Data Warehouse Enterprise (EDW) baseado em banco de dados relacional com modelagem normalizada (3FN) para todos os dados, garantindo a integridade referencial tanto das vendas quanto dos logs, visto que a normalização é a única forma de garantir consistência ACID em escala de petabytes;

B

adotar uma arquitetura Data Lake pura (baseada em Hadoop/HDFS ou Object Storage), utilizando a abordagem Schema-on-Read para todos os consumidores; isso atenderá à equipe de ciência de dados, e a equipe de BI deverá adaptar suas ferramentas para realizar as agregações e junções em tempo de execução, aceitando a latência inerente à varredura de arquivos brutos;

C

manter a separação física, construindo um Data Mart dimensional para cada departamento dentro de um banco relacional proprietário e utilizando ferramentas de federação de dados (Data Virtualization) para que a equipe de ciência de dados consulte o Data Mart em tempo real, evitando assim a construção de um Data Lake e garantindo que o modelo de dados seja sempre Schema-on-Write;

D

utilizar um banco de dados NoSQL orientado a documentos (como MongoDB) para centralizar tanto as vendas quanto os logs, aproveitando a flexibilidade do esquema (schemaless) para ingerir dados heterogêneos rapidamente, e resolver a necessidade de BI através de processos de desnormalização extrema, armazenando todos os dados relacionados em um único documento aninhado para evitar joins;

E

implementar uma arquitetura Lakehouse, utilizando formatos de tabela abertos (como Delta Lake ou Apache Iceberg) sobre o armazenamento de objetos; isso permite aplicar transações ACID e Schema Enforcement nos dados de vendas, enquanto se adota uma modelagem dimensional (esquema estrela) na camada "Gold" para performance de BI, mantendo os dados brutos (camada "Bronze") acessíveis para Machine Learning.

Provas

Questão presente nas seguintes provas

4014374 Ano: 2026
Disciplina: TI - Ciência de Dados e BI
Banca: IBGP
Orgão: Câm. Porto Velho-RO

Provas:

Analista de TI
Provas ×

BI: Business IntelligenceOLAP e OLTP

Considerando um Sistemas Gerenciadores de Banco de Dados (SGBD) multiusuários, o processamento de transações on-line (OLTP) e as propriedades das transações, bem como os conceitos fundamentais da linguagem SQL e das operações realizadas em bancos de dados relacionais, avalie a afirmativas a seguir.

I. Em um SGBD multiusuário, o mecanismo de controle de concorrência é essencial para assegurar que operações de atualização simultâneas sobre o mesmo dado resultem estados logicamente corretos do banco de dados, sendo essa uma característica das aplicações OLTP.
II. O conceito de transação pressupõe que comandos SQL de inserção, de alteração e de exclusão possam ser executados de forma autônoma, ausente a necessidade de garantia de atomicidade, desde que o isolamento entre transações concorrentes seja preservado.
III. A propriedade de isolamento garante que, mesmo com centenas de transações executadas simultaneamente, cada transação se comporte como se estivesse sendo executada sozinha, o que diferencia um SGBD de um sistema tradicional de processamento de arquivos.
IV. A atomicidade assegura que todas as operações de manipulação de dados realizadas por uma transação, como comandos SQL de atualização em tabelas, sejam efetivadas integralmente ou totalmente desfeitas, caso ocorra alguma falha durante sua execução.

Está CORRETO o que se afirma em

Provas

Questão presente nas seguintes provas

4010842 Ano: 2026
Disciplina: TI - Ciência de Dados e BI
Banca: Funatec
Orgão: Pref. São José Divino-PI

Provas:

Professor do Ensino Fundamental - Informática
Provas ×

Inteligência ArtificialConceitos e Fundamentos de IA

Um sistema analisa dados históricos de clientes para prever se um novo cliente será bom ou mau pagador, com base em atributos como renda, idade e profissão. Com base nessa informação, é possível concluir que essa tarefa caracteriza um problema de: