Foram encontradas 5.143 questões.
Uma Secretaria da Fazenda Estadual recebeu uma base de dados contendo 2,3 milhões de registros de declarações fiscais para
análise de conformidade tributária. Durante a fase de exploração inicial, a equipe técnica identificou diversos problemas: campos de
CNPJ com formatações inconsistentes (alguns com pontuação, outros sem), valores monetários registrados com separadores
decimais divergentes (vírgula e ponto), datas em formatos distintos (DD/MM/AÄAA, AAAA-MM-DD), campos obrigatórios vazios em
aproximadamente 12% dos registros, e a presença de valores extremos de receita bruta (outliers) que distorciam as análises
estatísticas. Além disso, a variável "regime tributário" apresentava categorias redundantes devidoa erros de digitação (ex:
"Simples Nacional", "SIMPLES NACIONAL", "Simples nacional"). Para viabilizar a análise de risco fiscal e a construção de modelos
preditivos, tornou-se necessário aplicar técnicas sistemáticas de preparação dos dados antes do processamento analítico.
Considerando as melhores práticas de pré-processamento de dados, o tratamento correto e adequado para essa situação é
Provas
Questão presente nas seguintes provas
No desenvolvimento de um modelo de detecção de contribuintes com alto risco de simulação de operações, após definir claramente com a área de fiscalização quais tipos de fraude serão priorizados, quais indicadores de negócio serão acompanhados
(como aumento de autos de infração qualificados e redução de fiscalizações improdutivas) e quais restrições legais e
operacionais existem para uso do modelo, a equipe de uma Secretaria da Fazenda registra esses critérios e alinha expectativas
com a alta gestão. Com base na metodologia CRISP-DM, essa descrição se encaixa principalmente na fase de
Provas
Questão presente nas seguintes provas
Uma equipe de auditoria possui uma tabela de NF-e com mais de 1 bilhão de registros em um pyspark.sgl.DataFrame
chamado df. A auditora deseja inspecionar apenas 1.000 registros localmente em seu notebook, usando funcionalidades
avangadas de pandas para buscar inconsisténcias. Nesse cenário, a abordagem em PySpark mais apropriada para gerar esses
registros em um pandas. DataFrame, minimizando o risco de estouro de memória no ambiente local é:
Provas
Questão presente nas seguintes provas
Uma Secretaria da Fazenda pretende, ao mesmo tempo:
I. prever o valor de arrecadação mensal de ICMS para os próximos meses;
II. classificar cada declaração de contribuinte em “alto risco” ou “baixo risco” para fins de seleção de auditoria.
Considerando os tipos de modelos de aprendizado de maquina, a combinação de tarefas que está conceitualmente alinhada com esses objetivos é:
I. prever o valor de arrecadação mensal de ICMS para os próximos meses;
II. classificar cada declaração de contribuinte em “alto risco” ou “baixo risco” para fins de seleção de auditoria.
Considerando os tipos de modelos de aprendizado de maquina, a combinação de tarefas que está conceitualmente alinhada com esses objetivos é:
Provas
Questão presente nas seguintes provas
Uma base tributaria de uma SEFAZ é analisada por meio de um cubo OLAP de arrecadação de ISS, com as seguintes
dimensões: Ano, Município, Atividade econômica, Regime tributário e Contribuinte. Em uma reunido, um
analista parte de uma visão agregada da arrecadação anual por município, em seguida, navega para uma visão mensal e depois
para uma visão por contribuinte dentro de um município especifico, mantendo as demais dimensões fixas. Do ponto de vista
conceitual em OLAP, essa sequência de operações é um exemplo de
Provas
Questão presente nas seguintes provas
Uma Secretaria da Fazenda projeta um Data Lake para suportar fiscalização eletrônica, com ingestão diária de notas fiscais
eletrônicas, conhecimentos eletrônicos de transporte de cargas, registros fiscais digitais entregues ao fisco, declarações do
SIMPLES Nacional e recolhimentos. A equipe adota uma arquitetura em zonas (raw/bronze, refined/silver, curated/gold), com
processos de ELT. Para o uso por auditores fiscais e cientistas de dados, a descrição mais adequada é que a zona raw/bronze
Provas
Questão presente nas seguintes provas
4047108
Ano: 2026
Disciplina: TI - Ciência de Dados e BI
Banca: CONSULPAM
Orgão: Pref. Eusébio-CE
Disciplina: TI - Ciência de Dados e BI
Banca: CONSULPAM
Orgão: Pref. Eusébio-CE
Provas:
Uma secretaria municipal implantou um Data
Warehouse para consolidar dados de atendimento de
vários sistemas legados. Em reuniões com a área de
negócio, foi solicitado ao Técnico de TI que os
relatórios permitam analisar “quantidade de
atendimentos” e “tempo médio de atendimento” por
tempo, unidade e tipo de serviço, com boa
performance para agregações e filtros. Para isso, o
Técnico de TI e sua equipe de dados adotaram a
modelagem dimensional. Diante do exposto, assinale
a alternativa que apresenta CORRETAMENTE o
papel da tabela fato nesse cenário.
Provas
Questão presente nas seguintes provas
4047107
Ano: 2026
Disciplina: TI - Ciência de Dados e BI
Banca: CONSULPAM
Orgão: Pref. Eusébio-CE
Disciplina: TI - Ciência de Dados e BI
Banca: CONSULPAM
Orgão: Pref. Eusébio-CE
Provas:
Uma entidade pública deseja um novo sistema de
relatórios gerenciais consolidados com histórico,
apresentando questões como tendência por mês,
comparativo por unidade e tipo de serviço. Esta nova
solução não pode impactar o desempenho dos
sistemas transacionais atuais. Nesse caso, é uma
solução CORRETA ao objetivo do cenário
apresentado:
Provas
Questão presente nas seguintes provas
As redes neurais artificiais, utilizadas em diversos sistemas de IA, inspiram-se:
Provas
Questão presente nas seguintes provas
Um servidor público utiliza uma ferramenta de Inteligência Artificial (IA) para realizar
pesquisas e auxiliar na tomada de decisões administrativas. Considerando os cuidados necessários no
uso de ferramentas de IA no ambiente institucional, é correto afirmar que:
Provas
Questão presente nas seguintes provas
Cadernos
Caderno Container