4047855 Ano: 2026
Disciplina: TI - Ciência de Dados e BI
Banca: FCC
Orgão: SEFAZ-SP

Provas:

Auditor-Fiscal da Receita Estadual - Gestão Tributária
Provas ×

BI: Business IntelligenceETL/ELT

Uma Secretaria da Fazenda Estadual recebeu uma base de dados contendo 2,3 milhões de registros de declarações fiscais para análise de conformidade tributária. Durante a fase de exploração inicial, a equipe técnica identificou diversos problemas: campos de CNPJ com formatações inconsistentes (alguns com pontuação, outros sem), valores monetários registrados com separadores decimais divergentes (vírgula e ponto), datas em formatos distintos (DD/MM/AÄAA, AAAA-MM-DD), campos obrigatórios vazios em aproximadamente 12% dos registros, e a presença de valores extremos de receita bruta (outliers) que distorciam as análises estatísticas. Além disso, a variável "regime tributário" apresentava categorias redundantes devidoa erros de digitação (ex: "Simples Nacional", "SIMPLES NACIONAL", "Simples nacional"). Para viabilizar a análise de risco fiscal e a construção de modelos preditivos, tornou-se necessário aplicar técnicas sistemáticas de preparação dos dados antes do processamento analítico. Considerando as melhores práticas de pré-processamento de dados, o tratamento correto e adequado para essa situação é

A

aplicar tokenização em campos textuais para fragmentar as informações em unidades menores, utilização de técnicas de stemming e lemmatização para uniformizar as categorias de regime tributário, implementação de métodos de detecção de anomalias baseados em Isolation Forest para identificar registros fiscais suspeitos e preenchimento de valores ausentes mediante algoritmos de interpolação linear ou polinomial, assegurando a completude da base de dados para processamento posterior.

B

iniciar com a aplicação de técnicas de feature scaling através de padronização z-score em todas as variáveis numéricas para centralizá-las em média zero e desvio padrão unitário, seguida de codificação ordinal para variáveis categóricas respeitando hierarquias naturais, detecção de outliers multivariados mediante distância de Mahalanobis e imputação de dados faltantes exclusivamente por valores constantes predefinidos conforme regras de negócio tributário, evitando métodos estatísticos que alterem distribuições originais.

C

priorizar, inicialmente, a exclusão automática de todos os registros que apresentem campos obrigatórios vazios, seguida da aplicação de técnicas de winsorização para substituir valores extremos pelos percentis 5 e 95, padronização das strings mediante conversão para maiúsculas e remoção de acentuação, garantindo assim a integridade da base sem necessidade de imputação de dados faltantes que poderia introduzir viés nas análises tributárias.

D

aplicar técnicas de normalização min-max em todas as variáveis numéricas para escaloná-las entre 0 e 1, realizar a codificação one-hot encoding nas variáveis categóricas incluindo a variável regime tributário, implementar detecção de outliers através do método de Tukey (IQR) com remoção automática dos valores identificados e utilizar forward fill para preencher dados faltantes sequencialmente, preservando a ordenação temporal dos registros fiscais.

E

padronizar formatos mediante expressões regulares para unificar CNPJ, valores monetários e datas em padrões consistentes, tratamento de dados faltantes através de análise contextual para decidir entre imputação (por média, mediana ou algoritmos como KNN) ou exclusão baseada em criticidade, normalização de texto com conversão para caixa baixa, remoção de espaços extras para eliminar duplicatas categóricas e análise criteriosa de outliers distinguindo valores legítimos de erros de registro antes de qualquer ação corretiva.

Provas

Questão presente nas seguintes provas

4047853 Ano: 2026
Disciplina: TI - Ciência de Dados e BI
Banca: FCC
Orgão: SEFAZ-SP

Provas:

Auditor-Fiscal da Receita Estadual - Gestão Tributária
Provas ×

No desenvolvimento de um modelo de detecção de contribuintes com alto risco de simulação de operações, após definir claramente com a área de fiscalização quais tipos de fraude serão priorizados, quais indicadores de negócio serão acompanhados (como aumento de autos de infração qualificados e redução de fiscalizações improdutivas) e quais restrições legais e operacionais existem para uso do modelo, a equipe de uma Secretaria da Fazenda registra esses critérios e alinha expectativas com a alta gestão. Com base na metodologia CRISP-DM, essa descrição se encaixa principalmente na fase de

Provas

Questão presente nas seguintes provas

4047723 Ano: 2026
Disciplina: TI - Ciência de Dados e BI
Banca: FCC
Orgão: SEFAZ-SP

Provas:

Auditor-Fiscal da Receita Estadual - TI
Provas ×

Big Data

Uma equipe de auditoria possui uma tabela de NF-e com mais de 1 bilhão de registros em um pyspark.sgl.DataFrame chamado df. A auditora deseja inspecionar apenas 1.000 registros localmente em seu notebook, usando funcionalidades avangadas de pandas para buscar inconsisténcias. Nesse cenário, a abordagem em PySpark mais apropriada para gerar esses registros em um pandas. DataFrame, minimizando o risco de estouro de memória no ambiente local é:

Provas

Questão presente nas seguintes provas

4047722 Ano: 2026
Disciplina: TI - Ciência de Dados e BI
Banca: FCC
Orgão: SEFAZ-SP

Provas:

Auditor-Fiscal da Receita Estadual - TI
Provas ×

Uma Secretaria da Fazenda pretende, ao mesmo tempo:

I. prever o valor de arrecadação mensal de ICMS para os próximos meses;
II. classificar cada declaração de contribuinte em “alto risco” ou “baixo risco” para fins de seleção de auditoria.

Considerando os tipos de modelos de aprendizado de maquina, a combinação de tarefas que está conceitualmente alinhada com esses objetivos é:

Provas

Questão presente nas seguintes provas

4047721 Ano: 2026
Disciplina: TI - Ciência de Dados e BI
Banca: FCC
Orgão: SEFAZ-SP

Provas:

Auditor-Fiscal da Receita Estadual - TI
Provas ×

BI: Business IntelligenceOLAP e OLTP

Uma base tributaria de uma SEFAZ é analisada por meio de um cubo OLAP de arrecadação de ISS, com as seguintes dimensões: Ano, Município, Atividade econômica, Regime tributário e Contribuinte. Em uma reunido, um analista parte de uma visão agregada da arrecadação anual por município, em seguida, navega para uma visão mensal e depois para uma visão por contribuinte dentro de um município especifico, mantendo as demais dimensões fixas. Do ponto de vista conceitual em OLAP, essa sequência de operações é um exemplo de

A

Roll-up sobre a dimensão Município, detalhando contribuinte em um município, ano e mês específicos.

B

Slice na dimensão Regime tributário, fixando um único valor dessa dimensão.

C

Drill-down nas hierarquias das dimensões Tempo e Contribuinte, detalhando de ano para mês e depois para contribuinte em um município especifico.

D

Dice nas dimensões Município e Atividade econômica, selecionando subconjuntos específicos em cada uma.

E

Pivot entre as dimensões Ano e Município, apenas alterando linhas e colunas do relatório em um município especifico.

Provas

Questão presente nas seguintes provas

4047717 Ano: 2026
Disciplina: TI - Ciência de Dados e BI
Banca: FCC
Orgão: SEFAZ-SP

Provas:

Auditor-Fiscal da Receita Estadual - TI
Provas ×

Big Data

Uma Secretaria da Fazenda projeta um Data Lake para suportar fiscalização eletrônica, com ingestão diária de notas fiscais eletrônicas, conhecimentos eletrônicos de transporte de cargas, registros fiscais digitais entregues ao fisco, declarações do SIMPLES Nacional e recolhimentos. A equipe adota uma arquitetura em zonas (raw/bronze, refined/silver, curated/gold), com processos de ELT. Para o uso por auditores fiscais e cientistas de dados, a descrição mais adequada é que a zona raw/bronze

A

recebe apenas dados já deduplicados; a refined/silver armazena somente dados de terceiros; e a curated/gold contém exclusivamente dados operacionais de sistemas OLTP otimizadas para Bl e análises avançadas.

B

contém apenas dados agregados histéricos; a refined/silver guarda somente dados em tempo real; e a curated/gold armazena principalmente logs de auditoria de acesso.

C

é usada apenas para dados não estruturados; a refined/silver apenas para dados estruturados; e a curated/gold apenas para dados semiestruturados.

D

é onde os auditores executam as consultas finais; a refined/silver é usada somente por times de infraestrutura; e a curated/gold funciona basicamente como área de backup de longo prazo.

E

armazena dados brutos conforme recebidos; a refined/silver aplica padronizacao, enriquecimento e regras básicas de qualidade; a curated/gold disponibiliza modelos dimensionais ou views otimizadas para Bl e análises avançadas.

Provas

Questão presente nas seguintes provas

4047108 Ano: 2026
Disciplina: TI - Ciência de Dados e BI
Banca: CONSULPAM
Orgão: Pref. Eusébio-CE

Provas:

Técnico de TI
Provas ×

BI: Business IntelligenceData Warehouse

Uma secretaria municipal implantou um Data Warehouse para consolidar dados de atendimento de vários sistemas legados. Em reuniões com a área de negócio, foi solicitado ao Técnico de TI que os relatórios permitam analisar “quantidade de atendimentos” e “tempo médio de atendimento” por tempo, unidade e tipo de serviço, com boa performance para agregações e filtros. Para isso, o Técnico de TI e sua equipe de dados adotaram a modelagem dimensional. Diante do exposto, assinale a alternativa que apresenta CORRETAMENTE o papel da tabela fato nesse cenário.

Provas

Questão presente nas seguintes provas

4047107 Ano: 2026
Disciplina: TI - Ciência de Dados e BI
Banca: CONSULPAM
Orgão: Pref. Eusébio-CE

Provas:

Técnico de TI
Provas ×

BI: Business IntelligenceData Warehouse

Uma entidade pública deseja um novo sistema de relatórios gerenciais consolidados com histórico, apresentando questões como tendência por mês, comparativo por unidade e tipo de serviço. Esta nova solução não pode impactar o desempenho dos sistemas transacionais atuais. Nesse caso, é uma solução CORRETA ao objetivo do cenário apresentado:

Provas

Questão presente nas seguintes provas

4045859 Ano: 2026
Disciplina: TI - Ciência de Dados e BI
Banca: FUNDATEC
Orgão: ISSEG

Provas:

Médico - Auditoria
Provas ×

Inteligência ArtificialConceitos e Fundamentos de IA

As redes neurais artificiais, utilizadas em diversos sistemas de IA, inspiram-se:

Provas

Questão presente nas seguintes provas

4045808 Ano: 2026
Disciplina: TI - Ciência de Dados e BI
Banca: FUNDATEC
Orgão: ISSEG

Provas:

Agente Administrativo
Provas ×

Inteligência ArtificialConceitos e Fundamentos de IA

Um servidor público utiliza uma ferramenta de Inteligência Artificial (IA) para realizar pesquisas e auxiliar na tomada de decisões administrativas. Considerando os cuidados necessários no uso de ferramentas de IA no ambiente institucional, é correto afirmar que:

A

As informações fornecidas por sistemas de IA são sempre precisas e podem ser utilizadas sem qualquer validação.

B

O uso de IA substitui integralmente a análise e a responsabilidade do servidor público.

C

Os resultados gerados por ferramentas de IA devem ser analisados e verificados antes de serem utilizados em decisões relevantes.

D

O uso de IA dispensa a observância de princípios éticos e de proteção à privacidade.

E

Dados pessoais e sensíveis podem ser inseridos livremente em qualquer ferramenta de IA, independentemente da finalidade.

Comentários

×