Foram encontradas 520 questões.
O profiling de dados é uma etapa analítica
realizada sobre conjuntos de dados com o objetivo de
compreender sua estrutura, qualidade e distribuição antes
de iniciar processos de transformação ou carga em
camadas analíticas. A realização adequada do profiling
permite identificar problemas de qualidade e orientar as
regras de tratamento a serem aplicadas no pipeline. Diante
disso, analise as afirmativas a seguir sobre profiling básico
de dados:
I. A análise de cardinalidade em uma coluna consiste em identificar o número de valores distintos presentes, sendo útil para reconhecer possíveis chaves candidatas e detectar colunas com baixa variabilidade que podem indicar problemas de qualidade.
II. O profiling de nulidade verifica a proporção de valores ausentes em cada coluna, fornecendo informações relevantes para decisões sobre estratégias de tratamento, como imputação, exclusão de registros ou criação de indicadores de ausência.
III. A análise de distribuição de frequência permite identificar quais valores ocorrem com maior regularidade em uma coluna e é aplicável exclusivamente a colunas com tipos de dados numéricos, não sendo útil para colunas do tipo texto ou categórico.
IV. O profiling básico, por ser uma análise estática realizada antes da ingestão, elimina a necessidade de validações de qualidade posteriores durante as fases de transformação e carga, desde que o dataset analisado não sofra alterações estruturais.
Estão CORRETAS:
I. A análise de cardinalidade em uma coluna consiste em identificar o número de valores distintos presentes, sendo útil para reconhecer possíveis chaves candidatas e detectar colunas com baixa variabilidade que podem indicar problemas de qualidade.
II. O profiling de nulidade verifica a proporção de valores ausentes em cada coluna, fornecendo informações relevantes para decisões sobre estratégias de tratamento, como imputação, exclusão de registros ou criação de indicadores de ausência.
III. A análise de distribuição de frequência permite identificar quais valores ocorrem com maior regularidade em uma coluna e é aplicável exclusivamente a colunas com tipos de dados numéricos, não sendo útil para colunas do tipo texto ou categórico.
IV. O profiling básico, por ser uma análise estática realizada antes da ingestão, elimina a necessidade de validações de qualidade posteriores durante as fases de transformação e carga, desde que o dataset analisado não sofra alterações estruturais.
Estão CORRETAS:
Provas
Questão presente nas seguintes provas
O formato JSON é um padrão amplamente
utilizado para representação e troca de dados
semiestruturados em pipelines, APIs REST e sistemas de
integração corporativa. A correta interpretação da
estrutura e dos tipos de dados do JSON é essencial para o
processamento adequado das informações. Diante disso,
analise o quadro a seguir, com um trecho JSON, extraído
de um sistema de gestão de pedidos:
{ "pedido_id": 1042, "cliente": { "nome": "Maria Souza", " cpf" : " 123.456.789-00", "ativo": true }, "itens": [ { "produto": "Notebook", "quantidade": 1, "preco": 3500.00}, { "produto": "Mouse", "quantidade": 2, "preco":45.50 } ], "observacao": null }
Com base na estrutura e nas especificações do formato JSON, assinale a alternativa CORRETA.
{ "pedido_id": 1042, "cliente": { "nome": "Maria Souza", " cpf" : " 123.456.789-00", "ativo": true }, "itens": [ { "produto": "Notebook", "quantidade": 1, "preco": 3500.00}, { "produto": "Mouse", "quantidade": 2, "preco":45.50 } ], "observacao": null }
Com base na estrutura e nas especificações do formato JSON, assinale a alternativa CORRETA.
Provas
Questão presente nas seguintes provas
O formato CSV é amplamente utilizado em pipelines de dados para transferência de conjuntos de dados entre sistemas heterogêneos. Apesar de sua simplicidade, o formato apresenta características e limitações técnicas que devem ser consideradas durante a implementação de processos de ingestão e integração. Diante disso, analise as afirmativas a seguir sobre o formato CSV:
I. O formato CSV não incorpora um esquema de dados embutido no arquivo, o que exige que os tipos, significados e formatos de cada coluna sejam documentados externamente ou inferidos durante a leitura.II. Um arquivo CSV suporta a representação nativa de dados hierárquicos e aninhados, como listas de itens vinculados a um único registro pai, desde que os delimitadores aninhados sejam configurados corretamente no parser utilizado.
III. Quando um valor de campo contém o caractere delimitador, esse campo deve ser envolvido entre aspas duplas para que o parser o interprete como um único valor, conforme previsto pela especificação RFC 4180.
IV. A codificação de caracteres utilizada em um arquivo CSV é declarada de forma explícita no próprio arquivo, garantindo que sistemas distintos realizem a leitura correta dos dados sem necessidade de configuração adicional.
Está(ão) CORRETA(S):
Provas
Questão presente nas seguintes provas
Na gestão de qualidade de dados em pipelines de ingestão, a aplicação de regras de validação e consistência é etapa essencial para assegurar que os dados disponibilizados nas camadas de consumo sejam confiáveis, completos e coerentes. O descumprimento dessas regras pode comprometer análises, relatórios e decisões de negócio suportadas pela plataforma de dados. Com base nas técnicas e conceitos de validação e consistência de dados, assinale a alternativa INCORRETA.
Provas
Questão presente nas seguintes provas
Na administração de bancos de dados, o fator de preenchimento (Fill Factor) determina a porcentagem do espaço em cada página de um índice que será preenchida com dados no momento de sua criação ou reconstrução, reservando o restante para futuras operações de inserção e atualização. A configuração inadequada do Fill Factor pode impactar o desempenho de leitura e escrita e aumentar a necessidade de manutenção periódica. Com base nos conceitos de índices e Fill Factor em banco de dados relacionais, assinale a alternativa INCORRETA.
Provas
Questão presente nas seguintes provas
No projeto de esquemas relacionais, as restrições de integridade (constraints) são mecanismos declarativos que definem regras sobre os dados armazenados, garantindo a consistência e a confiabilidade das informações no banco de dados. Um DBA está revisando o esquema de um sistema de gestão de contratos públicos para verificar se as restrições definidas estão adequadas às regras de negócio estabelecidas. Com base nos conceitos e no comportamento das constraints em bancos de dados relacionais, assinale a alternativa CORRETA.
Provas
Questão presente nas seguintes provas
Uma equipe de dados operacionaliza um pipeline de ingestão diária que carrega arquivos de diversas fontes para um data warehouse corporativo. Após uma falha em uma das etapas do processo, a equipe precisa analisar os registros de execução (logs) para identificar a causa do problema, o momento da interrupção e quais registros foram processados com sucesso antes da falha. Com base nas boas práticas de registro de execução em pipelines de dados, assinale a alternativa CORRETA.
Provas
Questão presente nas seguintes provas
Uma instituição pública implementa um sistema de gestão de benefícios sociais que armazena dados pessoais sensíveis dos beneficiários, incluindo informações de saúde, renda e composição familiar. O Analista é responsável por definir a política de controle de acesso e garantir conformidade com a Lei Geral de Proteção de Dados Pessoais (LGPD). Com base nos princípios da LGPD e nas boas práticas de controle de acesso em bancos de dados, assinale a alternativa CORRETA.
Provas
Questão presente nas seguintes provas
Um Analista de Sistemas analisa um relatório de contenção em um sistema de gestão de ordens de serviço com alto volume de transações simultâneas. O relatório indica que diversas transações de leitura (SELECT) estão sendo bloqueadas por transações de escrita (UPDATE) em andamento sobre a tabela de Ordens. Ao investigar o comportamento no SGBD, o DBA precisa compreender a compatibilidade entre os tipos de bloqueio envolvidos. Com base nos mecanismos de controle de concorrência e nos tipos de bloqueio em bancos de dados relacionais, assinale a alternativa CORRETA.
Provas
Questão presente nas seguintes provas
Em sistemas gerenciadores de bancos de dados relacionais, o controle de concorrência busca garantir que transações simultâneas sejam executadas de forma segura, mantendo a consistência dos dados. Em um sistema bancário, a Transação A obteve bloqueio exclusivo sobre o registro da Conta Corrente e aguarda o bloqueio sobre o registro de Transferência, enquanto a Transação B obteve bloqueio exclusivo sobre o registro de Transferência e aguarda o bloqueio sobre o registro da Conta Corrente, formando uma espera mútua indefinida. Com base no conceito de deadlock em bancos de dados relacionais, assinale a alternativa CORRETA.
Provas
Questão presente nas seguintes provas
Cadernos
Caderno Container