Magna Concursos

Foram encontradas 5.143 questões.

3307983 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TCE-PA

O crescimento na quantidade e complexidade dos dados disponíveis para as empresas torna imprescindível que a Governança de Dados seja estruturada com documentos que circulem em vários níveis da empresa de acordo com as suas respectivas finalidades, contribuindo para colimar os esforços de todos os membros para obter os resultados esperados.

Com relação aos documentos da Governança de Dados, avalie as afirmativas a seguir.

I. As políticas de dados são regras pormenorizadas do que pode ser feito e o que não pode ser feito, devendo ser conhecidas por todos os profissionais da empresa.

II. As normas são documentos que indicam as práticas recomendadas, mas não obrigatórias, que devem ser adotadas pelas pessoas que trabalham com os dados.

III. Os procedimentos têm por finalidade orientar as pessoas na execução de tarefas específicas visando atingir determinado objetivo, ou seja, documentos que indicam o “como fazer” determinada tarefa.

Está correto o que se afirma em

 

Provas

Questão presente nas seguintes provas

Com o avanço da tecnologia as empresas têm acesso a uma quantidade cada vez maior de dados que podem ser utilizados para diversas finalidades, como, por exemplo, melhorar os processos internos e o relacionamento com clientes. Contudo, não basta possuir os dados, é necessário saber lidar com eles. Nesse contexto, a Governança de Dados tem ganhado cada vez mais importância no ambiente empresarial.

Analise os incidentes a seguir sob a ótica da Qualidade de Dados.

I. Uma empresa relacionava a quantidade de óleo em litros necessária para suas operações. Contudo, após análise decorrente de resultados incoerentes, notou-se que para uma atividade específica, devido a um erro de digitação, foi inserido o valor do volume de óleo menor do que o realmente necessário.

II. Ao migrar de sistema, a empresa teve problemas com valores numéricos, que, após análise, mostraram-se ser devido ao sistema original usar o separador decimal no padrão americano, enquanto o novo sistema usa o padrão brasileiro.

III. Ao comparar dois bancos de dados relacionados a diferentes produtos, a empresa reparou que o mesmo CPF estava relacionado a dois clientes diferentes.

Os requisitos para a qualidade dos dados diretamente relacionados aos incidentes I, II e III são, respectivamente,

 

Provas

Questão presente nas seguintes provas

O DMBOK é estruturado em torno de onze (11) áreas de conhecimento do Framework de Gerenciamento de Dados DAMA-DMBOK. Essas áreas descrevem o escopo e o contexto de diversos conjuntos de atividades de gerenciamento de dados, e nelas estão incorporados os objetivos e princípios fundamentais do gerenciamento de dados.

A área do conhecimento que inclui a reconciliação e a manutenção contínuas dos dados críticos, compartilhados e essenciais para permitir o uso consistente entre sistemas da versão mais precisa, oportuna e relevante da verdade sobre entidades empresariais essenciais é a

 

Provas

Questão presente nas seguintes provas
3307977 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TCE-PA

Ao se utilizar bancos de dados reais no treinamento de métodos de aprendizado de máquina é normal se deparar com entradas que possuem um ou mais parâmetros (campos) ausentes.

Com relação às estratégias para lidar com dados ausentes, analise as afirmativas a seguir.

I. Só é possível realizar imputation quando o atributo (feature) ausente é numérico.

II. Ao utilizar o k-nearest neighbors (KNN) para fazer o imputation é uma boa estratégia primeiro fazer a normalização ou padronização dos dados.

III. Ao se trabalhar com bancos de dados com poucas amostras (itens), uma estratégia usualmente utilizada para lidar com as amostras) que possuem valores ausentes é a remoção.

Está correto o que se afirma em

 

Provas

Questão presente nas seguintes provas
3307975 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TCE-PA

Alguns algoritmos de aprendizado de máquina foram desenvolvidos para trabalhar com atributos discretos. Porém, dados coletados no mundo real muitas vezes são contínuos.

Nesses casos, podemos usar métodos de discretização no tratamento dos dados. Um desses métodos de discretização consiste em estabelecer os limites das partições de forma que cada partição tenha aproximadamente o mesmo número de elementos.

O método acima descrito é o

 

Provas

Questão presente nas seguintes provas
3307974 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TCE-PA

Os candidatos de um concurso público realizaram um teste de redação que vale até 1000 pontos. 5000 candidatos realizaram o teste, o que gerou uma distribuição das notas cuja média foi de 600 pontos e cujo desvio padrão foi de 90 pontos.

Dessa distribuição são retiradas 40 novas amostras, com 100 notas em cada amostra, sem reposição.

Dados: \( \sqrt{4999}=70,7;\dfrac{100}{101}=0,99 \)

O desvio-padrão da distribuição das 40 médias obtidas a partir das novas amostras (de 100 notas) retiradas é igual a

 

Provas

Questão presente nas seguintes provas
3307973 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TCE-PA

Testes de hipóteses são ferramentas estatísticas que viabilizam a tomada de decisões com base em dados, mesmo quando há incerteza.

A respeito dessas ferramentas, relacione cada definição com as características a que elas mais se adequam:

1. Teste-z

2. Teste-t

3. ANOVA

4. Teste chi-quadrado (χ2)

( ) Usado(a) para comparar as médias de duas amostras independentes, com amostragens suficientemente grandes e desvios-padrão conhecidos.

( ) Usado(a) para comparar as médias de duas ou mais amostras independentes, normalmente distribuídas.

( ) Usado(a) para comparar as médias de duas amostras independentes, com pequeno número de amostras ou com desvio-padrão desconhecido.

( ) Usado(a) para verificar a normalidade de uma amostra.

A relação correta, na ordem apresentada, é

 

Provas

Questão presente nas seguintes provas
3307972 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TCE-PA

Considere a existência de duas caixas idênticas A e B. Na caixa A são colocadas duas bolinhas de cor verde e duas bolinhas cor-de-rosa. Na caixa B são colocadas quatro bolinhas de cor verde.

Em seguida, executam-se sequencialmente os passos a seguir:

1. Escolhe-se, aleatoriamente, uma das caixas, sem, no entanto, identificá-la.

2. Retira-se uma bolinha da caixa escolhida, que revela possuir a cor verde.

3. Retira-se uma segunda bolinha da caixa escolhida, que também acaba por possuir a cor verde.

A sequência que indica a evolução das probabilidades de que a caixa inicialmente escolhida seja a caixa A ou a caixa B, respectivamente, imediatamente após os passos 1, 2, e 3, é dada por:

 

Provas

Questão presente nas seguintes provas

A densidade de probabilidade de uma variável aleatória segue a função p(x) = 1 – | x |, caso | x | < 1, ou 0, caso contrário.

Ao retirar-se uma amostra aleatória x, a probabilidade de -3,0 < x < 0,8 é:

 

Provas

Questão presente nas seguintes provas

Sobre o Modelo de Referência Cross- Industry Standard Process for Data Mining (CRISP-DM), avalie as afirmativas a seguir:

I. Após a fase de “Preparação dos dados” ocorre a fase de “Compreensão dos dados”.

II. Durante a fase de “Mineração de Dados” ocorre a aplicação de algoritmos de mineração de dados buscando a extração de padrões.

III. Durante a fase de “Preparação dos Dados”, pode ocorrer a construção de novos atributos a partir de outros já existentes.

Está correto o que se afirma em

 

Provas

Questão presente nas seguintes provas