Magna Concursos

Foram encontradas 5.143 questões.

3327753 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: EPE

A decomposição em valores singulares (Singular Value Decomposition - SVD) de uma matriz é uma fatoração importante por ser aplicável em diversos algoritmos de inteligência artificial.

Considere o trecho de código em linguagem R a seguir.

1. A <- matrix(c(1,2,1,2), ncol=2, nrow=2)

2. svd_result <- svd(A)

3. V <-svd_result$v

4. M <- V %*% t(V)

5. cat(M[1,1], "--", M[2,2])

Assinale a opção que indica a saída esperada para a execução do trecho de código.

 

Provas

Questão presente nas seguintes provas
3327752 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: EPE

As métricas de distância em aprendizado de máquina estão relacionadas às normas de vetores que costumam representar instâncias de dados. Duas normas comuns em ciência de dados são as normas L1 e L2.

Sejam a matriz \( A \) = \( \begin{bmatrix} 3 & 4 \\ 4 & 3 \end{bmatrix} \) e um vetor \( v \), bidimensional, cujos elementos são os autovalores de A.

As normas L1 e L2 de \( v \) são, respectivamente, dadas por

 

Provas

Questão presente nas seguintes provas
3327745 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: EPE

NSCE007-00_29

O pacote neuralnet, da linguagem R, é uma ferramenta útil para a definição e para o treinamento de redes neurais, disponibilizando ao usuário uma interface relativamente simples.

Uma das limitações do pacote neuralnet é não oferecer ao usuário muitas opções pré-definidas de funções de ativação. Caso o usuário deseje utilizar uma função de ativação diferente das únicas duas já pré-definidas no pacote, é preciso definí-la e atribuí-la por meio do argumento act.fct.

Ao invocar o método neuralnet para o treinamento de uma rede neural, caso o argumento act.fct não seja explicitamente determinado na chamada do método, a função de ativação padrão utilizada nos neurônios da rede será

 

Provas

Questão presente nas seguintes provas
3327744 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: EPE

O treinamento em redes neurais artificiais é, essencialmente, um problema de otimização, em que se busca minimizar o erro entre as predições do modelo neural e os valores alvo preexistentes no conjunto de dados de treinamento.

Com respeito aos métodos relacionados à otimização de parâmetros em redes neurais artificiais, analise as afirmativas a seguir.

I. No algoritmo backpropagation, a aplicação da regra da cadeia é fundamental para o cálculo dos gradientes dos erros com respeito aos pesos (parâmetros) da rede neural artificial.

II. O método do gradiente (também chamado de método do máximo declive ou Gradient Descent – GD) escolhe aleatoriamente um pequeno número de instâncias de dados de treinamento a cada passo, aumentando a velocidade inicial de minimização das métricas de erro.

III. As técnicas de regularização L1 (Lasso) e L2 (Ridge) podem ser utilizadas para mitigar problemas relacionados a inicialização indevida de pesos (parâmetros) em redes neurais.

Está correto o que se afirma em

 

Provas

Questão presente nas seguintes provas
3327743 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: EPE

Um modelo de regressão múltipla foi utilizado para estudar o consumo do gás natural em função de vários fatores levantados por especialistas. Nesse modelo adotado foi realizado uma análise de resíduos e verificou-se a presença de outliers.

Para verificar se um outlier é influente ou não, o método mais apropriado seria

 

Provas

Questão presente nas seguintes provas
3327742 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: EPE

Um pesquisador desenvolveu um estudo longitudinal para analisar o consumo de energia elétrica mensal de empresas do setor energético de determinada região, ao longo dos últimos 40 anos. Analisando a base de dados coletada, o pesquisador verificou que a base tinha vários dados faltantes e que necessitava utilizar alguma técnica de imputação de dados.

Assinale a opção que apresenta a técnica mais apropriada para o estudo do pesquisador.

 

Provas

Questão presente nas seguintes provas
3327741 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: EPE

O algoritmo conhecido por Naïve Bayes, apesar de ter limitações devido às suas premissas de simplificação, é bastante utilizado e costuma apresentar boa performance para a classificação de instâncias de dados.

Considere o conjunto de dados a seguir, que apresenta, de forma simplificada, as características de uma amostra de 1600 animais de estimação.

Animal

Pequenos

Pelos longos

Comportamento agitado

Totais

Cães

560

480

320

800

Gatos

480

120

180

600

Outros

140

20

60

200

Sejam dois novos animais de estimação identificados por A e B, tais que:

• A é pequeno, com pelos curtos e de comportamento agitado;

• B é grande, com pelos longos e de comportamento agitado.

Aplicando o algoritmo Naïve Bayes, assinale a opção que apresenta as classes mais prováveis dos animais A e B, respectivamente.

 

Provas

Questão presente nas seguintes provas
3327740 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: EPE

As técnicas de aprendizado supervisionado estão baseadas na determinação de modelos capazes de otimizar o mapeamento entre entradas e saídas de um conjunto de dados. Por vezes, o processo de treinamento pode gerar modelos muito complexos que “aprendem” o ruído existente nos conjuntos de dados, caracterizando o fenômeno de sobreajuste ou overfitting.

Um método que pode ajudar a mitigar a ocorrência do overfitting consiste em

I. dividir o conjunto de dados em k partes;

II. utilizar uma das partes para teste e as outras k-1 para treinamento;

III. repetir o processo para cada uma das k partes do conjunto de dados; e

IV. avaliar a média das métricas de performance para o modelo.

O método acima é chamado de

 

Provas

Questão presente nas seguintes provas
3327739 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: EPE

Um analista da área de tecnologia da informação recebeu um conjunto de dados sobre o consumo de energia elétrica de indústrias no formato de distribuição de frequência.

Assinale a opção que indica o tipo de gráfico mais adequado para representar essa distribuição de frequência.

 

Provas

Questão presente nas seguintes provas

Uma empresa decidiu utilizar o Power BI para poder gerenciar melhor os seus dados. Dessa forma, contratou um especialista para criar um dashboard com o objetivo de melhorar a visualização de seus negócios.

Sobre as a construção de dashboards, assinale a afirmativa correta.

 

Provas

Questão presente nas seguintes provas