3327753 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: EPE

Provas:

Analista de Gestão Corporativa - TI/Ciência de Dados
Provas ×

ProgramaçãoLinguagem R

A decomposição em valores singulares (Singular Value Decomposition - SVD) de uma matriz é uma fatoração importante por ser aplicável em diversos algoritmos de inteligência artificial.

Considere o trecho de código em linguagem R a seguir.

1. A <- matrix(c(1,2,1,2), ncol=2, nrow=2)

2. svd_result <- svd(A)

3. V <-svd_result$v

4. M <- V %*% t(V)

5. cat(M[1,1], "--", M[2,2])

Assinale a opção que indica a saída esperada para a execução do trecho de código.

Provas

Questão presente nas seguintes provas

3327752 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: EPE

Provas:

Analista de Gestão Corporativa - TI/Ciência de Dados
Provas ×

Inteligência ArtificialMachine Learning

As métricas de distância em aprendizado de máquina estão relacionadas às normas de vetores que costumam representar instâncias de dados. Duas normas comuns em ciência de dados são as normas L1 e L2.

Sejam a matriz $ A $ = $ \begin{bmatrix} 3 & 4 \\ 4 & 3 \end{bmatrix} $ e um vetor $ v $, bidimensional, cujos elementos são os autovalores de A.

As normas L1 e L2 de $ v $ são, respectivamente, dadas por

Provas

Questão presente nas seguintes provas

3327745 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: EPE

Provas:

Analista de Gestão Corporativa - TI/Ciência de Dados
Provas ×

Inteligência ArtificialMachine LearningRedes Neurais
ProgramaçãoLinguagem R

NSCE007-00_29

O pacote neuralnet, da linguagem R, é uma ferramenta útil para a definição e para o treinamento de redes neurais, disponibilizando ao usuário uma interface relativamente simples.

Uma das limitações do pacote neuralnet é não oferecer ao usuário muitas opções pré-definidas de funções de ativação. Caso o usuário deseje utilizar uma função de ativação diferente das únicas duas já pré-definidas no pacote, é preciso definí-la e atribuí-la por meio do argumento act.fct.

Ao invocar o método neuralnet para o treinamento de uma rede neural, caso o argumento act.fct não seja explicitamente determinado na chamada do método, a função de ativação padrão utilizada nos neurônios da rede será

Provas

Questão presente nas seguintes provas

3327744 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: EPE

Provas:

Analista de Gestão Corporativa - TI/Ciência de Dados
Provas ×

Inteligência ArtificialMachine LearningAvaliação de ModelosMétricas

O treinamento em redes neurais artificiais é, essencialmente, um problema de otimização, em que se busca minimizar o erro entre as predições do modelo neural e os valores alvo preexistentes no conjunto de dados de treinamento.

Com respeito aos métodos relacionados à otimização de parâmetros em redes neurais artificiais, analise as afirmativas a seguir.

I. No algoritmo backpropagation, a aplicação da regra da cadeia é fundamental para o cálculo dos gradientes dos erros com respeito aos pesos (parâmetros) da rede neural artificial.

II. O método do gradiente (também chamado de método do máximo declive ou Gradient Descent – GD) escolhe aleatoriamente um pequeno número de instâncias de dados de treinamento a cada passo, aumentando a velocidade inicial de minimização das métricas de erro.

III. As técnicas de regularização L1 (Lasso) e L2 (Ridge) podem ser utilizadas para mitigar problemas relacionados a inicialização indevida de pesos (parâmetros) em redes neurais.

Está correto o que se afirma em

Provas

Questão presente nas seguintes provas

3327743 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: EPE

Provas:

Analista de Gestão Corporativa - TI/Ciência de Dados
Provas ×

Inteligência ArtificialMachine Learning
Análise de DadosEstatística

Um modelo de regressão múltipla foi utilizado para estudar o consumo do gás natural em função de vários fatores levantados por especialistas. Nesse modelo adotado foi realizado uma análise de resíduos e verificou-se a presença de outliers.

Para verificar se um outlier é influente ou não, o método mais apropriado seria

Provas

Questão presente nas seguintes provas

3327742 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: EPE

Provas:

Analista de Gestão Corporativa - TI/Ciência de Dados
Provas ×

Análise de DadosEstatística
Análise de DadosTécnicas de Pré-processamento

Um pesquisador desenvolveu um estudo longitudinal para analisar o consumo de energia elétrica mensal de empresas do setor energético de determinada região, ao longo dos últimos 40 anos. Analisando a base de dados coletada, o pesquisador verificou que a base tinha vários dados faltantes e que necessitava utilizar alguma técnica de imputação de dados.

Assinale a opção que apresenta a técnica mais apropriada para o estudo do pesquisador.

Provas

Questão presente nas seguintes provas

3327741 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: EPE

Provas:

Analista de Gestão Corporativa - TI/Ciência de Dados
Provas ×

Inteligência ArtificialMachine LearningAlgoritmosNaive Bayes

O algoritmo conhecido por Naïve Bayes, apesar de ter limitações devido às suas premissas de simplificação, é bastante utilizado e costuma apresentar boa performance para a classificação de instâncias de dados.

Considere o conjunto de dados a seguir, que apresenta, de forma simplificada, as características de uma amostra de 1600 animais de estimação.

Animal	Pequenos	Pelos longos	Comportamento agitado	Totais
Cães	560	480	320	800
Gatos	480	120	180	600
Outros	140	20	60	200

Sejam dois novos animais de estimação identificados por A e B, tais que:

• A é pequeno, com pelos curtos e de comportamento agitado;

• B é grande, com pelos longos e de comportamento agitado.

Aplicando o algoritmo Naïve Bayes, assinale a opção que apresenta as classes mais prováveis dos animais A e B, respectivamente.

Provas

Questão presente nas seguintes provas

3327740 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: EPE

Provas:

Analista de Gestão Corporativa - TI/Ciência de Dados
Provas ×

Inteligência ArtificialMachine LearningAvaliação de ModelosOverfitting e Underfitting
Inteligência ArtificialMachine LearningTipos de AprendizadoSupervisionado

As técnicas de aprendizado supervisionado estão baseadas na determinação de modelos capazes de otimizar o mapeamento entre entradas e saídas de um conjunto de dados. Por vezes, o processo de treinamento pode gerar modelos muito complexos que “aprendem” o ruído existente nos conjuntos de dados, caracterizando o fenômeno de sobreajuste ou overfitting.

Um método que pode ajudar a mitigar a ocorrência do overfitting consiste em

I. dividir o conjunto de dados em k partes;

II. utilizar uma das partes para teste e as outras k-1 para treinamento;

III. repetir o processo para cada uma das k partes do conjunto de dados; e

IV. avaliar a média das métricas de performance para o modelo.

O método acima é chamado de

Provas

Questão presente nas seguintes provas

3327739 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: EPE

Provas:

Analista de Gestão Corporativa - TI/Ciência de Dados
Provas ×

BI: Business Intelligence
Análise de DadosEstatística
Análise de DadosAnálise Exploratória

Um analista da área de tecnologia da informação recebeu um conjunto de dados sobre o consumo de energia elétrica de indústrias no formato de distribuição de frequência.

Assinale a opção que indica o tipo de gráfico mais adequado para representar essa distribuição de frequência.

Provas

Questão presente nas seguintes provas

3327738 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: EPE

Provas:

Analista de Gestão Corporativa - TI/Ciência de Dados
Provas ×
Analista de Gestão Corporativa - TI/Soluções
Provas ×

BI: Business IntelligenceFerramentas de BIPower BI

Uma empresa decidiu utilizar o Power BI para poder gerenciar melhor os seus dados. Dessa forma, contratou um especialista para criar um dashboard com o objetivo de melhorar a visualização de seus negócios.

Sobre as a construção de dashboards, assinale a afirmativa correta.