Magna Concursos

Foram encontradas 5.143 questões.

3328046 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: EPE

Algoritmos de agrupamento são fundamentais para a área de aprendizado de máquina não supervisionado. Em geral, esses algoritmos determinam clusters de instâncias de dados que possuem algum traço de similaridade entre si. Relacione os métodos de agrupamento hierárquico e o K-means às suas principais características.

1. Agrupamento Hierárquico

2. K-means

( ) Seus resultados são altamente sensíveis ao número de clusters que deve ser pré-definido pelo usuário do algoritmo.

( ) Baseia-se em abordagens top-down ou bottom-up, isto é, com a divisão ou com a união sucessiva de clusters.

( ) Seus resultados costumam ser graficamente visualizados por dendrogramas, que podem ser seccionados de acordo com o número de clusters determinado pelo usuário do algoritmo.

( ) Avalia distâncias entre as instâncias de dados e os centroides dos clusters e atualiza a posição dos centroides dos clusters sucessivamente, até a convergência.

Assinale a opção que indica a relação correta, na ordem apresentada.

 

Provas

Questão presente nas seguintes provas
3328045 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: EPE

A análise de componentes principais (Principal Component Analysis - PCA) é uma técnica consagrada para a redução de dimensionalidade e para a identificação de padrões estruturais lineares em conjuntos de dados.

Com relação à análise de componentes principais, analise as afirmativas a seguir e assinale (V) para a verdadeiras e (F) para a falsa.

( ) Baseia-se na identificação dos autovetores da matriz de covariâncias dos dados, permitindo ao analista determinar direções de maiores variações nas instâncias de dados.

( ) Permite a seleção e a eliminação das dimensões referentes às direções de maiores variações nas instâncias de dados, que por sua vez contribuem com poucas informações úteis para a análise do conjunto de dados.

( ) É utilizada em compressão de dados, pois permite a representação dos dados em menos dimensões que são facilmente interpretáveis pelo analista, sem grandes perdas de informações.

As afirmativas são, respectivamente.

 

Provas

Questão presente nas seguintes provas
3328040 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: EPE

Há uma família de modelos de IA generativa que tem dois modelos treinados em conjunto: o gerador e o discriminador.

O gerador tenta criar dados falsos que sejam indistinguíveis dos dados reais, enquanto que o discriminador tenta distinguir entre dados reais e falsos. O treinamento é um jogo min-max, em que o gerador melhora suas habilidades para enganar o discriminador, e o discriminador melhora suas habilidades para detectar dados falsos.

Assinale a opção que apresenta as características do modelo de IA generativa descritas no texto.

 

Provas

Questão presente nas seguintes provas

No contexto de ciência de dados, os dados podem ser interpretados como itens elementares, captados e armazenados por recursos de Tecnologia da Informação. Seu propósito é expressar fatos do mundo real de forma a serem tratados no contexto computacional, sendo a base de uma pirâmide hierárquica.

Um nível acima, as informações representam os dados processados, com significado e contextos bem definidos.

Assinale a opção que apresenta corretamente o conceito do último nível dessa pirâmide, correspondendo a um padrão ou conjunto de padrões cuja formulação pode envolver e relacionar fatos e informações.

 

Provas

Questão presente nas seguintes provas

O pacote dplyr do R é um dos mais usados para manipulação de dados.

Assinale a opção que indica o conjunto de funções auxiliares desse pacote que são muito úteis para a seleção de colunas.

 

Provas

Questão presente nas seguintes provas

Na Ciência de Dados é muito comum a utilização da linguagem Python e do R para visualização de dados.

Sobre as diferenças entre essas duas ferramentas, analise as afirmativas a seguir.

I. Python possui um padrão mais bem definido, permitindo que diferentes tipos de funcionalidades sejam escritos da mesma forma, enquanto no R, a mesma funcionalidade pode ser escrita de diversas formas diferentes.

II. Python é principalmente usada quando a análise de dados precisa ser integrada com aplicativos web ou se o código estatístico precisa ser integrado em um servidor em ambiente de produção, que vai servir muitos usuários, enquanto o R é principalmente usado quando as atividades de análise de dados requerem computação standalone (em um único computador) ou análise em servidores individuais.

III. Tanto o Python quanto o R foram criados inicialmente para análise de dados.

Está correto o que se afirma em

 

Provas

Questão presente nas seguintes provas

Um analista da área de ciência de dados construiu um histograma levando em consideração uma determinada base de dados. Para incluir uma curva nesse histograma foi utilizado a função as.timeSeries.

Essa função pertence à biblioteca

 

Provas

Questão presente nas seguintes provas

Com relação à linguagem R, analise os itens a seguir.

I. A linguagem R é case sensitive.

II. A linguagem R permite modo interativo com o programador.

III. Por meio do comando q() é possível encerrar uma sessão no programa R.

Está correto o que se afirma em

 

Provas

Questão presente nas seguintes provas
3327824 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: EPE

A respeito de um projeto de reconhecimento de imagem, em que foi decidido usar uma Rede Neural Convolucional (CNN).

Assinale a opção que apresenta a característica que a diferencia e a torna especialmente eficaz para tarefas de visão computacional.

 

Provas

Questão presente nas seguintes provas
3327811 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: EPE

A produção e a disseminação de dados corporativos cresceram muito rapidamente, o que requer tecnologias de função analítica adequadas ao volume de dados envolvidos, visando extrair informações úteis e viabilizar a criação de relatórios analíticos.

As tecnologias descritas recebem, na literatura, o nome de

 

Provas

Questão presente nas seguintes provas