3431758 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: DATAPREV

Provas:

Analista de TI - Desenvolvimento
Provas ×

BI: Business IntelligenceData Warehouse
BI: Business IntelligenceETL/ELT

Em arquiteturas modernas de Data Warehousing, o processo de ETL é fundamental para preparar os dados de forma eficiente para a tomada de decisões estratégicas.

Ele é como uma ponte entre os sistemas e o Data Warehouse. Nesse contexto, o principal objetivo do processo de ETL em uma solução de Data Warehousing é

A

criar visualizações e dashboards interativos para serem analisados em tempo real.

B

realizar análises estatísticas complexas nos dados, aplicando técnicas de modelagem preditiva para descobrir insights ocultos.

C

desenvolver e treinar modelos de machine learning, facilitando a previsão de tendências.

D

extrair dados de diversas fontes, transformá-los em um formato padronizado e consistente e carregá-los no Data Warehouse.

E

gerenciar o acesso e a segurança dos dados armazenados no Data Warehouse, garantindo assim que as informações estejam protegidas contra acessos não autorizados.

Provas

Questão presente nas seguintes provas

3431755 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: DATAPREV

Provas:

Analista de TI - Inteligência da Informação
Provas ×

Inteligência ArtificialMachine LearningAvaliação de ModelosOverfitting e Underfitting

Um conjunto de dados foi particionado em dois subconjuntos, sendo um de treinamento e outro de testagem, ambos utilizados exclusivamente para serem usados em seus objetivos originais (dados de treino para treinamento, e de teste para testagem).

Em relação ao ajuste e validação de modelos em aprendizado de máquina, um modelo sofre overfitting quando

A

apresenta bom desempenho nos dados de treinamento, mas tem baixo desempenho nos dados de teste.

B

é simples demais para capturar os padrões subjacentes nos dados.

C

minimiza o erro nos dados de treinamento e os de teste, aumentando a correlação entre esses dois conjuntos.

D

oferece uma matriz de confusão para um classificador detalhando seu desempenho.

E

relaciona-se aos altos viés e variância do conjunto de dados.

Provas

Questão presente nas seguintes provas

3431754 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: DATAPREV

Provas:

Analista de TI - Desenvolvimento
Provas ×

Inteligência ArtificialMachine LearningRedes Neurais

A Inteligência Artificial (IA) é uma área da ciência da computação que visa desenvolver sistemas capazes de realizar tarefas que normalmente exigiriam inteligência humana.

O conceito que está mais diretamente relacionado ao desenvolvimento de sistemas que aprendem com os dados e melhoram seu desempenho ao longo do tempo é o de

Provas

Questão presente nas seguintes provas

3431750 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: DATAPREV

Provas:

Analista de TI - Inteligência da Informação
Provas ×

BI: Business Intelligence
Análise de DadosEstatística

Seja o código em R a seguir:

Enunciado 3950795-1

Analisando o código apresentado, sem a necessidade de executálo, é correto deduzir que

Provas

Questão presente nas seguintes provas

3431737 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: DATAPREV

Provas:

Analista de TI - Inteligência da Informação
Provas ×

BI: Business Intelligence
Inteligência ArtificialMachine Learning
Análise de Dados

Considere o seguinte cenário: Uma empresa de telecomunicações está analisando os dados de uso de seus clientes, como frequência de chamadas, uso de dados móveis e envio de mensagens. Ela quer identificar grupos de clientes com comportamentos semelhantes para oferecer promoções personalizadas.

Em uma escolha por uma solução de aprendizado de máquina, o cientista de dados deve observar que, se o aprendizado for

A

híbrido, congregará as características dos modelos supervisionado e não supervisionado, em um modelo ensemble.

B

não supervisionado oferecerá opções como os algoritmos back propagation, K-means e C4.5.

C

não supervisionado demandará uma fase de pósprocessamento que envolve visualização e análise do modelo.

D

supervisionado considerará a abstração de um modelo de conhecimento da forma (entrada, saída desejada).

E

supervisionado, os algoritmos partirão dos dados, buscando relacionamento entre eles.

Provas

Questão presente nas seguintes provas

3431729 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: DATAPREV

Provas:

Analista de TI - Inteligência da Informação
Provas ×

Inteligência ArtificialMachine Learning
Análise de DadosEstatística

O algoritmo de redução de dimensionalidade conhecido como Análise de Componentes Principais (PCA – Principal Component Analysis) possui características importantes.

Dada a escolha de um número k de componentes principais e um conjunto de dados X com cinco variáveis A, B, C, D e E, o PCA

A

adiciona a média de cada observação para cada dimensão de X, normalizando-a depois pelo desvio-padrão.

B

constrói a matriz de confusão a partir de X, multiplicando-a pelos autovalores de seus vetores originais.

C

escolhe k autovetores aleatórios do conjunto original de dados.

D

preserva as distâncias geodésicas entre os pontos do espaço original dos dados por redução não linear.

E

retorna k combinações lineares dos atributos do conjunto {A,B,C,D,E}.

Provas

Questão presente nas seguintes provas

3431723 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: DATAPREV

Provas:

Analista de TI - Inteligência da Informação
Provas ×

Data Mining
Inteligência ArtificialMachine LearningAlgoritmos

Algoritmos de agrupamento podem ser classificados em diferentes categorias. Um algoritmo de agrupamento amplamente utilizado em aprendizado de máquina e mineração de dados é conhecido como K-Means.

O K-Means, em sua versão original, é classificado como um tipo de algoritmo

Provas

Questão presente nas seguintes provas

3431689 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: DATAPREV

Provas:

Analista de TI - Inteligência da Informação
Provas ×

Inteligência ArtificialMachine LearningAvaliação de ModelosMétricas

Considere o seguinte conjunto de transações em uma loja de varejo:

Transação	Itens adquiridos
1	Leite, Pão, Manteiga
2	Leite, Pão
3	Leite, Manteiga
4	Pão, Manteiga
5	Leite, Pão, Queijo
6	Manteiga, Queijo

A partir desse conjunto de transações, produz-se a regra de associação R: Leite → Pão Nesse contexto, é correto afirmar que a métrica de R que possui valor igual a 50% é

Provas

Questão presente nas seguintes provas

3431683 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: DATAPREV

Provas:

Analista de TI - Inteligência da Informação
Provas ×

Análise de DadosEstatística

A companhia aérea Flying to the Moon sabe que o peso das bagagens despachadas por passageiro é uma variável aleatória com média μ=20 kg e desvio padrão σ=5 kg. Em um voo com capacidade máxima de 100 passageiros, todos os assentos estão ocupados.

Observações:

• Considere que a distribuição da soma pode ser aproximada por uma distribuição normal;

• Nomeando de Z a variável padronizada (escore-z), utilize a tabela a seguir, se julgar necessário.

Enunciado 3950728-1

A probabilidade de que o peso total das bagagens neste voo exceda 2100 kg, e assim, ultrapasse o limite de segurança estabelecido, é igual a

Provas

Questão presente nas seguintes provas

3431644 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: DATAPREV

Provas:

Analista de TI - Negócios
Provas ×

BI: Business IntelligenceData Warehouse
BI: Business IntelligenceOLAP e OLTP

Uma empresa multinacional está desenvolvendo uma plataforma avançada de Business Intelligence (BI) para integrar e analisar dados provenientes de diversas unidades de negócio ao redor do mundo. As fontes de dados incluem:

Sistemas transacionais estruturados: bancos de dados relacionais de ERP e CRM que armazenam informações sobre vendas, clientes e operações internas.

Dados semiestruturados: arquivos XML e JSON contendo registros de transações online e interações de usuários em aplicativos móveis.

Dados não estruturados: logs de servidores web, postagens em redes sociais, emails de suporte ao cliente dados de sensores IoT.

A empresa planeja implementar um Data Warehouse com um modelo multidimensional otimizado para permitir análises complexas e operações de OLAP que suportem a tomada de decisões estratégicas.

Durante o projeto, a equipe enfrenta os seguintes desafios:

Integração de dados heterogêneos: unificar dados estruturados, semiestruturados e não estruturados em um ambiente coeso.

Modelagem e otimização: desenvolver um modelo multidimensional que atenda às necessidades analíticas complexas, mantendo o desempenho.

Definição de hierarquias e granularidades: estabelecer níveis adequados de detalhe para suportar operações de OLAP como drill-down e roll-up.

Com base nesse cenário, avalie as afirmativas a seguir:

I. Para mapear as fontes de dados heterogêneas, é essencial utilizar metadados padronizados que descrevam a estrutura, o significado e a qualidade dos dados, facilitando sua integração no Data Warehouse.

II. Na modelagem multidimensional, a adoção de um esquema em floco de neve (snowflake schema), com tabelas de dimensões normalizadas, melhora o desempenho das consultas OLAP em comparação com o esquema estrela (star schema).

III. As operações de OLAP permitem análises em múltiplas dimensões; por exemplo, o slice fixa um valor em uma dimensão, enquanto o dice cria um subcubo selecionando valores específicos em múltiplas dimensões.

IV. A implementação de uma política de governança de dados clara e abrangente é fundamental para garantir a qualidade, consistência, segurança e privacidade dos dados ao longo de todo o ciclo de vida do projeto de BI.

Está correto o que se afirma em