Magna Concursos

Foram encontradas 5.012 questões.

2161669 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TCU
Provas:

Natasha, uma cientista de dados, está trabalhando com um conjunto de dados sobre carros para fazer um modelo preditivo para uma companhia de seguros. A primeira versão do modelo utiliza apenas informações básicas sobre os carros: a marca e a cor.

Como esses dados são categóricos, Natasha faz um pré-processamento usando a biblioteca scikit-learn. Em um ambiente interativo, ela executa os comandos a seguir.

>>> from sklearn.preprocessing import OneHotEncoder
>>> enc = OneHotEncoder()
>>> X = [['Toyota', 'vermelho'], ['Toyota',
'verde'], ['BMW', 'vermelho']]

>>> enc.fit(X)
>>> enc.get_feature_names()
array(['x0_BMW', 'x0_Toyota', 'x1_verde', 'x1_vermelho'], dtype=object)

>>> X_prime = enc.transform(X).toarray()
>>> X_prime
array([[0., 1., 0., 1.], [0., 1., 1., 0.], [1., 0., 0., 1.]])

Para contar o número de carros da marca Toyota no conjunto de dados, obtendo corretamente o resultado 2, Natasha pode usar a seguinte linha de código:

 

Provas

Questão presente nas seguintes provas
2161668 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TCU
Provas:

Um analista do TCU recebe o conjunto de dados com covariáveis e a classe a que cada amostra pertence na tabela a seguir.

X1

X2

Classe

0 1 A
0 2 B
1 0 A
1 -1 B
2 2 B
1 2 A
-1 1 B
2 3 A

Esse analista gostaria de prever a classe dos pontos (1,1), (0,0) e (-1,2) usando o algoritmo de k-vizinhos mais próximos com k=3 e usando a distância euclidiana usual.

Suas classes previstas são, respectivamente:

 

Provas

Questão presente nas seguintes provas
2161666 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TCU
Provas:

Seja uma rede neural com camada de entrada com dimensão dois que recebe dados (x1, x2). Essa rede aplica pesos w1 em x1, w2 em x2 e adiciona um viés w0. A função de ativação é dada pela função sinal s(z) = +1, se z \( \ge \) 0, e s(z) = -1, se z \( < \) 0. Essa rede não tem nenhuma camada oculta e será utilizada para classificar observações em y=+1 ou y=-1.

Para pesos w1 = 2, w2 = 3 e viés w0 = 1, a região de classificação é uma reta que passa nos pontos:

 

Provas

Questão presente nas seguintes provas
2161664 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TCU
Provas:

Um analista do TCU gostaria de aplicar um modelo de Latent Dirichlet Allocation (LDA) em um conjunto de textos.

A alternativa que melhor descreve o resultado do modelo é:

 

Provas

Questão presente nas seguintes provas
2161663 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TCU
Provas:

A tabela presente no código em R abaixo apresenta a quantidade de processos analisados por três analistas (denotados por A1, A2 e A3) em diferentes anos.

dados = tibble::tibble(Analista=c(“A1”, “A1”, “A1”, “A2”,

“A2”, “A3”, “A3”, “A3”),

Ano=c(2018,2019,2020,2019,2020,2018,2019,2020),

Processos=c(10,15,20,25,20,8,7,12))

Um programador roda o código abaixo em R.

tidyr::pivot_wider(data=dados, names_from=”Analista”,

values_from=”Processos”)

Os valores esperados na primeira linha do objeto resultante do comando acima são:

 

Provas

Questão presente nas seguintes provas
2160230 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: PGE-RJ

Julgue o próximo item, a respeito de business intelligence (BI).

Data warehouse contém grande variedade de dados que apresentam uma imagem coerente das condições da empresa em um determinado ponto no tempo; por conta dessas características, não pode ser utilizado como repositório de dados em uma arquitetura de BI.

 

Provas

Questão presente nas seguintes provas
2160039 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: VUNESP
Orgão: ALESP

Considerando o processo de ETL (Extração, Transformação e Carga – Load) utilizado para a obtenção de dados, por exemplo, em sistemas de análise dos negócios, é correto afirmar que a etapa de

 

Provas

Questão presente nas seguintes provas
2151821 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: UFRGS
Orgão: SES-RS
Associe os termos dos 5Vs de Big Data às suas respectivas características.

(1) Volume
(2) Velocidade
(3) Variedade
(4) Veracidade
(5) Valor

( ) Dados autênticos e verdadeiros.
( ) Processamento ágil.
( ) Utilidade dos dados.
( ) Fontes de dados muito heterogêneas.
( ) Grande quantidade de dados gerados.

A sequência correta de preenchimento dos parênteses, de cima para baixo, é
 

Provas

Questão presente nas seguintes provas
2151769 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: PGE-RJ

Com relação a data warehouse e data mining, julgue o item.

O OLAP multidimensional (MOLAP) é o resultado de um banco de dados OLAP implementado sobre um banco de dados relacional existente; ele é aplicado quando há um grande número de atributos, que não possam ser colocados facilmente em uma estrutura de cubos.

 

Provas

Questão presente nas seguintes provas
2151768 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: PGE-RJ

Com relação a data warehouse e data mining, julgue o item.

A análise de cluster em data mining permite, por meio de análise exploratória de dados, ordenar casos em clusters, de modo que o grau de associação seja forte entre os membros do mesmo cluster e fraco entre membros de clusters diferentes.

 

Provas

Questão presente nas seguintes provas