Magna Concursos

Foram encontradas 5.010 questões.

2065535 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: Petrobrás

Quanto aos conceitos relativos à arquitetura de dados, julgue o item a seguir.

Modelagem multidimensional de banco de dados é uma técnica usada para o auxílio às consultas do data warehouse, nas mais diferentes perspectivas. A visão multidimensional permite o uso mais intuitivo para o processamento analítico pelas ferramentas OLAP (on-line analytical processing).

 

Provas

Questão presente nas seguintes provas
2065450 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: Petrobrás

Um usuário deseja importar para o Python, por meio do módulo Pandas, o arquivo no formato csv de nome pesquisa.csv, cujo conteúdo é mostrado a seguir. Esse arquivo se encontra no diretório (ou pasta ou caminho) D:/.

05/06/2008,16:00,2.5788,2.5813,,,

05/06/2008,16:15,2.5768,2.5793,,,

05/06/2008,16:30,2.5744,2.5769,,,

05/06/2008,16:45,2.574,2.5765,,,

05/06/2008,17:00,2.571,2.5735,,,

05/06/2008,17:15,2.5733,2.5758,,,

05/06/2008,17:30,2.5728,2.5753,,,

05/06/2008,17:45,2.5727,2.5752,,,

05/06/2008,18:00,2.5788,2.5813,,,

05/06/2008,18:15,2.5731,2.5756,,,

05/06/2008,18:30,2.5743,2.5768,,,

Considerando essas informações, julgue o próximo item.

O código abaixo permite importar apenas a última linha das duas primeiras colunas do arquivo pesquisa.csv.

import os
os.chdir('D:/')
import pandas
dados=pandas.read_csv('pesquisa.csv',
header=None,usecols=[1,2],
skiprows = range(1,9))

 

Provas

Questão presente nas seguintes provas
2065449 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: Petrobrás

Com respeito a métodos para imputação de dados, julgue o seguinte item.

O método de imputação K-NN (k-nearest neighbours) leva em consideração os padrões de similaridade presentes no conjunto de dados para predizer os valores faltantes. No entanto, a escolha da função de distância para a aplicação desse método, como, por exemplo, HEOM (heterogeneous euclidean-overlap metric) ou HVDM (heterogeneous value difference metric), pode influenciar significativamente nos resultados da imputação.

 

Provas

Questão presente nas seguintes provas
2065445 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: Petrobrás

Com respeito a machine learning aplicado, julgue o próximo item.

Suponha que a palavra amor ocorra 1.000 vezes no último livro escrito por certo autor, que escreveu, no total, 10 livros. Nesse caso, se a palavra amor for encontrada em todos os livros desse autor, então o valor do TF-IDF (term frequencyinverse document frequency) referente à palavra amor no último livro escrito será igual a 1/1.000.

 

Provas

Questão presente nas seguintes provas
2065444 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: Petrobrás

Com respeito a machine learning aplicado, julgue o próximo item.

Stop-words constituem um conjunto de palavras que proporcionam pouca informação para o significado de uma frase.

 

Provas

Questão presente nas seguintes provas
2065443 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: Petrobrás

Julgue o próximo item, relativo a redes neurais artificiais (RNA).

O algoritmo de backpropagation consiste das fases de propagação e de retro propagação: na primeira, as entradas são passadas através da rede e as previsões de saída são obtidas; na segunda, se calcula o termo de correção dos pesos e, por conseguinte, a atualização dos pesos.

 

Provas

Questão presente nas seguintes provas
2065442 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: Petrobrás

Julgue o próximo item, relativo a redes neurais artificiais (RNA).

As funções de ativação são elementos importantes nas redes neurais artificiais; essas funções introduzem componente não linear nas redes neurais, fazendo que elas possam aprender mais do que relações lineares entre as variáveis dependentes e independentes, tornando-as capazes de modelar também relações não lineares.

 

Provas

Questão presente nas seguintes provas
2065441 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: Petrobrás

Com respeito a análise de componentes principais, mistura de gaussianas e agrupamento k-means, julgue o item que se segue.

Considere a tabela abaixo que mostra as distâncias entre cada observação de um conjunto de dados hipotético e os vetores médios (centroides) do cluster correspondente ao final da aplicação do algoritmo de agrupamento k-means. Com base nessa tabela, infere-se que o cluster 1 é constituído pelas observações 2, 5 e 10.

  cluster
observação 1 2 3 4
1 3 8 7 12
2 12 7 5 10
3 7 3 8 10
4 4 8 12 8
5 12 5 7 7
6 2 7 6 10
7 7 12 9 1
8 8 10 4 9
9 5 2 6 6
10 9 8 5 2
 

Provas

Questão presente nas seguintes provas
2065439 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: Petrobrás

Uma árvore de decisão representa um determinado número de caminhos possíveis de decisão e os resultados de cada um deles, apresentando muitos pontos positivos, ou seja, são fáceis de entender e interpretar. Elas têm processo de previsão completamente transparente e lidam facilmente com diversos atributos numéricos, assim como atributos categóricos, podendo até mesmo classificar dados sem atributos definidos.

De acordo com os aspectos construtivos de uma árvore de decisão, julgue o item a seguir.

A entropia de uma árvore de decisão aborda o aspecto da quantidade de informações que está associada às respostas que podem ser obtidas às perguntas formuladas, representando o grau de incerteza associado aos dados.

 

Provas

Questão presente nas seguintes provas
2065438 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: Petrobrás

Uma árvore de decisão representa um determinado número de caminhos possíveis de decisão e os resultados de cada um deles, apresentando muitos pontos positivos, ou seja, são fáceis de entender e interpretar. Elas têm processo de previsão completamente transparente e lidam facilmente com diversos atributos numéricos, assim como atributos categóricos, podendo até mesmo classificar dados sem atributos definidos.

De acordo com os aspectos construtivos de uma árvore de decisão, julgue o item a seguir.

Se o processo adotado para a construção de árvores de decisão for determinístico, uma forma de obtenção de árvores aleatórias, que compõem as florestas aleatórias, pode ser realizada por meio do bootstrap dos dados, em que cada árvore é treinada com base no resultado de bootstrap_sample (inputs).

 

Provas

Questão presente nas seguintes provas