Foram encontradas 5.012 questões.
1. linhas = sc.textFile("dados.txt")
2. linhasComprimento = linhas.map(lambda s: len(s))
3. totalComprimento = linhasComprimento.reduce(lambda a, b: a + b)
Em relação ao código pyspark acima, assinale a afirmativa incorreta.
Provas
O principal objetivo do Hadoop YARN foi dividir as funcionalidades de gerenciamento de recursos e agendamento/monitoramento de tarefas em daemons separados.
Assinale a opção que não figura como uma característica da arquitetura de Hadoop YARN.
Provas
Considere a consulta de streaming que conta os cliques dos usuários por país para uma campanha publicitária na web a cada 30 minutos. Ao aplicar o modelo de processamento de micro batch a esta consulta, o fluxo de dados é dividido em duas fases: batching e processing, como mostra a figura a seguir.

O processamento stream é obtido repetindo as fases de batching e processing para as novas tuplas de dados.
Em relação ao processamento stream em micro-batches, assinale a opção incorreta.
Provas
O Apache Spark é um framework para processamento paralelo e oferece suporte ao processamento na memória para aumentar o desempenho de aplicações de big data.
Em relação aos RDDs e a suas operações, assinale a afirmativa incorreta.
Provas
Matei Zaharia et al. propuseram o framework Spark como alternativa para processar workloads que reutilizam dados através de múltiplas operações paralelas.
As opções a seguir apresentam características do framework Spark, à exceção de uma. Assinale-a.
Provas
Sobre o conceito de Governança de Dados (DAMA), assinale a afirmativa correta.
Provas
Kimball elenca uma série de conceitos fundamentais para a elaboração de um modelo dimensional.
Em relação a esses conceitos, assinale a afirmativa incorreta.
Provas
O HDFS foi projetado para armazenar arquivos grandes como uma sequência de blocos.
Em relação à replicação dos dados, assinale a afirmativa incorreta.
Provas
Sobre as redes neurais convolucionais (CNNs) é correto afirmar que
Provas
No processamento de linguagem natural, é preciso realizar transformações de textos em números, geralmente vetores ou matrizes, de forma que sirvam de entrada para os algoritmos computacionais de aprendizado de máquina.
Sobre esses algoritmos de extração de características de textos, assinale a afirmativa incorreta.
Provas
Caderno Container