Foram encontradas 40 questões.
Em um projeto de mineração de dados para um banco de
varejo que deseja prever a probabilidade de inadimplência
de empréstimos, são coletados dados de clientes, incluindo
histórico de crédito, renda, emprego e comportamento de
pagamento. Ao preparar esses dados para análise, qual dos
seguintes tipos de atributos é essencial para a modelagem
preditiva da inadimplência?
Provas
Questão presente nas seguintes provas
Uma rede de supermercados deseja melhorar suas
estratégias de vendas e marketing para aumentar o valor do
carrinho médio de compras. Para isso, planeja utilizar a
mineração de dados para analisar o comportamento de
compra dos seus clientes. Considerando os dados
coletados no ponto de venda, incluindo datas, horários de
compras, itens adquiridos e métodos de pagamento, qual
aplicação da mineração de dados seria mais eficaz para
atingir esse objetivo?
Provas
Questão presente nas seguintes provas
Considerando as aplicações da mineração de dados, qual
das seguintes opções descreve um exemplo típico no qual
a mineração de dados é aplicada para extrair conhecimento
útil de grandes conjuntos de dados?
Provas
Questão presente nas seguintes provas
Os sistemas de bancos de dados para processamento de
grafos são otimizados para armazenar e navegar em
relações complexas com alta eficiência. Utilizando o Neo4j
como exemplo, qual característica principal diferencia os
bancos de dados de grafos de outros tipos de sistemas
NoSQL?
Provas
Questão presente nas seguintes provas
Os sistemas de banco de dados NoSQL surgiram como uma
resposta às limitações dos bancos de dados relacionais
tradicionais, especialmente em contextos de Big Data e
aplicações web em larga escala. Considerando as
categorias de bancos de dados NoSQL, qual das seguintes
opções descreve corretamente um banco de dados baseado
em documentos?
Provas
Questão presente nas seguintes provas
O Apache Spark oferece várias bibliotecas integradas que
ampliam suas capacidades para além do processamento de
dados em lote. Entre essas bibliotecas, qual é projetada
especificamente para simplificar o desenvolvimento de
algoritmos de machine learning em larga escala?
Provas
Questão presente nas seguintes provas
O Apache Spark é conhecido por sua capacidade de
processar grandes volumes de dados de forma eficiente,
usando um modelo de processamento paralelo e distribuído.
Uma das principais abstrações do Spark é o RDD (Resilient
Distributed Dataset). Qual característica dos RDDs contribui
diretamente para a eficiência do processamento de dados
no Spark?
Provas
Questão presente nas seguintes provas
O modelo de programação MapReduce é essencial no
ecossistema Hadoop para processamento paralelo e
distribuído de grandes volumes de dados. Qual é a principal
função do componente "Reduce" no modelo MapReduce?
Provas
Questão presente nas seguintes provas
O Apache Hadoop YARN (Yet Another Resource
Negotiator) elevou o gerenciamento de recursos e
agendamento de tarefas em clusters Hadoop a um novo
patamar com sua arquitetura mais flexível e eficiente. Qual
dos seguintes benefícios é proporcionado pelo YARN em
comparação ao modelo original do Hadoop?
Provas
Questão presente nas seguintes provas
O Apache Hadoop é um framework que permite o
processamento distribuído de grandes conjuntos de dados
em clusters de computadores usando simples modelos de
programação. Um de seus componentes principais é o
Hadoop Distributed File System (HDFS). Qual é a principal
característica do HDFS que o torna particularmente
adequado para o processamento de Big Data?
Provas
Questão presente nas seguintes provas
Cadernos
Caderno Container