Foram encontradas 5.143 questões.
A linguagem R foi desenvolvida para realizar análises de dados por meio de um ambiente voltado à computação estatística e gráfica. Ela permite explorar dados, criar funções personalizadas, executar comandos diretamente e utilizar uma ampla variedade de pacotes disponíveis na rede CRAN (Comprehensive R Archive Network), tornando-se uma ferramenta poderosa para a manipulação e visualização de dados.
A função apply(D, i, f), em R, é utilizada para
Provas
O Apache Spark é uma ferramenta amplamente utilizada para processamento de grandes volumes de dados.
Assinale a opção que o descreve corretamente, assim como suas capacidades e suas funcionalidades.
Provas
O Comitê Olímpico Brasileiro está implantando uma nova infraestrutura de banco de dados em memória para otimizar a análise de desempenho dos atletas. A utilização de técnicas de Inteligência Artificial (IA) tem permitido prever resultados, identificar padrões de desempenho e detectar anomalias em tempo real, proporcionando aos treinadores dados rápidos e precisos para tomada de decisões estratégicas.
Com a combinação de IA e bancos de dados em memória, o Comitê espera melhorar a eficiência na análise de grandes volumes de dados e fornecer insights personalizados para cada atleta, otimizando o treinamento e a performance nas competições.
Diante desse cenário, sobre o impacto da IA aplicada a bancos de dados em memória, assinale a opção incorreta.
Provas
O Apache Hadoop é uma plataforma amplamente utilizada no processamento de grandes volumes de dados. Ele se destaca por sua arquitetura distribuída e capacidade de lidar com grandes conjuntos de dados de forma eficiente.
Com base nas capacidades e funcionalidades do Hadoop, assinale a opção que = descreve corretamente seu funcionamento e aplicação prática.
Provas
Considere o seguinte código em R:

É correto afirmar que
Provas
Uma loja online que está crescendo e coletando muitas informações sobre seus clientes: o que eles clicam, o que compram, as avaliações que deixam nos produtos e até as mensagens que enviam. Para dar dicas de produtos cada vez melhores e deixar a experiência de cada cliente mais personalizada, a loja decidiu criar um "grande depósito de dados" (Data Lake) para guardar tudo isso. E a equipe de especialistas em dados planeja usar Inteligência Artificial e Machine Learning para desvendar os segredos contidos nesse depósito.
Nesse caso, a grande vantagem de usar IA e ML junto com um Data Lake é
Provas
É considerada uma prática fundamental para assegurar o sucesso de um projeto de Business Intelligence (BI) em uma organização
Provas
Sobre as técnicas de integração e ingestão de dados ETL (Extract, Transform, Load) e ELT (Extract, Load, Transform), assinale a opção incorreta.
Provas
Seja o conjunto de dados X apresentado a seguir, em que os atributos “P” e “Q” são preditores, e o atributo “Classe” é o atributo-alvo:

Queremos classificar uma nova amostra x=(5.0, 5.0) utilizando o algoritmo clássico dos k vizinhos mais próximos (k-NN), utilizando a distância euclidiana para a determinação de vizinhanças. Com base nesse algoritmo, e considerando os valores aproximados de √2 ≈ 1,414 e √3 ≈ 2,236, o k-NN retorna como categoria de x
Provas
A validação cruzada é uma importante técnica em aprendizado de máquina, usada para obter uma estimativa mais robusta do erro de generalização. Dessa forma, ela contribui para a construção de modelos mais confiáveis, permitindo uma avaliação mais precisa de sua capacidade preditiva em diferentes cenários.
Uma das características da validação cruzada com k conjuntos é que esse método
Provas
Caderno Container