Dados massivos são grandes grupos de dados que podem ser
capturados, comunicados, agregados, armazenados e analisados. Uma das plataformas de processamento de dados massivos mais conhecidas é o Apache Hadoop. Sobre tal plataforma,
assinale a afirmativa correta.
O CDC (Change Data Capture) é uma forma viável de atualizar
informações em um Data Warehouse com pouca latência porque fornece um mecanismo de simples implementação para o
rastreamento dos dados, trabalha de forma assíncrona e causa
um baixo impacto no servidor transacional. A metodologia utilizada para construir um CDC, que consiste em executar consultas ciclicamente para capturar e identificar as mudanças realizadas, sendo necessário, adicionalmente, utilizar algumas
propriedades nas tabelas como, por exemplo, possuir uma coluna chamada “última atualização” ou um inteiro crescente
como chave primária, denomina-se:
Arquiteturas de Big Data são responsáveis por lidar com ingestão, processamento e análise de dados grandes ou complexos demais para sistemas de banco de dados tradicionais. Em relação aos componentes das arquiteturas de Big Data, assinale a afirmativa INCORRETA.
A governança de dados é entendida como uma ação multidisciplinar que tem como finalidade tratar os dados como insumos ativos e tangíveis nas organizações. Em relação aos seus
princípios, assinale a afirmativa correta.
Os elementos ambientais básicos definem cada área de conhecimento ou função da Gestão de Dados presentes no guia DAMA-DMBOK. São considerados alguns destes elementos:
De acordo com o guia DAMA-DMBOK, os dados podem ser avaliados sobre diversas dimensões. A dimensão que se refere como as coisas do mundo real estão corretamente representadas é:
O processamento em batch tem grande eficiência; é altamente escalável, de baixo custo e processa dados em repouso. Assinale, a seguir, os três componentes essenciais de uma arquitetura em batch (Hadoop).
Considerando que o Hadoop Distributed File System (HDFS) é
um sistema de arquivos distribuídos otimizados para atuar em
dados não estruturados, assinale a afirmativa correta.
A ideia básica do Data Lake é simples;todos os dados emitidos pela organização serão armazenados em uma única
estrutura de dados chamada Data Lake. Assinale, a seguir,
um dos estágios para a implementação de um Data Lake.
Uma arquitetura de gestão de Big Data deve incluir uma
variedade de serviços que permitam que as empresas façam
uso de incontáveis fontes de dados de maneira rápida e eficiente. Sobre a arquitetura de Big Data, assinale a afirmativa
correta.