O Big Data é definido como coleções de dados cuja sua quantidade é tão grande que é difícil armazenar, gerenciar, processar e analisar esses dados por meio de bancos de dados tradicionais. Nos últimos anos, houve um crescimento exponencial nos dados estruturados e não estruturados gerados pela tecnologia da informação da indústria e saúde por meio da internet das coisas (IoT), por exemplo. Sabendo disso, assinale a alternativa que apresenta corretamente as cinco características, também conhecidas como os cinco “vês”, de um big data.
Um cientista de dados deve utilizar uma técnica de mineração de dados que não usa regras ou árvore de decisão ou qualquer outra representação explícita do classificador, mas que usa o ramo da matemática conhecido como teoria das probabilidades para encontrar a mais provável das possíveis classificações. Sabendo disso, assinale a alternativa que apresenta corretamente o nome da técnica a ser utilizada pelo cientista de dados.
Para suportar inteligência empresarial, em geral, os bancos de dados são montados de forma a fornecer relatórios e ferramentas úteis para a análise. Sabendo disso, assinale a alternativa que apresenta corretamente um programa que possibilite que os usuários explorem dados de diferentes perspectivas para conduzir à inteligência empresarial.
Um analista de dados do MJSP necessita entregar, a seus usuários, dados que sejam compreensíveis para os negócios e, ainda, ofereça desempenho rápido para consultas. Sabendo disso, assinale a alternativa que apresenta corretamente o nome da técnica ideal, amplamente difundida, que o analista de dados deve utilizar para atender às necessidades dos usuários do MJSP.
O MJSP possui uma coleção de conjuntos de dados cujo volume, velocidade e variedade é grande e difícil de armazenar, gerenciar, processar e analisar. Esse conjunto de dados é definido atualmente como
José está enfrentando problemas relacionados ao armazenamento em vários formatos, com estrutura de dados geralmente inconsistente, e à dificuldade de integração. Esses problemas, conhecidos em Qualidade de Dados para Big Data, podem ser respectivamente classificados como
O BI (Business Intelligence) de uma organização pode contar com um portal BA (Business Analytics Portal) que constitui uma pequena parte do processo geral para fornecer suporte aos negócios. Sabendo disso, assinale a alternativa que apresenta corretamente o objetivo do portal de BA e suas ferramentas.
Os formatos de tabela OLAP referem-se a estruturas de tabela multidimensionais, normalmente empregadas em sistemas de Data Warehouse. Assim, os dados são representados em estruturas. Um profissional de tecnologia da informação necessita montar uma dessas estruturas as quais recebem o nome de