Em uma determinada empresa de tecnologia da informação foi desenvolvido um sistema que recebe dados diários com a temperatura, coletada a cada hora do dia, de um conjunto de 30 municípios de uma região; após alguns anos armazenando esses dados, a
empresa possuirá uma base de dados com um volume relevante, o que permitirá uma equipe especializada, realizar diversos processamentos para extrair informações úteis sobre as variações climáticas na região, a média do volume de chuva e outras informações relevantes para a população inserida nesse contexto. São consideradas etapas conhecidas nas operações de processamento
de dados, EXCETO:
Uma prefeitura deseja analisar a mobilidade urbana sobre acidentes de trânsito em duas regiões da cidade. Ela criou o código em R a
seguir para checar a média por regiões:
Assinale a opção que indica os códigos em Python que se encaixa no para produzir corretamente o mesmo
resultado que o código em R.
Armazéns de dados (ou data warehouses) são bases de dados
que se mostram como uma interessante opção em processos de
tomada de decisão. Elas armazenam grandes volumes de dados
históricos e agregados para apoiar a tomada de decisões
estratégicas e operacionais da organização.
Assinale a opção que apresenta uma característica correta de um
data warehouse.
Para analisar as vendas dos vários livros correspondentes a vários
autores em uma rede de livrarias, construiu-se um DataMart com
uma nova tabela "FATO" que armazenará os preços dos livros,
chamada #VendaLivro (LivroID, AutorID, PrecoVenda).
Assinale a opção que descreve a ação correta para incluir esta
nova tabela no banco de dados, considerando que já há dados
nas tabelas #Livro e #Autor.
No que se refere a dados estruturados e não estruturados e a
técnicas de integração e ingestão de dados, julgue o próximo item.
Dados estruturados normalmente são armazenados em
arquivos dos tipos doc, wmv, mpw, mp3, wav, jpg; grandes
volumes de dados estruturados são armazenados em
data lakes, os quais podem ser acessados quando necessário.
A respeito de modelagem relacional, modelagem dimensional e
normalização das estruturas de dados, julgue o item que se
segue.
Na modelagem dimensional, as métricas estão contidas na
tabela de fatos, enquanto o caráter quantitativo das
informações descritivas está armazenado na tabela
dimensões.
As inteligências artificiais vêm conquistando cada vez mais o interesse do público, principalmente devido à ascensão de ferramentas como o ChatGPT. Em relação à inteligência artificial (IA) e ao ChatGPT, assinalar a alternativa CORRETA:
No que se refere a modelagem dimensional, mineração de dados e big data, julgue os itens subsequentes.
No modelo CRISP-DM, a fase de preparação dos dados é caracterizada por atividades como análise da qualidade dos dados, exploração dos dados, geração dos primeiros insights e formulação de hipóteses.