Foram encontradas 4.990 questões.
As organizações públicas podem se beneficiar do uso de Big Data para auditar grandes volumes de informações de maneira eficiente.
Sobre os 5Vs que caracterizam o Big Data, assinale a afirmativa correta.
Provas
No contexto de auditoria e compliance, a pilha ELK Stack (Elasticsearch, Logstash e Kibana) é amplamente usada para analisar e monitorar atividades nos sistemas, especialmente no que se refere à integridade e à segurança de dados.
Sobre as funcionalidades dessa pilha, assinale a afirmativa correta.
Provas
As Redes Neurais Convolucionais (Convolutional Neural Network - CNNs) são amplamente utilizadas em tarefas de reconhecimento de imagens.
Sobre as características e as arquiteturas das CNNs, avalie as afirmativas a seguir.
I. Uma camada que compõe uma CNN é a camada convolucional. Nela ocorre a subamostragem da imagem, com o objetivo de se diminuir a carga computacional, o uso de memória e o número de parâmetros necessários.
II. LeNet-5, AlexNet e ResNet são exemplos de arquiteturas CNN.
III. A arquitetura de uma CNN é composta exclusivamente por camadas convolucionais e camadas de pooling.
Está correto o que se afirma em
Provas
Marcelo, auditor especializado em Análise de Dados, está estudando o uso de algoritmos de aprendizado de máquina (Machine Learning) para a detecção de fraudes em contas públicas. Como parte de seus experimentos, ele dividiu seu conjunto de dados em treinamento e teste. Após treinar um modelo, percebeu que os resultados apresentavam indícios de underfitting.
O underfitting ocorre
Provas
Algoritmos de Aprendizado de Máquina (Machine Learning) podem ser classificados quanto ao tipo de aprendizado. Em relação ao tema, avalie as afirmações a seguir e assinale (V) para a verdadeira e (F) para a falsa.
( ) Tarefas de classificação e regressão são exemplos típicos de aprendizado supervisionado.
( ) No aprendizado não supervisionado, os dados de treinamento não estão rotulados.
( ) SVM, árvores de decisão e regressão logística são exemplos de algoritmos de aprendizado supervisionado.
As afirmativas são, respectivamente,
Provas
Você, como analista de dados do TCE-RR, pode ser incumbido de utilizar um cubo OLAP para avaliar as auditorias do tribunal pelas dimensões cidade, tempo e custo.
Considere que a análise possua a seguinte cadeia de ações: filtro para apenas considerar o último ano, detalhamento de ano para mês e agregação de mês para trimestre.
A sequência de ações OLAP será:
Provas
O Apache Spark é um mecanismo de análise unificado para processamento de dados em grande escala com diversas aplicações em ciência de dados, machine learning e processamento de gráficos.
Considerando essa ferramenta, julgue as afirmativas a seguir.
I. O Spark pode ser executado no Apache Hadoop, Kubernetes, por conta própria, na nuvem, em máquinas isoladas ou em clusters.
II. DataFrames, SQL e Structured Streaming são exemplos de APIs do Spark.
III. Uma diferença entre o Spark e o MapReduce é que o Spark processa e mantém os dados na memória para as etapas subsequentes, sem gravar ou ler do disco, gerando maior velocidade de processamento.
Está correto o que se afirma em
Provas
Sobre algoritmos de mineração de dados, avalie as afirmativas a seguir e assinale (V) para a verdadeira e (F) para a falsa.
( ) K-means, também conhecido como K-NN, é um algoritmo baseado na ideia de que objetos semelhantes estão próximos uns dos outros.
( ) Árvore de decisão é uma estrutura hierárquica constituída por nós. Nela, o coeficiente de Gini de um nó é sempre maior do que o do seu nó pai.
( ) O algoritmo SVM, utilizado apenas para a tarefa de classificação, emprega classificadores lineares que separam o conjunto de dados por meio de hiperplanos, não sendo possível seu uso com problemas não linearmente separáveis.
As afirmativas são, respectivamente,
Provas
Sobre o processo de ETL (Extract, Transform, and Load), analise as afirmativas a seguir.
I. A etapa de extração pode impactar negativamente o desempenho do sistema de origem, caso não seja planejada adequadamente, principalmente quando se trata de um grande volume de dados em tempo real.
II. O Apache NiFi é uma plataforma de orquestração de fluxos de trabalho de código aberto, frequentemente utilizado para criação de pipelines ETL complexos, em que o usuário deve utilizar a linguagem de programação Python.
III. A etapa de transformação compreende tarefas como a limpeza, padronização e formatação dos dados, além de conversões de tipos de dados e agregações.
Está correto o que se afirma em
Provas
No contexto de ferramentas para análise e exploração de dados (Excel avançado, SQL e Business Intelligence - BI), avalie as afirmativas a seguir.
I. Ferramentas de BI permitem a criação de dashboards interativos e visualizações em tempo real.
II. O SQL é ideal para consultas e manipulação direta de dados armazenados em grandes bancos de dados.
III. O MS Excel oferece maior flexibilidade em análises locais com fórmulas personalizadas.
Está correto o que se afirma em
Provas
Caderno Container