Foram encontradas 5.143 questões.
Considerando este tema, avalie as afirmativas a seguir.
I. A análise de sentimentos pode ser tratada como um problema de classificação de textos, onde é importante definir se o texto é objetivo ou subjetivo. Textos subjetivos são os de principal interesse nesse campo de pesquisa.
II. A análise de sentimentos pode ser usada para a identificação de avaliações falsas em sites de e-commerce. Uma limitação para essa aplicação é a dificuldade de obtenção de dados para treinamento de modelos, uma vez que a marcação manual de avaliações com opiniões falsas ou enganosas é muitas vezes difícil.
III. Um exemplo de algoritmo supervisionado de análise de sentimentos para avaliações de produtos pode ser resumido nos seguintes passos: extração de frases com padrões predeterminados de opinião; cálculo de um indicador de orientação de cada frase; obtenção da orientação média da avaliação como um todo; e determinação se é positiva ou negativa.
Está correto o que se afirma em
Provas
No contexto de ferramentas de integração de ambientes de Big Data e Banco de Dados relacionais, associe cada descrição a seguir à respectiva ferramenta.
1. Apache Kafka.
2. Apache Sqoop.
( ) Muito usado para transferência de dados entre bancos relacionais para o ecossistema Hadoop.
( ) Suas transferências de dados são baseadas em lotes, focando em transferências programadas ou sob demanda.
( ) Muito usado para streaming de dados em tempo real.
( ) Trabalha com mensageria distribuída, baseada no conceito de tópicos, permite que produtores enviem mensagens e consumidores as processem de forma assíncrona.
A associação correta, na ordem apresentada, é
Provas
As organizações públicas podem se beneficiar do uso de Big Data para auditar grandes volumes de informações de maneira eficiente.
Sobre os 5Vs que caracterizam o Big Data, assinale a afirmativa correta.
Provas
No contexto de auditoria e compliance, a pilha ELK Stack (Elasticsearch, Logstash e Kibana) é amplamente usada para analisar e monitorar atividades nos sistemas, especialmente no que se refere à integridade e à segurança de dados.
Sobre as funcionalidades dessa pilha, assinale a afirmativa correta.
Provas
As Redes Neurais Convolucionais (Convolutional Neural Network - CNNs) são amplamente utilizadas em tarefas de reconhecimento de imagens.
Sobre as características e as arquiteturas das CNNs, avalie as afirmativas a seguir.
I. Uma camada que compõe uma CNN é a camada convolucional. Nela ocorre a subamostragem da imagem, com o objetivo de se diminuir a carga computacional, o uso de memória e o número de parâmetros necessários.
II. LeNet-5, AlexNet e ResNet são exemplos de arquiteturas CNN.
III. A arquitetura de uma CNN é composta exclusivamente por camadas convolucionais e camadas de pooling.
Está correto o que se afirma em
Provas
Marcelo, auditor especializado em Análise de Dados, está estudando o uso de algoritmos de aprendizado de máquina (Machine Learning) para a detecção de fraudes em contas públicas. Como parte de seus experimentos, ele dividiu seu conjunto de dados em treinamento e teste. Após treinar um modelo, percebeu que os resultados apresentavam indícios de underfitting.
O underfitting ocorre
Provas
Algoritmos de Aprendizado de Máquina (Machine Learning) podem ser classificados quanto ao tipo de aprendizado. Em relação ao tema, avalie as afirmações a seguir e assinale (V) para a verdadeira e (F) para a falsa.
( ) Tarefas de classificação e regressão são exemplos típicos de aprendizado supervisionado.
( ) No aprendizado não supervisionado, os dados de treinamento não estão rotulados.
( ) SVM, árvores de decisão e regressão logística são exemplos de algoritmos de aprendizado supervisionado.
As afirmativas são, respectivamente,
Provas
Você, como analista de dados do TCE-RR, pode ser incumbido de utilizar um cubo OLAP para avaliar as auditorias do tribunal pelas dimensões cidade, tempo e custo.
Considere que a análise possua a seguinte cadeia de ações: filtro para apenas considerar o último ano, detalhamento de ano para mês e agregação de mês para trimestre.
A sequência de ações OLAP será:
Provas
O Apache Spark é um mecanismo de análise unificado para processamento de dados em grande escala com diversas aplicações em ciência de dados, machine learning e processamento de gráficos.
Considerando essa ferramenta, julgue as afirmativas a seguir.
I. O Spark pode ser executado no Apache Hadoop, Kubernetes, por conta própria, na nuvem, em máquinas isoladas ou em clusters.
II. DataFrames, SQL e Structured Streaming são exemplos de APIs do Spark.
III. Uma diferença entre o Spark e o MapReduce é que o Spark processa e mantém os dados na memória para as etapas subsequentes, sem gravar ou ler do disco, gerando maior velocidade de processamento.
Está correto o que se afirma em
Provas
Sobre algoritmos de mineração de dados, avalie as afirmativas a seguir e assinale (V) para a verdadeira e (F) para a falsa.
( ) K-means, também conhecido como K-NN, é um algoritmo baseado na ideia de que objetos semelhantes estão próximos uns dos outros.
( ) Árvore de decisão é uma estrutura hierárquica constituída por nós. Nela, o coeficiente de Gini de um nó é sempre maior do que o do seu nó pai.
( ) O algoritmo SVM, utilizado apenas para a tarefa de classificação, emprega classificadores lineares que separam o conjunto de dados por meio de hiperplanos, não sendo possível seu uso com problemas não linearmente separáveis.
As afirmativas são, respectivamente,
Provas
Caderno Container