Foram encontradas 5.143 questões.
No que se refere à classificação da mineração de dados, à mineração de texto, à modelagem preditiva e à visualização e análise exploratória de dados, julgue os itens subsecutivos.
Modelos de regressão linear são métodos estocásticos para modelagem da relação entre variáveis aleatórias e uma função polinomial.
Provas
No que se refere à classificação da mineração de dados, à mineração de texto, à modelagem preditiva e à visualização e análise exploratória de dados, julgue os itens subsecutivos.
Em um processo de mineração de texto, a tokenização é o processo de dividir textos longos em palavras individuais, removendo-se espaços e pontuação, para fins de identificação da frequência de termos ou da estrutura de uma frase em um grande volume de documentos.
Provas
No que se refere à classificação da mineração de dados, à mineração de texto, à modelagem preditiva e à visualização e análise exploratória de dados, julgue os itens subsecutivos.
Histograma é uma representação da distribuição dos dados de certa base, conforme um ou mais atributos desses dados, por meio de um gráfico de barras.
Provas
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: TCE-RN
Julgue os itens a seguir, relativos a conceitos e técnicas de aprendizado de máquina, IA generativa, redes neurais e deep learning.
No aprendizado supervisionado, o modelo é treinado com um conjunto de dados rotulados, no qual a saída ou o resultado desejado para cada observação já é conhecido previamente.
Provas
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: TCE-RN
Julgue os itens a seguir, relativos a conceitos e técnicas de aprendizado de máquina, IA generativa, redes neurais e deep learning.
As redes adversárias generativas (GANs) operam com duas redes neurais — o gerador e o discriminador —, que colaboram cooperativamente para minimizar a mesma função de perda, produzindo dados sintéticos indistinguíveis dos reais.
Provas
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: TCE-RN
Julgue os próximos itens, a respeito de visualização e análise exploratória de dados, de linguagens e ferramentas de apoio à análise de dados e de técnicas e tarefas de mineração de dados.
O boxplot (diagrama de caixa) é uma ferramenta de visualização que possibilita identificar a mediana, a dispersão dos dados e a presença de valores atípicos (outliers) em uma distribuição.
Provas
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: TCE-RN
Julgue os próximos itens, a respeito de visualização e análise exploratória de dados, de linguagens e ferramentas de apoio à análise de dados e de técnicas e tarefas de mineração de dados.
A técnica de lematização (lemmatization) reduz palavras à sua raiz por meio de regras heurísticas, frequentemente resultando em formas que não constituem palavras válidas no dicionário do idioma original.
Provas
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: TCE-RN
Acerca de modelagem dimensional, do CRISP-DM e do uso de banco de dados relacionais na análise de dados, julgue os itens a seguir.
O esquema estrela é caracterizado por uma tabela de fatos central conectada a múltiplas tabelas de dimensão altamente normalizadas, e visa otimizar o uso de espaço de armazenamento.
Provas
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: TCE-RN
Acerca de modelagem dimensional, do CRISP-DM e do uso de banco de dados relacionais na análise de dados, julgue os itens a seguir.
No modelo de referência CRISP-DM, a fase de preparação de dados ocorre estritamente após a conclusão da fase de modelagem, com o objetivo de formatar as saídas preditivas geradas.
Provas
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: TCE-RN
A respeito de dados estruturados e não estruturados, de banco de dados NoSQL, de modelagem e normalização de dados e de Big Data, julgue os itens a seguir.
Sabendo-se que, no contexto da implementação de uma arquitetura de Big Data, o uso de um data lake distribuído para o armazenamento de dados brutos favorece a escalabilidade horizontal e a flexibilidade de esquemas, a adoção de formatos de arquivo colunares, como o Apache Parquet, é uma prática recomendada para otimizar a performance de leitura e reduzir o consumo de armazenamento por meio de técnicas de compressão e codificação eficientes.
Provas
Caderno Container