Foram encontradas 60 questões.
Sobre redes neurais convolucionais profundas (CNNs), assinale a alternativa correta.
Provas
Em Mineração de Dados, após o pré-processamento dos dados, inicia-se a fase de análises. Para esta fase há análises descritivas e análises preditivas.
Quais das tarefas a seguir são todas análises descritivas?
Provas
Um conceito importante em ciência de dados é o de Big Data.
As três características mais importantes deste tipo de dados são conhecidas como os três V's, que são:
Provas
A visualização de dados vem se tornando um mecanismo indispensável em organizações para tomada de decisão em diversos níveis hierárquicos gerenciais. Ferramentas de visualização de dados, também denominadas ferramentas analíticas, tais como Power BI e Tableau, têm sido amplamente divulgadas e empregadas para apoiar a decisão baseada em dados.
Essas ferramentas possibilitam a importação
Provas
Considerando a área de Processamento de Linguagem Natural, assinale a alternativa correta.
Provas
Ao se considerar a modelagem de dados em um ambiente de data warehouse, qual das seguintes afirmações descreve corretamente vantagens e/ou desvantagens do esquema "estrela" (star schema) e do esquema "floco de neve" (snowflake schema)?
Provas
Considere o seguinte código na linguagem de programação Python:
def misterio (a):
aux = 0.0
for v in a:
if v < aux:
a.append (aux)
c = (aux, a)
return c
b = [2, 4, 1, -5, 10]
resp = misterio (b)
print (resp [1])
Qual é a saída que será impressa após a execução deste programa?
Provas
Suponha que você possua um dataset que represente uma amostra de treinamento balanceada de 500.000 instâncias para classificação binária. Devido à demanda de tempo de processamento dos algoritmos de indução de classificadores que você usará, você definiu que cada treinamento deve ser realizado apenas por 40.000 instâncias e cada teste sobre 10.000 instâncias. Uma vez que 1) cada treinamento e teste demoram juntos 2 horas, 2) você tem disponível apenas 20 horas para executar a estimação de desempenho do algoritmo usado em seus dados, e 3) você quer fazer o máximo de treinamentos/testes possível nessas 20 horas, uma boa estratégia a ser aplicada sobre seu dataset para a estimação de desempenho é:
Provas
Suponha que você possua dados de uma grande rede de lojas e que precise criar um classificador para prever se um determinado cliente comprará ou não um determinado produto. Para isso, a empresa disponibilizou uma amostra contendo dados de 10.000 clientes que compraram o produto e de 10.000 clientes que não compraram o produto. Dentre os vários atributos (ou características) de cada cliente estão: faixa de renda familiar (um valor discreto de 1 a 5), idade, o valor total de produtos já comprados da empresa (somando todas as compras já realizadas), e se comprou ou não o produto (0 = não, 1 = sim) durante uma campanha.
Antes de executar um algoritmo de treinamento do classificador, um procedimento importante de pré-processamento a ser realizado sobre esses dados é:
Provas
Considere um classificador binário treinado para classificar dados de um e-mail em spam ou não-spam. A seguinte matriz de confusão foi obtida após a aplicação desse classificador binário em uma amostra de teste:
| Valor predito | |||
| Spam | Não-spam | ||
|
Valor Real |
Spam | 40 | 20 |
| Não-spam | 10 | 130 | |
Utilizando a matriz acima, quais os valores de acurácia, precisão e revocação (recall ou sensibilidade), respectivamente?
Provas
Caderno Container