Foram encontradas 60 questões.
Considere que você possua um dataset contendo 100 instâncias de uma classe A e 120 instâncias de uma classe B.
Você utilizou 80% das instâncias de cada classe deste dataset para treinar um classificador, e o utilizou para prever a classe de todas as 220 instâncias do dataset. Curiosamente, seu classificador acertou a classe de todas as instâncias que foram utilizadas no treinamento do classificador, mas acertou apenas cerca de 50% das instâncias que não foram usadas no treinamento.
Este é um cenário típico que indica que você deveria ter aplicado qual técnica no seu processo de treinamento?
Provas
Sobre o algoritmo SVM (máquinas de vetores de suporte), pode-se afirmar que são classificadores
Provas
- Inteligência ArtificialMachine LearningSeleção de Modelos
- Análise de DadosTécnicas de Pré-processamentoRedução de Dimensionalidade
Sobre redução de dimensionalidade e seleção de características, assinale a alternativa correta.
Provas
Suponha que você precisa analisar posts em uma rede social sobre opiniões de clientes da sua empresa.
O conjunto de textos desses posts são considerados dados
Provas
Dados abertos são dados que
Provas
Sobre técnicas de agrupamento (clusterização), assinale a alternativa correta.
Provas
Sobre anomalias (outliers), assinale a alternativa correta.
Provas
O esquema parcial de um Banco de Dados Relacional de uma Universidade é apresentado a seguir, composto pelas relações Estudante, Disciplina, TurmaDisciplina e HistoricoEscolar. Os nomes entre parênteses definem os atributos armazenados para cada relação; atributos sublinhados indicam chave primária e atributos em negrito indicam chave estrangeira. Atributos que compõem chaves estrangeiras são identificados com o mesmo nome dos atributos que compõem chaves primárias às quais fazem referência.
Considere a execução do seguinte comando em Structured Query Language (SQL) padrão:
Estudante(e-codigo, e-nome, e-curso)
Disciplina(d-codigo,d-nome,d-quantidade-aulas)
TurmaDisciplina(td-codigo, d-codigo, td-ano, td-semestre, td-local-aula)
HistoricoEscolar(e-codigo,td-codigo, he-notafinal, he-frequencia)
Comando SQL executado:
select
e.e-nome, d.d-nome, he.he-nota-final
from
Estudante e, Disciplina d, TurmaDisciplina td,
HistoricoEscolar he
where
he.e-codigo = e.e-codigo and
he.td-codigo = td.td-codigo and
td.d-codigo = d.d-codigo and
td.td-ano = 2023 and
td.td-semestre = 1 and
(he.td-codigo,he.he-nota-final) in
(select he2.td-codigo, max(he2.he-nota-final)
from HistoricoEscolar he2
group by he2.td-codigo);
É correto afirmar que o comando mostra o nome do aluno, o nome da disciplina e a nota final
Provas
Sobre a krigagem, no contexto de análise de dados georreferenciados, a seguinte afirmação é correta:
Provas
Um modelo de regressão linear simples foi ajustado sobre um conjunto de pares !$ (x_1, \, y_1) \, ... \, (x_5, \, y_5), !$ com o objetivo de se prever o valor da variável !$ y, !$ dado o valor de !$ x. !$
Denotamos por !$ \hat{y} !$ o valor predito de !$ y_i, !$ dado o valor de !$ x_i, !$ e denotamos por !$ \bar{y} !$ a média dos valores de !$ y_1 \, , \, ... \, , \, y_5. !$
Suponha que, após o ajuste do modelo, os seguintes indicadores de ajuste tenham sido obtidos:
!$ TSS \, = \, \sum\limits_{i=1}^5 \, (y_i \, - \, \bar {y})^2 \, = \, 16. !$
!$ RSS \, = \, \sum\limits_{i=1}^5 \, (y_i \, - \, \hat {y})^2 \, = \, 4; !$
Com base nestas informações, qual é o valor do coeficiente de determinação, R2?
Provas
Caderno Container