Prova Completa: Técnico de Planejamento e Pesquisa - Ciência de Dados (IPEA - CESGRANRIO

3076591 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: CESGRANRIO
Orgão: IPEA

Provas:

Técnico de Planejamento e Pesquisa - Ciência de Dados
Provas ×

Inteligência ArtificialMachine LearningAlgoritmosAgrupamentos Hierárquicos

No aprendizado não supervisionado, os dados de treinamento não têm rótulos. O objetivo é agrupar instâncias semelhantes em clusters. Nesse contexto, suponha que se deseja executar um algoritmo de agrupamento para tentar detectar grupos de visitantes semelhantes em um blog. Em nenhum momento é informado ao algoritmo a que grupo um visitante pertence, mas ele encontra essas conexões sem ajuda. Por exemplo, o algoritmo pode notar que 40% dos visitantes são homens que adoram histórias em quadrinhos e, geralmente, leem o blog à noite, enquanto 20% são jovens amantes de ficção científica que visitam o blog durante os fins de semana, e assim por diante. Deseja-se, nesse caso, usar um algoritmo de agrupamento hierárquico para subdividir cada grupo em grupos menores, o que pode ajudar a direcionar as postagens do blog para cada grupo específico.

Nesse cenário, qual é o algoritmo mais apropriado para fazer o agrupamento desejado?

Provas

Questão presente nas seguintes provas

3076590 Ano: 2024
Disciplina: TI - Desenvolvimento de Sistemas
Banca: CESGRANRIO
Orgão: IPEA

Provas:

Técnico de Planejamento e Pesquisa - Ciência de Dados
Provas ×

Fundamentos de Programação

A biblioteca Scikit-Learn emprega o algoritmo Classification And Regression Tree (CART) para treinar Árvores de Decisão. O algoritmo CART baseia-se na recursividade e na estratégia de divisão binária para construir uma árvore de decisão. Inicialmente, a árvore é representada por um único nó, que contém todos os dados de treinamento. A cada passo, o algoritmo busca a melhor maneira de dividir o conjunto de dados. A recursividade continua até que uma condição de parada seja atendida, como atingir uma profundidade máxima da árvore. Uma vez construída a árvore, a fase de predição ocorre ao percorrer a estrutura da árvore de acordo com as condições estabelecidas nos nós, levando a uma predição (inferência) para uma determinada entrada.

Considerando-se que n corresponde ao número de features e m ao número de instâncias, qual é a complexidade computacional assintótica de predição para árvores de decisão treinadas com o algoritmo CART?

Provas

Questão presente nas seguintes provas

3076589 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: CESGRANRIO
Orgão: IPEA

Provas:

Técnico de Planejamento e Pesquisa - Ciência de Dados
Provas ×

Inteligência ArtificialMachine LearningAlgoritmosÁrvores de Decisão
ProgramaçãoPythonScikit-learn (Sklearn)

As árvores de decisão são um modelo de aprendizado de máquina que opera por meio da construção de uma estrutura em forma de árvore para tomar decisões e que oferece uma compreensão clara da lógica de decisão e da hierarquia de características que contribuem para as predições finais. Elas são versáteis e podem ser usadas tanto para tarefas de classificação quanto para as de regressão.

Nesse contexto, considere a construção de uma árvore de regressão usando a classe DecisionTreeRegressor do Scikit-Learn e seu treinamento em um conjunto de dados quadrático com max_depth=2, conforme mostrado a seguir:

from sklearn.tree import DecisionTreeRegressor
tree_reg = DecisionTreeRegressor(max_depth=2)
tree_reg.fit(X, y)

A árvore resultante é representada na Figura a seguir.

Enunciado 3328451-1

GÉRON, A. Hands-on machine learning with Scikit-Learn, Keras, and TensorFlow: Concepts, Tools, and Techniques
to Build Intelligent Systems. 2 ed. Sebastopol, CA: O’Reilly Media, Inc.: 2019, p. 183.

Considerando-se o cenário apresentado e que se deseja fazer uma predição para uma nova instância, com x1 = 0.6, qual será o valor predito?

Provas

Questão presente nas seguintes provas

3076588 Ano: 2024
Disciplina: Estatística
Banca: CESGRANRIO
Orgão: IPEA

Provas:

Técnico de Planejamento e Pesquisa - Ciência de Dados
Provas ×

Em uma nota técnica publicada em 2022 pelo Ipea, sobre população em situação de rua, foi utilizada a técnica de análise de componente principal (PCA).

Na análise por PCA, a primeira componente principal de um conjunto de dados representa a

Provas

Questão presente nas seguintes provas

3076587 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: CESGRANRIO
Orgão: IPEA

Provas:

Técnico de Planejamento e Pesquisa - Ciência de Dados
Provas ×

Inteligência ArtificialMachine LearningAlgoritmosÁrvores de Decisão

Em uma nota técnica do Ipea sobre emprego público nos governos subnacionais brasileiros, no ano de 2016, aparece menção sobre o fato de as bases utilizadas possuirem outliers, ou valores atípicos.

A construção de um modelo preditivo a partir dos dados dessas bases, usando árvores aleatórias, Random Forests,

Provas

Questão presente nas seguintes provas

3076586 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: CESGRANRIO
Orgão: IPEA

Provas:

Técnico de Planejamento e Pesquisa - Ciência de Dados
Provas ×

Inteligência ArtificialMachine LearningAlgoritmosNaive Bayes

Alguns trabalhos publicados como notas técnicas pelo Ipea se utilizam do método de classificação denominado de Bayes Ingênuo.

No contexto do classificador Bayesiano Ingênuo, Naive Bayes, a ingenuidade do modelo é caracterizada pela(o)

Provas

Questão presente nas seguintes provas

3076585 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: CESGRANRIO
Orgão: IPEA

Provas:

Técnico de Planejamento e Pesquisa - Ciência de Dados
Provas ×

Inteligência ArtificialMachine LearningAlgoritmosSVM: Máquinas de Vetores de Suporte

Um cientista de dados está utilizando máquinas de vetor de suporte (SVM) em um projeto de classificação, pois deseja evitar o overfitting do modelo aos dados de treinamento.

Qual das seguintes técnicas auxilia a prevenir o overfitting em SVM?

Provas

Questão presente nas seguintes provas

3076584 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: CESGRANRIO
Orgão: IPEA

Provas:

Técnico de Planejamento e Pesquisa - Ciência de Dados
Provas ×

Inteligência ArtificialMachine LearningTipos de AprendizadoSupervisionado

Em um projeto de classificação de textos, um modelo de machine learning foi aplicado em um conjunto de teste e apresentou os seguintes resultados: uma precisão de 80% e uma revocação de 70%.

Com base nessas informações e considerando-se apenas a parte inteira da porcentagem, qual é o F1 Score desse modelo?

Provas

Questão presente nas seguintes provas

3076583 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: CESGRANRIO
Orgão: IPEA

Provas:

Técnico de Planejamento e Pesquisa - Ciência de Dados
Provas ×

ProgramaçãoPythonScikit-learn (Sklearn)

Um pesquisador possui um conjunto de dados consistindo em características diversas, features, e suas respectivas classificações, labels. Ele deseja dividir esse conjunto de dados em conjuntos distintos, para treinamento e para teste, com o objetivo de validar a eficácia de um modelo de aprendizado de máquina. Nesse contexto, qual função do SciKit-learn ele deve utilizar para realizar essa divisão de maneira eficiente e adequada?