3360848 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TRF-1

Provas:

Analista Judiciário - TI/Análise de Dados
Provas ×

Data Mining

Eriberto, analista de dados do TRF-1, desenvolve um aplicativo que gera resumos das sentenças do Tribunal em linguagem coloquial, mantendo a coerência e a coesão textuais.

O aplicativo de Eriberto realiza a tarefa de:

Provas

Questão presente nas seguintes provas

3360844 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TRF-1

Provas:

Analista Judiciário - TI/Análise de Dados
Provas ×

Análise de Dados

Duas instâncias A e B de um dataset de tweets são representadas, respectivamente, por intermédio dos vetores x_A=[2,−2,0,1,] e x_B=[−4,0,2,−4].

Os valores da similaridade de cosseno e da distância de Manhattan entre essas duas instâncias são, respectivamente:

Provas

Questão presente nas seguintes provas

3360843 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TRF-1

Provas:

Analista Judiciário - TI/Análise de Dados
Provas ×

Análise de DadosAnálise Exploratória

Carolina produz um relatório em que compara os modelos de representação vetorial de palavras Word2Vec (em seus dois métodos: CBOW e Skip-Gram) e GloVe.

Em seu relatório, Carolina destaca corretamente que o:

Provas

Questão presente nas seguintes provas

3360842 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TRF-1

Provas:

Analista Judiciário - TI/Análise de Dados
Provas ×

Análise de DadosTécnicas de Pré-processamento

Bernardo, analista de dados do TRF-1, realiza o pré-processamento de um dataset que será utilizado para treinar o chatbot do Tribunal. Em uma das etapas do pré-processamento, ele utiliza uma ferramenta que deflexiona as palavras, retirando suas inflexões.

Nessa etapa, Bernardo realizou uma:

Provas

Questão presente nas seguintes provas

3360839 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TRF-1

Provas:

Analista Judiciário - TI/Análise de Dados
Provas ×

Inteligência ArtificialConceitos e Fundamentos de IA

Nas técnicas de agrupamento hierárquico, é necessário estabelecer uma abordagem para calcular a similaridade entre dois clusters.

A abordagem que utiliza como medida a maior distância de um ponto do primeiro cluster para um ponto do segundo cluster é chamada de ligação:

Provas

Questão presente nas seguintes provas

3360837 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TRF-1

Provas:

Analista Judiciário - TI/Análise de Dados
Provas ×

Inteligência ArtificialMachine LearningAvaliação de ModelosMétricas

Anderson, analista de dados do TRF-1, gerou a matriz de confusão abaixo a partir dos resultados obtidos com um classificador binário.

		Previsto
		Classe 1	Classe 2
Real	Classe 1	80	30
Real	Classe 2	10	40

Ao calcular a F1-score ponderada para esse classificador, Anderson obteve o valor:

Provas

Questão presente nas seguintes provas

3360836 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TRF-1

Provas:

Analista Judiciário - TI/Análise de Dados
Provas ×

ProgramaçãoPythonPytorch

A analista Ana está implementando um script para deep learning utilizando o Python e o PyTorch. Considere o seguinte trecho do script de Ana:

import torch
import torch.nn.functional as F
input = torch.randn(3, 5, requires_grad=True)
target = torch.tensor([1, 2, 0])
loss_fn = F.nll_loss
loss = loss_fn(F.log_softmax(input, dim=1), target)
print(loss)

Ao ser executado, o trecho do script acima irá:

Provas

Questão presente nas seguintes provas

3360834 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TRF-1

Provas:

Analista Judiciário - TI/Análise de Dados
Provas ×

ProgramaçãoPythonNumPy

Considere o seguinte código em Python com NumPy:

import numpy as np

a = np.arange(16).reshape(8,2).T
print(a.shape, a.ndim, a[0][1])

Ao ser executado, o código acima imprime na saída padrão:

Provas

Questão presente nas seguintes provas

3357467 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: CESGRANRIO
Orgão: BNDES

Provas:

Analista de TI - Ciência de Dados
Provas ×

Big Data

Em aplicações modernas de Processamento de Linguagem Natural, usando Grandes Modelos de Linguagem (Large Language Models – LLM) é comum a necessidade de usar informações relevantes que estão em documentos novos e privados, que não foram usados no pré-treinamento dos modelos de LLM. Considerando que esses documentos podem ser longos e em grande quantidade, que o tamanho do contexto usado na chamada à Application Programming Interface (API) da LLM é limitado, e ainda pensando que os custos de processar são muitas vezes calculados por quantidade de tokens, foi desenvolvida a técnica conhecida como Retrieval Augmented Generation (RAG).

Considerando-se esse contexto, qual é a característica da técnica RAG?

A

Compara a resposta da LLM aos documentos recuperados para verificar seu alinhamento com a resposta desejada.

B

Refina a LLM previamente com base nos documentos, evitando custos adicionais por contexto.

C

Realiza uma tarefa de recuperação de informação para selecionar as partes de documentos que devem ser enviadas dentro do contexto.

D

Revisa localmente todas as possibilidades combinatórias das partes de documentos escolhendo um número mínimo ótimo, reduzindo assim o custo de análise.

E

Usa chamadas recursivas a LLM para enviar todas as partes necessárias do documento.

Provas

Questão presente nas seguintes provas

3357464 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: CESGRANRIO
Orgão: BNDES

Provas:

Analista de TI - Ciência de Dados
Provas ×

BI: Business Intelligence
Inteligência ArtificialMachine Learning

Um cientista de dados está utilizando SHapley Additive exPlanations (SHAP) para entender a importância das variáveis em um modelo de aprendizado de máquina que prevê a probabilidade de um cliente deixar de ser assinante de um serviço (churn). Considere o seguinte conjunto de dados simplificado com três características para um cliente específico:

Característica	Valor	Contribuição Marginal ao Modelo – Valor de Shapley
Tempo de Assinatura	12 (meses)	0,05
Número de Reclamações	3	0,20
Número de Acessos ao Suporte	10	0,15

A previsão base do modelo, que representa a probabilidade estimada de um cliente se tornar um churn quando nenhuma das características individuais é considerada, é de 0,30.

Considerando-se esse contexto, qual é a probabilidade prevista pelo modelo para que esse cliente deixe de assinar o serviço?