Magna Concursos

Foram encontradas 5.143 questões.

3360848 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TRF-1

Eriberto, analista de dados do TRF-1, desenvolve um aplicativo que gera resumos das sentenças do Tribunal em linguagem coloquial, mantendo a coerência e a coesão textuais.

O aplicativo de Eriberto realiza a tarefa de:

 

Provas

Questão presente nas seguintes provas
3360844 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TRF-1

Duas instâncias A e B de um dataset de tweets são representadas, respectivamente, por intermédio dos vetores xA=[2,−2,0,1,] e xB=[−4,0,2,−4].

Os valores da similaridade de cosseno e da distância de Manhattan entre essas duas instâncias são, respectivamente:

 

Provas

Questão presente nas seguintes provas
3360843 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TRF-1

Carolina produz um relatório em que compara os modelos de representação vetorial de palavras Word2Vec (em seus dois métodos: CBOW e Skip-Gram) e GloVe.

Em seu relatório, Carolina destaca corretamente que o:

 

Provas

Questão presente nas seguintes provas
3360842 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TRF-1

Bernardo, analista de dados do TRF-1, realiza o pré-processamento de um dataset que será utilizado para treinar o chatbot do Tribunal. Em uma das etapas do pré-processamento, ele utiliza uma ferramenta que deflexiona as palavras, retirando suas inflexões.

Nessa etapa, Bernardo realizou uma:

 

Provas

Questão presente nas seguintes provas
3360839 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TRF-1

Nas técnicas de agrupamento hierárquico, é necessário estabelecer uma abordagem para calcular a similaridade entre dois clusters.

A abordagem que utiliza como medida a maior distância de um ponto do primeiro cluster para um ponto do segundo cluster é chamada de ligação:

 

Provas

Questão presente nas seguintes provas
3360837 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TRF-1

Anderson, analista de dados do TRF-1, gerou a matriz de confusão abaixo a partir dos resultados obtidos com um classificador binário.

Previsto

Classe 1

Classe 2

Real

Classe 1 80 30

Classe 2

10 40

Ao calcular a F1-score ponderada para esse classificador, Anderson obteve o valor:

 

Provas

Questão presente nas seguintes provas
3360836 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TRF-1

A analista Ana está implementando um script para deep learning utilizando o Python e o PyTorch. Considere o seguinte trecho do script de Ana:

import torch
import torch.nn.functional as F
input = torch.randn(3, 5, requires_grad=True)
target = torch.tensor([1, 2, 0])
loss_fn = F.nll_loss
loss = loss_fn(F.log_softmax(input, dim=1), target)
print(loss)

Ao ser executado, o trecho do script acima irá:

 

Provas

Questão presente nas seguintes provas
3360834 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TRF-1

Considere o seguinte código em Python com NumPy:

import numpy as np

a = np.arange(16).reshape(8,2).T
print(a.shape, a.ndim, a[0][1])

Ao ser executado, o código acima imprime na saída padrão:

 

Provas

Questão presente nas seguintes provas
3357467 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: CESGRANRIO
Orgão: BNDES

Em aplicações modernas de Processamento de Linguagem Natural, usando Grandes Modelos de Linguagem (Large Language Models – LLM) é comum a necessidade de usar informações relevantes que estão em documentos novos e privados, que não foram usados no pré-treinamento dos modelos de LLM. Considerando que esses documentos podem ser longos e em grande quantidade, que o tamanho do contexto usado na chamada à Application Programming Interface (API) da LLM é limitado, e ainda pensando que os custos de processar são muitas vezes calculados por quantidade de tokens, foi desenvolvida a técnica conhecida como Retrieval Augmented Generation (RAG).

Considerando-se esse contexto, qual é a característica da técnica RAG?

 

Provas

Questão presente nas seguintes provas
3357464 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: CESGRANRIO
Orgão: BNDES

Um cientista de dados está utilizando SHapley Additive exPlanations (SHAP) para entender a importância das variáveis em um modelo de aprendizado de máquina que prevê a probabilidade de um cliente deixar de ser assinante de um serviço (churn). Considere o seguinte conjunto de dados simplificado com três características para um cliente específico:

Característica

Valor Contribuição Marginal
ao Modelo – Valor de Shapley

Tempo de
Assinatura

12 (meses)

0,05

Número de
Reclamações

3 0,20

Número de
Acessos ao
Suporte

10 0,15

A previsão base do modelo, que representa a probabilidade estimada de um cliente se tornar um churn quando nenhuma das características individuais é considerada, é de 0,30.

Considerando-se esse contexto, qual é a probabilidade prevista pelo modelo para que esse cliente deixe de assinar o serviço?

 

Provas

Questão presente nas seguintes provas