2261218 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: FCC
Orgão: TRT-22

Provas:

Técnico Judiciário - TI
Provas ×

Inteligência ArtificialMachine Learning

No âmbito do Aprendizado de Máquina, uma das métricas mais conhecidas para problemas de regressão é o RMSE (Root Mean Squared Error). Considere os dados abaixo (valores fornecidos: raiz quadrada de 81,25 = 9,01; raiz quadrada de 325 = 18,03; raiz quadrada de 100 = 10; raiz quadrada de 25 = 5).

Enunciado 2261218-1

Com base nos dados fornecidos,

A

a média de X (erro elevado ao quadrado) é 325/4 = 81,25 e o RMSE corresponde a 9,01.

B

o RMSE corresponde à média da soma dos valores da coluna X, ou seja, 325/4 = 81,25.

C

o RMSE corresponde à raiz quadrada da soma dos valores da coluna X, ou seja, 18,03.

D

X corresponde ao RMSE de cada valor do modelo comparado ao valor real.

E

o RMSE de cada valor do modelo comparado ao valor real é a raiz quadrada de X, ou seja: 10, 10, 5 e 10.

Provas

Questão presente nas seguintes provas

2260959 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: FCC
Orgão: TRT-22

Provas:

Analista Judiciário - TI
Provas ×

Inteligência ArtificialMachine LearningTipos de AprendizadoSupervisionado
Inteligência ArtificialMachine LearningTipos de AprendizadoNão Supervisionado

Considere, abaixo, as situações que envolvem métodos de aprendizado de máquina que podem ser supervisionados (S) ou não supervisionados (NS).

I. Uma empresa monitora e coleta dados em tempo real de mais de 1.000 veículos de divulgação, 100 mil blogs e das principais redes sociais do mundo. Utiliza um método capaz de identificar e segmentar grupos de eleitores a favor ou contra determinado assunto, de acordo com o interesse do cliente.

II. A partir de uma base de dados na qual são identificadas pessoas que estão fumando e pessoas que não estão fumando, são formados dois subconjuntos disjuntos: a base de treino (contendo 70% dos dados originais) e a base de teste (contendo o restante dos dados originais, 30%). Em seguida, a base de treino é submetida ao modelo para que seus parâmetros sejam calibrados e, após esta etapa, ocorre a predição de classes.

III. O sistema de recomendação de um site de comércio eletrônico monitora todos os itens vendidos e, quando um cliente está realizando uma compra, apresenta para ele itens semelhantes frequentemente comprados juntos.

Os itens I, II e III, são exemplos, respectivamente, de métodos

Provas

Questão presente nas seguintes provas

2260958 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: FCC
Orgão: TRT-22

Provas:

Analista Judiciário - TI
Provas ×

Inteligência ArtificialMachine LearningAvaliação de ModelosMétricas

A matriz de confusão é utilizada na avaliação de modelos de classificação, no contexto do aprendizado de máquina. Dentre as métricas que podem ser extraídas da matriz de confusão, que resumem a capacidade de um modelo de acertar suas predições, estão o percentual que foi predito:

I. Positivo corretamente sobre o total que de fato era positivo.

II. Negativo corretamente sobre o total que de fato era negativo.

III. Positivo sobre o total que de fato era negativo.

IV. Negativo sobre o total que de fato era positivo.

Os itens de I a IV correspondem, correta e respectivamente, a

A

Verdadeiro Positivo − Verdadeiro Negativo − Falso Positivo − Falso Negativo.

B

Falso Positivo − Verdadeiro Positivo − Verdadeiro Negativo − Falso Negativo.

C

Falso Negativo − Verdadeiro Positivo − Falso Positivo − Verdadeiro Negativo.

D

Verdadeiro Positivo − Falso Negativo − Verdadeiro Negativo − Falso Positivo.

E

Falso Negativo − Falso Positivo − Verdadeiro Negativo − Verdadeiro Positivo.

Provas

Questão presente nas seguintes provas

2260156 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: AOCP
Orgão: BANESE

Provas:

Técnico Bancário - TI/Desenvolvimento
Provas ×

BI: Business IntelligenceModelagem Multidimensional

Uma das formas de se criar um modelo floco de neve (snowflake) clássico de um modelo dimensional é apresentada corretamente em qual das alternativas a seguir?

A

Remove-se atributos de baixa cardinalidade de uma tabela de dimensão e coloca-se esses atributos em uma tabela de dimensão secundária, conectada por uma chave de floco de neve.

B

Acrescenta-se todas as chaves primárias como chave estrangeira em uma única tabela central. Após isso, conecta-se as tabelas secundárias a outras tabelas, terciárias. Isso dá a formação do floco de neve.

C

Remove-se as formas normais, sendo elas 1FN, 2FN e 3FN. Após isso, coloca-se todos os dados em uma tabela única que passará por uma validação ETL (Extração, Transformação e Carga).

D

Fragmenta-se o modelo relacional em diversas dimensões das quais se retira as chaves primárias e estrangeiras, uma vez que os dados pertencentes ao modelo serão sumarizados.

E

Gera-se dimensões degeneradas ou descaracterizadas pelas tabelas transacionais. Apesar da perda de dados, isso se faz relevante para a análise em diferentes dimensões.

Provas

Questão presente nas seguintes provas

2260155 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: AOCP
Orgão: BANESE

Provas:

Técnico Bancário - TI/Desenvolvimento
Provas ×

BI: Business IntelligenceModelagem Multidimensional

Em se tratando de uma modelagem de dados multidimensional, a tabela central é denominada

Provas

Questão presente nas seguintes provas

2260075 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TCU

Provas:

Auditor de Controle Externo
Provas ×

Inteligência ArtificialMachine LearningAplicaçõesPLN: Processamento de Linguagem Natural

Considere os documentos A e B a seguir.

A = “Há pessoas que choram por saber que as rosas têm espinho”

B = “Há outras que sorriem por saber que os espinhos têm rosas”

A submatriz da matriz de TF-IDF desses dois documentos correspondente aos termos “Rosas”, “Choram” e “Sorriem”, nessa ordem, é:

A

$ \begin{bmatrix} 0&0&\dfrac{1}{11}\\0&\dfrac{log\ 2}{11}&0\end{bmatrix} $

B

!$ \begin{bmatrix} \dfrac{1}{11}&\dfrac{1}{11}&0\\\dfrac{1}{11}&0&\dfrac{1}{11} \end{bmatrix} !$

C

$ \begin{bmatrix} 0&\dfrac{log\ 2}{11}&0\\0&0&\dfrac{log\ 2}{11} \end{bmatrix} $

D

$ \begin{bmatrix} 0&0&\dfrac{log\ 2}{11}\\0&\dfrac{1}{11}&0 \end{bmatrix} $

E

$ \begin{bmatrix} \dfrac{1}{11}&\dfrac{log\ 2}{11}&0\\ \dfrac{1}{11}&0&\dfrac{log\ 2}{11} \end{bmatrix} $

Provas

Questão presente nas seguintes provas

2260074 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TCU

Provas:

Auditor de Controle Externo
Provas ×

Inteligência ArtificialMachine LearningAvaliação de ModelosMétricas

Um analista de dados deseja criar um modelo para classificação de documentos em duas categorias: sigilosos e públicos. À sua disposição, existe um conjunto de dados com N documentos, dos quais uma fração $ \alpha $ deles é sigilosa. O analista quer escolher uma fração $ \beta $ dos N documentos para pertencer ao conjunto de teste. O objetivo é garantir que cada uma das classes (documentos sigilosos e públicos) seja responsável, em média, por ao menos 10% do total de documentos. Essa restrição precisa ser válida tanto no conjunto de treino quanto no conjunto de teste.

Um par ($ \alpha $,$ \beta $) que satisfaz as restrições do analista é:

Provas

Questão presente nas seguintes provas

2260073 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TCU

Provas:

Auditor de Controle Externo
Provas ×

Inteligência ArtificialMachine LearningAlgoritmosÁrvores de Decisão

Em um problema de classificação é entregue ao cientista de dados um par de covariáveis, (x1, x2), para cada uma das quatro observações a seguir: (6,4), (2,8), (10,6) e (5,2). A variável resposta observada nessa amostra foi “Sim”, “Não”, “Sim”, “Não”, respectivamente.

A partição que apresenta o menor erro de classificação quando feita na raiz (primeiro nível) de uma árvore de decisão é:

Provas

Questão presente nas seguintes provas

2259818 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: TCE-RJ

Provas:

Analista de Controle Externo - TI
Provas ×

BI: Business IntelligenceModelagem Multidimensional

Julgue o item seguinte, referente a arquiteturas e aplicações data warehouse, ETL e OLAP.

No processo de ETL, na fase de transformação os dados são padronizados, sendo transformados em um formato unificado, independentemente do seu formato de origem.