Foram encontradas 12.068 questões.
Bases de dados desbalanceadas podem afetar os resultados de muitos algoritmos que tentam identificar padrões
nesses dados. Essa é uma realidade para muitas bases
da saúde, pois a prevalência de uma doença na população
pode ser algo raro. Sobre o processo de rebalanceamento
de bases de dados, avalie se são verdadeiras (V) ou falsas
(F) as afirmativas a seguir.
I. A técnica de oversampling envolve aumentar o número de instâncias da classe minoritária (menos frequente) para equilibrar a distribuição das classes.
II. A técnica de undersampling envolve reduzir o número de instâncias da classe majoritária (mais frequente) para equilibrar a distribuição das classes.
III. Antes de aplicar a técnica de oversampling, é importante dividir os dados em conjuntos de treino e teste. A técnica de oversampling só deve ser aplicada ao conjunto de testes.
As afirmativas I, II e III são respectivamente:
I. A técnica de oversampling envolve aumentar o número de instâncias da classe minoritária (menos frequente) para equilibrar a distribuição das classes.
II. A técnica de undersampling envolve reduzir o número de instâncias da classe majoritária (mais frequente) para equilibrar a distribuição das classes.
III. Antes de aplicar a técnica de oversampling, é importante dividir os dados em conjuntos de treino e teste. A técnica de oversampling só deve ser aplicada ao conjunto de testes.
As afirmativas I, II e III são respectivamente:
Provas
Questão presente nas seguintes provas
Você é um cientista de dados incumbido de desenvolver
uma aplicação de perguntas e respostas para facilitar a
extração de informações de documentos PDF contendo
artigos científicos na área da saúde. Para construir essa
aplicação, as seguintes estratégias foram apresentadas.
I. Utilizar a técnica de embeddings de texto para converter documentos PDF em vetores e armazená-los em um vectorstore, como ChromaDb ou Pinecone, permitindo buscas semânticas rápidas e eficientes baseadas no conteúdo dos artigos.
II. Desenvolver um sistema de indexação baseado em metadados extraídos dos documentos PDF, como autor, data de publicação e palavras-chave, para facilitar a filtragem e a busca por documentos específicos.
III. Implementar uma abordagem de processamento de linguagem natural (PLN) que empregue a API do modelo de linguagem para gerar respostas precisas às perguntas, utilizando os vetores e metadados armazenados para recuperar informações relevantes dos documentos e inseri-las no contexto do prompt.
IV. Realizar o fine-tuning do modelo de linguagem através de um dataset que contenha o conhecimento do domínio que se quer adicionar ao modelo, utilizando frameworks como LoRA ou QLoRA para fazer o merge desse dataset adicional treinado.
V. Criar uma hierarquia de documentos baseada na classificação dos artigos científicos por tópicos e subtópicos, utilizando algoritmos de clustering para organizar automaticamente os documentos em categorias relevantes.
Das estratégias acima:
I. Utilizar a técnica de embeddings de texto para converter documentos PDF em vetores e armazená-los em um vectorstore, como ChromaDb ou Pinecone, permitindo buscas semânticas rápidas e eficientes baseadas no conteúdo dos artigos.
II. Desenvolver um sistema de indexação baseado em metadados extraídos dos documentos PDF, como autor, data de publicação e palavras-chave, para facilitar a filtragem e a busca por documentos específicos.
III. Implementar uma abordagem de processamento de linguagem natural (PLN) que empregue a API do modelo de linguagem para gerar respostas precisas às perguntas, utilizando os vetores e metadados armazenados para recuperar informações relevantes dos documentos e inseri-las no contexto do prompt.
IV. Realizar o fine-tuning do modelo de linguagem através de um dataset que contenha o conhecimento do domínio que se quer adicionar ao modelo, utilizando frameworks como LoRA ou QLoRA para fazer o merge desse dataset adicional treinado.
V. Criar uma hierarquia de documentos baseada na classificação dos artigos científicos por tópicos e subtópicos, utilizando algoritmos de clustering para organizar automaticamente os documentos em categorias relevantes.
Das estratégias acima:
Provas
Questão presente nas seguintes provas
Ao integrar informações provenientes de fontes de
dados externas, como documentos ou bancos de dados,
com Large Language Models (LLMs), é possível empregar
uma variedade de técnicas e estratégias para construir
aplicações adaptadas às demandas específicas de cada
projeto e aos recursos disponíveis.
Das opções abaixo, a que descreve corretamente uma dessas técnicas é:
Das opções abaixo, a que descreve corretamente uma dessas técnicas é:
Provas
Questão presente nas seguintes provas
Considerando o avanço recente dos modelos de Processamento de Linguagem Natural (PLN) e a necessidade
crescente de processar e sumarizar grandes volumes de
documentos de forma eficiente, você foi encarregado de
desenvolver uma aplicação capaz de sumarizar automaticamente documentos clínicos, proporcionando aos
profissionais de saúde acessos mais rápidos e precisos às
informações relevantes dos pacientes. Um aspecto primordial no desenvolvimento de aplicações de sumarização é
a avaliação dos sumários gerados, na medida em que os
usuários passam a confiar nesses sumários para tomada
de decisão.
Sobre avaliação de sumários, a opção que NÃO apresenta um modelo adequado para esta tarefa é:
Sobre avaliação de sumários, a opção que NÃO apresenta um modelo adequado para esta tarefa é:
Provas
Questão presente nas seguintes provas
No ITIL v4 (Information Technology Infrastructure
Library versão 4), as 4 dimensões do gerenciamento de
serviços são:
Provas
Questão presente nas seguintes provas
O pré-processamento de dados é uma das etapas
mais importantes da análise de dados e, quando bem
executado, proporciona uma maior eficácia em todo o
processo de análise. Dentre as alternativas abaixo, a
única que contém 3 técnicas de pré-processamento de
dados é:
Provas
Questão presente nas seguintes provas
No contexto de mineração de dados, exemplos de
técnicas de validação cruzada incluem:
Provas
Questão presente nas seguintes provas
Quando realizamos o agrupamento de objetos de acordo
com seus atributos, ou seja, uma tarefa de aprendizado
não supervisionado, precisamos avaliar a qualidade deste
agrupamento sem informação de supervisão. Como não se
tem as classes ou rótulos das instâncias, é preciso avaliar
a qualidade dos grupos apenas através de aferições estatísticas de similaridade intra e inter-grupos. Dentre estes
índices, podemos citar, EXCETO:
Provas
Questão presente nas seguintes provas
Considerando a família de produtos do COBIT 5, é
INCORRETO afi rmar que se trata de um “Professional
Guide” o:
Provas
Questão presente nas seguintes provas
Um dos princípios do COBIT V5 é possibilitar uma abordagem holística da organização para que a governança de
TI abranja a empresa como um todo. Visando atender este
princípio, o COBIT faz uso de viabilizadores. Neste contexto,
é INCORRETO afirmar que:
Provas
Questão presente nas seguintes provas
Cadernos
Caderno Container