Foram encontradas 4.973 questões.
Júlio chegou ao Departamento de Desenvolvimento de Sistemas
de Informação Transacionais e Analíticos e começou a estudar as
características dos bancos de dados que armazenavam as
informações desses sistemas.
Em seus estudos, Júlio constatou que os bancos de dados
analíticos possuem:
Provas
Questão presente nas seguintes provas
O chefe de Juca solicitou a implementação de uma solução para
exploração de dados multidimensionais visando a apoiar análises
de fatos por diferentes perspectivas e níveis hierárquicos, com a
possibilidade de realizar cortes por meio de filtros em atributos
descritores.
Para atender à solicitação de seu chefe, Juca implementou um(a):
Para atender à solicitação de seu chefe, Juca implementou um(a):
Provas
Questão presente nas seguintes provas
O cientista de dados Leo está desenvolvendo um modelo de
inteligência artificial para analisar casos e tomar decisões sobre a
procedência ou não do pleito.
Para analisar como o modelo chegou a uma determinada decisão, Leo deve utilizar:
Para analisar como o modelo chegou a uma determinada decisão, Leo deve utilizar:
Provas
Questão presente nas seguintes provas
Um laboratório de pesquisa médica está desenvolvendo um
sistema de inteligência artificial para auxiliar no diagnóstico de
uma doença de pele extremamente rara. O maior desafio do
projeto é a escassez de dados: a equipe possui apenas
300 imagens dermatoscópicas rotuladas da doença, quantidade
insuficiente para treinar uma rede neural convolucional (CNN)
complexa do zero sem causar sobreajuste (overfitting).
Para contornar essa limitação, os cientistas de dados decidiram utilizar um modelo de arquitetura robusta (como a ResNet-50), que já foi previamente treinado em milhões de imagens genéricas do banco de dados ImageNet. A estratégia adotada consiste em manter os pesos das camadas iniciais da rede inalterados (congelados), aproveitando a capacidade do modelo de reconhecer formas e texturas, e treinar apenas as últimas camadas para distinguir a lesão de pele específica.
Essa técnica de reaproveitamento de conhecimento prévio de um domínio para resolver um problema em outro domínio com poucos dados é denominada:
Para contornar essa limitação, os cientistas de dados decidiram utilizar um modelo de arquitetura robusta (como a ResNet-50), que já foi previamente treinado em milhões de imagens genéricas do banco de dados ImageNet. A estratégia adotada consiste em manter os pesos das camadas iniciais da rede inalterados (congelados), aproveitando a capacidade do modelo de reconhecer formas e texturas, e treinar apenas as últimas camadas para distinguir a lesão de pele específica.
Essa técnica de reaproveitamento de conhecimento prévio de um domínio para resolver um problema em outro domínio com poucos dados é denominada:
Provas
Questão presente nas seguintes provas
Diferentes sistemas produzem dados em formatos variados, que
podem ser classificados em dados estruturados,
semiestruturados ou não estruturados.
Nesse contexto, relacione os tipos de dados às suas respectivas descrições.
1. Dados estruturados
2. Dados semiestruturados
3. Dados não estruturados
( ) Gravações em áudio e vídeo de audiências públicas, armazenadas em arquivos MP4, acompanhadas apenas de nome do arquivo e data de criação.
( ) Registros de protocolo eletrônico armazenados em tabelas de banco de dados relacional, com campos bem definidos (número do processo, data, unidade, assunto) e chaves primárias/estrangeiras.
( ) Arquivos de log de acesso ao portal de serviços do governo, registrados em formato JSON, contendo campos como timestamp, user_id, endpoint, status_code, com alguns campos opcionais variando conforme o tipo de requisição.
A sequência correta é:
Nesse contexto, relacione os tipos de dados às suas respectivas descrições.
1. Dados estruturados
2. Dados semiestruturados
3. Dados não estruturados
( ) Gravações em áudio e vídeo de audiências públicas, armazenadas em arquivos MP4, acompanhadas apenas de nome do arquivo e data de criação.
( ) Registros de protocolo eletrônico armazenados em tabelas de banco de dados relacional, com campos bem definidos (número do processo, data, unidade, assunto) e chaves primárias/estrangeiras.
( ) Arquivos de log de acesso ao portal de serviços do governo, registrados em formato JSON, contendo campos como timestamp, user_id, endpoint, status_code, com alguns campos opcionais variando conforme o tipo de requisição.
A sequência correta é:
Provas
Questão presente nas seguintes provas
Uma fintech desenvolveu um pipeline ponta a ponta (end-to-end)
de machine learning para detecção de fraudes em transações
financeiras.
O pipeline inclui as seguintes etapas:
(1) ingestão de dados em tempo real via streaming;
(2) feature engineering com agregações temporais (médias móveis de 7 e 30 dias);
(3) predição usando um modelo de gradient boosting;
(4) deployment em arquitetura de microsserviços.
Após três meses em produção, o time de MLOps observou degradação gradual no F1-score de 0.89 para 0.72, enquanto o monitoramento revelou que as distribuições das features agregadas apresentavam mudanças estatisticamente significativas (p < 0.01 no teste de Kolmogorov-Smirnov), embora as features brutas individuais permanecessem estáveis.
Considerando as melhores práticas de pipelines de ML em produção e estratégias de deployment, a equipe deve:
O pipeline inclui as seguintes etapas:
(1) ingestão de dados em tempo real via streaming;
(2) feature engineering com agregações temporais (médias móveis de 7 e 30 dias);
(3) predição usando um modelo de gradient boosting;
(4) deployment em arquitetura de microsserviços.
Após três meses em produção, o time de MLOps observou degradação gradual no F1-score de 0.89 para 0.72, enquanto o monitoramento revelou que as distribuições das features agregadas apresentavam mudanças estatisticamente significativas (p < 0.01 no teste de Kolmogorov-Smirnov), embora as features brutas individuais permanecessem estáveis.
Considerando as melhores práticas de pipelines de ML em produção e estratégias de deployment, a equipe deve:
Provas
Questão presente nas seguintes provas
Uma empresa de e-commerce implantou um modelo de machine learning para prever a probabilidade de churn, métrica que indica a rotatividade ou evasão de clientes. Após seis meses em produção, a equipe de dados observou que, embora as distribuições estatísticas das features de entrada permanecessem estáveis (mesmas médias, mesmos desvios-padrão e mesmas distribuições), o relacionamento entre essas features e a variável-alvo (churn) havia mudado significativamente devido a alterações no comportamento dos consumidores causadas por novas políticas de fidelização da empresa.
Diante desse cenário, é correto afirmar que o modelo:
Diante desse cenário, é correto afirmar que o modelo:
Provas
Questão presente nas seguintes provas
O desempenho de modelos de aprendizado de máquina está intrinsecamente relacionado ao equilíbrio entre viés e variância. Modelos com alto viés tendem a simplificar excessivamente o problema, resultando em subajuste (underfitting), enquanto modelos com alta variância podem capturar ruído nos dados de treinamento, levando ao sobreajuste (overfitting). Para mitigar esses problemas, diversas técnicas de regularização podem ser empregadas, ajustando a complexidade do modelo e melhorando sua capacidade de generalização.
Considerando os conceitos de compensação viés-variância, sobreajuste, subajuste e técnicas de regularização, é correto afirmar que:
Considerando os conceitos de compensação viés-variância, sobreajuste, subajuste e técnicas de regularização, é correto afirmar que:
Provas
Questão presente nas seguintes provas
O aprendizado de máquina (machine learning) é frequentemente
categorizado em diferentes paradigmas, dependendo da natureza
dos dados disponíveis e do problema a ser resolvido. Dois dos
tipos mais comuns são o aprendizado supervisionado e o
aprendizado não supervisionado.
A principal diferença conceitual entre essas duas abordagens reside no fato de que, no aprendizado supervisionado:
A principal diferença conceitual entre essas duas abordagens reside no fato de que, no aprendizado supervisionado:
Provas
Questão presente nas seguintes provas
Um time está iniciando a migração de dados de um sistema
transacional (OLTP) legado para um novo Data Warehouse (DW)
corporativo. O sistema legado possui um modelo de dados
altamente normalizado, atendendo à Terceira Forma Normal
(3FN), o que garante a integridade das transações diárias. No
entanto, para o novo ambiente analítico, cujo foco é a geração de
relatórios gerenciais e painéis de BI (Business Intelligence) com
alto volume de leitura, o arquiteto decidiu aplicar técnicas de
desnormalização intencional em algumas tabelas, consolidando
dados de produtos e categorias em uma única estrutura
dimensional.
Considerando os impactos dessa decisão de projeto e os fundamentos da modelagem de dados, é correto afirmar que:
Considerando os impactos dessa decisão de projeto e os fundamentos da modelagem de dados, é correto afirmar que:
Provas
Questão presente nas seguintes provas
Cadernos
Caderno Container