Foram encontradas 5.143 questões.
Ao executar o algoritmo Apriori, as seguintes regras associativas foram determinadas como relevantes:
{café, açúcar} => {leite} e {açúcar, trigo} => {leite}.
Considerando essas duas regras associativas relevantes, é verdade que
{café, açúcar} => {leite} e {açúcar, trigo} => {leite}.
Considerando essas duas regras associativas relevantes, é verdade que
Provas
Questão presente nas seguintes provas
Algoritmos de aprendizado de máquina podem ser classificados como paramétricos e não paramétricos.
São exemplos de algoritmos não paramétricos
Provas
Questão presente nas seguintes provas
Na etapa de transformação dos dados no processo de descoberta de informação, a técnica que mapeia
dados de alta cardinalidade em um espaço de dimensão inferior, de tal forma que a informação relevante
para o problema de aprendizado seja preservada, é chamada de
Provas
Questão presente nas seguintes provas
No contexto do aprendizado de máquina supervisionado, considere a matriz de confusão.
![]()
A métrica F1-score pode ser calculada da seguinte forma:
Provas
Questão presente nas seguintes provas
Na elaboração de relatórios analíticos, é comum a utilização de gráficos. O tipo de gráfico que possui os
componentes corpo e pavio e o tipo de gráfico que possui os componentes bigode e outliers são,
respectivamente, os gráficos
Provas
Questão presente nas seguintes provas
Com relação aos conceitos e tipos ELT e ETL de pipeline de dados, analise as afirmativas a seguir.
I. A abordagem ELT é recomendada para tarefas relacionadas a LGPD porque realiza a limpeza de dados sensíveis antes que eles atinjam o sistema de destino, reduzindo riscos de segurança e economizando espaço de armazenamento.
II. No processo ETL, o conjunto de dados completo e sem tratamento é carregado diretamente no sistema de destino. Como há apenas uma etapa, e ela ocorre apenas uma vez, o carregamento no processo ETL é mais rápido do que no ELT.
III. Na abordagem ELT, é possível aproveitar o poder de processamento distribuído e a escalabilidade elástica do data warehouse de destino para realizar transformações via SQL, eliminando a necessidade de um servidor de processamento intermediário.
É verdadeiro o que é afirmado em
I. A abordagem ELT é recomendada para tarefas relacionadas a LGPD porque realiza a limpeza de dados sensíveis antes que eles atinjam o sistema de destino, reduzindo riscos de segurança e economizando espaço de armazenamento.
II. No processo ETL, o conjunto de dados completo e sem tratamento é carregado diretamente no sistema de destino. Como há apenas uma etapa, e ela ocorre apenas uma vez, o carregamento no processo ETL é mais rápido do que no ELT.
III. Na abordagem ELT, é possível aproveitar o poder de processamento distribuído e a escalabilidade elástica do data warehouse de destino para realizar transformações via SQL, eliminando a necessidade de um servidor de processamento intermediário.
É verdadeiro o que é afirmado em
Provas
Questão presente nas seguintes provas
Em relação aos repositórios de dados data lake e data warehouse em arquiteturas de Big Data, analise
as afirmativas a seguir.
I. Um data lake é caracterizado por priorizar a ingestão de dados em seu formato original, permitindo armazenar dados estruturados, semiestruturados e não estruturados, com uso de abordagens de schema-on-read.
II. Um data warehouse adota schema-on-write, exigindo modelagem prévia, como esquemas em estrela ou floco de neve, para suportar consultas analíticas otimizadas.
III. A simples adoção de schema-on-write em um data lake o caracteriza automaticamente como um data warehouse.
É verdadeiro o que se afirma em
I. Um data lake é caracterizado por priorizar a ingestão de dados em seu formato original, permitindo armazenar dados estruturados, semiestruturados e não estruturados, com uso de abordagens de schema-on-read.
II. Um data warehouse adota schema-on-write, exigindo modelagem prévia, como esquemas em estrela ou floco de neve, para suportar consultas analíticas otimizadas.
III. A simples adoção de schema-on-write em um data lake o caracteriza automaticamente como um data warehouse.
É verdadeiro o que se afirma em
Provas
Questão presente nas seguintes provas
No âmbito de Business Intelligence, sistemas OLAP são projetados para
Provas
Questão presente nas seguintes provas
Com relação à orquestração de dados, analise as afirmativas a seguir.
I. Um agendador baseado em tempo, como o cron, dispara tarefas conforme um horário configurado.
II. Um sistema de orquestração pode iniciar tarefas quando as dependências de um grafo acíclico direcionado (DAG) são satisfeitas e pode sinalizar falhas durante a execução.
III. Um sistema de orquestração pode manter histórico de execuções e suportar reprocessamento de períodos anteriores por meio de backfill.
É verdadeiro o que se afirma em
I. Um agendador baseado em tempo, como o cron, dispara tarefas conforme um horário configurado.
II. Um sistema de orquestração pode iniciar tarefas quando as dependências de um grafo acíclico direcionado (DAG) são satisfeitas e pode sinalizar falhas durante a execução.
III. Um sistema de orquestração pode manter histórico de execuções e suportar reprocessamento de períodos anteriores por meio de backfill.
É verdadeiro o que se afirma em
Provas
Questão presente nas seguintes provas
Em relação ao aprendizado de máquina não supervisionado, analise as afirmativas a seguir.
I. No algoritmo k-means, a atribuição de cada instância a um grupo é feita pela menor distância ao centroide, e os centroides são atualizados como a média das instâncias atribuídas a cada grupo, de forma iterativa até um critério de parada.
II. O coeficiente de silhouette é uma métrica de avaliação de agrupamento, baseada em a(i) (distância média da instância i ao seu grupo) e b(i) (menor distância média de i a um grupo vizinho), assumindo valores no intervalo [−1,1].
III. O algoritmo DBSCAN é um método de agrupamento baseado em centroides, no qual o número de grupos k é definido previamente.
É verdadeiro o que se afirma em
I. No algoritmo k-means, a atribuição de cada instância a um grupo é feita pela menor distância ao centroide, e os centroides são atualizados como a média das instâncias atribuídas a cada grupo, de forma iterativa até um critério de parada.
II. O coeficiente de silhouette é uma métrica de avaliação de agrupamento, baseada em a(i) (distância média da instância i ao seu grupo) e b(i) (menor distância média de i a um grupo vizinho), assumindo valores no intervalo [−1,1].
III. O algoritmo DBSCAN é um método de agrupamento baseado em centroides, no qual o número de grupos k é definido previamente.
É verdadeiro o que se afirma em
Provas
Questão presente nas seguintes provas
Cadernos
Caderno Container