Foram encontradas 5.012 questões.
João precisa criar um modelo interpretável de previsão de cancelamento de serviços com base em dados de cliente, demográficos e de tipo de serviço. Para tanto, João deve considerar que o problema é tabular, com vários atributos e regras de escolha complexas.
No contexto de técnicas de classificação, o tipo de algoritmo que João deverá utilizar é:
Provas
João está trabalhando em um projeto de reconhecimento de animais por imagens, em que o conjunto de dados possui um atributo como rótulo, o qual indica o nome do animal retratado, como "cachorro", "gato", "pássaro" e "peixe".
Para treinar o modelo de reconhecimento de imagens de animais, a tarefa de aprendizado supervisionado que João deverá utilizar é:
Provas
No contexto de Descoberta do Conhecimento em Bancos de Dados - Knowledge Discovery in Database (KDD), o analista de dados João deverá analisar um conjunto de dados preparado e consolidado com dados financeiros sobre transações, saldos de contas e históricos de crédito de clientes ao longo dos últimos anos. O objetivo é identificar possíveis anomalias ou atividades suspeitas que possam indicar fraudes.
Para isso, a fase do processo KDD que João deverá utilizar é:
Provas
Considere o conjunto de dados da entidade PACIENTE que possui o atributo do tipo contínuo TEMPERATURA com os valores {38.0, 39.5, 36.0, 35.5}. Para alimentar uma tarefa de Mineração de Dados, é necessário transformar os dados do atributo TEMPERATURA em um número finito de intervalos, como: {35-37, 38-40}.
A tarefa de preparação de dados utilizada no atributo TEMPERATURA é:
Provas

“Existiram filósofos muito conhecidos no passado que não acreditavam na possibilidade de consciência das máquinas ...” (linhas 14 e 15)
Provas
Provas
Provas
Na escola há uma base de dados históricos que anualmente armazena, para cada aluno, em cada série, a nota final de cada uma dessas duas disciplinas. Essa nota é um valor decimal, entre 0 e 10. Note-se que essa escola, como em outras, há professores que aplicam diferentes graus de exigência nas suas avaliações, uns sendo mais “generosos” e outros, mais “rigorosos”.
Três estratégias de transformação de dados foram discutidas, à luz das ideias da Ciência de Dados, como descritas a seguir.
I. Agrupar os alunos a partir de intervalos de notas finais, do tipo “0 até 2,0”, “2,1 até 4,0”, ..., “8,1 até 10”.
II. Rotular grupos de desempenho, “Aprovado” e “Reprovado” e agrupar os alunos de acordo com os critérios de aprovação vigentes em cada situação.
III. Rotular grupos de desempenho, do tipo “Grupo A”, “Grupo B”, ..., “Grupo E”, e agrupar separadamente os alunos de cada conjunto ano/série/disciplina/professor de acordo com a distribuição relativa das notas em cada conjunto.
À luz da ciência de dados e do exposto acima, assinale a afirmativa correta.
Provas
Maria está construindo um sistema de aprendizado de máquina que utiliza a informação sobre a segmentação de clientes que está armazenada no CRM da empresa. Porém, a segmentação que ela extrai do CRM possui os valores "bronze", "prata" e "ouro", que seu sistema não entende.
Para isso, Maria quer implementar um processo de ETL que recodifica a segmentação para os valores "0", "1" e "2" representando, respectivamente, "bronze", "prata" e "ouro" antes de carregar os dados em seu sistema.
O tipo de transformação que Maria deve empregar em seu processo ETL é
Provas
O Coeficiente Silhouette é utilizado na análise de agrupamentos, principalmente para examinar
Provas
Caderno Container