Foram encontradas 5.012 questões.
Leia o fragmento a seguir.
“CRISP-DM é um modelo de referência não proprietário, neutro, documentado e disponível na Internet, sendo amplamente utilizado para descrever o ciclo de vida de projetos de Ciência de Dados. O modelo é composto por seis fases:
1. entendimento do negócio;
2. ;
3. ;
4. Modelagem;
5. ; e
6. implantação”.
Assinale a opção cujos itens completam corretamente as lacunas do fragmento acima, na ordem apresentada.
Provas
Os data warehouses existem para facilitar que analista e tomadores de decisão executem as consultas complexas e ocasionais, fazendo uso intensivo de dados por meio de processamento OLAP.
A operação analítica que se caracteriza por analisar dados em níveis de agregação progressivamente mais detalhados e de menor granularidade, é denominada
Provas
O Power BI da Microsoft é uma coleção de serviços de software, aplicativos e conectores que trabalham em conjunto para transformar fontes de dados não relacionadas em informações coerentes, visualmente envolventes e mais interativas.
O elemento do Power BI que cria relatórios paginados, é denominado
Provas
Com relação às características de dados abertos, analise as afirmativas a seguir.
I. Reuso e redistribuição: os dados precisam estar disponíveis integralmente, devendo estar em um formato conveniente e modificável e sob custo não maior que um custo razoável de reprodução.
II. Disponibilidade e acesso: os dados precisam ser fornecidos em condições de reuso e redistribuição, podendo ser recombinados com outros dados.
III. Participação universal: todos os usuários podem usar, reusar e redistribuir o dado sem restrições de áreas de atuação, pessoas ou grupos.
Está correto o que se afirma em
Provas
Certo conjunto de dados contém 10000 observações, em que cada observação possui 10 variáveis. A análise de componentes principais (PCA) sobre estes dados apontou que a primeira componente principal é dada pelo vetor w.
A esse respeito, assinale a afirmativa correta.
Provas
O índice de Jaccard, dado por \( J(A,B)={\large{\left\vert A \cap B \right\vert \over \left\vert A \cup B \right\vert }} \), entre os conjuntos de palavras A= {bolo, vela, faca, aniversário} e B = {crime, vela, faca, polícia} é
Provas
A técnica de validação cruzada é usada para avaliar modelos de classificação.
Com relação a esta técnica, é correto afirmar que
Provas
O algoritmo KNN (K-nearest neighbors ou k-vizinhos mais próximos) se insere na categoria de
Provas
Sobre aprendizado profundo (Deep Learning), é correto afirmar que
Provas
Certo grupo de pesquisadores utilizou a regressão logística para construir um classificador binário que estima se uma observação pertence a certo grupo de interesse. Este classificador é baseado em uma única variável explicativa \(x\)
Suponha que a função obtida, após o treinamento, é \( p(x)={\large{1 \over 1+e^x}} \) (com \( p(x)=1 \) indicando que a observação pertence ao grupo de interesse). Uma nova observação tem variável \( x \approx ln \) (3).
Esta nova observação deve ser classificada pelo classificador como
Provas
Caderno Container