👉 Cientista de Dados (11)

Voltar

Checklist de Limpeza de Dados

Desenvolva um checklist para limpeza de dados em projetos de Machine Learning. Inclua: 1. Remoção de nulos 2. Padronização de nomes 3. Outliers 4. Encoding 5. Documentação do pipeline.

ChatGPT Grok Copilot Claude Perplexity Mistral

Modelo de Pipeline de Modelagem

Monte um modelo básico de pipeline de modelagem de dados. Inclua: 1. Importação 2. Pré-processamento 3. Treinamento 4. Teste 5. Avaliação e retrain.

ChatGPT Grok Copilot Claude Perplexity Mistral

Guia de Interpretação de Resultados

Crie um guia para interpretar métricas de modelos preditivos. Inclua: 1. Acurácia x Recall 2. Precisão 3. Matriz de confusão 4. Curva ROC 5. Decisão de ajuste.

ChatGPT Grok Copilot Claude Perplexity Mistral

Manual de Gestão do Ciclo de Vida de Modelo

Crie um manual para gestão do ciclo de vida de modelos em produção. Inclua: 1. Monitoramento 2. Logging 3. Detecção de drift 4. Backup de versões 5. Plano de atualização.

ChatGPT Grok Copilot Claude Perplexity Mistral

Estratégias para Trabalho em Equipe

Liste 7 estratégias para trabalho colaborativo em times de ciência de dados. Para cada: 1. Ferramenta 2. Rotina de reunião 3. Critério de performance.

ChatGPT Grok Copilot Claude Perplexity Mistral

Checklist para Seleção de Algoritmos

Elabore um checklist detalhado para seleção de algoritmos de machine learning, com o objetivo de escolher o modelo mais adequado para cada problema e para cada conjunto de dados. Detalhes: a) Definição do tipo de problema (classificação, regressão, agrupamento, etc.) b) Análise das características dos dados, como o número de variáveis, o tipo de dados e a distribuição c) Consideração dos requisitos de desempenho, como a precisão, a velocidade e a interpretabilidade d) Experimentação com diferentes algoritmos e comparação dos resultados e) Validação do modelo com dados independentes para garantir a sua generalização.

ChatGPT Grok Copilot Claude Perplexity Mistral

Guia de Interpretabilidade de Modelos

Crie um guia completo de interpretabilidade de modelos de machine learning, com o objetivo de compreender como os modelos tomam decisões, de identificar possíveis vieses e de aumentar a confiança dos usuários nos resultados. Detalhes: a) Utilização de técnicas de interpretabilidade global, como análise de importância das variáveis e visualização das regras de decisão b) Utilização de técnicas de interpretabilidade local, como LIME e SHAP, para explicar as decisões do modelo para cada instância individual c) Avaliação da estabilidade e da robustez do modelo d) Comunicação dos resultados de forma clara e acessível para os usuários e) Implementação de ações para mitigar os vieses e melhorar a justiça do modelo.

ChatGPT Grok Copilot Claude Perplexity Mistral

Checklist para Preparação de Dados

Elabore um checklist detalhado para preparação de dados para modelos de machine learning, com o objetivo de garantir que os dados sejam adequados, limpos, consistentes e que permitam o treinamento de modelos precisos, generalizáveis e interpretáveis. Detalhes: a) Coleta dos dados de diferentes fontes, como bancos de dados, arquivos, APIs e web scraping b) Limpeza dos dados, removendo ou imputando os valores ausentes, corrigindo os erros e removendo os outliers c) Transformação dos dados, escalando, normalizando, codificando e discretizando as variáveis d) Seleção das variáveis mais relevantes, utilizando técnicas de análise de importância e de redução de dimensionalidade e) Criação de novas variáveis, combinando, agregando ou derivando as existentes.

ChatGPT Grok Copilot Claude Perplexity Mistral

Guia de Seleção de Algoritmos

Crie um guia completo de seleção de algoritmos de machine learning, com o objetivo de auxiliar os cientistas de dados a escolherem o algoritmo mais adequado para cada tipo de problema, de dado e de objetivo, considerando as suas vantagens, as suas desvantagens, os seus requisitos e as suas limitações. Detalhes: a) Apresentação dos diferentes tipos de algoritmos, como regressão, classificação, agrupamento, redução de dimensionalidade e aprendizado por reforço b) Explicação de como funcionam os algoritmos, quais são os seus parâmetros e como ajustá-los c) Demonstração de como avaliar o desempenho dos algoritmos, utilizando diferentes métricas, como acurácia, precisão, recall, F1-score, AUC e RMSE d) Comparação dos algoritmos, considerando a sua complexidade, a sua interpretabilidade e a sua capacidade de generalização e) Sugestão de ferramentas e de recursos para implementar e para otimizar os algoritmos.

ChatGPT Grok Copilot Claude Perplexity Mistral

Checklist para Avaliação de Modelos de Machine Learning

Elabore um checklist detalhado para avaliação de modelos de machine learning, com o objetivo de verificar se o modelo é preciso, generalizável, robusto, interpretável e que atende aos requisitos do negócio. Detalhes: a) Separação dos dados em conjuntos de treinamento, de validação e de teste b) Escolha das métricas de avaliação mais adequadas para cada tipo de problema, como acurácia, precisão, recall, F1-score, AUC e RMSE c) Utilização de técnicas de validação cruzada, para estimar o desempenho do modelo em diferentes subconjuntos dos dados d) Análise da curva de aprendizado, verificando se o modelo está aprendendo com os dados e se não está sofrendo de overfitting ou de underfitting e) Interpretação dos resultados, identificando os fatores que influenciam a predição e as oportunidades de melhoria.

ChatGPT Grok Copilot Claude Perplexity Mistral

Guia de Engenharia de Features

Crie um guia completo de engenharia de features (feature engineering), com o objetivo de auxiliar os cientistas de dados a selecionarem, a transformarem e a criarem as variáveis (features) que serão utilizadas para treinar os modelos de machine learning, de forma a melhorar a sua precisão, a sua interpretabilidade e a sua generalização. Detalhes: a) Seleção das features mais relevantes, utilizando técnicas como análise de correlação, importância de features e seleção univariada b) Transformação das features, utilizando técnicas como normalização, padronização, discretização e codificação c) Criação de novas features, combinando, agregando ou derivando as features existentes d) Validação das features, verificando se elas são úteis, relevantes e que não introduzem ruído ou viés no modelo e) Documentação das features, explicando o seu significado, a sua origem e a sua transformação.

ChatGPT Grok Copilot Claude Perplexity Mistral