Tempo de leitura: 5 minutos
O Machine Learning Canvas, ou ML Canvas, é uma abordagem visual criada por Louis Dorard para propor, planejar e desenhar aplicações de Machine Learning. O ML Canvas é baseado no Business Generation de Alex Osterwalder e difundido pela Strategyzer.
Qual a função do ML Canvas?
- Validar a viabilidade das suas ideias de casos de uso de Machine Learning já no começo do projeto
- Melhorar a colaboração dentro da equipe que esteja alocada para execução do projeto
- Antecipar problemas que, de outra forma, surgiriam no projeto durante as fases de implementação ou até mesmo de produção.
Quais as premissas do ML Canvas?
Dorard, ao propor a organização do projeto de Machine Learning em um Canvas, assumiu que os sistemas de Machine Learning são complexos. Definr o dado certo, no formato certo, dentro de um modelo bem escolhido e que seja capaz de realizar predições de acordo com a especificação inicial não é um esforço trivial e a presença da incerteza contribuiu bastante para a complexidade.
Uma outra preocupação diz respento ao esforço necessário para avançar com qualquer iniciativa de Machine Learning. Como o esforço pode ser alto, não deve-se gastar tempo resolvendo problemas errados, ainda mais em cenários de projeto que existe a presença restrições de custos ou de recursos.
O ML Canvas é uma abordagem visual que permite uma melhor conexão entre as equipes de negócio, que tem preocupações direcionadas ao uso efetivo do sistema a ser desenvolvido, e as equipes de desenvolvimento e implantação deste mesmo sistema.
Por fim, um cuidado presente na abordagem do ML Canvas é o efetivo uso das predições realizadas. Para Dorard, as predições se tornam valiosas somente quando elas são usadas para a tomada de decisões.
Grupos de Blocos do ML Canvas
- Objetivo: Proposta de valor( Value Proposition )
- Aprendizagem: Fontes de Dados (Data Sources), Coleçõa de Dados (Data Collection), Variáveis (Features), Construção do Modelo (Building Models)
- Predições: Tarefa de Predição (Prediction Task), Decisões( Decisions), Simuação de Impacto(Impact Simulation), Fazendo Predições(Making Predictions)
- Avaliação: Monitoring
Grupo: Objetivo – Qual a Proposta de Valor do Projeto?
Esse grupo é o coração do modelo. Dele vamos desdobrar os demais blocos. Basicamente devemos definir o que estamos tentando fazer, explicar a importância e identificar quem será o usuário final. Apesar de conter apenas um bloco, é de suma importância para o correto preenchimento dos demais blocos.
- Proposta de Valor: Concentre-se no O quê – O que estamos tentando fazer? Por quê – Por quê é importante? Quem – Quem irá usar o projeto / usuário final? Quais são seus objetivos? Como eles se beneficiarão do sistema de ML? Mencione o fluxo de trabalho/interfaces.
Grupo: Predições – Qual a tarefa de ML e como vamos executá-la?
O preenchimento desse grupo já necessita de algum conhecimento prévio superficial sobre Machine Learning, vamos lá!
- ML task: Qual é o tipo do problema (ex. classificação, regressão…), qual é o input, e qual é o output da predição? Qual a entidade sobre a qual são feitas as previsões? Quais os Resultados possíveis?
- Decisões: Como as predições serão usadas para tomada de decisões ou seja como as previsões são transformadas em valor proposto para o usuário final?P
- Fazendo Predições: Quando fazer novas predições? De quanto em quanto tempo?
- Avaliação Offline: Quais métodos e métricas devem ser usadas para avaliar as predições antes do envio para produçao?
Grupo: Aprendizagem – Como vamos aprender?
Nesse grupo é importante definir as fontes de dados, como os mesmos serão coletados, quais variáveis serão consideradas:
- Fontes de dados: Quais fontes de dados serão usadas (Internas e Externas). Onde podemos obter informações (brutas) sobre entidades e resultados observados? Mencione tabelas de banco de dados, métodos de API, sites para raspagem, etc.
- Coletando os dados: Como obter novos dados para o modelo continuar aprendendo? Estratégia para conjunto de treinamento inicial e atualização contínua.
- Features (variáveis): Quais as possíveis variáveis podem ser importantes para resolver o problema proposto? Variáveis são representações de entrada disponíveis no momento da previsão, extraídas de fontes de dados brutas.
- Construindo o modelo: Quantos modelos de produção são necessários? Quando deveríamos atualizar? Tempo disponível para isso (incluindo criação de características e análise)?
Grupo: Avaliação – Como o sistema será monitorado?
Hora de monitorar o sistema de Machine Learning desenvolvimento. Grupo com apenas um bloco, como a Proposta de Valor, mas não menos importante que os demais.
- Monitoramento: Quais Métricas para quantificar a criação de valor e medir o impacto do sistema de ML em produção (nos usuários finais e nos negócios)?
Conclusões
O ML Canvas, ou Canvas de Aprendizado de Máquina, é um modelo visual que o ajudará a refinar sua avaliação de viabilidade técnica e econômica do projeto, especificar os requisitos do seu sistema de ML e antecipar custos. Use-o de forma combinada com as demais técnicas e ferramentas para gestão de projetos, como Cronogramas, Quadros Kanban, Canvas de Projeto e outras.