Agora veremos os tipos mais clássicos de modelagem. Ou seja, os formatos de perguntas mais comuns no mundo da modelagem.
Modelos de Propensão
São modelos que buscam predizer uma variável categórica, seja binária ou de múltiplas categorias. É um aprendizado supervisionado.
Exemplos:
binária - classificar uma pessoa como portadora de uma doença: sim/não
múltiplas categorias - classificar um carro como sendo da categoria: A/B/C/D
Modelos assim predizem a qual categoria um indivíduo/objeto pertence, e qual a probabilidade disso ser verdade.
Ex.1: dadas suas características, João foi classificado pelo modelo como tendo 76% de chance (propensão) de estar doente (sim).
Ex.2: dadas suas características, o Carro Cherry foi classificado pelo modelo como tendo 85% de chance (propensão) de ser da categoria D.
Alguns algoritmos que fazem isso:
- Regressão logística - binária
- Redes Neurais - múltiplas categorias
- Árvores de decisão - múltiplas categorias
Modelos de Estimação
São modelos que buscam predizer uma variável contínua. Modelos assim estimam o valor de uma variável quantitativa. É um aprendizado supervisionado.
Exemplos: valor de vendas; valor de um imóvel; peso de uma pessoa.
Ex.1: dadas suas características, o valor do imóvel 1 é estimado em R$293.908.
Ex.2: dadas suas características, o peso de Maria é estimado em 65 quilos.
Alguns algoritmos que fazem isso:
- Regressão Linear
- Redes Neurais
Modelos de Segmentação
São modelos que buscam encontrar similaridades entre indivíduos/objetos. É um aprendizado não supervisionado.
Exemplos: grupos de pessoas similares; grupos de produtos similares; grupos de cidades similares.
Ex.1: dadas suas características, João, Maria e Paulo foram agrupados como similares no segmento 1; Ana, Cláudia e Mário foram agrupados como similares no segmento 2.
Ex.2: dadas suas características, as cidades de são Paulo, Rio de Janeiro e Porto Alegre foram agrupadas como similares no segmento 1; Natal, Maceió e Fortaleza foram agrupadas como similares no segmento 2.
Alguns algoritmos que fazem isso:
- K-means
- Two-step
Modelos de Regras de Associação
São modelos que buscam encontrar padrões de ocorrência de eventos/fatos. É um aprendizado não supervisionado.
Exemplos: produtos que vendem juntos num carrinho de compras; situações que acontecem juntas;
Ex.1: dadas as ocorrências, em 86% das vezes que uma pessoa coloca macarrão em seu carrinho de compras, ela coloca também frango;
Ex.2: dadas as ocorrências, em 79% das vezes que ocorre uma falha numa rede X de computadores, falta também fornecimento de água no local.
Alguns algoritmos que fazem isso:
- Apriori
- Carma
Repare que alguns algoritmos podem ser usados tanto para respostas binárias quanto para respostas de múltiplas categorias e ainda respostas contínuas, como, por exemplo, Redes Neurais.
Abraços miningnoobs!