Ciência de dados

Tirar conhecimento e padrão de grandes volumes de dado pra apoiar decisão com evidência.

Hard

O que é

Ciência de dados é o campo que junta estatística, computação e conhecimento de domínio pra extrair padrão de dado complexo. Em produto, ela dá ao time a chance de entender comportamento, prever tendência e otimizar experiência com prova, em vez de achismo.

Um uso central é a capacidade preditiva, porque treinando um modelo com histórico dá pra estimar coisas como churn, demanda por uma feature ou chance de conversão, o que ajuda a priorizar onde o retorno é maior. Ainda assim, a previsão é insumo de decisão, e não decisão pronta.

O outro uso é entender a interação, já que analisando clique, fluxo e comportamento dentro do produto o time enxerga onde há atrito e onde o caminho funciona. E isso sustenta uma experimentação séria, com teste A/B, significância e leitura de resultado sem chute.

Em uma frase

A ciência de dados treinou um modelo de churn que sinaliza quem vai sair, então dá pra agir antes da pessoa cancelar.

A pergunta que ele responde

Quando vale chamar a ciência de dados, em vez de resolver com uma métrica simples?

Quando usar

Ajuda quando há dado suficiente e a pergunta pede previsão ou padrão complexo que o olho humano sozinho não pega.

Como não usar

O cuidado é não pedir ciência de dados pra um problema que uma métrica simples resolveria, porque modelo sofisticado pra dúvida boba é desperdício de gente cara.

Na prática

Pense num time de dados que treina um modelo de churn e marca quem tem risco de sair antes de a pessoa sair. Com isso, o time de produto age cedo, em vez de reagir quando a pessoa já cancelou.

Não confunda com

Vale separar ciência de dados de analytics. O analytics descreve o que aconteceu, com relatório e métrica, enquanto a ciência de dados modela, prevê e explica o porquê. Uma olha pra trás, e a outra tenta antecipar o que vem.

D

Em inglês

Data Science

Pronúncia

n/a

Também chamado de

data science, ciência de dados

Origem

n/a

Fonte

Saiba mais

Hilary Mason, conteúdo introdutório sobre data science em produto