Introdução à Ciência de Dados
O que é Ciência de Dados
A Ciência de Dados é um campo misto que engloba basicamente programação, estatística e conhecimentos específicos da área sendo estudada. De forma geral, um cientista de dados, em posse de diversas ferramentas práticas e teóricas, analisa (ora, ora...) dados para solucionar/estudar problemas.
De uma forma simples, se estamos analisando um problema da área da saúde, um cientista de dados deve possuir não apenas conhecimentos de programação e estatística consolidados, mas também a habilidade de absorver os conhecimentos específicos da área da saúde (oriundos de experts da área), aplicáveis ao problema questão. O cientista de dados, em posse de todas essas habilidades e conhecimentos, é capaz de realizar um estudo quantitativo, interpretar os resultados obtidos e colher conclusões para, assim, solucionar o problema.
A Ciência de Dados engloba campos como: Aprendizado de Máquina (Machine Learning) e Inteligência Artificial (Artificial Intelligence), que ainda serão discutidos neste blog.
Mas com que tipo de problemas um cientista de dados trabalha?
A resposta não poderia ser menos específica, sendo um campo multidisciplinar, a Ciência de Dados se apresenta de forma bastante diversificada, com certas aplicações sendo bem específicas para determinadas áreas. Entretanto, como todas as áreas de estudo, existe uma série de conhecimentos que são pré-requisitados e devem constar na bagagem de todo cientista de dados, estes serão suas ferramentas para solucionar problemas de diversas áreas.
Assim, visando ter um conteúdo completo, os primeiros posts deste blog (que tomarão bastante tempo) terão como foco a consolidação deste conjunto de ferramentas.
Exemplo
Suponha que você é dono de uma loja que vende itens diversificados (como a Amazon) e você gostaria de investir em propaganda de seus itens, enviando, por exemplo, emails com ofertas para clientes que já realizaram compras.
Com o cenário bem definido, o problema que surge é: Que itens ofertar para quais tipos de clientes (faixa etária, padrão de consumo, etc) ?
Antigamente (na realidade isso é ainda presente), existe uma pessoa responsável por analisar o mercado e, "manualmente" definir quais itens se encaixam melhor para cada tipo de público.
Entretanto, é aqui que um Cientista de Dados pode entrar. Ele pode, em posse dos dados dos clientes (como idade, itens comprados, frequência de compras, etc.), definir Tipos de Clientes e, com a ajuda de um especialista na área, definir uma estratégia de marketing.
Observe que, para tratar problemas reais, um cientista de dados raramente vai trabalhar sozinho, ele é o responsável por desenvolver e aplicar os modelos, produzindo insights e soluções.
Obs: a parte de "definir Tipos de Clientes" vai ser mais estudada futuramente neste blog, isso se trata de um exemplo de Aprendizado Não-Supervisionado.
O próximo post será sobre os tipos de Aprendizado mais recorrentes em Ciência de Dados
Até eu animei aqui hahah, muito bom :)
ResponderExcluirBem simples e direto, top!
ResponderExcluir