4

Veja o que e onde estudar para ser um Cientista de Dados

Como já vem sendo discutido aqui no blog, a ciência de dados é um campo que vem revolucionando as sociedades nos mais diversos aspectos e em constante renovação. Se você se interessou por essa área e quer se formar em ciência de dados, aqui vai o caminho que precisa seguir para atuar nesse campo.

O cientista de dados é o especialista que captura, organiza, analisa e extrai conhecimento de grandes quantidades de informações, tal compreensão que não era antes possível sem o atual poder computacional e de ferramentas especializadas, que permitem trabalhar com tais massas de dados.

C

É necessário formação em alguma ciência exata ou boa base em matemática, estatística e computação, para compreender, desenvolver e aplicar as técnicas e ferramentas comuns da área. Esse profissional deve ser multidisciplinar, com forte atuação em áreas que abrangem o comportamento humano, onde nem sempre fórmulas e contas resolverão o problema, por isso conhecimentos nas áreas que tal conhecimento será aplicado são de grande ajuda.

Assim, um cientista de dados moderno precisa ter conhecimento nas seguintes áreas:

  • Matemática e Estatística
  • Programação e Banco de Dados
  • Conhecimento e Competências na Área
  • Comunicação e Visualização

Atualmente não temos instituições brasileiras que forneçam formação plena para um cientista de dados, embora algumas universidades já estejam disponibilizando cursos em algumas especialidades dessa nova profissão. A Folha elaborou uma lista que pode ser conferida aqui.

Felizmente a internet e sua ampla gama de conhecimento vem disponibilizando diversos cursos online gratuitamente e a UbiCity preparou um guia para você.

Se seu inglês é afiado, o Data Science Master oferece uma excelente variedade de cursos e material de apoio, exemplos, códigos e vídeos. Outra opção é o Open Source Society que segue a mesma linha.

Porém se não se sente confortável com o inglês ou deseja aprender na sua língua nativa, preparamos um currículo com aulas em português ou legendadas para você. 

 Matemática e Estatística

Como citado, o profissional da área deve ter sólidos conhecimentos nessas disciplinas, sendo essenciais para compreensão dos conceitos e tecnologias que serão usadas. Se não estudou os assuntos ou seus conhecimentos estão enferrujados, recomendamos os seguintes tópicos:

1-Álgebra Linear: https://pt.khanacademy.org/math/linear-algebra

2-Probabilidade: https://pt.khanacademy.org/math/probability

3-Introdução a Estatística: https://br.udacity.com/course/intro-to-statistics–st101/

4-Introdução a Estatística descritiva https://br.udacity.com/course/intro-to-descriptive-statistics–ud827/

5-Introdução a Inferência Estatística https://br.udacity.com/course/intro-to-inferential-statistics–ud201/

Introdução a Ciência dos Dados (Data Science)

A ciência de dados é uma área magnífica, esse curso disponibilizado pelo professor Wagner Meira Júnior da UFMG aborda os tópicos iniciais dessa área.

Parte 1 https://www.youtube.com/watch?v=fc1gEeit6nc

Parte 2 https://www.youtube.com/watch?v=wpBFPOKMs3Q

Parte 3 https://www.youtube.com/watch?v=fANDJidOJuw

Parte 4 https://www.youtube.com/watch?v=vmdagNtHziM

Programação 

1-Python: https://br.udacity.com/course/intro-to-computer-science–cs101/

é sem dúvida alguma a linguagem mais utilizada na ciência de dados, devido principalmente a sua simplicidade. Você vai dedicar mais tempo resolvendo seus problemas do que os problemas do seu código, além de sua infinidade de módulos consagrados para resolução de problemas de dados, como o scikit-learn, pandas, numpy e muitos outros. Curso produzido pelo Fernando Masanori que introduz conceitos básicos do python mas que já dão as condições para programar confortavelmente na linguagem.

2- Linguagem R: https://www.udemy.com/computacao_r/

Linguagem extremamente poderosa quando o assunto é estatística. Aliá-lo com o Python te garantirá um arsenal poderosíssimo.

Banco de Dados

1-SQL: https://www.udemy.com/minisqloracle/

2- NoSQL: https://pt.coursera.org/learn/ruby-on-rails-web-services-mongodb/lecture/fmacg/introduction-to-nosql

Aprendizado de Máquina/Aprendizagem Automática (Machine Learning)

Coursera: https://pt.coursera.org/learn/machine-learning

Produzido pelo professor Andrew Ng, esse curso é referência no estudo de aprendizado de máquina.

Udacity: https://br.udacity.com/course/intro-to-machine-learning–ud120/

Outra opção é o curso da Udacity caso ache o curso do Andrew muito complicado. O curso é baseado em Python.

Big Data e Computação em Nuvem

https://www.coursera.org/learn/big-data-cloud-computing-cdn

 

Se pode investir uma quantia considerável na sua formação, aqui vão alguns cursos:

Nanodegrees da Udacity

Se você está disposto a dedicar uma boa grana para sua formação, o Udacity oferece um excelente curso para formação completa em ciência de dados, através de seus Nanodegrees:

 – Analista de Dados:

https://br.udacity.com/course/data-analyst-nanodegree–nd002/

– Engenheiro de Machine Learning:

https://br.udacity.com/course/machine-learning-engineer-nanodegree–nd009/

Embora o preço seja um pouco salgado a primeira vista, R$399, é justificado pela sua alta qualidade, são cursos elaborados por empresas como Google e Facebook. Uma solução mais em conta é o DataQuest.

Bom, como vocês viram, a oferta de cursos é extensa e a lista que colocamos aqui é apenas uma pequena amostra dos conhecimentos e habilidades que um cientista de dados deve ter. Lembre-se sempre da figurinha lá de cima com as quatro grandes áreas.

Bons estudos e bem vindo ao fascinante mundo da ciência de dados.

Jader Martins

4 Comments

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *