Big Data Brasil Day

Curso Data Science

ESGOTADO – Ao final deste curso, você terá uma ampla visão dos principais conceitos de Estatística e Machine Learning que fundamentam a ciência de dados. Trabalharemos com teoria e com as principais ferramentas e softwares para a resolução de problemas reais, como o entendimento de mercado e o relacionamento com o consumidor.

Carga horária: 16hs

Data e Horário: Dias 02 e 03 de maio das 8:00hs às 17:00hs. Inicio do credenciamento às 7:30hs.

Incluso: Coffee Break de manhã e de tarde. Certificado de participação. Material para anotações.

Local: UMC – Avenida Imperatriz Leopoldina, 550 – SP. Primeiro andar.

Parceiros: Neuron, Mandic Cloud

Instrutores: Felipe Polo (Neuron) e Eduardo Heitor (Neuron)

Módulo 1: Entendendo o mundo com estatística

Duração: 4h

Conteúdo:

– As bases da teoria da probabilidade: variáveis aleatórias e distribuições

– Aplicação: estimando o tempo de um projeto com simulação de Monte Carlo

– Explorando datasets reais: formas numéricas e gráficas de sintetizar os dados

– Utilizando regressão linear para entender e prever como o mercado precifica imóveis

– Utilizando regressão logística para entender e prever o comportamento do consumidor

Módulo 2: Introdução à predição com modelos de Machine Learning

Duração: 3h

Conteúdo:

– Entendendo melhor o que é Machine Learning

– Principais modelos de Aprendizado Supervisionado e aplicações (scikit-learn) em datasets reais:

–  Gradient descent, o processo de aprendizado, Hyperparameter tuning

–  O problema da regressão: prevendo preços de imóveis com menor erro

–  O problema da classificação: prevendo o comportamento do consumidor com maior precisão

– Modelos de Aprendizado Não Supervisionado e aplicações (scikit-learn) em datasets reais:

– Clusterização: descobrindo padrões escondidos nos dados

– Redução de dimensionalidade: uma técnica para ganho de performance

Módulo 3: Machine Learning com TensorFlow no GCP (Google Cloud Platform)

Duração: 2,5h

Conteúdo:

– Introdução ao GCP e recursos para ML / Data Science

– Introdução ao TensorFlow

– Explorar um dataset grande usando Datalab e BigQuery

– Criar um dataset e construir um modelo

Módulo 4: Sistema de Recomendação com TensorFlow

Duração: 2,5h

Conteúdo:

– Diferentes tipos de sistemas de recomendação

– Sistemas de Recomendação baseados em conteúdo

– Sistemas de Recomendação de filtragem colaborativa

– Sistema de Recomendação Híbrido de Rede Neural

 

Módulo 5: Uso de Data Science no aperfeiçoamento de UX em chatbots

Duração: 2h

Conteúdo:

– Actions on Google e Google Assistant: introdução

– Firebase e arquitetura serverless

– Web services no Actions para o Google Assistant

– Análise em fluxo contínuo nos chatbots

//cursos...

Os cursos acontecerão nos dias 2 e 3 de maio na Faculdade UMC.