Advanced Analytics com PySpark

Curso para quem já tem experiência em programação e quer entrar de cabeça no mundo de Python e Spark.

facebook icon twitter icon linkedin icon

conteúdo do curso

Introdução a programação com Python

Nesse módulo vamos utilizar a ferramenta Jupyter e Python.

saiba mais

1 - Jupyter | Conhecendo a ferramenta | 2 - Python | O que é e para que serve | Variáveis, Lista e Dicionarios | Declaração condicional e de controle | Métodos, funções e pacotes | Coleções | Classes | Manipulação de exceção | Boas práticas de engenharia de software com Python

Análise de dados com PySpark

Saiba como apresentar e fazer análises usando Spark.

saiba mais

1 - Análise de dados: Conceitos e uso do Spark | Fundamentos de processamento distribuído | Arquitetura do Spark (driver e executores) | Conceitos e uso de Data Frame | Spark e suas diferentes aplicações e bibliotecas | Introdução a SQL com o PySpark | Desafios de SQL com PySpark | 2 - PySpark (Spark.pandas): Lendo dados de uma fonte de dados | Filtrando o dataframe | Visualizando os dados | Como apagar colunas | Tratando valores nulos | Como agrupar | Trabalhando com categóricos | Transformando Séries do tipo String | Tabela de frequência | Tratando datas | Unindo datasets | Boas práticas de engenharia de software com PySpark

Estatística descritiva e inferencial

O conhecimento de estatística é um dos pilares do mundo da ciência de dados e, nesta aula, você vai aprender como deixá-la mais simples utilizando as ferramentas certas.

saiba mais

1 - Introdução a estatística | Probabilidade | Correlação vs Causalidade | 2 - Métricas | Média aritmética | Quartil/Percentil | Mediana | Moda | 3 - Criando e analisando gráficos | 4 - Medidas de dispersão | 5 - Variância | 6 - Desvio padrão | 7 - Amostra | Viés amostral | Detecção de outliers | 8 - Distribuições | 9 - Design de experimento | Teste de hipótese frequentista | Teste de hipótese bayesiano

Introdução a Machine Learning com PySpark & MLlib

Aprenda machine learning e como você poderá fazer modelos usando PySpark e MLlib para ajudar na sua empresa.

saiba mais

1 - Conceito: Família de algoritmos | 2- Aprendizado supervisionado | Treino e Teste | Métricas de avaliação | Introdução a Forecasting | Regressão Linear | Random Forest

calendário

calendário completo
aulas praticas

aulas 100% práticas

Solucione problemas do seu dia a dia de mercado utilizando Python e Jupyter em um ambiente exclusivo na Cloud.

network

espaço para network

Aumente sua rede de contatos com os melhores profissionais de Big Data e Data Science da sua cidade e aprenda em um ambiente perfeito para o desenvolvimento de ideias.

ambiente descontraido

ambiente descontraído

Aprenda rápido, de forma dinâmica e descontraída: nós sabemos que uma aula comum não é o que você quer depois de um dia cheio.

perguntas frequentes

1

O que é o Data Bootcamp?

ver resposta

O Data Bootcamp é uma empresa que tem como foco trazer o conhecimento sobre o mundo dos dados. Trazemos esse conhecimento de forma prática, pois nós acreditamos que a teoria pode ser explicada de uma forma mais clara quando inserida em um propósito. Para isso trazemos desafios do dia-a-dia dos nossos instrutores para as aulas tornando-as dinâmicas e únicas.

2

Qual o público?

ver resposta

Todos que querem conhecer ou aprimorar seu conhecimento sobre Data Science e Big Data. Alguns cursos têm pré-requisitos, eles ficam descritos na página do curso. Qualquer dúvida entre em contato conosco.

3

Vocês fazem cursos personalizados?

ver resposta

Sim, nós projetamos cursos personalizados, desenhados junto com você para melhor atender às necessidades da sua empresa. Vamos criar juntos? Entre em contato!

Contato

Ainda com dúvidas ou gostaria de receber notícias das próximas turmas? Entre em contato com a gente.