Skip to content

Curso R - Segundo semestre #6

@zlkrvsm

Description

@zlkrvsm

Proposta

O uso do software R oferece uma alternativa a outras formas de trabalho com dados quantitativos para as ciências sociais quantitativas e, especialmente, a demografia. No entanto, o software tem uma barreira de entrada alta, devido a ausência de uma interface de usuário gráfica e da necessidade da introdução de temas de programação, ciência da computação e ciência de dados. Por essa razão, este curso introdutório pretende suavizar essa curva de aprendizado através da introdução de conceitos e técnicas de programação em R em linguagem acessível e voltada para praticantes das ciências humanas. O curso pretende introduzir também algumas alternativas para a realização das diferentes tarefas, usando exemplos do R base e do tidyverse.

Tópicos

  • Introdução aos conceitos básicos e modelo Import/Tidy/Transform/Visualize/Model/Communicate (ITTVMC)
  • Importação de distintas fontes de dados e tratamento inicial dos dados ("cozinha")
  • Programação
  • Pesquisas Amostrais (ficou diluído nos outros)
  • Visualização de dados
  • Rmarkdown (?)

Aulas

  1. O Básico do R

    1. Um exemplo de data pipeline, da importação à visualização.
      • O modelo: import, tidy, transform, visualize, model, communicate.
    2. Comentários sobre temas diversos:
      • Workflow
      • Funções, objetos, vetores, data.frames.
      • Pasta de trabalho.
      • Projetos e pastas.
      • A importância dos livros e tutoriais online.
    3. Exercício
      • Um exemplo-exercício: calcular algumas medidas demográficas a partir de um extrato do Censo 2010
        • Com R Base.
        • Com tidyverse.
  2. Importação e cozinha

    1. Importação de diferentes tipos de bases de dados
      • Censo Demográfico
      • PNAD
      • PNAD Contínua
    2. Cozinha (tidy) dos dados
      • Tipos de dados (números, strings, factors, lógicos, data/hora)
      • Missing data
      • Long/Wide data
    3. Exportação de dados
      • CSV
      • RDS
      • RDATA
      • SPSS/SAS/STATA
    4. Comentários sobre temas diversos
      • Pacotes
      • survey objects e outros objetos estranhos
      • Listas
      • Como a cozinha dos dados se integra com as partes posteriores
      • Uma crítica ao ITTVMC: "Perdidos nos dados"
      • O ofício do cientista de dados
    5. Exercício
      • PNAD Contínua:
        • importação e tratamento inicial dos dados
        • criação do objeto survey
        • conversão para factors
        • tratamento dos missings
        • conversão de long pra wide data
  3. Transformação, visualização, modelagem

    1. Transformando dados
      • Variáveis derivadas
      • Medidas resumo
      • Operações por grupo
    2. Visualizações básicas
      • Scatterplot
      • Lines
      • Boxplot
      • Density plot
      • Barplots and Histograms
      • Pointrange (erros)
      • Mapas
    3. Modelos
      • Introdução extremamente superficial a modelagem
      • Um exemplo MUITO simples de modelo linear
      • Visualizando uma linha de tendência de modelo linear
    4. Exercicio
      • Censo Demográfico:
        • construção de variáveis derivadas de idade, renda e educação
        • gráficos para exploração dos dados
        • um modelo linear de renda e educação
  4. Programação

    1. Controle de fluxo
      • if/else
      • switch
      • break
      • return
    2. Loops
      • for
      • while
      • repeat
    3. Funções: Round 2
      • Componentes
      • Escrevendo sua primeira função
      • Modificando funções que já existem
      • Usando funções no lugar de loops (lapply, sapply, tapply, família map)
    4. Exercicios
      • Criando uma variável dummy usando ifelse/if_else
      • Criando uma região migratória com case_when ou if - else - if chain
      • Criando uma função que faz grupos etários a partir de um vetor de idade
      • Criando uma função que faz índice de Myers/Whipple
      • Criando uma função que faz taxa de fecundidade total
  5. Mini-projeto em R

    1. Escolha um dos temas a seguir e implemente a pipeline em R, da importação até a visualização/exportação
      • Taxa de fecundidade total para todos os municípios de uma área geográfica (país, estado) de acordo com a potência do seu computador com visualização
      • Medidas resumo de migração para uma área geográfica: volume bruto, saldo migratório, taxa bruta, taxa líquida, índice de eficácia migratória.
      • Tábua de vida
      • Mapa coroplético de variável socioeconômica
      • 3 visualizações mais complexas da sua preferência

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions