+ - 0:00:00
Notes for current slide
Notes for next slide

R aplicado a la ECH

Setiembre 2020
Gabriela Mathieu

Creative Commons License
Creative Commons Attribution 4.0 International License

¿Qué haremos hoy?

  • Repaso

¿Qué haremos hoy?

  • Repaso

  • Subempleo y empleo con restricciones: estimaciones

¿Qué haremos hoy?

  • Repaso

  • Subempleo y empleo con restricciones: estimaciones

  • Funciones educativas

¿Qué haremos hoy?

  • Repaso

  • Subempleo y empleo con restricciones: estimaciones

  • Funciones educativas

  • Educación: cálculo de variables y estimación de indicadores

¿Qué haremos hoy?

  • Repaso

  • Subempleo y empleo con restricciones: estimaciones

  • Funciones educativas

  • Educación: cálculo de variables y estimación de indicadores

  • Ejercicios

ech

Funciones de estimación

  • get_estimation_mean() : permite estimar la media de una variable numérica o la proporción de una variable categórica.


  • get_estimation_median(): permite estimar la mediana de una variable numérica.

Funciones de estimación

  • get_estimation_mean() : permite estimar la media de una variable numérica o la proporción de una variable categórica.


  • get_estimation_median(): permite estimar la mediana de una variable numérica.

  • get_estimation_total(): permite estimar el total de una variable numérica.

Funciones de estimación

  • get_estimation_mean() : permite estimar la media de una variable numérica o la proporción de una variable categórica.


  • get_estimation_median(): permite estimar la mediana de una variable numérica.

  • get_estimation_total(): permite estimar el total de una variable numérica.

  • setdesign(): define el diseño de muestra. Se usa al interior de estas funciones get_estimation*().

ech::get_estimation_mean()

Empleo con restricciones

Estimo la proporción de personas empleadas que están subempleadas y/o no aportan a la seguridad social. Ver código

library(ech); library(dplyr) # cargo paquetes
load("data/ech19.RData") # cargo los datos
ech19 <- underemployment(ech19) # calculo la variable desempleo
ech19 <- employment_restrictions(ech19) # calculo la variable empleo con restricciones
# estimo la proporcion de personas empleadas con restricciones
get_estimation_mean(ech19, variable = "employment_restrictions", level = "i", ids = "upm", estrato = "estrato")
# A tibble: 4 x 4
employment_restrictions estimacion estimacion_low estimacion_upp
<fct> <dbl> <dbl> <dbl>
1 "Sin restricciones" 0.723 0.718 0.728
2 "Restriccion por no aporte" 0.181 0.177 0.185
3 "Restriccion por subempleo" 0.0285 0.0269 0.0301
4 "Restriccion por subempleo y no apor… 0.0673 0.0646 0.0699

Chequeo resultados con datos del OS-MIDES

Funciones educativas

El paquete ech trae cuatro funciones para calcular variables educativas:

  • enrolled_school(): permite calcular la asistencia a un centro de educación formal.

Funciones educativas

El paquete ech trae cuatro funciones para calcular variables educativas:

  • enrolled_school(): permite calcular la asistencia a un centro de educación formal.

  • level_completion(): permite calcular la completitud según niveles de educación. Crea un grupo de variables dicotómicas que establecen la completitud de primaria, ciclo basico, bachillerato y nivel terciario.

    • Para el nivel terciario se incluye un parámetro n para definir los años de educación terciaria que se consideran necesarios para haber completado ese nivel.
    • Dado que la educación terciaria se compone de diferentes carreras de variada duración no es posible establecer un cantidad de años determinada para considerar que ha completado ese nivel.

Funciones educativas

El paquete ech trae cuatro funciones para calcular variables educativas:

  • enrolled_school(): permite calcular la asistencia a un centro de educación formal.

  • level_completion(): permite calcular la completitud según niveles de educación. Crea un grupo de variables dicotómicas que establecen la completitud de primaria, ciclo basico, bachillerato y nivel terciario.

    • Para el nivel terciario se incluye un parámetro n para definir los años de educación terciaria que se consideran necesarios para haber completado ese nivel.
    • Dado que la educación terciaria se compone de diferentes carreras de variada duración no es posible establecer un cantidad de años determinada para considerar que ha completado ese nivel.

Funciones educativas

  • level_education(): permite calcular el máximo nivel educativo alcanzado.

    • Sin instrucción
    • Primaria
    • Secundaria
    • UTU
    • Magisterio o profesorado
    • Universidad o similar

Funciones educativas

  • level_education(): permite calcular el máximo nivel educativo alcanzado.

    • Sin instrucción
    • Primaria
    • Secundaria
    • UTU
    • Magisterio o profesorado
    • Universidad o similar

  • years_of_schooling(): permite calcular el acumulado de años de educación.

  • Las variables educativas se relacionan con la edad de las personas, por lo tanto, conviene realizar las estimaciones considerando diferentes tramos de edad.

  • age_group(): permite crear una variable con grupos de edad.

Asistencia

Preguntas de la encuesta que relevan asistencia a un centro de estudio

Descripción Variable Códigos
Asiste a preescolar 193 1 Asiste; 2 Asistió; 3 Nunca asistió
Asistencia a educación primaria e197 1 Asiste; 2 Sí, asistió; 3 No asistió
Asistencia a educación media e201 1 Asiste; 2 Sí, asistió; 3 No asistió
Asistencia a educación técnica e212 1 Asiste; 2 Sí, asistió; 3 No asistió
Asistencia a magisterio o profesorado e215 1 Asiste; 2 Sí, asistió; 3 No asistió
Asistencia a universidad o similar e218 1 Asiste; 2 Sí, asistió; 3 No asistió
Asistencia a terciario no universitario e221 1 Asiste; 2 Sí, asistió; 3 No asistió
Asistencia a postgrado e224 1 Asiste actualmente; 2 Sí, asistió; 3 No asistió

Asistencia

# Asistencia actual a un centro educativo y edad categorizada
ech19 <- ech19 %>%
mutate(asistencia_actual = case_when((e193 == 1 | e197 == 1 | (e201 == 1 & e27 > 10) | e212 == 1 | (e215 == 1 & e27 > 17) |
(e218 == 1 & e27 > 17) | (e221 == 1 & e27 > 17) | (e224 == 1 & e27 > 17)) ~ 1,
TRUE ~ 0),
edad_tramos = cut(e27, c(0,4,11,17,29, max(e27)), include.lowest = TRUE,
labels = c("0-4", "5-11", "12-17", "18-29", "30+")))
ech19 %>% group_by(edad_tramos, asistencia_actual) %>%
summarise(total = n())
# A tibble: 10 x 3
# Groups: edad_tramos [5]
edad_tramos asistencia_actual total
<fct> <dbl> <int>
1 0-4 0 3480
2 0-4 1 2208
3 5-11 0 65
4 5-11 1 9302
5 12-17 0 631
6 12-17 1 8703
7 18-29 0 10557
8 18-29 1 6071
9 30+ 0 65215
10 30+ 1 1639

ech::enrolled_school()

Asistencia

Ahora lo calculamos usando el paquete ech.

ech19 <- age_groups(ech19)
ech19 <- enrolled_school(ech19)
ech19 %>% group_by(age_groups, school_enrollment) %>%
filter(school_enrollment == 1) %>%
summarise(total = n())
# A tibble: 5 x 3
# Groups: age_groups [5]
age_groups school_enrollment total
<int+lbl> <dbl+lbl> <int>
1 1 1 [Si] 2208
2 2 1 [Si] 9302
3 3 1 [Si] 8703
4 4 1 [Si] 4747
5 5 1 [Si] 2963

Estimación de asistencia actual por tramos de edad

Estimo la proporción de personas que asisten actualmente a un centro educativo formal por tramo de edad según departamento.

# usando age_groups
tabla_asiste <- get_estimation_mean(ech19,
variable = "school_enrollment",
by.x = "age_groups",
by.y = "dpto",
level = "i") %>%
filter(school_enrollment == "Si")

Estimación de una proporción o media

get_estimation_mean(
data = ech::toy_ech_2018, # data.frame
variable = NULL, # variable a estimar
by.x = NULL, # variable de cruce
by.y = NULL, # variable de cruce
domain = NULL, # dominio o subpoblacion
level = NULL, # nivel hogares o personas
ids = NULL, # upms
numero = "numero", # identificador hogar
estrato = NULL, # estrato
pesoano = "pesoano", # ponderador
name = "estimacion" # etiqueta
)

Estimación de asistencia actual para una subpoblación

Estimo la proporción de personas entre 12 y 17 años que asisten actualmente a un centro educativo formal según departamento.

# usando age_groups
get_estimation_mean(ech19,
variable = "school_enrollment",
by.x = "dpto",
domain = "age_groups == 3",
level = "i") %>%
filter(school_enrollment == "Si")
# A tibble: 19 x 5
# Groups: dpto [19]
dpto school_enrollment estimacion estimacion_low estimacion_upp
<fct> <fct> <dbl> <dbl> <dbl>
1 Montevideo Si 0.945 0.935 0.954
2 Artigas Si 0.895 0.859 0.932
3 Canelones Si 0.931 0.917 0.944
4 Cerro Largo Si 0.926 0.895 0.957
5 Colonia Si 0.940 0.914 0.966
6 Durazno Si 0.939 0.906 0.972
7 Flores Si 0.960 0.922 0.998
8 Florida Si 0.869 0.815 0.923
9 Lavalleja Si 0.933 0.894 0.972
10 Maldonado Si 0.941 0.920 0.963
11 Paysandú Si 0.945 0.924 0.967
12 Río Negro Si 0.965 0.935 0.995
13 Rivera Si 0.919 0.886 0.951
14 Rocha Si 0.925 0.895 0.955
15 Salto Si 0.868 0.834 0.901
16 San José Si 0.936 0.912 0.961
17 Soriano Si 0.899 0.861 0.937
18 Tacuarembó Si 0.896 0.859 0.933
19 Treinta y Tres Si 0.926 0.882 0.970

Estimación de asistencia actual para una subpoblación

Estimo la proporción de personas entre 12 y 17 años que asisten actualmente a un centro educativo formal según departamento.

# usando edad
get_estimation_mean(ech19,
variable = "school_enrollment",
by.x = "dpto",
domain = "e27 > 11 & e27 < 18",
level = "i") %>%
filter(school_enrollment == "Si")
# A tibble: 19 x 5
# Groups: dpto [19]
dpto school_enrollment estimacion estimacion_low estimacion_upp
<fct> <fct> <dbl> <dbl> <dbl>
1 Montevideo Si 0.945 0.935 0.954
2 Artigas Si 0.895 0.859 0.932
3 Canelones Si 0.931 0.917 0.944
4 Cerro Largo Si 0.926 0.895 0.957
5 Colonia Si 0.940 0.914 0.966
6 Durazno Si 0.939 0.906 0.972
7 Flores Si 0.960 0.922 0.998
8 Florida Si 0.869 0.815 0.923
9 Lavalleja Si 0.933 0.894 0.972
10 Maldonado Si 0.941 0.920 0.963
11 Paysandú Si 0.945 0.924 0.967
12 Río Negro Si 0.965 0.935 0.995
13 Rivera Si 0.919 0.886 0.951
14 Rocha Si 0.925 0.895 0.955
15 Salto Si 0.868 0.834 0.901
16 San José Si 0.936 0.912 0.961
17 Soriano Si 0.899 0.861 0.937
18 Tacuarembó Si 0.896 0.859 0.933
19 Treinta y Tres Si 0.926 0.882 0.970

Ejercicio

  • Estimar los años de educación según sexo para personas mayores de 24 años. Comparar con OTU

  • Estimar el máximo nivel educativo alcanzado para una subpoblación, personas mayores de 24 años. Comparar con OTU

  • Calcular las variables de completitud de cada nivel de enseñanza. Para calcular la completitud en el nivel terciario definir la cantidad de años aprobados que consideramos completan el nivel igual a 2, luego repetir para n=4.

  • Estimar la completitud en primaria y ciclo báscio para personas mayores de 15 años; la completitud en bachillerato para las personas mayores de 17 años y la completitud en el nivel terciario para las personas mayores de 24 años.

  • Comparar resultados con los publicados por OTU

Nivel de educación completado

Descripción Variable
e197 asiste a primaria
e197_1 primaria completa
e201 asiste a secundaria
e51_4 años aprobados en ciclo básico
e51_5 años aprobados en bachillerato
e51_6 años aprobados en bachillerato técnico
e51_7 años aprobados en educación técnico
e51_7_1 requisitos para educación técnica
e51_8 años aprobados en magisterio/profesorado
e51_9 años aprobados en universidad o similar
e51_10 años aprobados en terciaria (no universitaria)
e212 asiste a educación técnica (no universitaria)
e215 asiste a magisterio
e218 asiste a universidad
e221 asiste a terciaria

Nivel completado

Defino terciaria completa si completó al menos 4 años

ech19 <- ech19 %>%
mutate(primaria_completa = ifelse(e197 == 2 & e197_1 == 1, 1, 0),
baja_secundaria_completa = ifelse(e201 %in% 1:2 & e51_4 == 3, 1, 0),
alta_secundaria_completa = ifelse(e201 %in% 1:2 & (e51_5 == 3 | e51_6 == 3), 1, 0),
terciaria_completa = ifelse((e212 %in% 1:2 & e51_7_1 == 1 & e51_7 >= 3) | (e215 %in% 1:2 & e51_8 >= 3) | (e218 %in% 1:2 & e51_9 >= 3) | (e221 %in% 1:2 & e51_10 >= 3), 1, 0)

Ejercicio

  • Estima la proporción de jóvenes que estudian o trabajan según sexo. Categorías: "Estudia o trabaja","Busca trabajo","Realiza quehaceres del hogar","Ninguna de las anteriores"
  • Observa cómo cambia esta estimación si en trabajo se incluyen a quienes realizan los quehaceres del hogar y a quienes buscan trabajo:

  • Calcula la variable clima educativo del hogar como el promedio de años de educación de las personas mayores de edad.

¿Qué haremos hoy?

  • Repaso

Paused

Help

Keyboard shortcuts

, , Pg Up, k Go to previous slide
, , Pg Dn, Space, j Go to next slide
Home Go to first slide
End Go to last slide
Number + Return Go to specific slide
b / m / f Toggle blackout / mirrored / fullscreen mode
c Clone slideshow
p Toggle presenter mode
t Restart the presentation timer
?, h Toggle this help
Esc Back to slideshow