censo2022arg permite extraer, etiquetar y leer los microdatos del Censo Nacional de Poblacion, Hogares y Viviendas 2022 de Argentina desde las bases REDATAM distribuidas oficialmente por el INDEC.
- Extraccion completa de microdatos provincia por provincia
- Reconstruccion de identificadores jerarquicos (vivienda, hogar, persona)
- Etiquetado automatico de variables desde los diccionarios oficiales del INDEC
- Verificacion de integridad contra los totales publicados por el INDEC
- Gestion eficiente de memoria mediante subprocesos independientes
- Salida en formato Parquet (default), CSV, SPSS o SAS
- Compatible con cualquier base RedatamX (.rxdb)
# Desde CRAN (recomendado)
install.packages("censo2022arg")
# Version de desarrollo desde GitHub
# install.packages("remotes")
remotes::install_github("RodriDuran/censo2022arg")Este paquete se apoya en redatamx
de Jaime Salvador para la comunicacion con el motor REDATAM desarrollado por
CELADE (CEPAL). Ambas dependencias se instalan automaticamente.
La funcion censo_info() es el punto de entrada recomendado. Diagnostica el
estado actual de la instalacion y guia al usuario paso a paso hacia la accion
que corresponde ejecutar a continuacion, desde la configuracion inicial hasta
la lectura de los datos.
library(censo2022arg)
# Punto de entrada recomendado: diagnostica el estado e indica el proximo paso
censo_info()
# 1. Configurar el directorio de datos (solo la primera vez)
censo_configurar("/ruta/a/mis/datos/censo2022", persistent = TRUE)
# 2. Verificar el motor de extraccion y seguir las instrucciones
censo_verificar_engine()
# 3. Descargar las bases desde el INDEC (~500 MB)
censo_descargar()
# 4. Extraer los microdatos
extraer_redatam() # todas las provincias
extraer_redatam(provincias = 66) # solo Salta (prueba rapida)
extraer_redatam(provincias = c(66, 38, 34)) # varias provincias
# 5. Etiquetar las variables con los diccionarios oficiales
censo_etiquetar()
# 6. Leer y analizar los datos
# Personas de Salta
personas <- censo_leer(base = "Personas", provincias = 66)
# Hogares de Salta y Jujuy, solo algunas variables
hogares <- censo_leer(
base = "Hogares",
provincias = c(66, 38),
columnas = c("NBI_1", "NBI_2", "TIPHOGAR")
)
# Personas mayores de 18 con filtro aplicado antes de cargar en RAM
mayores <- censo_leer(
base = "Personas",
provincias = 66,
columnas = c("EDAD", "CONDACT", "IDRADIO"),
filtro = quote(EDAD >= 18)
)
# Hogares de todo el pais como data.table
hogares_arg <- censo_leer(base = "Hogares", formato = "data.table")
# Extraer microdatos de cualquier base RedatamX generica
extraer_rxdb(dic_path = "/ruta/a/base.rxdb")El INDEC distribuye tres bases complementarias del Censo 2022:
| Base | Archivo | Contenido |
|---|---|---|
| VP | cpv2022.rxdb |
Viviendas particulares — variables de persona, hogar y vivienda |
| PO | cpv2022.rxdb |
Pueblos originarios, afrodescendientes e identidad de genero |
| VC | cpv2022col.rxdb |
Viviendas colectivas |
El pipeline combina VP y PO automaticamente, obteniendo el radio censal de VP y las variables adicionales de PO (P03, P22, P23, P24, P25, IDETNICA).
Este paquete no distribuye datos del censo. Los datos deben descargarse directamente desde el portal oficial del INDEC: https://www.indec.gob.ar/indec/web/Institucional-Indec-BasesDeDatos
Los datos del Censo 2022 estan protegidos por la Ley N 17.622 de secreto estadistico. Su uso esta permitido exclusivamente con fines estadisticos y de investigacion.
Las provincias de Tucuman (cod. 90) y Tierra del Fuego (cod. 94) presentan conteos incorrectos en las bases distribuidas por el INDEC (Tucuman devuelve 310.725 personas en lugar de 1.727.337; Tierra del Fuego devuelve 0). El problema fue confirmado en las tres bases (VP, PO, VC) y no es un error de este paquete. Las 22 provincias restantes verifican con diferencia cero respecto a las tablas de control oficiales. Reporte enviado a: censo2022@indec.gob.ar
Si utilizas este paquete en tu investigacion, por favor citalo:
Duran, R. J. (2026). censo2022arg: Extraccion y Procesamiento de Microdatos
del Censo Nacional 2022 de Argentina. Version 1.0.1. R package.
doi:10.32614/CRAN.package.censo2022arg
En formato BibTeX:
@software{duran2026censo2022arg,
author = {Dur{\'a}n, Rodrigo Javier},
title = { {censo2022arg}: Extracci{\'o}n y Procesamiento de Microdatos
del Censo Nacional 2022 de Argentina},
year = {2026},
version = {1.0.1},
doi = {10.32614/CRAN.package.censo2022arg},
url = {https://doi.org/10.32614/CRAN.package.censo2022arg}
}GPL (>= 3). Ver LICENSE para mas detalles.