Profesores: Juan Pablo Ruiz Nicolini y Pablo Tiscornia
21 de junio - 30 de agosto de 2022 | 19.15hs | VIRTUAL
Instrumentos de Análisis Urbano II está pensado como un curso aplicado de Ciencia de Datos para ciudades. Para ello nos valdremos de herramientas computacionales que, en conjunto, tienen como objetivo la elaboración de un proyecto de análisis urbano desde la obtención de los datos (de diversas fuentes y formatos); su curaduría, limpieza, procesamiento, análisis, hasta la comunicación de los mismos.
Desde el inicio, además, propondremos alternativas para la organización del proyecto que apuntan a potenciar la reproducibilidad de las investigaciones y sacar provecho del control de versiones y el trabajo colaborativo.
El curso se divide en dos grandes módulos:
Introducción a las principales herramientas de R para el procesamiento de datos.
Introducción a las principales herramientas de R para el procesamiento de datos espaciales y la visualización de la información.
Las clases se estructuran con una presentación del contenido de forma oral seguida de prácticas en clase sobre lo expuesto. El objetivo es que los y las alumnas puedan practicar y disponer de la clase como ámbito de consulta.
Este curso está pensado para avanzar a través de la práctica de los contenidos. Por ello se espera de los alumnos una participación activa, con entregas de pequeños ejercicios periódicamente. Esta participación será parte de la evaluación final (\(40\%\)) que requerirá además la entrega de un informe original sobre un tema urbano que aplique el conjunto de herramientas expuestas a lo largo del curso. La puntuación máxima del informe será el \(60\%\) de la nota final.
Se propone un trabajo final integrador. Se espera en el mismo que se plasme el planteo de un problema plausible de ser respondido con datos y el desarrollo de los procedimientos programáticos en R para la resolución del mismo.
El trabajo debe incluir los contenidos dictados a lo largo de los dos módulos (Planteo de un problema, importación y limpieza de la base de datos, generación de indicadores no espaciales y espaciales y presentación de los resultados. Se ofrece elegir un tema propio o relativo a la base de trabajo que se dará en clase.
El formato de entrega esperado es un proyecto de trabajo en RStudio vinculado a un repositorio en Github.
Intro a R
y RStudio + Paquetes
Organización del flujo de trabajo (.Rproj
, y git
)
Scripts vs RMarkdown
Los principales paquetes y sus verbos para:
leer datos (readr
, heaven
, readxl
, googlesheets4
, etc)
limpiar datos (tidyr
, janitor
, tibble
)
transformar datos (dplyr
)
Herramientas auxiliares para mejorar el flujo del código:
magrittr
(%>%
) para encadenar y glue
para facilitar la concatenación.dplyr
Ampliando la caja de herramientas:
forcats
para datos categóricos (factors)
stringr
para datos de texto
Funciones
Iteraciones / loops
Flujo de trabajo con datos espaciales
Procesamiento de datos con sf
El paquete geoAr
Introducción a la visualización de datos
La Gramática de los Gráficos
El paquete ggplot2
Las muchas capas de ggplot2
Facet con geoAr
para grillas como si fueran mapas
Composición de gráficos con patchwork
, cowplot
, entre otros.
geom_sf()
para mapas estáticos
Una alternativa para mapsf
leaflet
para mapas interactivos