Repositorio de los datos abiertos y scrappeados de dengue en México junto con modelo de predicción de casos.
Brevemente el modelo sigue la siguiente estructura:
una explicación más técnica del modelo la puedes encontrar en MODELO.md.
datos-abiertoscontienen los datos abiertos (históricos) de la DGE y su diccionario.datos_abiertos_dengue_*.zipbase de datos decargada de la Dirección General de Epidemiología correspondiente a la fecha*.diccionarioarchivo con el diccionario de los datos (descargado el 19 de mayo 2022) contiene dos bases:Descriptores_Dengue.xlsxcon los descriptores de las variables.Catalogos_Dengue.xlsxcon el catálogo de variables.
datos-limpioscontiene la base de datos de 2016 a 2022 de los datos de dengue ya limpios en formato tidydengue_2016_2022_mx.rdsbase de datos con la información de dengue desde el registro de las semanas epidemiológicas de2016hasta el2022. Para leer usareadr::read_rds.dengue_2016_2022_mx.csvbase de datos con la información de dengue desde el registro de las semanas epidemiológicas de2016hasta el2022. Para leer usareadr::read_csvconUTF-8de encoding.dengue_for_model_mx.csvcontiene los datos de dengue de 2015 a la fecha con los datos de las semanas faltantes interpolados así como transformaciones a log_casos. Es input para el modelo.
datos-climacontiene las bases de datos de 1985 a 2022 de precipitación promedio por entidad y temperaturas (mínima, máxima y promedio) por mes. Las bases de datos son descargadas de los resúmenes de CONAGUA para 2021-2022 así como de los datos abiertos para 1985-2019.-
descarga_clima_1985_today.Rse encarga de descargar los datos de CONAGUA y de datos abiertos así como de usarpythonpara procesar lospdfde CONAGUA (2021 en adelante). -
imagesimágenes auxiliares para visualizar las variables de clima como auxiliares al modelo. -
processedcontiene las bases de datos de las variables climatológicas ya limpias en formatotidy.Clima_info.csvyClima_info.rdsson la misma base para leer conreadr. Contienen temperaturas y precipitaciones por entidad desde 1985. Se generan pordescarga_clima_1985_today.
-
pdf_reportscontiene los reportes que se descargan automáticamente de CONAGUA.PREC_*.pdfReporte de precipitación para el año*.TMAX_*.pdfReporte de temperatura máxima para el año*.TMED_*.pdfReporte de temperatura promedio para el año*.TMIN_*.pdfReporte de temperatura mínima para el año*.
-
Precipitacion.zip,Temperatura_Maxima_Excel.zip,Temperatura_Minima_Excel.zip,Temperatura_Promedio_Excel.zipson los datos abiertos que contienen la variable respectiva por entidad en formato Excel desde 1985 al 2020 (y 2021 parcialmente).NOTA Hay dos archivos con información del 2020 en estos
.zipuno de ellos es incompleto.
-
imagesImágenes de los resultados conDengue_predictincluyendo los resultados del modelo mientras queDengueyDengue_estadoson visualizaciones de cómo va la enfermedad a la fecha.orchestrate.shMi script de Linux para correr encrontaby actualizar el modelo semanalmente.panoramas_epidemiologicos_previoscontienen lospdfde anteriores panoramas epidemiológicos de dengue por año.importcontiene el código de Python para importar los panoramas (un código por año).processedcontiene los datos scrappeados de los panoramas epidemiológicos previosunreadabledocumentospdfde panoramas epidemiológicos que no se pudieron leer.2016-2021carpetas con documentos enpdfde los panoramas epidemiológicos de la Secretaría de Salud.
scriptspara la descarga y el formateo de datosdaterange.pymódulo auxiliar paraDescarga.py.Descarga.pypara descarga diaria de los datos màs nuevosformat_dataset.Rpara correr los datos nuevos y ponerlos para el modelomodel_bayes.Rel modelo para predecir dengue a nivel nacionalmodel_bayes.stanarchivo deStancon el modelo de dengue.- NO CORRER
modelo_clima.Rsubset del modelo completo enfocado para hacer experimentos en la parte de clima del modelo. - NO CORRER
predice_clima.stansubset del modelo completo enfocado para hacer experimentos en la parte de clima del modelo.
La meta es tener un (mejor) modelo de dengue aunque sea a nivel nacional. Éste es sólo una prueba de concepto. Si te interesa escríbeme o manda un pull request. Algunas cosas en las que podrías colaborar:
- Descargar datos de años previos.

