Procesamiento de datos geoespaciales de biodiversidad mediante el lenguaje de programación Python#

Descripción general del curso#

Este curso trata sobre el manejo, visualización y análisis de datos geoespaciales de biodiversidad mediante el lenguaje de programación Python. Se estudian los fundamentos de Python, sus módulos geoespaciales y su aplicación al procesamiento de datos de biodiversidad. Se demuestra como metodologías y técnicas de ciencia de datos pueden ser aplicadas al componente espacial de la informática de la biodiversidad.

Horario y fecha de inicio#

Los lunes de 6:00 p.m. a 8:00 p.m. a partir del 13 de enero de 2025 y durante ocho semanas.

Objetivos#

General#

Aprender a desarrollar programas en el lenguaje de programación Python orientados al procesamiento de datos geoespaciales de biodiversidad.

Específicos#

  • Aplicar un enfoque de ciencia de datos en los procesos de importación, transformación, visualización, análisis y comunicación de datos geoespaciales de biodiversidad.

  • Desarrollar soluciones reproducibles a problemas computacionales mediante Python.

  • Integrar visualizaciones tabulares, gráficas y geoespaciales de datos de biodiversidad en documentos y aplicaciones interactivas desarrolladas en Python.

Metodología#

El curso se desarrolla mediante clases teórico-prácticas virtuales y sincrónicas. Los conceptos teóricos son explicados por el profesor durante las sesiones teóricas y también a través de lecturas previamente asignadas. Las sesiones prácticas se destinan a la realización de diferentes ejercicios de programación por parte de los estudiantes.

Los contenidos de las lecciones están disponibles en el sitio web del curso, en el que hay enlaces a la bibliografía y a otros recursos de aprendizaje como tutoriales y videos.

Cronograma#

Semana Temas
PARTE I - CIENCIA DE DATOS
1
  • Introducción a la ciencia de datos
  • Cuadernos de notas Jupyter
  • El lenguaje de marcado Markdown
  • Representación de datos
PARTE II - PYTHON
2
  • Introducción al lenguaje de programación Python
  • El lenguaje de programación Python
    • Tipos de datos básicos
    • Variables
    • Expresiones
    • Comentarios
    • Condicionales
3
  • El lenguaje de programación Python (continuación)
    • Ciclos
    • Funciones
    • Estructuras de datos
      • Listas
      • Diccionarios
PARTE III - DATOS DE BIODIVERSIDAD
4
  • Introducción a los datos sobre biodiversidad
  • El API de GBIF
  • pygbif: biblioteca para acceso a datos en GBIF
PARTE IV - ANÁLISIS DE DATOS
4
  • pandas: biblioteca para manipulación y análisis de datos
PARTE V - GRAFICACIÓN ESTADÍSTICA
5
  • La biblioteca Matplotlib
  • La biblioteca Plotly
PARTE VI - DATOS GEOESPACIALES
6
  • Introducción a los datos geoespaciales
    • Modelos de datos
    • Sistemas de información geográfica
  • Datos vectoriales
    • La biblioteca GeoPandas
7
  • Datos raster
    • La biblioteca Rasterio
8
  • Visualización de datos geoespaciales
    • La biblioteca Leafmap

Evaluación#

Rubro Valor (%)
Asistencia 30
Tareas 30
Proyecto final 40
TOTAL 100

Bibliografía recomendada#

Ciencia de datos#

Çetinkaya-Rundel, M., & Hardin, J. (2021). Chapter 1: Hello data en Introduction to Modern Statistics (1st ed.). OpenIntro, Inc. https://openintro-ims.netlify.app/data-hello

Wickham, H., Çetinkaya-Rundel, M., & Grolemund, G. (2023). Introduction en R for Data Science: Import, Tidy, Transform, Visualize, and Model Data (2nd ed.). O’Reilly Media. https://r4ds.hadley.nz/intro

Markdown#

Markdown Tutorial. (s.f.). Recuperado 19 de marzo de 2022, de https://www.markdowntutorial.com/

Python#

Severance, D. C. R. (2016). Python for Everybody: Exploring Data in Python 3 (S. Blumenberg & E. Hauser, Eds.). CreateSpace Independent Publishing Platform. https://www.py4e.com/html3/

Downey, A. B. (2024). Think Python: How to Think Like a Computer Scientist (3rd ed.). O’Reilly Media. https://greenteapress.com/wp/think-python-3rd-edition

Datos de biodiversidad#

Chamberlain, S. (s. f.). pygbif: Python client for the Global Biodiversity Information Facility (GBIF) [Documentación]. rOpenSci. https://pygbif.readthedocs.io

Darwin Core Maintenance Group. (2021). Darwin Core Quick Reference Guide. Biodiversity Information Standards (TDWG). https://dwc.tdwg.org/terms/

Global Biodiversity Information Facility (GBIF). (s.f.). Developer portal. GBIF. https://www.gbif.org/developer/summary

Wieczorek, J., Bloom, D., Guralnick, R., Blum, S., Döring, M., Giovanni, R., … & Vieglais, D. (2012). Darwin Core: An evolving community-developed biodiversity data standard. PLoS ONE, 7(1), e29715. https://doi.org/10.1371/journal.pone.0029715

Análisis de datos#

Kaggle. (s.f.-a). Learn Pandas. Recuperado 1 de agosto de 2024, de https://www.kaggle.com/learn/pandas

The Pandas Development Team. (s.f.). pandas: Powerful data structures for data analysis, time series, and statistics. Recuperado 1 de enero de 2022, de https://pandas.pydata.org

Gráficación estadística#

Kaggle. (s.f.-b). Learn Data Visualization. Recuperado 1 de agosto de 2024, de https://www.kaggle.com/learn/data-visualization

P, C. (s.f.). plotly: An open-source, interactive data visualization library for Python. Recuperado 1 de agosto de 2024, de https://plotly.com/python/

Análisis de datos geoespaciales#

Rey, S. J., Arribas-Bel, D., & Wolf, L. J. (2020). Geographic Data Science with Python. https://geographicdata.science/book/

Kaggle. (s.f.-c). Learn Geospatial Analysis. Recuperado 1 de agosto de 2024, de https://www.kaggle.com/learn/geospatial-analysis

Geopandas contributors. (s.f.). geopandas: Geographic pandas extensions. Recuperado 1 de enero de 2022, de http://geopandas.org

Gillies, S. (s.f.). rasterio: Fast and direct raster I/O for use with Numpy and SciPy. Recuperado 1 de enero de 2022, de mapbox/rasterio

Wu, Q. (s.f.). leafmap. Recuperado 3 de marzo de 2024, de https://leafmap.org/

Contactos#

Si tiene alguna pregunta o comentario sobre este curso, por favor contacte a:

Manuel Vargas - mfvargas@gmail.com
Profesor

María Biarreta - biarretam@gmail.com
Asistente

Josué Castro - jd.castro23r@gmail.com
Asistente

María Auxiliadora Mora - maria.mora@itcr.ac.cr
Coordinadora de la Red Bioma

Licencia de Creative Commons
Los contenidos de este curso, a menos que se especifique de otra forma, se comparten mediante una licencia de Creative Commons Reconocimiento-CompartirIgual 4.0 Internacional.