Este taller tiene como objetivo que el alumno empiece a sacar partido del open data del punto de vista de un reutilizador, por medio de casos prácticos en los que se accede a distintos datos para resolver varios problemas. Además, analizaremos las plataformas de concursos, como Kaggle, como medio de aprendizaje, de acceso a datos y de acceso a código abierto para usar esos datos.
Tras la realización del curso el participante será capaz de:
1. Acceder a datos abiertos de distintas fuentes.
2. Empezar a analizar esos datos abiertos.
3. Acceder a la plataforma Kaggle.
Los alumnos deben desarrollar actividades de estudio y práctica mediante:
1º Estudio de documentación
Para que resulte mas fácil la realización de los ejecicios, se aporta al alumno una máquina virtual. Todos los contenidos se verán en el taller.
2º Desarrollo de sesiones y aplicación práctica.
Durante el tiempo previsto para el desarrollo del curso, se realizarán actividades grupales / individuales basadas en lo explicado para tener un conocimiento práctico, del mismo modo que tendrá una posterior evaluación.
Explicación del concepto amplio del Open Data desde el punto de vista de los reutilizadores de datos. Fuentes de datos abiertas. Reutilización de código en plataformas de concursos: Kaggle.
Se mostrarán distintos ejemplos prácticos de cómo utilizar Rstudio, mostrará las ventajas del entorno y dará las bases de uso del lenguaje de programación R.
Breve análisis teórico de cómo plantear un proyecto de datos y practica guiada sobre como incorporar datos en Rstudio y trabajar con datos en memoria.
Practica guiada sobre como bajarse datos abiertos, hacer un análisis previo (EDA) y una limpieza inicial de los datos.