¡Envíe conjuntos de datos para la ciencia de datos!

Seguir

La necesidad

Los conjuntos de datos relacionables, atractivos y de alta calidad son esenciales para la educación en ciencia de datos, y las primeras investigaciones muestran que la selección de conjuntos de datos de un estudiante tiene un impacto sustancial en su compromiso. Hay muchos conjuntos de datos disponibles gratuitamente en línea o listos para ser proporcionados por socios de la industria. Sin embargo, esos conjuntos de datos pueden no ser apropiados para una audiencia en el aula, ni se garantiza que incluyan los resultados pedagógicos necesarios para enseñar conceptos básicos de ciencia de datos o estadísticos de una manera clara, atractiva y fácil de identificar. Se requiere trabajo adicional para seleccionar y limpiar los conjuntos de datos para su uso en las aulas de ciencia de datos o en los planes de estudios de ciencia de datos, lo que puede ser una barrera entre los maestros y los redactores de planes de estudio para crear lecciones de ciencia de datos atractivas y accesibles.

La acción

Como una colaboración entre Code.org, Bootstrap y Data Science for Everyone: hemos creado Datasets for Classroom Data Science Spec para brindar orientación sobre qué tipos de conjuntos de datos son más apropiados para la ciencia de datos en el aula y son más compatibles con nuestras herramientas para entregar instrucción a los estudiantes. Ofrece una vía para que las personas encuentren, limpien, documenten y carguen conjuntos de datos que se pueden usar en herramientas de ciencia de datos (como App Lab de Code.org) o planes de estudio (como el curso de ciencia de datos de Bootstrap), siguiendo el modelo del piloto de Bootstrap con estudiantes de la Universidad de Brown. 

Esta especificación también codifica el requisito de que los conjuntos de datos incluyan una hoja de datos, adaptada de los requisitos enumerados en el documento de investigación Hojas de datos para conjuntos de datos. Estas hojas de datos brindan el contexto necesario cuando se considera la fuente y el uso de los datos, información sobre cualquier normalización o limpieza que se haya realizado para hacer que un conjunto de datos sea compatible con la especificación, así como consideraciones pedagógicas para educadores y desarrolladores de planes de estudios para informar mejor cómo estos conjuntos de datos pueden ser usado con intencionalidad dentro de una lección o currículo.

Empezando

  1. Lea los conjuntos de datos para la especificación de ciencia de datos del aula
  2. Encuentre un conjunto de datos que le interese o que sería interesante para los estudiantes
  3. Procese previamente los datos para asegurarse de que se alineen con la especificación. Esto garantiza que los estudiantes puedan acceder al conjunto de datos y que funcione correctamente con nuestras herramientas.
  4. Cree una hoja de datos orientada al educador. Proporcionamos plantillas clonables en Google Docs o como un archivo README.md en un repositorio público de GitHub.
  5. Cargue el conjunto de datos y la hoja de datos en una ubicación pública (como una unidad de Google compartida o un repositorio público de GitHub).
  6. Envíe un correo electrónico a support@code.org para informarnos sobre su conjunto de datos y lo agregaremos a App Lab. Nuestro equipo de currículo también puede incorporarlo en las lecciones para los estudiantes, o usarlo al desarrollar nuevas lecciones o actividades a medida que crece nuestro currículo.

Si tiene alguna pregunta sobre el envío de un conjunto de datos, no dude en enviarnos un correo electrónico a support@code.org.

Tecnología de Zendesk