Un datasprint pédagogique est un dispositif de médiation numérique des savoirs contributif limité dans le temps où les participants unissent leurs compétences pour explorer, augmenter un jeu de données et proposer des visualisations éclairant une question déterminée. Il propose un cadre hybride et engageant propice à la créativité, à la collaboration, au questionnement. Les participants y développent des habilités numériques et critiques tout en construisant collectivement un savoir autour de la question explorée à travers un ou des datasets. Aucune expertise initiale, technique ou scientifique n'est requise.
Le datasprint pédagogique s'inscrit dans le cadre de la classe contributive. C'est un levier pour la construction des savoirs des élèves — savoirs en soi / savoirs pour soi — , de formation à l'adulte, de compréhension d'un territoire, d'exploration d'une problématique.
Développer le vélo comme moyen de transport responsable⚓
Depuis quelques années, le vélo revient dans les pratiques des Français. Son développement devient un enjeu de santé publique : c'est un mode de déplacement propre pour l'environnement, qui peut remplacer la voiture sur de petits trajets et qui génère une pratique sportive régulière. Depuis la rentrée 2018, un plan vélo est mis en place pour inciter les Français à utiliser davantage leur bicyclette. En 1970, le vélo représentait 10% de leurs déplacements ; aujourd'hui 2,7 % seulement. L’État souhaiterait s'approcher à nouveau des 10% en 2024. Pour cela, il entent :
augmenter le nombre de pistes cyclables sur le territoire
développer les vélos en libre service
améliorer la sécurité des déplacements à vélo
On voit alors que la pratique du vélo est liée à de nombreux questionnements disciplinaires et transdisciplinaires, mêlés les uns aux autres.
Les mobilités⚓
L'émergence des NVEI (nouveaux véhicules électriques individuels) a modifié les petits trajets du quotidien pour de nombreux usagers. Sur de courtes distances ou de manière multimodale, les NVEI se multiplient notamment en ville. Trottinette électrique, mono-roue, hoverboard... le vélo lui aussi s’électrise et permet des déplacements plus rapides et moins fatigants, donc sur de plus longues distances.
Le développement du vélo électrique a contribué à faire grossir la communauté des vélotaffeurs, ceux qui utilisent leur vélo pour leurs trajets du quotidiens et notamment pour aller au "taf", au travail (vous obtiendrez quelques chiffres clés pour votre région sur le site de l'INSEE). On n'oubliera pas toutefois tous ceux qui pratiquent le vélo en tant que loisir et/ou pour le sport. D'ailleurs sur ce point, y a-t-il une vraie distinction entre ville et campagne ? Le phénomène des cyclotaffeurs est-il plutôt urbain alors qu'on trouverait plus de pratique sportive ou de loisir en milieu rural ?
Avec les données il est aussi possible de se représenter sociologiquement les cyclistes, vélotaffeur ou non. Les vélotaffeurs sont-ils réellement plus nombreux qu'auparavent ? Quelle est la part des femmes ? L'âge médian évolue-t-il ? etc...
L'aménagement du territoire⚓
L'aménagement du territoire est directement lié au développement du vélo car des aménagements réfléchis peuvent rendre sa pratique plus simple, moins coûteuse et plus sécurisée. L'installation de bornes de vélos en libre service ou de garages à vélo près des gares ou des stations de transport en communs peut favoriser les déplacements multimodaux ; tout comme la présence d'espaces réservés aux vélos dans les trains petites et grandes lignes. Comment mesurer l'efficacité des aménagements avec les données ? Se développent-ils partout ? A quel rythme aménage-t-on des pistes cyclables par exemple ? Et aussi, quel type de piste cyclable est plus efficace en terme de sécurité des cyclistes ? Quels sont les lieux les plus dangereux pour les vélos ? Avec les données, il est possible de cartographier les accidents : les informations dont on dispose associées à un déplacement sur le terrain peuvent permettre de comprendre la dangerosité du lieu. Dans une démarche d'engagement citoyen, il peut être intéressant, analyse des données à l'appui, de proposer les aménagements nécessaires pour réduire le risque d'accident.
Ces nombreux aménagements répondent aujourd'hui forcément à une démarche de développement durable : les nouveaux aménagements doivent apporter des bénéfices écologiques, économiques et sociaux.
La création régulière de ces nouvelles pistes vient parfois diminuer l'espace alloué aux voitures et les cyclistes se plaignent eux aussi régulièrement des véhicules qui circulent ou stationnent sur les voies qui leur sont réservées. Les conflits d'usage de la route sont ainsi très fréquents. On le voit bien aujourd'hui, le développement des NVEI pose des problème de cohabitation, notamment dans les espaces urbains déjà saturés.
La sécurité routière⚓
Même si les cyclistes semblent avoir été détrônés par les usagers des trottinettes électriques (en ce moment du moins et seulement dans les villes où le service s'est développé), ils ont pour habitude de cristalliser le mécontentement des piétons et des automobilistes qui les accusent d'être des dangers publics, de griller des feux ou de rouler sur les trottoirs. Alors les cyclistes respectent-ils le code de la route et les recommandations de sécurité routière ? Portent-ils un casque ? Un système réfléchissant ? Le port de ces équipements leur évitent-il des accidents ?
La relation des cyclistes avec les autres usagers de la route est un autre élément sur lequel il est possible de réfléchir. Avec quel type de véhicules, les vélos ont-ils le plus d'accidents ? Est-ce les mêmes en ville ou à la campagne ? Et d'où vient le danger ?Les données peuvent également permettre de dresser une représentation visuelle des points d'impact du vélo.
Si, contrairement au NVEI, la réglementation pour les vélos est claire, elle est encore assez méconnue. Beaucoup d'entre nous ignorent encore certaines réglementations récentes. Les vélos électriques rapides (pouvant dépasser les 25km/h jusqu'à 45 km/h) sont régis par la réglementation des cyclomoteurs : ils doivent être immatriculés, le port d'un casque homologué est obligatoire et surtout ils ne peuvent pas circuler sur les pistes cyclables. Des villes ont également mis en place des réglementations particulières comme le cédez-le-passage cycliste au feu (plus communément appelé le "tourne à droite") qui permet de dissocier le démarrage des véhicules motorisés de celui des cyclistes, à une intersection ou à un carrefour et donc d'augmenter la sécurité de ces derniers.
Pour se familiariser davantage avec les droits et les devoirs du cycliste, on pourra consulter la nouvelle rubrique du journal Libération rédigée par Julien Guillot (notre super datajournaliste et vélotafeur !) "Roues cool"
L'éducation à la santé⚓
Le vélo est le moyen de transport de tous les élèves : aucun permis n'est nécessaire, on le pratique depuis un très jeune âge et dans toutes les classes sociales même les plus populaires en raison de son faible coût (achat/récup'/location et entretien).
Pour toutes ces raisons, la promotion de la pratique du vélo dans l'éducation à la santé est idéale puisqu'on préconise une activité physique régulière, notamment auprès des plus jeunes qui sont de plus en plus touchés par la sédentarité. La question est aussi liée à l'ESR car la mobilité et l'activité physique font partie des questions aux épreuves d'ASSR.
Dans le cadre du Plan Vélo, le Gouvernement a lancé un programme "Savoir Rouler à Vélo". "Destiné aux enfants de 6 à 11 ans, ce dispositif vise à généraliser l'apprentissage du vélo et la formation nécessaire à une réelle autonomie sur la voie publique avant l'entrée au collège. Cette initiative interministérielle pensée au bénéfice direct des enfants et des familles, est pilotée par la ministre des Sports, avec le ministre de l'Éducation Nationale et de la Jeunesse, le ministre de l'Intérieur et la ministre des Transports, ainsi que la Sécurité Routière." (Source : https://www.education.gouv.fr/cid141021/lancement-du-programme-savoir-rouler-a-velo.html)
Le développement durable⚓
Ce datasprint aborde aussi le développement durable. Il s'agit ici de promouvoir un moyen de transport propre, décarboné en faisant souvent mentir les idées reçues, par exemple : le vélo est-il un moyen de déplacement dangereux ? Est-il uniquement réservé à du déplacement de loisirs ?
Il est aussi possible de coupler le jeu de données avec d'autres sur une thématique EDD : circulation, pollution, qualité de l'air... L'utilisation du vélo a-t-il un impact sur la circulation ou la qualité de l'air ? L'aménagement d'une piste cyclable sur une route très fréquentée a-t-elle des conséquences positives ou négatives sur la circulation sur cette même route ? à plus petite échelle ? a court ou à long terme ?
Il est impossible à l'échelle nationale de préconiser l'usage d'un jeu de données en particulier. Ceux-ci sont très disparates sur le territoire national : ils existent souvent mais pas partout, pas à la même échelle et pas toujours avec les mêmes caractéristiques (unités de mesure, méthodologie pour générer les données, nomenclatures utilisées...). A votre échelle, consultez les portails open-data de vos collectivités territoriales (municipalité, département, région) mais aussi data.gouv.fr pour voir ce qu'il est possible de faire sur ce point sur votre territoire.
Les données du datasprint⚓
Les médiateurs de l'Atelier Canopé qui accompagne votre classe vous fourniront le jeu de données au début du datasprint. Ils pourront établir avec vous l'échelle de territoire sur laquelle vous souhaitez travailler et ils couperont dans le jeu de données initial pour vous fournir uniquement les éléments dont vous avez besoin. Le jeu de données fourni au début du datasprint concernera donc les accidents corporels de la circulation impliquant les vélos sur un territoire déterminé en amont par l'enseignant et les médiateurs accompagnants.
Il est possible de conserver les données tous véhicules confondus, par exemple dans un but comparatif. Il ne faudra toutefois pas oublier que la problématique devra être centrée sur la pratique du vélo.
Le jeu de données initial
La base de données des accidents corporels de la circulation sert de matière première au travail de ce datasprint pédagogique. Elle recense les données de tous les accidents survenus sur une voie ouverte à la circulation publique, impliquant au moins un véhicule et ayant fait au moins une victime ayant nécessité des soins. Bien plus qu'une base de sécurité routière, elle comprends de très riches informations qui permettent de questionner la pratique du vélo par les champs de la sociologie, de l'aménagement du territoire, du développement durable et bien entendu de l'accidentologie. Publiées depuis 2005 jusqu'à 2017 par le ministère de l'Intérieur, ces données permettent également d'établir des comparaisons dans le temps.
La base de données des accidents corporels de la circulation est téléchargeable sur https://www.data.gouv.fr/fr/datasets/base-de-donnees-accidents-corporels-de-la-circulation/
Pour chaque année, 4 fichiers sont publiés. Il faudra télécharger les 4 fichiers, pour chaque année sur lesquelles vous souhaitez travailler.
- Un fichier principal appelé "caractéristiques"
- Un fichier "véhicules"
- Un fichier "lieux"
- Un fichier "usagers"
Un numéro d'indexation "Num_Acc" est attribué à chaque accident, il permet de relier les fichiers et les informations entre elles. Pour un accident identifié dans le fichiers caractéristiques, on retrouvera donc, sous le même numéro d'indexation, les informations concernant le lieux de l'accident dans le fichier "lieux" et les véhicules et usagers impliqués dans le fichier "véhicules" et "usagers". Quand un accident comporte plusieurs véhicules, il faut aussi pouvoir relier chaque véhicule à ses occupants. Ce lien est fait par la variable "Num_veh".
Le fichier de description des données
Le fichier de description des données permet de comprendre le jeu de données car celui-ci est extrêmement codifié afin de faciliter la saisie des unité des forces de l'ordre (police, gendarmerie, etc.) intervenues sur les lieux des accidents. Ce document indispensable donne la signification de chacune des nomenclatures utilisées dans la base.
Les étapes du travail⚓
Conseil :
Un datasprint pédagogique propose un cadre hybride et engageant propice à la créativité, à la collaboration et au questionnement. Les participants y développent des habilités numériques et critiques tout en construisant collectivement un savoir autour de la question explorée à travers un ou des datasets.
Pour favoriser ce développement, chaque étape peut se faire en groupe. La démarche réflexive et pratique qui conduit les élèves à la réalisation d'une datavisualisation commence souvent par un temps de réflexion en débranché. Après la prise de connaissance du jeu de données, chaque groupe formule la question qu'il se pose, indiquent avec quelles données il envisage d'y répondre et sous quelle forme (avec quel type de représentation graphique). Le numérique est bien ici un environnement de travail.
Rendre les données exploitables⚓
Décoder le fichier⚓
Les fichier de données initial est difficilement compréhensible tel quel. Il utilise une nomenclature chiffrée pour à la fois simplifier et uniformiser la saisie. Cette étape n'est pas indispensable mais elle peut permettre de gagner du temps par la suite afin de ne pas revenir constamment au fichier de description, document qui permet de traduire les codes utilisés par les opérateurs de la saisie des données. On peut ainsi demander aux élèves de remplacer les nomenclatures utilisées dans le fichier par des éléments textuels plus compréhensibles.
Méthode : Remplacer les nomenclatures utilisées dans le fichier
Dans chaque tableur, il existe une fonction de recherche et de remplacement en général accessible via le menu.
Sheets (Google) : menu "Edition" --> "Rechercher et remplacer"
Calc (Libre Office) : menu
Excel (Microsoft) : menu "Accueil" --> "Rechercher et sélectionner"
Ajouter le point manquant à la latitude et à la longitude⚓
Méthode : Ajouter un caractère dans une cellule
Modifier Latitude et Longitude (ajouter les points) :
Latitude : =GAUCHE(O2;2)&"."&STXT(O2;3;5)
Longitude : =GAUCHE(P2;1)&"."&STXT(P2;2;5)
Ajouter le type de véhicule dans l'onglet "Usagers"⚓
Cette étape peut être effectuée en amont du datasprint par votre Atelier Canopé de proximité si vous la jugez utile et si le niveau de votre classe ne vous permet pas de le faire avec les élèves. Discutez-en avec le médiateur ou la médiatrice qui vous accompagne durant ce datasprint.
Dans le fichier "véhicules", la colonne "catv" renseigne sur la catégorie des véhicules impliqués dans les accidents. Malheureusement, cette information n'est pas précisée dans le fichier "usagers" il est donc impossible dans l'état actuel de distinguer les usagers de vélos, les conducteurs de voitures, de poids lourds, de scooter, etc.
Ce tutoriel va vous permettre d'ajouter cette information aux fichier "usagers". Il est possible de le faire réaliser par les élèves si ceux-ci ont besoin de cette information pour réaliser leur datavisualisation.
Combiner le numéro d'accident et le numéro du véhicule⚓
Méthode :
Les fichiers véhicules et usagers contiennent tous deux une colonne avec le "num_acc" et une autre avec le "num_veh". Ce dernier est le "numéro de véhicule", il permet de distinguer les différents véhicules impliqués dans un accident ainsi que leurs usagers. Contrairement au "num_acc" qui est unique pour chaque accident, le "num_veh" ne l'est pas. Il est différent pour chaque véhicule au sein d'un accident mais à cause de sa construction, les mêmes "num_veh" reviennent de nombreuses fois dans le fichier. Pour créer un "num_veh" unique, nous allons accoler le "num_acc_ au "num_veh" dans une seule et même cellule.
A cette étape il s'agit de mettre en forme le fichier final pour mettre en évidence les usagers des vélo. Les manipulations se font donc à partir du fichier collaboratif et ses 4 onglets. La méthode proposée et les captures d'écran proviennent de Google Sheets.
Depuis l'onglet "véhicules 2017", travaillez sur la première colonne vide (normalement la colonne J). Nommez-la "num_acc_veh"
La formule CONCATENER va nous permettre d'accoler le contenu des colonnes "num_acc" (normalement en colonne A) et "num_veh" (normalement en colonne I).
Dans la colonne "num_acc_veh" tapez : =CONCATENER(A2;"_";I2) pour obtenir une cellule contenant le "num_acc" et le "num_veh" séparé par un underscore "_"
Dupliquez la formule à toutes les cellules de la colonne :
Double cliquez sur le coin inférieur droit de la cellule J2 qui inclue la formule de recherche pour répéter celle-ci jusqu'en bas de la colonne I.
Vous obtenez ainsi un numéro d'identification unique pour chaque véhicule du fichier.
Reproduisez exactement la même démarche dans l'onglet "usagers 2017"
Déplacez la colonne "num_acc_veh" en colonne A.
Méthode : Utiliser le "num_acc_veh" pour ajouter le type de véhicule au fichier "usagers"
Ce pas à pas vous montre la démarche pour mettre en évidence les cyclistes dans le fichiers "usagers". Il faudra suivre la même procédure pour les autres type de véhicules.
Dans l'onglet "usagers 2017" de votre fichier collaboratif, ajouter une colonne "catv".
Dans l'onglet "vehicules 2017", filtrez les données de la colonne "catv" pour ne conserver que les vélos :
Activer le filtre sur la colonne "catv" et paramétrez-le pour n'afficher que les cellules contenant "01". Les vélo sont codés par "01" (il se peut que votre tableur n'affiche que le "1" sans le 0 puisqu'il le reconnaît comme un nombre).
Dans SHEETS, cliquez sur le menu "données" puis "activer le filtre". Cliquez ensuite sur le filtre pour le paramétrer. Dans la fenêtre qui s'ouvre, cliquez sur "Effacer" pour désélectionner toutes les occurrences. Cliquez ensuite sur "1" pour le conserver que cette occurence dans les résultats. Enfin cliquez sur OK.
Copier le contenu de la colonne J, contenant désormais les "num_acc_veh" des vélos uniquement.
Rendez-vous dans l'onglet "usagers 2017".
Ajoutez deux colonnes à gauche de la colonne A qui contient les "num_acc_veh". La colonne A passe alors en colonne C.
Collez vos données précédemment copiées dans la colonne A encore vide.
Renommez la colonne A "num_acc_velos" et repérez la dernière ligne de données pour cette colonne.
Dans la colonne B, dans la cellule B2, ajoutez la formule suivante : =RECHERCHEV(C2;$A$2:$A$91;1;0)
Remplacez ici 491 par le numéro de la ligne que vous avez repérée dans l'étape précédente.
Dupliquez maintenant la formule sur toutes les lignes du document. Il faudra alors utiliser un raccourci clavier :
Copier d'abord le contenu de la cellule B2 avec le raccourci clavier Ctrl + C
Appuyez ensuite sur la flèche de droite pour vous placez dans la cellule C2 et appuyez sur : Ctrl + ↓. Ceci vous emmène en bas de la colonne C, dans la dernière cellule comportant des données.
Appuyez ensuite sur la flèche de gauche pour vous placez sur la cellule d'à côté dans la colonne B.
Appuyez sur Ctrl + Shift (majuscules sans verrouillage) +↑ pour sélectionner toutes les cellules entre celles où vous vous trouvez et le haut de la colonne.
Enfin appuyez sur Crtl + V pour coller votre formule dans chacune de ces cellules.
Si les caractères "#N/A" apparaissent dans la cellule c'est que le "Num_Acc_veh" présent en cellule C2 n'a pas été repéré dans la liste "Num_Acc_veh". Le véhicule auquel il correspond n'est donc pas d'un vélo.
En revanche, si le "Num_Acc_veh" apparait dans la colonne B c'est qu'il est bien présent dans la colonne "Num_Acc_velos", il vous faut donc le conserver.
Activez le filtre sur la colonne B dans laquelle vous avez effectué la recherche.
Paramétrez le filtre pour n'afficher que les vélos :
Cliquez sur le filtre en en-tête de colonne. Dans la fenêtre qui apparaît, cliquez sur "Tout sélectionner" puis décocher "(Vides)" et "#N/A" de la liste des occurrences pour ne conserver que les usagers de vélos. Cliquez ensuite sur OK.
Dans les lignes de données obtenues, ajoutez "1" dans la colonne "catv" si vous souhaitez réutiliser les nomenclatures utilisées pour la création du jeu de données initial, ou vélo si vous avez simplifié la lecture du jeu de données par un décodage.
Compléter les données⚓
Trouver des données complémentaires⚓
Le jeux de données initial peut par exemple être complété avec des données sur la circulation, la qualité des l'air, les équipements de garage, ou les points vélos en libre service... Il est impossible à l'échelle nationale de préconiser l'usage d'un jeu de données en particulier. Ceux-ci sont très disparates sur le territoire national : ils existent souvent mais pas partout, pas à la même échelle et pas toujours avec les mêmes caractéristiques (granularité, unités de mesure, méthodologie pour générer les données, nomenclatures utilisées...).
La plateforme ouverte des données publiques françaises
Vous y trouverez des jeux de données nationaux issus de différents ministères mais également des jeux de données locaux ! Par exemple pour une recherche "pistes cyclables" on obtient des résultats concernant Saint-Paul-Les-Dax, Grenoble, la Gironde, Metz Métropole, Saint-Denis, l'agglomération de Saint-Quentin... etc.
La plateforme ouverte des données publiques françaises : https://www.data.gouv.fr/fr/
Les portails open data locaux
Certaines collectivités territoriales, administrations ou associations ont développé leur propre portail open data. Ils ne sont pas à négliger car tous les jeux de données qui s'y trouvent ne sont pas forcément présents sur la plateforme nationale.
Exemple de portail open data territorial : https://data.angers.fr/pages/home/
La Plateforme Nationale de Fréquentations
Animée par Vélo & Territoires elle permet de mutualiser, d'agréger et de communiquer sur des données de comptages vélo au niveau national sur la base de données collectées au niveau local. Lancée en septembre 2013, la PNF rassemble plus de 690 compteurs vélo partagés par plus de 76 collectivités propriétaires des compteurs. Ce projet est cofinancé par la Coordination interministérielle pour le développement de l'usage du vélo et a été soutenu par l'Ademe à son lancement.
Nous sommes en contact avec eux afin d'obtenir les jeux de données brutes. Dans l'attente de ces jeux de données, vous pouvez déjà repérer les compteurs sur votre territoire et vous faire une idée de leur fréquentation journalière, hebdomadaire ou mensuelle.
La Plateforme Nationale des Fréquentations (PNF) : http://www.eco-public.com/ParcPublic/?id=891
Ajouter les coordonnées géographiques manquantes⚓
La latitude et la longitude ne sont pas toujours complétées dans le fichier de données. Il est possible d'utiliser l'adresse de l'accident pour les retrouver.
Sur un petit volume de données, en collaboratif
Lors d'un travail collaboratif sur un fichier en ligne, il sera possible de demander aux élèves de retrouver manuellement les latitudes et les longitudes des lignes de données ou l'information est manquante. Pour cela, il faudra se répartir le travail et confier des lignes de données précise à chaque élèves ou groupe d'élèves.
Rendez-vous sur Google Maps et recherchez l'adresse de l'accident.
Cliquez du bouton droit de la souris sur le repère ainsi obtenu et choisissez "Plus d'infos sur cet endroit"
La latitude et la longitude apparaissent alors en bas de la fenêtre.
Vous pouvez alors les sélectionner avec la souris et les copier dans votre fichier de données.
La latitude apparaît en premier avant la virgule, la longitude en second. Sur le territoire métropolitain, la latitude est comprise entre 41 au Sud et 51 au Nord et la longitude entre -4 à l'Ouest et 8 à l'Est, le méridien de Greenwich coupant la France en deux.
Sur un grand volume de données
Il est possible d'importer un grand volume d'adresses dans des outils de géocodage et ainsi de récupérer les latitudes et longitudes correspondantes à chacune des adresses entrées.
Vous pouvez par exemple utiliser l'outil gratuit en ligne Batch geocoder for journalists
Indiquer le pays dans le champs "Indicate Country" afin de limiter les erreurs de géocodage.
Copier vos adresses directement depuis votre fichier dans le champs "Copy and past a list of locations". Chaque adresse doit apparaître sur une ligne différente et comporter au moins la voie et la ville ou un code postal (il faudra modifier votre fichier de données en ce sens).
Cliquer sur le bouton bleu "Add to geocoder"
Vos résultats s'affichent en direct sur la carte. L'outil vous indique en vert les points dont il est sûr, en orange ceux sur lesquels il a un doute, et en rouge ceux qu'il n'a pas réussi à géocoder. Après cette étape, vous pouvez valider ou modifier chacun des points, ce qui rend l'outil très pratique. Les parenthèses utilisées dans le fichier de données poseront en général problème, ainsi que les rue dont le nom a changé depuis l'accident.
Traiter les données⚓
Des calculs sont en général nécessaires à la réalisation de graphiques. Le tableur propose pour cela des fonctionnalités bien utiles : les filtres, faire des calculs simples, le tableau croisé dynamique, ... etc.
Le tableau croisé dynamique⚓
Le tableau croisé dynamique est une fonctionnalité des tableurs qui permet de générer un tableau de synthèse à partir de données. Il permet de regrouper les données identiques et d'en calculer le nombre d'occurrences. Il est le préalable à beaucoup de graphiques générés à partir d'un jeu de données.
Exemple : Je souhaite calculer le nombre d'accidents survenus chaque mois de l'année
Dans Google Sheets :
Dans l'onglet "caractéristiques 2017", sélectionnez la colonne "mois".
Dans le menu "Données", choisissez "Tableau croisé dynamique".
Cochez l'option "Nouvelle feuille" et cliquez sur "Créer" pour que votre tableau croisé dynamique soit créé dans un nouvel onglet. Pensez à le renommer.
Votre tableau est créé mais il est vide. Il faut maintenant le paramétrer pour qu'il prenne en compte vos données.
Dans l'éditeur de tableau croisé dynamique à droite de votre écran, cliquez sur le bouton "Ajouter" en face de "Lignes" et ajoutez les "mois"
Les différents mois de l'année apparaissant dans la colonne "mois" de votre fichier de données sont ainsi répartis sur les différentes lignes de votre fichier.
En cliquant plutôt sur le bouton "Ajouter" en face de "Colonnes" dans l'éditeur, vous auriez obtenu les mois répartis en colonnes.
Par défaut, les mois apparaissent classés dans l'ordre croissant, mais vous pouvez choisir de les classer par ordre décroissant.
Pour compter le nombre d'occurences de chacun des mois dans le fichier de données, cliquez maintenant sur le bouton "Ajouter" en face de "Valeurs" et sélectionnez une nouvelle fois les "mois"
Dans le champs "Synthétisez via", modifier le paramètre par défaut "SUM" en "COUNT"
Vous obtenez ainsi un tableau comptabilisant le nombre d'accidents pour chaque mois de l'année.
Réaliser les datavisualisations⚓
La datavisualisation sert à rendre visibles et lisibles des données. Elle permet d'en faciliter la compréhension en les retranscrivant sous une forme visuelle (graphiques, cartes, infographie / tableaux de bord...).
Attention :
Pour chaque datavisualisation il est essentiel de citer la source des données ainsi que le nombre de données sur lesquelles se basent vos calculs. De même le choix de l'échelle et des couleurs sont à travailler car se sont des éléments clés pour la compréhension de la représentation graphique mais aussi des éléments qui peuvent en modifier la perception (lire
"Sept conseils pour ne pas se faire avoir par les représentations graphiques", un article de Mathilde Damgé, publié dans Le Monde, Les Décodeurs, le 22 mai 2018.)
La légende, les unités de mesure, les graduations sont essentiels à la lecture, il ne faut pas les négliger.
Les graphiques⚓
Chaque type de graphique a son utilité, sa fonction. Certains permettent de comparer des valeurs entre plusieurs catégories, des proportions, d'autres de montrer des tendances dans le temps, ou encore de représenter des relations entre les données.
Le catalogue dataviz (en anglais) pourra aider à connaître les possibilités et les outils pour les réaliser. Attention toutefois car certains de ces outils sont payants ou nécessitent une connexion. Voici ceux que nous pouvons vous conseiller :
Réaliser des graphiques avec le tableur
C'est sans doute la solution la plus simple. Votre tableur vous permet de générer des graphiques à partir des données de votre fichier, souvent depuis le menu "Insertion". Vous pourrez choisir l'échelle, les couleurs, la police. Vous y retrouverez les graphiques les plus courants, par exemple :
Les diagrammes en barres permettent de comparer des valeurs entre plusieurs catégories. Des barres empilées permettent de montrer la composition d'une catégorie. Des barres multiples permettent de constituer des groupes (pour une bonne lisibilité, il ne faut pas aller au delà de 3 barres par groupe)
Les diagrammes en secteur (appelés parfois affectueusement "camemberts") permettent de représenter des proportions. Le cercle représente une totalité - 100%, et chaque part du graphique correspond à un pourcentage de ce total. Si votre outil le permet, il est conseillé de ranger les différentes part par ordre croissant, avec la plus grande part dans la partie supérieure. Si les sections sont trop nombreuses ou trop faibles en pourcentage, la lecture du graphique en sera altérée. Le diagramme en secteur n'est pas un graphique de comparaison (préférer le diagramme en barre), il est préférable de ne pas l'utiliser au delà de 2 données.
Les courbes montrent les variations de valeurs dans le temps. Le graphique peut en inclure plusieurs et les distinguer par des couleurs afin de comparer leurs tendances. Elles peuvent être pleines ou empilées.
Les nuages de points permettent de représenter les relations entre les données et représenter une tendance entre deux variables
Les radars permettent de comparer les variations de données. L'échelle part du centre. Pour plus de lisibilité il est conseillé de limiter le nombre de valeurs.
Réaliser des graphiques avec les outils en ligne
De nombreuses plateformes en ligne permettent aujourd'hui de réaliser des datavisualisations classiques mais aussi plus complexes, dynamiques, qu'il est impossible de réaliser avec un simple tableur. Malheureusement, la plupart de ces plateformes sont en anglais et nécessitent une connexion.
Rawgraphs : https://rawgraphs.io/ (sans connexion) est une plateforme opensource de datavisualisation
Il est possible d'importer ses données sans connexion par un simple copier/coller, une importation de fichier ou encore depuis une URL.
On peut par exemple y réaliser des dendrogrammes circulaires ou des diagrammes alluviaux. Comment faire un diagramme alluvial sur rawgraphs.io ? Toutes les étapes sont expliquées sur leur site (en anglais) : https://rawgraphs.io/learning/how-to-make-an-alluvial-diagram/
Flourish : https://flourish.studio/ (avec connexion)
Plateforme permettant de réaliser facilement des datavisualisations. Elle permet par exemple de réaliser une "bart chart race", une vidéo montrant les évolutions sur une longue période sous forme d'un diagramme en bâtons dynamique.
Knightlab : https://knightlab.northwestern.edu/projects/#storytelling (nécessite un compte google)
La cartographie⚓
Khartis
Khartis est un logiciel conçu par Sciences Po, simple à prendre en main et en français. Il existe une version en ligne et une version à installer localement sur votre machine. Cela ne demande pas d'authentification, comme la plupart des autres logiciels de ce type.
L'Atelier cartographie de Sciences Po, à l'origine de ce logiciel a mis en ligne une documentation très riche pour vous aider à prendre en main cet outil. N'hésitez pas à consulter la rubrique tutoriels.
--> https://www.sciencespo.fr/cartographie/khartis/docs/index.html
Exemple de carte réalisée à l'aide de Khartis qui localisent les 124 accidents impliquant des vélos dans le Maine-et-Loire en 2017 :
Carte réalisée par Hervé Brunet - Médiateur Ressources et Services Numérique et Innovation à l'Atelier 49
Umap
Umap permet de créer des cartes personnalisées sur les fonds de carte d'OpenStreetMap
--> https://umap.openstreetmap.fr/
Vous pourrez par exemple choisir le calque "OSM OpenCycleMap" pour placer vos données sur un fond de carte qui met en évidence les grandes voies cyclables du territoire français.
Vous pourrez importer vos propres données sur des calques différents et gérer leur mise en forme sur chacun des calques utilisés.
A la fin du travail, vous pourrez exporter votre carte sous le format de votre choix pour la réimporter dans un logiciel de cartographie ou bien copier le code d'intégration de la carte pour l'ajouter sur un blog ou un site web. Elle gardera ainsi son aspect interactif (zoom/dezoom).
Pour la réalisation d'un poster ou d'une infographie, il vous sera bien sûr possible de faire une capture d'écran.
Des outils de cartographie interactive
Knightlab (nécessite un compte google) : https://storymap.knightlab.com/select/
Arcgis (nécessite un compte) : https://www.arcgis.com/apps/
Les infographies⚓
Les infographies
Exemple d'infographie réalisée avec les données 124 accidents impliquant des vélos dans le Maine-et-Loire en 2017 :
Réalisée par Hervé Brunet - Médiateur Ressources et Services Numérique et Innovation à l'Atelier 49
Le storytelling⚓
Les datavisualisations d'une classe doivent être regroupées sur un même document. C'est l'occasion de travailler le storytelling de leur réflexion collective : comment relier leurs questionnements de groupe ?
La forme du document final est libre, il n'y a pas de prescription : blog, site web, poster, carte ou timeline interactive, vidéo (une bonne occasion de travailler aussi l'oral ?), etc.
La forme est à travailler en liaison avec le contenu. Pour uniformiser les productions des élèves on pourra réfléchir à une charte graphique : couleurs, police et taille.
Le suivi du projet⚓
Votre Atelier Canopé de proximité vous accompagne. Vous pouvez discuter avec lui de l'accompagnement qu'il peut vous apporter sur ce projet.
Carte des Ateliers intéressés : 33
Le calendrier⚓
Jusqu'au 19 Octobre : inscription des classes par les médiateurs des Ateliers Canopé
Septembre/Octobre : temps de formation en Ateliers pour les professeurs participants
4 Novembre 2019 : envoi du fichier de données initial dans les classes
30 Novembre 2019 : retour des travaux d'élèves
Décembre 2019 : valorisation des travaux sur la plateforme data.gouv.fr
Mai/Juin 2020 : valorisation pendant la Semaine nationale de la marche et du vélo à l'école et au collège
La communauté sur Twitter⚓
Ateliers Canopé, médiateurs, professeurs, classes : montrez votre progression dans le datasprint pédagogique, interpellez des professionnels, posez vos questions et présentez vos travaux via Twitter ! Nous construirons ainsi une vraie communauté et nous avancerons tous ensemble dans cette aventure.
N'oubliez pas les deux hashtags :
#Traces2roues : pour parler du datasprint pédagogique, montrer votre avancée, présenter vos travaux.
#T2RTeam : pour interpeller les membres de la communauté, partager des astuces, donner des idées, poser des questions.
Vous pouvez bien entendu mettre les deux hashtags dans un seul tweet ;)
Pour nous contacter via Twitter :
@Canope_94 : le compte de l'Atelier
@Jul_Dum : le compte de Julia Dumont, cheffe du projet --> faites moi remonter vos comptes Twitter, je constituerai ainsi une liste à laquelle vous pourrez vous abonner.
La publication des travaux des élèves⚓
Contribuer aux communs
Le datasprint pédagogique Traces2roues appuyé par un partenariat avec la mission Etalab. Celle-ci coordonne les actions des administrations de l'Etat et leur apporte son appui pour faciliter la diffusion et la réutilisation de leurs informations publiques. Elle développe et anime la plateforme d'open data data.gouv.fr. Cette plateforme collaborative permet de publier des jeux de données publics mais aussi des réutilisations de ces jeux de données. A l'issu du datasprint, les travaux des élèves y seront ainsi publiés en tant que réutilisation du jeu de données initial.
Les travaux d'élèves ont toute leur place sur cette plateforme. La valorisation est double : pour les élèves et pour la plateforme qui attire ainsi de nouveaux publics.
Dans une logique de contribution aux communs du numérique, les travaux d'élèves seront publiés sous licence Creative Common. Avant publication des travaux, il est nécessaire de faire signer une autorisation aux élèves et à leurs parents. Votre Atelier Canopé de proximité vous communiquera le document.
Il faudra aussi apposer le logo de la licence sur les travaux des élèves. La licence qui a été choisie est la licence CC BY. Elle permet aux autres de réutiliser, modifier, remixer le travail qui fait l'objet de la licence. La seule obligation est de citer le nom de son auteur. C'est la licence la plus ouverte.
La publication des travaux sur data.gouv.fr
Les travaux des élèves seront publiés sous le compte Réseau Canopé de data.gouv.fr. L'Atelier Canopé qui vous accompagne se chargera de la publication des travaux de vos élèves sur le compte Réseau Canopé. une fois publiés, la mission Etalab (mission placée au sein de la Direction interministérielle du numérique et du système d'information et de communication de l'État) se chargera de valoriser les productions sur la page d'accueil du site data.gouv.fr. Vous pourrez vous aussi communiquer le lien autour de vous.
Les Open Badges⚓
Des badges de compétences sont en cours d'élaboration. Le travail réalisé durant toute la durée du datasprint pédagogique donnera lieu à la remise de ces badges aux élèves, aux enseignants et aussi aux médiateurs qui auront accompagné les classes. Ils pourront être validés via la plateforme Open Badge Factory.
La typologie des badges (en cours d'élaboration)
La typologie proposée ici a été conçue pour correspondre à des dispositifs ancrés dans le champ des Humanités Numériques. Elle pourra donc être réutilisée à d'autres occasions.
Un méta badge "Datasprinteur" est également prévu. Il pourra être obtenu après avoir validé plusieurs badges. Nous les mettrons sur OpenBadgeFactory dès que possible !