Un datasprint pédagogique est un dispositif de médiation numérique des savoirs contributif limité dans le temps où les participants unissent leurs compétences pour explorer, augmenter un jeu de données et proposer des visualisations éclairant une question déterminée. Il propose un cadre hybride et engageant propice à la créativité, à la collaboration, au questionnement. Les participants y développent des habilités numériques et critiques tout en construisant collectivement un savoir autour de la question explorée à travers un ou des datasets. Aucune expertise initiale, technique ou scientifique n'est requise.
Le datasprint pédagogique s'inscrit dans le cadre de la classe contributive. C'est un levier pour la construction des savoirs des élèves — savoirs en soi / savoirs pour soi — , de formation à l'adulte, de compréhension d'un territoire, d'exploration d'une problématique.
Développer le vélo comme moyen de transport responsable⚓
Depuis quelques années, le vélo revient dans les pratiques des Français. Son développement devient un enjeu de santé publique : c'est un mode de déplacement propre pour l'environnement, qui peut remplacer la voiture sur de petits trajets et qui génère une pratique sportive régulière. Depuis la rentrée 2018, un plan vélo est mis en place pour inciter les Français à utiliser davantage leur bicyclette. En 1970, le vélo représentait 10% de leurs déplacements ; aujourd'hui 2,7 % seulement. L’État souhaiterait s'approcher à nouveau des 10% en 2024. Pour cela, il entent :
augmenter le nombre de pistes cyclables sur le territoire
développer les vélos en libre service
améliorer la sécurité des déplacements à vélo
On voit alors que la pratique du vélo est liée à de nombreux questionnements disciplinaires et transdisciplinaires, mêlés les uns aux autres.
Les mobilités⚓
L'émergence des NVEI (nouveaux véhicules électriques individuels) a modifié les petits trajets du quotidien pour de nombreux usagers. Sur de courtes distances ou de manière multimodale, les NVEI se multiplient notamment en ville. Trottinette électrique, mono-roue, hoverboard... le vélo lui aussi s’électrise et permet des déplacements plus rapides et moins fatigants, donc sur de plus longues distances.
Le développement du vélo électrique a contribué à faire grossir la communauté des vélotaffeurs, ceux qui utilisent leur vélo pour leurs trajets du quotidiens et notamment pour aller au "taf", au travail (vous obtiendrez quelques chiffres clés pour votre région sur le site de l'INSEE). On n'oubliera pas toutefois tous ceux qui pratiquent le vélo en tant que loisir et/ou pour le sport. D'ailleurs sur ce point, y a-t-il une vraie distinction entre ville et campagne ? Le phénomène des cyclotaffeurs est-il plutôt urbain alors qu'on trouverait plus de pratique sportive ou de loisir en milieu rural ?
Avec les données il est aussi possible de se représenter sociologiquement les cyclistes, vélotaffeur ou non. Les vélotaffeurs sont-ils réellement plus nombreux qu'auparavent ? Quelle est la part des femmes ? L'âge médian évolue-t-il ? etc...
L'aménagement du territoire⚓
L'aménagement du territoire est directement lié au développement du vélo car des aménagements réfléchis peuvent rendre sa pratique plus simple, moins coûteuse et plus sécurisée. L'installation de bornes de vélos en libre service ou de garages à vélo près des gares ou des stations de transport en communs peut favoriser les déplacements multimodaux ; tout comme la présence d'espaces réservés aux vélos dans les trains petites et grandes lignes. Comment mesurer l'efficacité des aménagements avec les données ? Se développent-ils partout ? A quel rythme aménage-t-on des pistes cyclables par exemple ? Et aussi, quel type de piste cyclable est plus efficace en terme de sécurité des cyclistes ? Quels sont les lieux les plus dangereux pour les vélos ? Avec les données, il est possible de cartographier les accidents : les informations dont on dispose associées à un déplacement sur le terrain peuvent permettre de comprendre la dangerosité du lieu. Dans une démarche d'engagement citoyen, il peut être intéressant, analyse des données à l'appui, de proposer les aménagements nécessaires pour réduire le risque d'accident.
Ces nombreux aménagements répondent aujourd'hui forcément à une démarche de développement durable : les nouveaux aménagements doivent apporter des bénéfices écologiques, économiques et sociaux.
La création régulière de ces nouvelles pistes vient parfois diminuer l'espace alloué aux voitures et les cyclistes se plaignent eux aussi régulièrement des véhicules qui circulent ou stationnent sur les voies qui leur sont réservées. Les conflits d'usage de la route sont ainsi très fréquents. On le voit bien aujourd'hui, le développement des NVEI pose des problème de cohabitation, notamment dans les espaces urbains déjà saturés.
La sécurité routière⚓
Même si les cyclistes semblent avoir été détrônés par les usagers des trottinettes électriques (en ce moment du moins et seulement dans les villes où le service s'est développé), ils ont pour habitude de cristalliser le mécontentement des piétons et des automobilistes qui les accusent d'être des dangers publics, de griller des feux ou de rouler sur les trottoirs. Alors les cyclistes respectent-ils le code de la route et les recommandations de sécurité routière ? Portent-ils un casque ? Un système réfléchissant ? Le port de ces équipements leur évitent-il des accidents ?
La relation des cyclistes avec les autres usagers de la route est un autre élément sur lequel il est possible de réfléchir. Avec quel type de véhicules, les vélos ont-ils le plus d'accidents ? Est-ce les mêmes en ville ou à la campagne ? Et d'où vient le danger ?Les données peuvent également permettre de dresser une représentation visuelle des points d'impact du vélo.
Si, contrairement au NVEI, la réglementation pour les vélos est claire, elle est encore assez méconnue. Beaucoup d'entre nous ignorent encore certaines réglementations récentes. Les vélos électriques rapides (pouvant dépasser les 25km/h jusqu'à 45 km/h) sont régis par la réglementation des cyclomoteurs : ils doivent être immatriculés, le port d'un casque homologué est obligatoire et surtout ils ne peuvent pas circuler sur les pistes cyclables. Des villes ont également mis en place des réglementations particulières comme le cédez-le-passage cycliste au feu (plus communément appelé le "tourne à droite") qui permet de dissocier le démarrage des véhicules motorisés de celui des cyclistes, à une intersection ou à un carrefour et donc d'augmenter la sécurité de ces derniers.
Pour se familiariser davantage avec les droits et les devoirs du cycliste, on pourra consulter la nouvelle rubrique du journal Libération rédigée par Julien Guillot (notre super datajournaliste et vélotafeur !) "Roues cool"
L'éducation à la santé⚓
Le vélo est le moyen de transport de tous les élèves : aucun permis n'est nécessaire, on le pratique depuis un très jeune âge et dans toutes les classes sociales même les plus populaires en raison de son faible coût (achat/récup'/location et entretien).
Pour toutes ces raisons, la promotion de la pratique du vélo dans l'éducation à la santé est idéale puisqu'on préconise une activité physique régulière, notamment auprès des plus jeunes qui sont de plus en plus touchés par la sédentarité. La question est aussi liée à l'ESR car la mobilité et l'activité physique font partie des questions aux épreuves d'ASSR.
Dans le cadre du Plan Vélo, le Gouvernement a lancé un programme "Savoir Rouler à Vélo". "Destiné aux enfants de 6 à 11 ans, ce dispositif vise à généraliser l'apprentissage du vélo et la formation nécessaire à une réelle autonomie sur la voie publique avant l'entrée au collège. Cette initiative interministérielle pensée au bénéfice direct des enfants et des familles, est pilotée par la ministre des Sports, avec le ministre de l'Éducation Nationale et de la Jeunesse, le ministre de l'Intérieur et la ministre des Transports, ainsi que la Sécurité Routière." (Source : https://www.education.gouv.fr/cid141021/lancement-du-programme-savoir-rouler-a-velo.html)
Le développement durable⚓
Ce datasprint aborde aussi le développement durable. Il s'agit ici de promouvoir un moyen de transport propre, décarboné en faisant souvent mentir les idées reçues, par exemple : le vélo est-il un moyen de déplacement dangereux ? Est-il uniquement réservé à du déplacement de loisirs ?
Il est aussi possible de coupler le jeu de données avec d'autres sur une thématique EDD : circulation, pollution, qualité de l'air... L'utilisation du vélo a-t-il un impact sur la circulation ou la qualité de l'air ? L'aménagement d'une piste cyclable sur une route très fréquentée a-t-elle des conséquences positives ou négatives sur la circulation sur cette même route ? à plus petite échelle ? a court ou à long terme ?
Il est impossible à l'échelle nationale de préconiser l'usage d'un jeu de données en particulier. Ceux-ci sont très disparates sur le territoire national : ils existent souvent mais pas partout, pas à la même échelle et pas toujours avec les mêmes caractéristiques (unités de mesure, méthodologie pour générer les données, nomenclatures utilisées...). A votre échelle, consultez les portails open-data de vos collectivités territoriales (municipalité, département, région) mais aussi data.gouv.fr pour voir ce qu'il est possible de faire sur ce point sur votre territoire.
Préparer les données⚓
Vous retrouverez ci-dessous toutes les explications pour préparer les fichiers de données à fournir à vos classes, deux tutoriels vous sont proposés : les tutoriels en vidéo (merci Philippe Chadefaux) et les tutoriels écrits illustrés par des captures d'écran.
Le jeu de données source⚓
La base de données des accidents corporels de la circulation
La base de données des accidents corporels de la circulation sert de matière première au travail de ce datasprint pédagogique. Elle recense les données de tous les accidents survenus sur une voie ouverte à la circulation publique, impliquant au moins un véhicule et ayant fait au moins une victime ayant nécessité des soins. Bien plus qu'une base de sécurité routière, elle comprends de très riches informations qui permettent de questionner la pratique du vélo par les champs de la sociologie, de l'aménagement du territoire, du développement durable et bien entendu de l'accidentologie. Publiées depuis 2005 jusqu'à 2017 par le ministère de l'Intérieur, ces données permettent également d'établir des comparaisons dans le temps.
La base de données des accidents corporels de la circulation est téléchargeable sur https://www.data.gouv.fr/fr/datasets/base-de-donnees-accidents-corporels-de-la-circulation/
Pour chaque année, 4 fichiers sont publiés. Il faudra télécharger les 4 fichiers, pour chaque année sur lesquelles vous souhaitez travailler.
- Un fichier principal appelé "caractéristiques"
- Un fichier "véhicules"
- Un fichier "lieux"
- Un fichier "usagers"
Un numéro d'indexation "Num_Acc" est attribué à chaque accident, il permet de relier les fichiers et les informations entre elles. Pour un accident identifié dans le fichiers caractéristiques, on retrouvera donc, sous le même numéro d'indexation, les informations concernant le lieux de l'accident dans le fichier "lieux" et les véhicules et usagers impliqués dans le fichier "véhicules" et "usagers". Quand un accident comporte plusieurs véhicules, il faut aussi pouvoir relier chaque véhicule à ses occupants. Ce lien est fait par la variable "Num_veh".
Le fichier de description des données
Le fichier de description des données permet de comprendre le jeu de données car celui-ci est extrêmement codifié afin de faciliter la saisie des unité des forces de l'ordre (police, gendarmerie, etc.) intervenues sur les lieux des accidents. Ce document indispensable donne la signification de chacune des nomenclatures utilisées dans la base.
Récupérer le jeu de données compilé par Koumoul.fr⚓
Koumoul.fr est une plateforme bretonne de visualisation, d'exploitation et de partage de données. Elle met à disposition un fichier de données composé à partir de notre fichier source, la base de données des accidents corporels de la circulation. Ce fichier :
Comprend uniquement les accidents du jeu de données primaire impliquant au moins 1 vélo
Compile les accidents de tous les fichiers annuels présents sur data.gouv.fr il comprend donc tous les accidents depuis 2005.
Réunit les 4 fichiers du jeu de donnée primaire en un seul csv (la compilation impliquent des modifications, des ajouts ou de suppression de champs)
Décode le jeu de données primaire et utilise les éléments du fichier de description à la place des codes chiffrés.
Ce fichier secondaire est répertorié sur data.gouv.fr, il peut être transmis comme document de travail aux classes participantes en précisant bien qu'il s'agit d'une source secondaire et qu'en cas de doute, un retour au fichier de données primaire est nécessaire. Il est donc indispensable de fournir également le lien vers le fichier primaire et d'indiquer aux classes comment retrouver un accident, un usager ou un véhicule à l'intérieur (avec le Num_Acc notamment).
Méthode :
Liens vers le fichier secondaire de Koumoul.fr :
Lien sur data.gouv.fr : https://www.data.gouv.fr/fr/datasets/accidents-de-velo-en-france/
Lien sur koumoul.fr : https://koumoul.com/datasets/accidents-velos
Le fichier de description des champs est disponible sur la page du jeu de données sur Koumoul.fr par le bouton suivant :
Ce fichier de données est national, il vous faudra le réduire au territoire voulu avant de le transmettre aux classes. Pour cela :
Ouvrez le fichier avec Libre Office.
Sélectionnez la colonne du département en F (ou de la commune en G).
Cliquez sur le bouton "AutoFiltre" dans la barre d'outil ou ouvrez le menu "Données" et choisissez "AutoFiltre".
Cliquez sur la flèche à droite de la cellule d'en-tête de colonne pour paramétrer le filtre.
Décochez la case "Tout" en bas de la fenêtre.
Cochez uniquement les numéros de département (ou de commune) qui vous intéressent dans la liste.
Cliquez sur "OK"
Les lignes de données qui restent à l'écran sont celles qui concernent le territoire recherché. Vous pouvez désormais copier ces lignes et les coller dans un nouveau fichier que vous transmettrez aux classes le 4 Novembre 2019 pour le lancement du datasprint.
Conseil : Quel format de fichier pour les classes ?
Les médiateurs veilleront à transmettre le jeu de données au format CSV, un format qui n'est pas un format propriétaire et qui permet une ouverture du jeu de données avec n'importe quel tableur.
Le choix de l'outil tableur dépend des usages et de l'équipement en établissement. Si cela est possible, l'utilisation par les élèves d'un outil collaboratif en ligne (Google Sheets, Excel 360, Framacalc, ...) peut permettre une travail de coopération plus efficace, pour répartir les tâches ou les données entre les groupes. Les élèves travaillent ainsi tous ensemble sur le même fichier, tous ont accès aux données retravaillées par les autres.
Composer soi-même le jeu de données⚓
Délimiter le cadre géographique⚓
Conseil :
Le choix du cadre géographique ne peut être prescrit en amont, tant les situations sont différentes entre un cadre urbain ou rural, une politique tendant à soutenir le développement du vélo ou non, etc. Se limiter à une ville, à un département ou à une région est un choix pédagogique qui a des répercutions sur le nombre de données à traiter durant le datasprint. Il faut savoir que les accidents de la circulation impliquant des vélos et des blessés ne sont pas si nombreux que cela. Par exemple, en 2017 à Marseille, il y en a eu 44 ; 86 si on prend tout le département des Bouches-Du-Rhône.
Étape 1 -Supprimer les données hors zone dans le fichier principal "caractéristiques"⚓
Méthode : Rechercher le bon COG
La première étape consiste à se rendre dans le fichier principal "caractéristiques".
Le département est codifié dans la colonne "dep", la commune dans la colonne "com". Ce sont les codes COG (Code Officiel Géographique) de l'INSEE qui sont utilisés ici.
Pour le département, il s'agit du COG suivi d'un 0 (sauf pour la Corse-du-Sud "201" et la Haute-Corse "202"). Exemple : le département des Bouches-Du-Rhône a pour COG = 13, son numéro dans la colonne "dep" est donc 130.
Pour la commune, il s'agit des deux ou des trois derniers chiffres du COG (les deux premiers étant justement le numéro du département). Exemple : Marseille a pour COG 13055, son numéro dans la colonne "com" est donc 55.
Vous pouvez rechercher les numéro de COG sur le site de l'INSEE : https://www.insee.fr/fr/recherche/recherche-geographique
Méthode : Composer un nouveau fichier avec les données du territoire qui vous intéresse
Une fois les bons COG de votre département et de votre ou de vos communes en main, vous allez pouvoir réduire le fichier de données et créer un nouveau fichier avec les données qui vous intéressent.
Ouvrez le fichier csv "caractéristiques-2017.csv
Activez les filtres en entête de colonne :
Dans Calc par exemple, sélectionnez l'onglet "données" puis "AutoFiltre". Un filtre apparaît ainsi sur chaque en-tête de colonne. il est symbolisé par une flèche vers le bas ou un entonnoir selon le logiciel utilisé.
Filtrez les données pour ne garder que le(s) COG qui vous intéresse(nt) :
Commencez par appliquer le filtre sur le département. Paramétrez le filtre de la colonne "dep"en cliquant sur la flèche ou l'entonnoir qui apparaît désormais dans l'entête de colonne.
Par défaut, tous les codes COG qui apparaissent dans la colonne sont cochés. Décochez les codes COG que vous ne souhaitez pas conserver. Pour aller plus vite, vous pouvez décocher le bouton "tout" afin de tout désélectionner. Il faudra ensuite recocher les codes COG correspondant à votre territoire.
Valider votre choix en cliquant sur OK. Dans votre tableau, n'apparaissent désormais que les lignes avec le COG sélectionné.
Si vous souhaitez circonscrire votre travail à quelques communes, suivez la même procédure dans la colonne "com". Cochez les COG des communes que vous souhaitez conservez et cliquez sur valider.
Vous ne pouvez pas filtrer les communes sans filtrer le département car des communes de deux départements différents peuvent avoir le même numéro. Ceci est en revanche impossible au sein d'un même département.
Copiez les données restantes :
Votre tableau affiche désormais uniquement les lignes concernant les départements et les communes de votre choix. Copiez alors l'intégralité du tableau afin de le coller dans un nouveau document.
Pour sélectionnez facilement tout le tableau vous pouvez appuyez sur les touches Ctrl + A de votre clavier. Vous pouvez également cliquez sur le bouton sélectionnez tout dans le coin supérieur gauche de votre feuille de calcul.
Appuyez ensuite sur les touches Ctrl + C pour copier votre sélection.
Collez les données dans un nouveau fichier :
Créez un nouveau fichier tableur avec l'outil de votre choix. Vous pouvez par exemple le nommer selon le modèle suivant : "codepostaldelétablissement_T2R"
Une fois le nouveau fichier ouvert, appuyez sur les touche Ctrl + V de votre clavier pour coller votre sélection.
Renommez votre feuille de calcul "caractéristiques 2017" en cliquant avec le bouton droit de la souris sur son onglet en bas de votre fenêtre (par défaut, celle-ci s'appelle "Feuille 1").
Créez dès maintenant 3 autres feuilles de calcul dans le même fichier et appelez les "lieux 2017", "véhicules 2017" et "usagers 2017" afin de réunir chacun des fichiers de données de la base dans le même tableur et de faciliter le travail des élèves.
Méthode : Tutoriel vidéo (jusqu'à 4'00 min)
Conseil : Quel outil tableur choisir ?
Le choix de l'outil tableur dépend des usages et de l'équipement en établissement. Si cela est possible, l'utilisation par les élèves d'un outil collaboratif en ligne (Google Sheets, Excel 360, Framacalc, ...) peut permettre une travail de coopération plus efficace, pour répartir les tâches ou les données entre les groupes. Les élèves travaillent ainsi tous ensemble sur le même fichier, tous ont accès aux données retravaillées par les autres.
Étape 2 - Supprimer les données hors zone dans les autres fichiers⚓
Méthode :
Les colonnes "dep" et "com" ne sont pas reportées dans les fichiers véhicules, usagers et lieux. On ne peut donc pas les utiliser pour réduire géographiquement ces fichiers. Pour y parvenir nous allons utiliser une fonction de comparaison de liste du tableur et comparer les "Num_Acc", numéros d'indexation présent dans chacun des fichiers). Nous allons demander au tableur de comparer la colonne "Num_Acc" du fichier "caractéristiques" que nous avons réduit géographiquement dans l'étape précédente, et celle de chacun des fichiers qui n'a pas encore été réduit. Le tableur nous dira ainsi quel "Num_Acc" apparaît dans les deux colonnes et donc quelles lignes nous allons pouvoir conserver.
Par exemple, si dans l'étape précédente j'ai circonscrit mon fichier "caractéristiques" au département de l'Ain (dep = 10) alors il me reste 413 lignes de données (+ la ligne d'en-tête). Il y a eu 413 accidents ayant nécessité une intervention dans le département de l'Ain en 2017. Je vais donc demander au tableur de retrouver les 413 "Num_Acc" obtenus dans les 103546 lignes de données du fichier "véhicules" qui à ce stade est encore national.
Commencez par copier la colonne "Num_Acc" du fichier "caractéristiques" une fois que celui-ci à été circonscrit à la zone géographique souhaitée.
Ouvrir le fichier de votre choix parmi les fichiers "véhicules", "usagers" ou "lieux".
Ajoutez deux colonnes au début du fichier, soit à gauche de la colonne A actuelle :
Avec le bouton droit de la souris, cliquez sur le A de la colonne A pour la sélectionnez entièrement et ouvrir le menu contextuel. Choisissez "Insérer des colonnes à gauche". Recommencer l'opération une seconde fois pour obtenir deux colonnes vides à gauche de la colonne "Num_Acc".
Collez les données copiées dans la première colonne et renommez là "Num_Acc_Geo" pour la distinguer de la colonne "Num_Acc" normalement en colonne C.
Nommez la colonne B "Num_Acc_Recherche".
Repérez la dernière ligne de données pour la colonne "Num_Acc_Geo"
Ici, il s'agit de la ligne 414 (j'ai figé la première ligne de mon tableau afin qu'elle apparaisse même lorsque je descends dans le document - dans Calc, onglet "Affichage" -->Fixer des cellules --> Fixer la première ligne)
Dans la colonne B, normalement encore vide, insérez la formule suivante en ligne 2 (la ligne 1 étant la ligne d'en-tête) : =RECHERCHEV(C2;$A$2:$A$414;1;0) (n'oubliez pas le "=" au début sinon cela ne sera pas reconnu comme une formule)
Remplacez ici 414 par le numéro de la ligne que vous avez repérée dans l'étape précédente.
Vous demandez ainsi au tableur de chercher le contenu de la cellule C2 (le premier "Num_Acc" de votre fichier) dans la liste "Num_Acc_Geo" présente dans la colonne A. Vous indiquez au tableur que cette liste s'étend de la cellule A2 à la cellule A414 (remplacez 414 par le numéro de la ligne que vous avez repérée dans l'étape précédente). La présence du caractère "$" signifie que les numéros de cellules sont fixes et que le tableur ne décalera pas sa recherche d'une ligne lorsque vous dupliquerez la formule dans la ligne du dessous.
Si les caractères "#N/D" (Calc) ou "#N/A" (Excel) apparaissent dans la cellule c'est que le "Num_Acc" présent en cellule C2 n'a pas été repéré dans la liste "Num_Acc_Geo". Il ne s'agit donc pas d'un accident survenu dans votre zone géographique.
En revanche, si c'est votre "Num_Acc" qui apparait c'est qu'il est bien présent dans la colonne "Num_Acc_Geo", il vous faut donc le conserver.
Dupliquez maintenant la formule sur toute les lignes du document :
Pour dupliquer la formule sur la colonne entière, sélectionnez la cellule de départ (ici la cellule contenant la formule, normalement la cellule B2) et placez votre souris sur le coin inférieur droit de celle-ci. Votre curseur se transforme alors en croix.
Double cliquez ensuite sur le coin inférieur droit de la cellule. La formule est alors copiée sur la colonne entière, du moins jusqu'à la dernière ligne complétée dans la colonne d'à côté.
Ici la formule a été copiée jusqu'à la dernière ligne complétée de la colonne A, soit la ligne 414. Il faut refaire l'opération et double cliquer à nouveau sur le coin inférieur droit de la dernière cellule dans laquelle a été copiée la formule pour l'étendre cette fois-ci jusqu'à la dernière ligne de la colonne C "Num_Acc".
Placez un filtre sur la colonne B :
Sélectionnez la colonne B et ajouter un filtre de données. Dans CALC, cliquez sur l'outil "AutoFiltre" dans la barre d'outils. Il est également disponible dans le menu "Données --> AutoFiltre". Dans EXCEL, sélectionnez la colonne et dans le menu "Données" choisissez "Filtre".
Filtrez les données pour ne conserver que les lignes concernant votre zone géographique :
Cliquez sur la flèche ou l'entonnoir qui apparaît en en-tête de colonne B. Une fenêtre apparaît avec les différents contenu de la colonne B. Dans cette liste, toutes les occurrences sont cochées. Cherchez l'occurrence "#N/D" et décochez-la pour quelle n'apparaisse plus dans les résultats.
Cliquez sur OK pour valider.
Vous retrouvez votre fichier de données sans les lignes de données situées hors de votre zone géographique.
Copiez/collez les données dans votre fichier de destination.
Copiez les colonnes de votre fichier à partir de la colonne C (il est inutile de copier les colonnes "Num_Acc_Geo" et "Num_Acc_Recherche") et collez les dans l'onglet correspondant que vous avez préparé dans votre fichier de destination. Si vous avez travaillez sur le fichier des véhicules en 2017, collez les données dans l'onglet "véhicules 2017".
Si vous souhaiter conserver les données des autres véhicules, procédez de même pour chacun des fichiers qui composent le jeu de données. Si vous souhaitez travailler uniquement sur les données des vélo et ne pas conserver celles des autres véhicules, vous pouvez passer tout de suite à la partie suivante "Circonscrire les données à la pratique du vélo".
Circonscrire les données à la pratique du vélo⚓
Conseil :
Il est tout à fait possible de ne pas effectuer cette étape et de conserver les informations sur les autres types de véhicules, par exemple dans le but d'une comparaison entre la pratique du vélo et des autres moyens de locomotion. Le vélo devra quoiqu'il arrive être au cœur du questionnement.
Ne conserver que les données des accidents impliquant au moins un vélo⚓
Méthode :
Commencer obligatoirement ce tutoriel avec le fichier "véhicules" réduit à votre zone géographique. Lui seul comprend la colonne "catv" qui renseigne sur la catégorie des véhicules impliqués dans les accidents. Le document de description nous indique que les vélos sont codés par "01". (La démarche est ici la même que dans les étapes précédentes, c'est pourquoi elle est un peu moins détaillée.)
Ajoutez un filtre sur la colonne "catv" (normalement, maintenant, vous savez faire ;))
Cliquez sur la flèche ou l'entonnoir en tête de colonne pour paramétrer le filtre.
Décochez la case "Tout" qui apparaît en bas de la fenêtre.
Dans la liste des occurrences, cochez "01" pour que seules les lignes avec "01" en colonne "catv" apparaissent dans votre fichier.
Vous ne pouvez pas supprimer toutes les autres, c'est-à-dire toutes les lignes de données sur les véhicules qui ne sont pas des vélos car certains de ces véhicules sont impliqués dans un accident avec un vélo !
Copiez la colonne "catv" avec les "Num_Acc" correspondant aux accidents impliquant des vélos.
Désactivez le filtre de la colonne "catv".
Ajoutez deux colonnes à gauche de la colonne A de sorte que la colonne "Num_Acc" se trouve en colonne C.
Collez vos données en colonne A et repérez le numéro de la dernière ligne de données. Renommez la colonne "Num_Acc_Velo"
Ici, il s'agit dans mon cas de la ligne 32
Renommez la colonne B en "Num_Acc_Recherche".
Dans la colonne B, normalement encore vide, insérez la formule suivante en ligne 2 (la ligne 1 étant la ligne d'en-tête) : =RECHERCHEV(C2;$A$2:$A$32;1;0) (n'oubliez pas le "=" au début sinon cela ne sera pas reconnu comme une formule)
Remplacez ici 32 par le numéro de la ligne que vous avez repérée dans l'étape précédente.
Double cliquez sur le coin inférieur droit de la cellule B2 qui inclue la formule de recherche pour répéter celle-ci jusqu'en bas de la colonne A. Recommencer l'opération si nécessaire pour la répéter jusqu'en bas de la colonne C qui énumère les "Num_Acc".
Paramétrer un filtre sur la colonne B. Décochez toutes les occurrences à l'aide de la case "Tout" en bas de la fenêtre. Validez le filtre.
Vous obtenez ainsi la liste de tous les véhicules impliqués dans des accidents qui comptent au moins 1 vélo.
Créer un nouvel onglet "Véhicules 2017" et supprimez le précédent (qui incluait tous les accidents même ceux n’impliquant pas de vélo).
Procédez de la même façon pour réduire les autres fichiers. Utilisez les données de la colonne "Num_Acc_Vélo" dans les fichiers :"caractéristiques", "lieux" et "usagers" pour n'obtenir que les données des accidents impliquant des vélos.
Faire ressortir les usagers de vélo dans le fichier "usagers"⚓
Il est tout à fait possible de faire réaliser ce travail par les élèves. Discutez-en avec les enseignants participants pour savoir s'ils jugent cette option utile en fonction du niveau de leur classe et de l'orientation de leur travail.
Méthode : Combiner le numéro d'accident et le numéro du véhicule
Les fichiers véhicules et usagers contiennent tous deux une colonne avec le "num_acc" et une autre avec le "num_veh". Ce dernier est le "numéro de véhicule", il permet de distinguer les différents véhicules impliqués dans un accident ainsi que leurs usagers. Contrairement au "num_acc" qui est unique pour chaque accident, le "num_veh" ne l'est pas. Il est différent pour chaque véhicule au sein d'un accident mais à cause de sa construction, les mêmes "num_veh" reviennent de nombreuses fois dans le fichier. Pour créer un "num_veh" unique, nous allons accoler le "num_acc_ au "num_veh" dans une seule et même cellule.
A cette étape il s'agit de mettre en forme le fichier final pour mettre en évidence les usagers des vélo. Les manipulations se font donc à partir du fichier collaboratif et ses 4 onglets. La méthode proposée et les captures d'écran proviennent de Google Sheets.
Depuis l'onglet "véhicules 2017", travaillez sur la première colonne vide (normalement la colonne J). Nommez-la "num_acc_veh"
La formule CONCATENER va nous permettre d'accoler le contenu des colonnes "num_acc" (normalement en colonne A) et "num_veh" (normalement en colonne I).
Dans la colonne "num_acc_veh" tapez : =CONCATENER(A2;"_";I2) pour obtenir une cellule contenant le "num_acc" et le "num_veh" séparé par un underscore "_"
Dupliquez la formule à toutes les cellules de la colonne :
Double cliquez sur le coin inférieur droit de la cellule J2 qui inclue la formule de recherche pour répéter celle-ci jusqu'en bas de la colonne I.
Vous obtenez ainsi un numéro d'identification unique pour chaque véhicule du fichier.
Reproduisez exactement la même démarche dans l'onglet "usagers 2017"
Déplacez la colonne "num_acc_veh" en colonne A.
Méthode : Utiliser le "num_acc_veh" pour mettre en évidence les cyclistes dans le fichier "usagers 2017"
Dans l'onglet "vehicules 2017" de votre fichier collaboratif, filtrez les données de la colonne "catv" pour ne conserver que les vélos :
Activer le filtre sur la colonne "catv" et paramétrez-le pour n'afficher que les cellules contenant "01". Les vélo sont codés par "01" (il se peut que votre tableur n'affiche que le "1" sans le 0 puisqu'il le reconnaît comme un nombre).
Dans SHEETS, cliquez sur le menu "données" puis "activer le filtre". Cliquez ensuite sur le filtre pour le paramétrer. Dans la fenêtre qui s'ouvre, cliquez sur "Effacer" pour désélectionner toutes les occurrences. Cliquez ensuite sur "1" pour le conserver que cette occurence dans les résultats. Enfin cliquez sur OK.
Copier le contenu de la colonne J, contenant désormais les "num_acc_veh" des vélos uniquement.
Rendez-vous dans l'onglet "usagers 2017".
Ajoutez deux colonnes à gauche de la colonne A qui contient les "num_acc_veh". La colonne A passe alors en colonne C.
Collez vos données précédemment copiées dans la colonne A encore vide.
Renommez la colonne A "num_acc_velos" et repérez la dernière ligne de données pour cette colonne.
Dans la colonne B, dans la cellule B2, ajoutez la formule suivante : =RECHERCHEV(C2;$A$2:$A$91;1;0)
Remplacez ici 491 par le numéro de la ligne que vous avez repérée dans l'étape précédente.
Dupliquez maintenant la formule sur toutes les lignes du document. Il faudra alors utiliser un raccourci clavier :
Copier d'abord le contenu de la cellule B2 avec le raccourci clavier Ctrl + C
Appuyez ensuite sur la flèche de droite pour vous placez dans la cellule C2 et appuyez sur : Ctrl + ↓. Ceci vous emmène en bas de la colonne C, dans la dernière cellule comportant des données.
Appuyez ensuite sur la flèche de gauche pour vous placez sur la cellule d'à côté dans la colonne B.
Appuyez sur Ctrl + Shift (majuscules sans verrouillage) +↑ pour sélectionner toutes les cellules entre celles où vous vous trouvez et le haut de la colonne.
Enfin appuyez sur Crtl + V pour coller votre formule dans chacune de ces cellules.
Si les caractères "#N/A" apparaissent dans la cellule c'est que le "Num_Acc_veh" présent en cellule C2 n'a pas été repéré dans la liste "Num_Acc_veh". Le véhicule auquel il correspond n'est donc pas d'un vélo.
En revanche, si le "Num_Acc_veh" apparait dans la colonne B c'est qu'il est bien présent dans la colonne "Num_Acc_velos", il vous faut donc le conserver.
Activez le filtre sur la colonne B dans laquelle vous avez effectué la recherche.
Paramétrez le filtre pour n'afficher que les vélos :
Cliquez sur le filtre en en-tête de colonne. Dans la fenêtre qui apparaît, cliquez sur "Tout sélectionner" puis décocher "(Vides)" et "#N/A" de la liste des occurrences pour ne conserver que les usagers de vélos. Cliquez ensuite sur OK.
Sélectionnez les lignes de données obtenues et par exemple changer leur arrière plan en jaune pour les repérer plus facilement. Vous pouvez aussi créer une colonne "catv" et indiquez 1 pour les lignes sélectionnées afin de réutiliser les nomenclatures utilisées pour la création du jeu de données initial.
Les étapes du travail⚓
Conseil :
Un datasprint pédagogique propose un cadre hybride et engageant propice à la créativité, à la collaboration et au questionnement. Les participants y développent des habilités numériques et critiques tout en construisant collectivement un savoir autour de la question explorée à travers un ou des datasets.
Pour favoriser ce développement, chaque étape peut se faire en groupe. La démarche réflexive et pratique qui conduit les élèves à la réalisation d'une datavisualisation commence souvent par un temps de réflexion en débranché. Après la prise de connaissance du jeu de données, chaque groupe formule la question qu'il se pose, indiquent avec quelles données il envisage d'y répondre et sous quelle forme (avec quel type de représentation graphique). Le numérique est bien ici un environnement de travail.
Rendre les données exploitables⚓
Décoder le fichier⚓
Les fichier de données initial est difficilement compréhensible tel quel. Il utilise une nomenclature chiffrée pour à la fois simplifier et uniformiser la saisie. Cette étape n'est pas indispensable mais elle peut permettre de gagner du temps par la suite afin de ne pas revenir constamment au fichier de description, document qui permet de traduire les codes utilisés par les opérateurs de la saisie des données. On peut ainsi demander aux élèves de remplacer les nomenclatures utilisées dans le fichier par des éléments textuels plus compréhensibles.
Méthode : Remplacer les nomenclatures utilisées dans le fichier
Dans chaque tableur, il existe une fonction de recherche et de remplacement en général accessible via le menu.
Sheets (Google) : menu "Edition" --> "Rechercher et remplacer"
Calc (Libre Office) : menu
Excel (Microsoft) : menu "Accueil" --> "Rechercher et sélectionner"
Ajouter le point manquant à la latitude et à la longitude⚓
Méthode : Ajouter un caractère dans une cellule
Modifier Latitude et Longitude (ajouter les points) :
Latitude : =GAUCHE(O2;2)&"."&STXT(O2;3;5)
Longitude : =GAUCHE(P2;1)&"."&STXT(P2;2;5)
Ajouter le type de véhicule dans l'onglet "Usagers"⚓
Cette étape peut être effectuée en amont du datasprint au moment de la préparation du fichier de données. Discutez-en avec les enseignants participants pour savoir s'ils jugent cette option utile dans le cas où le niveau de la classe (notamment en élémentaire) ne leur permet pas d'effectuer cette étape en classe.
Dans le fichier "véhicules", la colonne "catv" renseigne sur la catégorie des véhicules impliqués dans les accidents. Malheureusement, cette information n'est pas précisée dans le fichier "usagers" il est donc impossible dans l'état actuel de distinguer les usagers de vélos, les conducteurs de voitures, de poids lourds, de scooter, etc.
Ce tutoriel va vous permettre d'ajouter cette information aux fichier "usagers". Il est possible de le faire réaliser par les élèves si ceux-ci ont besoin de cette information pour réaliser leur datavisualisation.
Combiner le numéro d'accident et le numéro du véhicule⚓
Méthode :
Les fichiers véhicules et usagers contiennent tous deux une colonne avec le "num_acc" et une autre avec le "num_veh". Ce dernier est le "numéro de véhicule", il permet de distinguer les différents véhicules impliqués dans un accident ainsi que leurs usagers. Contrairement au "num_acc" qui est unique pour chaque accident, le "num_veh" ne l'est pas. Il est différent pour chaque véhicule au sein d'un accident mais à cause de sa construction, les mêmes "num_veh" reviennent de nombreuses fois dans le fichier. Pour créer un "num_veh" unique, nous allons accoler le "num_acc_ au "num_veh" dans une seule et même cellule.
A cette étape il s'agit de mettre en forme le fichier final pour mettre en évidence les usagers des vélo. Les manipulations se font donc à partir du fichier collaboratif et ses 4 onglets. La méthode proposée et les captures d'écran proviennent de Google Sheets.
Depuis l'onglet "véhicules 2017", travaillez sur la première colonne vide (normalement la colonne J). Nommez-la "num_acc_veh"
La formule CONCATENER va nous permettre d'accoler le contenu des colonnes "num_acc" (normalement en colonne A) et "num_veh" (normalement en colonne I).
Dans la colonne "num_acc_veh" tapez : =CONCATENER(A2;"_";I2) pour obtenir une cellule contenant le "num_acc" et le "num_veh" séparé par un underscore "_"
Dupliquez la formule à toutes les cellules de la colonne :
Double cliquez sur le coin inférieur droit de la cellule J2 qui inclue la formule de recherche pour répéter celle-ci jusqu'en bas de la colonne I.
Vous obtenez ainsi un numéro d'identification unique pour chaque véhicule du fichier.
Reproduisez exactement la même démarche dans l'onglet "usagers 2017"
Déplacez la colonne "num_acc_veh" en colonne A.
Méthode : Utiliser le "num_acc_veh" pour ajouter le type de véhicule au fichier "usagers"
Ce pas à pas vous montre la démarche pour mettre en évidence les cyclistes dans le fichiers "usagers". Il faudra suivre la même procédure pour les autres type de véhicules.
Dans l'onglet "usagers 2017" de votre fichier collaboratif, ajouter une colonne "catv".
Dans l'onglet "vehicules 2017", filtrez les données de la colonne "catv" pour ne conserver que les vélos :
Activer le filtre sur la colonne "catv" et paramétrez-le pour n'afficher que les cellules contenant "01". Les vélo sont codés par "01" (il se peut que votre tableur n'affiche que le "1" sans le 0 puisqu'il le reconnaît comme un nombre).
Dans SHEETS, cliquez sur le menu "données" puis "activer le filtre". Cliquez ensuite sur le filtre pour le paramétrer. Dans la fenêtre qui s'ouvre, cliquez sur "Effacer" pour désélectionner toutes les occurrences. Cliquez ensuite sur "1" pour le conserver que cette occurence dans les résultats. Enfin cliquez sur OK.
Copier le contenu de la colonne J, contenant désormais les "num_acc_veh" des vélos uniquement.
Rendez-vous dans l'onglet "usagers 2017".
Ajoutez deux colonnes à gauche de la colonne A qui contient les "num_acc_veh". La colonne A passe alors en colonne C.
Collez vos données précédemment copiées dans la colonne A encore vide.
Renommez la colonne A "num_acc_velos" et repérez la dernière ligne de données pour cette colonne.
Dans la colonne B, dans la cellule B2, ajoutez la formule suivante : =RECHERCHEV(C2;$A$2:$A$91;1;0)
Remplacez ici 491 par le numéro de la ligne que vous avez repérée dans l'étape précédente.
Dupliquez maintenant la formule sur toutes les lignes du document. Il faudra alors utiliser un raccourci clavier :
Copier d'abord le contenu de la cellule B2 avec le raccourci clavier Ctrl + C
Appuyez ensuite sur la flèche de droite pour vous placez dans la cellule C2 et appuyez sur : Ctrl + ↓. Ceci vous emmène en bas de la colonne C, dans la dernière cellule comportant des données.
Appuyez ensuite sur la flèche de gauche pour vous placez sur la cellule d'à côté dans la colonne B.
Appuyez sur Ctrl + Shift (majuscules sans verrouillage) +↑ pour sélectionner toutes les cellules entre celles où vous vous trouvez et le haut de la colonne.
Enfin appuyez sur Crtl + V pour coller votre formule dans chacune de ces cellules.
Si les caractères "#N/A" apparaissent dans la cellule c'est que le "Num_Acc_veh" présent en cellule C2 n'a pas été repéré dans la liste "Num_Acc_veh". Le véhicule auquel il correspond n'est donc pas d'un vélo.
En revanche, si le "Num_Acc_veh" apparait dans la colonne B c'est qu'il est bien présent dans la colonne "Num_Acc_velos", il vous faut donc le conserver.
Activez le filtre sur la colonne B dans laquelle vous avez effectué la recherche.
Paramétrez le filtre pour n'afficher que les vélos :
Cliquez sur le filtre en en-tête de colonne. Dans la fenêtre qui apparaît, cliquez sur "Tout sélectionner" puis décocher "(Vides)" et "#N/A" de la liste des occurrences pour ne conserver que les usagers de vélos. Cliquez ensuite sur OK.
Dans les lignes de données obtenues, ajoutez "1" dans la colonne "catv" si vous souhaitez réutiliser les nomenclatures utilisées pour la création du jeu de données initial, ou vélo si vous avez simplifié la lecture du jeu de données par un décodage.
Compléter les données⚓
Trouver des données complémentaires⚓
Le jeux de données initial peut par exemple être complété avec des données sur la circulation, la qualité des l'air, les équipements de garage, ou les points vélos en libre service... Il est impossible à l'échelle nationale de préconiser l'usage d'un jeu de données en particulier. Ceux-ci sont très disparates sur le territoire national : ils existent souvent mais pas partout, pas à la même échelle et pas toujours avec les mêmes caractéristiques (granularité, unités de mesure, méthodologie pour générer les données, nomenclatures utilisées...).
La plateforme ouverte des données publiques françaises
Vous y trouverez des jeux de données nationaux issus de différents ministères mais également des jeux de données locaux ! Par exemple pour une recherche "pistes cyclables" on obtient des résultats concernant Saint-Paul-Les-Dax, Grenoble, la Gironde, Metz Métropole, Saint-Denis, l'agglomération de Saint-Quentin... etc.
La plateforme ouverte des données publiques françaises : https://www.data.gouv.fr/fr/
Les portails open data locaux
Certaines collectivités territoriales, administrations ou associations ont développé leur propre portail open data. Ils ne sont pas à négliger car tous les jeux de données qui s'y trouvent ne sont pas forcément présents sur la plateforme nationale.
Exemple de portail open data territorial : https://data.angers.fr/pages/home/
La Plateforme Nationale de Fréquentations
Animée par Vélo & Territoires elle permet de mutualiser, d'agréger et de communiquer sur des données de comptages vélo au niveau national sur la base de données collectées au niveau local. Lancée en septembre 2013, la PNF rassemble plus de 690 compteurs vélo partagés par plus de 76 collectivités propriétaires des compteurs. Ce projet est cofinancé par la Coordination interministérielle pour le développement de l'usage du vélo et a été soutenu par l'Ademe à son lancement.
Nous sommes en contact avec eux afin d'obtenir les jeux de données brutes. Dans l'attente de ces jeux de données, vous pouvez déjà repérer les compteurs sur votre territoire et vous faire une idée de leur fréquentation journalière, hebdomadaire ou mensuelle.
La Plateforme Nationale des Fréquentations (PNF) : http://www.eco-public.com/ParcPublic/?id=891
Ajouter les coordonnées géographiques manquantes⚓
La latitude et la longitude ne sont pas toujours complétées dans le fichier de données. Il est possible d'utiliser l'adresse de l'accident pour les retrouver.
Sur un petit volume de données, en collaboratif
Lors d'un travail collaboratif sur un fichier en ligne, il sera possible de demander aux élèves de retrouver manuellement les latitudes et les longitudes des lignes de données ou l'information est manquante. Pour cela, il faudra se répartir le travail et confier des lignes de données précise à chaque élèves ou groupe d'élèves.
Rendez-vous sur Google Maps et recherchez l'adresse de l'accident.
Cliquez du bouton droit de la souris sur le repère ainsi obtenu et choisissez "Plus d'infos sur cet endroit"
La latitude et la longitude apparaissent alors en bas de la fenêtre.
Vous pouvez alors les sélectionner avec la souris et les copier dans votre fichier de données.
La latitude apparaît en premier avant la virgule, la longitude en second. Sur le territoire métropolitain, la latitude est comprise entre 41 au Sud et 51 au Nord et la longitude entre -4 à l'Ouest et 8 à l'Est, le méridien de Greenwich coupant la France en deux.
Sur un grand volume de données
Il est possible d'importer un grand volume d'adresses dans des outils de géocodage et ainsi de récupérer les latitudes et longitudes correspondantes à chacune des adresses entrées.
Vous pouvez par exemple utiliser l'outil gratuit en ligne Batch geocoder for journalists
Indiquer le pays dans le champs "Indicate Country" afin de limiter les erreurs de géocodage.
Copier vos adresses directement depuis votre fichier dans le champs "Copy and past a list of locations". Chaque adresse doit apparaître sur une ligne différente et comporter au moins la voie et la ville ou un code postal (il faudra modifier votre fichier de données en ce sens).
Cliquer sur le bouton bleu "Add to geocoder"
Vos résultats s'affichent en direct sur la carte. L'outil vous indique en vert les points dont il est sûr, en orange ceux sur lesquels il a un doute, et en rouge ceux qu'il n'a pas réussi à géocoder. Après cette étape, vous pouvez valider ou modifier chacun des points, ce qui rend l'outil très pratique. Les parenthèses utilisées dans le fichier de données poseront en général problème, ainsi que les rue dont le nom a changé depuis l'accident.
Traiter les données⚓
Des calculs sont en général nécessaires à la réalisation de graphiques. Le tableur propose pour cela des fonctionnalités bien utiles : les filtres, faire des calculs simples, le tableau croisé dynamique, ... etc.
Le tableau croisé dynamique⚓
Le tableau croisé dynamique est une fonctionnalité des tableurs qui permet de générer un tableau de synthèse à partir de données. Il permet de regrouper les données identiques et d'en calculer le nombre d'occurrences. Il est le préalable à beaucoup de graphiques générés à partir d'un jeu de données.
Exemple : Je souhaite calculer le nombre d'accidents survenus chaque mois de l'année
Dans Google Sheets :
Dans l'onglet "caractéristiques 2017", sélectionnez la colonne "mois".
Dans le menu "Données", choisissez "Tableau croisé dynamique".
Cochez l'option "Nouvelle feuille" et cliquez sur "Créer" pour que votre tableau croisé dynamique soit créé dans un nouvel onglet. Pensez à le renommer.
Votre tableau est créé mais il est vide. Il faut maintenant le paramétrer pour qu'il prenne en compte vos données.
Dans l'éditeur de tableau croisé dynamique à droite de votre écran, cliquez sur le bouton "Ajouter" en face de "Lignes" et ajoutez les "mois"
Les différents mois de l'année apparaissant dans la colonne "mois" de votre fichier de données sont ainsi répartis sur les différentes lignes de votre fichier.
En cliquant plutôt sur le bouton "Ajouter" en face de "Colonnes" dans l'éditeur, vous auriez obtenu les mois répartis en colonnes.
Par défaut, les mois apparaissent classés dans l'ordre croissant, mais vous pouvez choisir de les classer par ordre décroissant.
Pour compter le nombre d'occurences de chacun des mois dans le fichier de données, cliquez maintenant sur le bouton "Ajouter" en face de "Valeurs" et sélectionnez une nouvelle fois les "mois"
Dans le champs "Synthétisez via", modifier le paramètre par défaut "SUM" en "COUNT"
Vous obtenez ainsi un tableau comptabilisant le nombre d'accidents pour chaque mois de l'année.
Réaliser les datavisualisations⚓
La datavisualisation sert à rendre visibles et lisibles des données. Elle permet d'en faciliter la compréhension en les retranscrivant sous une forme visuelle (graphiques, cartes, infographie / tableaux de bord...).
Attention :
Pour chaque datavisualisation il est essentiel de citer la source des données ainsi que le nombre de données sur lesquelles se basent vos calculs. De même le choix de l'échelle et des couleurs sont à travailler car se sont des éléments clés pour la compréhension de la représentation graphique mais aussi des éléments qui peuvent en modifier la perception (lire
"Sept conseils pour ne pas se faire avoir par les représentations graphiques", un article de Mathilde Damgé, publié dans Le Monde, Les Décodeurs, le 22 mai 2018.)
La légende, les unités de mesure, les graduations sont essentiels à la lecture, il ne faut pas les négliger.
Les graphiques⚓
Chaque type de graphique a son utilité, sa fonction. Certains permettent de comparer des valeurs entre plusieurs catégories, des proportions, d'autres de montrer des tendances dans le temps, ou encore de représenter des relations entre les données.
Le catalogue dataviz (en anglais) pourra aider à connaître les possibilités et les outils pour les réaliser. Attention toutefois car certains de ces outils sont payants ou nécessitent une connexion. Voici ceux que nous pouvons vous conseiller :
Réaliser des graphiques avec le tableur
C'est sans doute la solution la plus simple. Votre tableur vous permet de générer des graphiques à partir des données de votre fichier, souvent depuis le menu "Insertion". Vous pourrez choisir l'échelle, les couleurs, la police. Vous y retrouverez les graphiques les plus courants, par exemple :
Les diagrammes en barres permettent de comparer des valeurs entre plusieurs catégories. Des barres empilées permettent de montrer la composition d'une catégorie. Des barres multiples permettent de constituer des groupes (pour une bonne lisibilité, il ne faut pas aller au delà de 3 barres par groupe)
Les diagrammes en secteur (appelés parfois affectueusement "camemberts") permettent de représenter des proportions. Le cercle représente une totalité - 100%, et chaque part du graphique correspond à un pourcentage de ce total. Si votre outil le permet, il est conseillé de ranger les différentes part par ordre croissant, avec la plus grande part dans la partie supérieure. Si les sections sont trop nombreuses ou trop faibles en pourcentage, la lecture du graphique en sera altérée. Le diagramme en secteur n'est pas un graphique de comparaison (préférer le diagramme en barre), il est préférable de ne pas l'utiliser au delà de 2 données.
Les courbes montrent les variations de valeurs dans le temps. Le graphique peut en inclure plusieurs et les distinguer par des couleurs afin de comparer leurs tendances. Elles peuvent être pleines ou empilées.
Les nuages de points permettent de représenter les relations entre les données et représenter une tendance entre deux variables
Les radars permettent de comparer les variations de données. L'échelle part du centre. Pour plus de lisibilité il est conseillé de limiter le nombre de valeurs.
Réaliser des graphiques avec les outils en ligne
De nombreuses plateformes en ligne permettent aujourd'hui de réaliser des datavisualisations classiques mais aussi plus complexes, dynamiques, qu'il est impossible de réaliser avec un simple tableur. Malheureusement, la plupart de ces plateformes sont en anglais et nécessitent une connexion.
Rawgraphs : https://rawgraphs.io/ (sans connexion) est une plateforme opensource de datavisualisation
Il est possible d'importer ses données sans connexion par un simple copier/coller, une importation de fichier ou encore depuis une URL.
On peut par exemple y réaliser des dendrogrammes circulaires ou des diagrammes alluviaux. Comment faire un diagramme alluvial sur rawgraphs.io ? Toutes les étapes sont expliquées sur leur site (en anglais) : https://rawgraphs.io/learning/how-to-make-an-alluvial-diagram/
Flourish : https://flourish.studio/ (avec connexion)
Plateforme permettant de réaliser facilement des datavisualisations. Elle permet par exemple de réaliser une "bart chart race", une vidéo montrant les évolutions sur une longue période sous forme d'un diagramme en bâtons dynamique.
Knightlab : https://knightlab.northwestern.edu/projects/#storytelling (nécessite un compte google)
La cartographie⚓
Khartis
Khartis est un logiciel conçu par Sciences Po, simple à prendre en main et en français. Il existe une version en ligne et une version à installer localement sur votre machine. Cela ne demande pas d'authentification, comme la plupart des autres logiciels de ce type.
L'Atelier cartographie de Sciences Po, à l'origine de ce logiciel a mis en ligne une documentation très riche pour vous aider à prendre en main cet outil. N'hésitez pas à consulter la rubrique tutoriels.
--> https://www.sciencespo.fr/cartographie/khartis/docs/index.html
Exemple de carte réalisée à l'aide de Khartis qui localisent les 124 accidents impliquant des vélos dans le Maine-et-Loire en 2017 :
Carte réalisée par Hervé Brunet - Médiateur Ressources et Services Numérique et Innovation à l'Atelier 49
Umap
Umap permet de créer des cartes personnalisées sur les fonds de carte d'OpenStreetMap
--> https://umap.openstreetmap.fr/
Vous pourrez par exemple choisir le calque "OSM OpenCycleMap" pour placer vos données sur un fond de carte qui met en évidence les grandes voies cyclables du territoire français.
Vous pourrez importer vos propres données sur des calques différents et gérer leur mise en forme sur chacun des calques utilisés.
A la fin du travail, vous pourrez exporter votre carte sous le format de votre choix pour la réimporter dans un logiciel de cartographie ou bien copier le code d'intégration de la carte pour l'ajouter sur un blog ou un site web. Elle gardera ainsi son aspect interactif (zoom/dezoom).
Pour la réalisation d'un poster ou d'une infographie, il vous sera bien sûr possible de faire une capture d'écran.
Des outils de cartographie interactive
Knightlab (nécessite un compte google) : https://storymap.knightlab.com/select/
Arcgis (nécessite un compte) : https://www.arcgis.com/apps/
Les infographies⚓
Les infographies
Exemple d'infographie réalisée avec les données 124 accidents impliquant des vélos dans le Maine-et-Loire en 2017 :
Réalisée par Hervé Brunet - Médiateur Ressources et Services Numérique et Innovation à l'Atelier 49
Le storytelling⚓
Les datavisualisations d'une classe doivent être regroupées sur un même document. C'est l'occasion de travailler le storytelling de leur réflexion collective : comment relier leurs questionnements de groupe ?
La forme du document final est libre, il n'y a pas de prescription : blog, site web, poster, carte ou timeline interactive, vidéo (une bonne occasion de travailler aussi l'oral ?), etc.
La forme est à travailler en liaison avec le contenu. Pour uniformiser les productions des élèves on pourra réfléchir à une charte graphique : couleurs, police et taille.
Le suivi du projet⚓
Chaque Atelier peut inscrire le nombre de classes de son choix et organiser leur accompagnement en fonction de ses forces et des particularités de son territoire.
Le modèle économique est laissé à votre discrétion : accompagnement physique en classe pour les établissements abonnés (exemple du 94 pendant Traces De Soldats), organisation d'une journée événement avec les classes en Atelier (exemple du 45 avec Caroline Chapuis pendant Traces De Soldats), vente du dispositif à la ville avant de recruter les classes (exemple du 49 avec Hervé Brunet et Bernard Malblanc pendant Traces De Soldats)...
Carte des Ateliers intéressés : 33
Le calendrier⚓
Jusqu'au 19 Octobre : inscription des classes par les médiateurs des Ateliers Canopé via le formulaire
Septembre/Octobre : temps de formation en Ateliers pour les professeurs participants
4 Novembre 2019 : envoi du fichier de données initial dans les classes
30 Novembre 2019 : retour des travaux d'élèves
Décembre 2019 : valorisation des travaux sur la plateforme data.gouv.fr
Mai/Juin 2020 : valorisation pendant la Semaine nationale de la marche et du vélo à l'école et au collège
La communauté sur Twitter⚓
Ateliers Canopé, médiateurs, professeurs, classes : montrez votre progression dans le datasprint pédagogique, interpellez des professionnels, posez vos questions et présentez vos travaux via Twitter ! Nous construirons ainsi une vraie communauté et nous avancerons tous ensemble dans cette aventure.
N'oubliez pas les deux hashtags :
#Traces2roues : pour parler du datasprint pédagogique, montrer votre avancée, présenter vos travaux.
#T2RTeam : pour interpeller les membres de la communauté, partager des astuces, donner des idées, poser des questions.
Vous pouvez bien entendu mettre les deux hashtags dans un seul tweet ;)
Pour nous contacter via Twitter :
@Canope_94 : le compte de l'Atelier
@Jul_Dum : le compte de Julia Dumont, cheffe du projet --> faites moi remonter vos comptes Twitter, je constituerai ainsi une liste à laquelle vous pourrez vous abonner.
La publication des travaux des élèves⚓
Contribuer aux communs
Le datasprint pédagogique Traces2roues appuyé par un partenariat avec la mission Etalab. Celle-ci coordonne les actions des administrations de l'Etat et leur apporte son appui pour faciliter la diffusion et la réutilisation de leurs informations publiques. Elle développe et anime la plateforme d'open data data.gouv.fr. Cette plateforme collaborative permet de publier des jeux de données publics mais aussi des réutilisations de ces jeux de données. A l'issu du datasprint, les travaux des élèves y seront ainsi publiés en tant que réutilisation du jeu de données initial.
Les travaux d'élèves ont toute leur place sur cette plateforme. La valorisation est double : pour les élèves et pour la plateforme qui attire ainsi de nouveaux publics.
Dans une logique de contribution aux communs du numérique, les travaux d'élèves seront publiés sous licence Creative Common. Avant publication des travaux, il est nécessaire de faire signer une autorisation aux élèves et à leurs parents :
Il faudra aussi apposer le logo de la licence sur les travaux des élèves. La licence qui a été choisie est la licence CC BY. Elle permet aux autres de réutiliser, modifier, remixer le travail qui fait l'objet de la licence. La seule obligation est de citer le nom de son auteur. C'est la licence la plus ouverte.
Publier les travaux sur data.gouv.fr
Les travaux des élèves seront publiés sous le compte Réseau Canopé de data.gouv.fr. Il vous faut créer votre compte individuel et demander votre rattachement à l'organisation Réseau Canopé afin de publier les travaux des élèves de votre département sous celui-ci.
L'Atelier Canopé 94 peut aussi se charger de la publication des travaux. Pour cela, envoyez les travaux des élèves à julia.dumont@reseau-canope.fr
Méthode : Rattacher votre compte data.gouv.fr à celui de l'organisation Réseau Canopé
Créez d'abord votre compte personnel sur en utilisant votre adresse data.gouv.fr reseau-canope.fr
Une fois connecté, depuis la page d'accueil, tapez "Réseau Canopé" dans le champs de recherche sans valider ! Cliquez sur l'organisation suggérée qui apparaît sous le champ de recherche.
Si vous avez validé votre recherche, vous obtenez une page de résultats contenant toutes les réutilisations publiées par l'organisation "Réseau Canopé". Pour voir l'organisation en elle même, il faudra cliquer sur l'onglet "1 organisation" en haut de la page.
Une fois sur la page de l'organisation, cliquez sur le bouton "REJOINDRE" sous le logo Réseau Canopé.
Après validation par les administrateurs de l'organisation, vous pourrez publier au nom de celle-ci.
Méthode : Publier les travaux d'élèves en tant que réutilisation du jeu de données
Une fois connecté à votre compte, cliquez sur le bouton "CONTRIBUEZ !" sur la page d'accueil
Choisissez "Publiez une réutilisation"
Sélectionnez votre organisation et non votre compte individuel pour publier "en tant qu'organisation" puis cliquez sur le bouton "Suivant"
Complétez les différents champs demandés :
Donnez un nom au travail à publier
Indiquez l'URL qui renvoie au travail (le travail peut être hébergé sur un Google Drive par exemple, il faudra penser à bien paramétrer les autorisations de consultation)
Cliquez dans le champs "Type" pour choisir ce qui correspond le mieux au travail dans le menu déroulant ("visualisation" sera sans doute le plus courant).
Proposez une description du travail qui résume le datasprint pédagogique Traces2roues, inclut le niveau de la classe et l'établissement concerné. Précisez la licence sous laquelle est publié le travail et ajoutez la liste des élèves selon la forme indiqué dans l'autorisation signée par les parents (Prénom Nom, Initiales, etc...). Ceci est nécessaire pour le respect de l'attribution avec la licence CCBY.
Proposition de texte :
"Dans le cadre du datasprint pédagogique Traces2roues organisé par Réseau Canopé en Novembre 2019, les élèves de 3e SEGPA du collège Willy Ronis de Champigny Sur Marne (94500) ont travaillé pendant 1 mois avec leur enseignant M. Guillot, sur la base de données des accidents corporels de la circulation de l'Onisr. Du 4 au 30 Novembre 2019, ils ont questionné, enrichi, trié et manipulé les données pour réaliser des datavisualisations.
Ce travail est mis à disposition selon les termes de la Licence Creative Commons Attribution 4.0 International.
Élèves de la classe à mentionner pour toute réutilisation : Leslie, Solenn B., Olivia, Victoire F., D. F., Axel G., Arthur G., Alice G., Capucine H.-H., Danny, Waris, Louis P., L. M., Lena M., Jadel L., Chiara S., Garance, Julien, C. C., Nils R., Axel R., Clara, Eva, Ambre T. et 3 élèves qui n'ont pas souhaité être mentionnés."
Attention ! Veillez à bien respecter le format indiqué sur la feuille d'autorisation de publication signées par les élèves et leur parents.
Ajoutez les mots clés suivants (vous pouvez copier/coller la liste telle quelle) : Traces2roues, datasprint pédagogique, vélo, éducation au développement durable, mobilité, aménagement du territoires
Vous pouvez ajoutez le territoire sur lequel vous avez travaillé à la liste des mots clé ! Le nom de la ville, du département, de la commune...
Le bouton "privé" ne doit pas être coché.
Une fois que vous avez terminé de compléter tous les champs, cliquez sur suivant.
Il faut maintenant indiquer quel(s) jeu(x) de données a/ont été utilisé(s) pour réaliser le travail.
Dans le champs "Trouver votre jeu de données" tapez "base accidents" sans valider votre recherche. Deux suggestions vous seront proposées par le moteur de recherche, choisissez celle avec le logo du ministère de l'Intérieur (la première sur l'image ci-dessous).
N'oubliez pas également d'ajouter le jeu de données publié par Koumoul si vous avez fait le choix du jeu de données simplifié ! Pour le trouvez tapez "vélo" dans le champs de recherche.
Si vous avez utilisé un autre jeu de données présent sur le site, cherchez-le et associez-le lui aussi à la contribution.
Cliquez ensuite sur "Suivant"
Dans l'étape suivante, importez une image qui servira de vignette à la réutilisation. Vous pouvez choisir un extrait du travail des élèves, un logo d'établissement, etc. L'image sera quoiqu'il arrive de format carré.
Cliquez sur "Suivant".
C'est la dernière étape. Vous pouvez ici partager la contribution que vous venez d'ajouter.
Les Open Badges⚓
Des badges de compétences sont en cours d'élaboration. Le travail réalisé durant toute la durée du datasprint pédagogique donnera lieu à la remise de ces badges aux élèves, aux enseignants et aussi aux médiateurs qui auront accompagné les classes. Ils pourront être validés via la plateforme Open Badge Factory.
La typologie des badges (en cours d'élaboration)
La typologie proposée ici a été conçue pour correspondre à des dispositifs ancrés dans le champ des Humanités Numériques. Elle pourra donc être réutilisée à d'autres occasions.
Un méta badge "Datasprinteur" est également prévu. Il pourra être obtenu après avoir validé plusieurs badges.
Afin de créer les comptes sur Open Badge Factory, merci d'inscrire dans ce document les médiateurs et médiatrices de vos Ateliers qui valideront les open badges des classes : https://huit.re/T2Ropenbadges
Le challenge vélotaf interateliers⚓
Et si durant le datasprint on venait tous travailler en vélo ? Pour porter le message du vélo comme moyen de transport responsable, déplaçons nous à vélo et comptons le nombre de kilomètres parcourus en 1 mois ! Du 4 au 30 Novembre, sillonner les routes avec votre biclou préféré et enregistrez les kilomètres parcourus sur Strava !
1. Créez-vous un compte sur Strava
2. Demandez votre rattachement au club Réseau Canopé : https://www.strava.com/clubs/551550
3. Parcourez le maximum de kilomètres durant le datasprint et enregistrez-les via l'application
--> Les comptes seront faits par Atelier et non par individu alors motivez tout le monde autour de vous !
Valorisation⚓
Fiche Noticia
Lien vers la fiche Noticia : https://www.reseau-canope.fr/service/traces2roues.html (code : W0018686)
Logo
Le vert du logo est issu de la charte Réseau Canopé :
Pantone : 3395U
Hex : 67BEA2
RVB : 103, 190, 162
Illustrations
Sprint
Travail collaboratif
Banderole
Logos des partenaires nationaux
Etalab
Data.gouv.fr