Aller au contenu

Les transports/Méthodes de collecte de données

Un livre de Wikilivres.

Module 3 : Méthodes de collecte de données

Les opinions sont souvent tranchées à propos des transports, en particulier pour ce qui touche à leur performance et leurs coûts.

  • On pense souvent dans de nombreuses régions métropolitaines que la congestion des routes et des transports en commun s’aggrave : ça peut être notre expérience personnelle, mais est-ce bien le cas?
  • Les usagers des différents modes pensent généralement qu'ils paient le coût intégral de leur déplacement, par exemple la construction des routes, l'achat et l'entretien des véhicules. Ce n'est pas évident...

Nous allons voir comment répondre à ces questions dans ce troisième module sur les méthodes de collecte de données. Car, c'est probablement évident, il faut des données pour répondre à ces questions.

« Ce qui ne peut se mesurer ne peut être amélioré
(If you can't measure it, you can't improve it). »

— Peter Drucker

Comme le dit Peter Drucker, il est indispensable de collecter des données sur les transports pour déterminer leur bon fonctionnement et leurs impacts, et ainsi trouver des façon de les améliorer.

À la fin de ce module, vous serez en mesure de décrire et choisir les méthodes de collecte de données de transport selon le contexte. Une ressource sur le sujet est le document suivant de l'Association des Transports du Canada (ATC) : Notions élémentaires sur la collecte de données sur le transport urbain des personnes : suivre le monde en constante évolution[1].

Différentes méthodes

[modifier | modifier le wikicode]

Observation et expérimentation

[modifier | modifier le wikicode]

D'un point de vue général, il existe deux grandes situations de recueil de données selon le rapport de l'observateur au phénomène observé :

  • Observation d'une situation sans la modifier, sans agir sur le système à l'étude ;
  • Expérimentation, lorsqu'une situation est créée et certains paramètres sont contrôlés pour mesurer leur impact sur la situation ou le système.

La gestion des systèmes de transport représente une situation d'observation particulière, car elle génère des données opérationnelles, par exemple : la vente des titres de transport, le contrôle de l'accès aux services de transport en commun ou à des places de stationnement, la location de véhicules, etc. Des données sont aussi générées lors de la conception et la planification des systèmes de transports, par exemple des plans ou le service planifié du transport en commun qui est par exemple diffusé dans les fichiers « General Transit Feed Specification » (GTFS).

Il existe peu de situations d'expérimentation en transport, pour des raisons :

  • de coût : il est difficile de construire plusieurs villes avec différentes variantes du même système de transport pour étudier le plus performant par exemple;
  • d'éthique : des modifications aux systèmes de transport ont généralement des impacts (c'est le but des expérimentations) sur la société, l'environnement et l'économie, par exemple sur la santé publique.

Il existe quelques exemples d'expérimentation en transport, comme l'utilisation de simulateurs de conduite pour étudier le comportement des conducteurs ou le test de dispositifs de contrôle de la circulation comme des panneaux de signalisation.

Navigation avec un portable et un récepteur GPS.

Méthodes d'acquisition de données

[modifier | modifier le wikicode]

Il y a trois grandes catégories de méthodes d'acquisition de données en transport :

  • Observations (plus ou moins automatiques) ;
  • Enquêtes et recensement : entre l'observation et l'expérimentation selon les questions posées ;
  • Simulation de phénomènes complexes : simulation des systèmes de transport, qui peuvent permettre l'évaluation expérimentale des transports.

Des exemples de collectes des différentes catégories sont présentés dans le tableau ci-dessous.

Exemples de collectes des différentes catégories de méthodes
Catégories Exemples
Observations
Enquêtes
  • enquêtes ménages téléphoniques origine-destination
  • enquêtes à bord des véhicules de transport en commun
  • enquêtes auprès des transporteurs, des entreprises
  • recensement de la population
Simulations
  • simulation des systèmes de transport
  • simulation des déplacements des piétons

Ces méthodes visent à collecter des données sur les trois composantes des systèmes de transport, les infrastructures, les véhicules et les usagers, en particuler sur les déplacements des usagers (et marchandises) et l'usage des véhicules. D'autres sources de données collectées par différentes organisations sont très utilisées en transport :

  • données sociodémographiques collectées lors du recensement ;
  • données économiques ;
  • données de flottes de véhicules (immatriculation) ;
  • cartes avec les réseaux des différents modes de transport.

La suite va traiter des méthodes d'enquête et d'observation.

Enquêtes sur les déplacements

[modifier | modifier le wikicode]

Certaines informations ne peuvent être obtenues qu'en les demandant directement auprès des usagers. C'est pourquoi des enquêtes sont réalisées auprès des usagers des transports afin de comprendre leur comportement de transport. Les grandes enquêtes Origine-Destination de la région de Montréal en sont un bon exemple[2].

Cette section repose sur les notes du cours Systèmes de transport (CIV2710) de Polytechnique Montréal. Les enquêtes répondent généralement à des objectifs spécifiques. « Par exemple, les grandes enquêtes Origine-Destination (OD) de la région de Montréal ont d'abord été mises en place afin de mesurer le niveau d'utilisation des réseaux de transport »[3]. Il existe différents types d'enquêtes pour répondre à ces objectifs, dont les composantes principales sont les suivantes :

  • objectifs de l'enquête : hypothèse de collecte, identification des données et de leur utilisation, par exemple dans un modèle;
  • population cible (ou de référence) : une fois le ou les sujets (objets ou unités) de l'enquête déterminés (par exemple ménage, personne, déplacement, véhicule), il s'agit de la population (ensemble) pour laquelle les informations seraient recueillies si cela était possible. Il faut aussi décider du territoire et de la période cible pour la collecte de données;
    • pour l'enquête OD de la région de Montréal, il s'agit de l'ensemble des ménages qui y résident;
  • échantillonnage : « l'échantillonnage est une méthode qui permet de ne pas enquêter l'ensemble de la population cible, tout en produisant des résultats représentatifs de cette population »[4]. Une base de sondage est la population utilisée pour tirer un échantillon (sous-ensemble) qui sera enquêté, et qui peut être différente de la population cible selon les sources de données disponibles. Un exemple est une liste électorale ou d'usager d'un service public comme l'électricité. Il faut ensuite déterminer la taille de l'échantillon et la méthode d'échantillonnage (comment les unités sont tirées dans la base de sondage);
  • type d'enquête : section, série chronologique (données longitudinales) avec un panel ou pas;
  • mode d'enquête : différents modes existent, selon le médium pour interagir avec l'enquêté (courrier, téléphone, Internet, face-à-face), la façon d'administrer l'enquête (administré par un enquêteur ou auto administré) et le lieu de l'enquête (domicile, lieu d'activité, véhicule);
    • par exemple, l'enquête OD de la région de Montréal est administrée par téléphone au domicile, tandis qu'une enquête cordon est administré en personne dans le véhicule à la limite (cordon) d'une zone à l'étude;
    • un exemple de questionnaire Internet conçu par l'équipe de la Chaire Mobilité de Polytechnique pour une enquête sur les déplacements est visible dans cette vidéo.
  • questionnaire : définition de la structure et du contenu du questionnaire, des types et de la formulation des questions, du format des réponses.

La conception d'une enquête répond à plusieurs contraintes et résulte de compromis, le plus fondamental étant celui entre les ressources (temps, argent, main d'œuvre), la qualité et la quantité des données[5]. Pour des ressources données, la qualité est fonction de la quantité désirée, ou la quantité est fonction de la qualité désirée : si la taille augmente, la qualité diminue, et vice versa. Il y a par exemple un compromis entre le détail et la complexité des questions (et des informations recherchées) et le nombre de réponses qui seront obtenues.

Les principales étapes de la réalisation d'une enquête sont les suivantes :

  • Planification préliminaire liée aux objectifs de l'enquête;
  • Choix d'une méthode d'enquête : cadre temporel, type et technique d'enquête;
  • Plan d'échantillonnage : population cible et unité d'échantillonnage, méthode d'échantillonnage, taille d'échantillon;
  • Conception du questionnaire et de l'outil d'enquête;
  • Enquête pilote : tester les outils et tous les aspects de l'enquête;
  • Réalisation de l'enquête (des entrevues le cas échéant);
  • Traitement des données : correction et expansion des données pour inférer les réponses pour la population cible, par exemple pour représenter toutes les composantes démographiques de la population cible.

Il existe de nombreux enjeux méthodologiques généraux des sondages et en particulier de l'échantillonnage que le lecteur intéressé peut explorer. La question des sondages est liée aux modèles de choix en économie, où on distingue les enquêtes à préférence révélées (sur des situations réelles) et déclarées (sur des situations hypothétiques)[6].

Parmi les enjeux des enquêtes est la difficulté de rejoindre les personnes et le taux de réponses. La méthode traditionnelle d'utiliser la liste des abonnés au téléphone fixe entraîne des biais importants puisqu'une part grandissante de la population n'a pas de téléphone fixe, mais que les usagers plus âgés n'ont pas forcément de téléphone mobile. Une fois les personnes rejointes, une proportion importante refuse de répondre : il faut alors vérifier qu'une partie de la population n'est pas sous-représentée, voir complètement absente des répondants.

Le problème fondamental des enquêtes est que la méthode peut influencer les comportements : pour différentes raisons, comme la désirabilité sociale ou simplement l'oubli, les personnes ne vont pas répondre la vérité. C'est pourquoi il est nécessaire d'avoir recours à des méthodes d'observation, pour une meilleure qualité des données ou des données complémentaires

Méthodes d'observations des déplacements

[modifier | modifier le wikicode]

Introduction : que veut-on et que peut-on mesurer ?

[modifier | modifier le wikicode]

À la différence des méthodes d'enquête, les méthodes d'observation visent à obtenir des données sans interagir avec les usagers, de façon passive (on parle d'observation naturaliste (article en anglais)), et ainsi éviter de perturber leurs comportements (ce qui pourrait se produire lorsque l'usager se sait observé ou qu'on lui pose des questions). Que veut-on et que peut-on mesurer par observation des déplacements?

  • Quoi? Des informations (attributs) sur toutes les composantes des systèmes de transport: usagers, véhicules et infrastructure
  • Quelles grandeurs? Idéalement, si on connaissait les déplacement complets de tous les usagers, en terme de trajectoires, on pourrait en dériver toutes les mesures nécessaires. Ce n'est pas pratique, car coûteux et pas souhaitable à cause des enjeux éthiques et les risques liés à ces données personnelles. En pratique, on veut détecter :
    • le nombre d'usagers et de véhicules (comptages), vitesses et taux d'occupation, classés selon les caractéristiques des usagers (âge, genre, etc.) ou des véhicules (type, longueur, poids, etc.);
    • la présence des usagers et véhicules pour la régulation de la circulation, ou pour calculer le taux d'occupation;
    • des évènements pertinents, comme des incidents, files d’attente, infractions, ce qui est peut être le difficile à faire.
  • Quand? À quel(s) moment(s), mais aussi avec quelle fréquence (on parlera aussi de collecte permanente ou temporaire).
    • Les observations peuvent être à un instant spécifique, ou à plusieurs instants, sur une période (par exemple pendant une heure) avec une certaine fréquence (par exemple toutes les 5 min).
  • Où? À quel(s) endroit(s), avec quelle résolution et couverture spatiale.
    • Les observations peuvent être à un endroit spécifique, ou à plusieurs endroits, sur une zone (par exemple une section de route) avec quelle granularité (par exemple tous les 100 m).
    • La couverture spatiale décrit l'espace qui est observé par la méthode ou le capteur : une méthode ponctuelle fait des mesures en un point de la route (pour des déplacements linéaires) ou passant une ligne de façon générale (pour des déplacement à deux dimensions, par exemple pour les piétons), tandis qu'une méthode spatiale fait des mesures sur l'ensemble d'une zone d'une certaine taille où se déplacent des usagers (définie par exemple par un rectangle).

Nous allons présenter dans la suite les méthodes (et généralement les capteurs associés) en deux grandes catégories selon leur couverture de l'espace, ponctuelle ou spatiale, et leurs autres attributs.

Capteurs ponctuels

[modifier | modifier le wikicode]
Boucle à induction enfouie dans la chaussée visible devant la voiture.

Les différentes méthodes de collecte de données ont différentes caractéristiques (voir tableau à la fin de la section pour un résumé des caractéristiques principales d'un sous-ensemble des capteurs les plus courants), ce qui les rend adaptés à différentes situations. La première est d'être manuelle ou automatique, auquel cas la collecte de données repose sur l'utilisation d'un capteur. On effectue encore régulièrement des comptages manuels de tous les types d'usagers, en particulier aux carrefours. De façon automatique, les boucles à induction magnétique enfouies dans la chaussée permettent aussi de compter des véhicules, motorisés ou non (voir image ci-contre). Les boucles sont les capteurs les plus courants, mais ils commencent à être remplacées par d'autres capteurs magnétiques sous forme de plaque ou rondelles enfouies dans ou attachées sur la chaussée.

Toutes ces méthodes sont ponctuelles, par opposition aux capteurs spatiaux traités dans la prochaine section. Les capteurs infrarouges permettent de compter des piétons ou des véhicules franchissant la ligne invisible du capteur (article Wikipedia en anglais sur les technologies de comptage des piétons).

Une autre caractéristique est l'aspect permanent ou temporaire de la méthode. La boucle magnétique est un capteur permanent, alors que les comptages manuels ne peuvent se faire que sur des périodes de temps limitées, de façon donc temporaire. Un capteur automatique, mais temporaire est le tube pneumatique, qui est le capteur temporaire le plus courant pour compter des véhicules.

Tube pneumatique posé sur la route, avec le compteur sur le trottoir.

La caractéristique intrusive des capteurs est aussi importante : par exemple, l'installation de boucles à induction requiert de faire des travaux sur la chaussée pour enfouir la boucle dans la chaussée. Cela amène une dégradation, un vieillissement accéléré de la chaussée et entraîne des impacts sur la circulation lors des interventions pour leur entretien (ce qui arrive fréquemment). À la différence des boucles à induction, le radar est installé sur le côté ou au-dessus de la chaussée et n'est donc pas intrusif. Il remplit des fonctions similaires à la boucle magnétique : il est automatique, ponctuel et permanent.

Enfin, tous ces capteurs sont fixes par rapport à l'infrastructure, ils ne bougent pas. Des capteurs peuvent être embarqués, c'est-à-dire se déplacer dans la circulation, comme dans l'ancienne technique des véhicules flottants (une personne payée pour collecter des données sur l'état de la circulation en se déplaçant dans la circulation). Aujourd'hui, les usagers transportent des capteurs GNSS sur eux, en particulier dans leurs téléphones intelligents, qui permettent de relever leur trajectoire de déplacement. Ces trajectoires peuvent ensuite être partagées avec des applications mobiles.

Les mesures obtenues de ces capteurs sont des comptages, des présences, des taux d'occupation et des TIV des véhicules ou usagers, basés sur leurs instants de passage. Certains capteurs comme le radar peuvent mesurer la vitesse directement, mais les autres capteurs détectant les instants de passage des usagers peuvent mesurer la vitesse s'ils sont installés par paires, à une distance connue l'un de l'autre. Certains capteurs peuvent classifier les usagers ou véhicules, par exemple selon leur longueur ou leur poids (par exemple les capteurs piézo-électriques pour la pesée).

Les méthodes de collecte de données ont d'autres caractéristiques, que l'on peut mentionner :

  • le caractère discret ou visible par les usagers, auquel cas les usagers risquent de modifier leur comportement (par exemple lorsque les observations visent à évaluer les comportements des usagers et leur lien à la sécurité routière). On utilise aussi les termes de méthode active ou passive, selon que la méthode requiert une action des usagers ou pas.
  • les données peuvent être utilisées en temps réel ou pas (« hors ligne »). Le temps réel nécessite des infrastructures de communication pour transmettre les données.
  • la précision et la robustesse de la méthode, c'est-à-dire la performance de la méthode (erreur sur la grandeur mesurée) et sa fiabilité dans le temps, d'où découle la qualité des données collectées. Certains capteurs ont besoin de calibration selon les conditions de la collecte de données, qui peuvent par exemple dépendre des conditions météorologiques et nécessiter une recalibration à intervalles de temps réguliers.

Pour résumer, la bonne performance des capteurs ponctuels enfouis dans la route, tels que les boucles magnétiques et les capteurs magnétiques, tient en partie à leur proximité au véhicule : ils sont insensibles aux mauvaises conditions météorologiques grâce à un rapport signal sur bruit élevé. Leur inconvénient principal est l'installation dans la chaussée qui requiert une intervention sur la chaussée. Les capteurs ponctuels au-dessus de la chaussée fournissent des données complémentaires et certains peuvent surveiller plusieurs voies avec une seule unité.

Capteurs spatiaux

[modifier | modifier le wikicode]

Le type de données fournies par la méthode est directement relié à la couverture spatiale de la méthode. Les capteurs spatiaux peuvent mesurer tout ce que les capteurs ponctuels peuvent mesurer, mais aussi des phénomènes qui se déroulent dans l'espace (selon les deux dimensions) comme des événements. La plupart des capteurs spatiaux sont des capteurs photographiques, comme les appareils photo et les caméras vidéo. Un premier exemple de méthode est une méthode historique de prise de photo par avion, dans lesquelles les usagers étaient suivis manuellement dans chaque image pour recréer leurs trajectoires. Aujourd'hui, de telles données peuvent être obtenues par des caméras à bord d'hélicoptères ou de drones, et même par des radars dans des satellites.

Le capteur spatial typique est la caméra vidéo : c'est un capteur spatial, fournissant des données très riches (trajectoires complètes, attributs des usagers et véhicules, et événements) qui peuvent être manuellement validées a posteriori (comme c'est utilisé encore dans les centres de gestion de la circulation), et pouvant être installé de façon permanente ou temporaire. C'est aussi un capteur non intrusif (placé en hauteur à des poteaux ou des bâtiments), peu cher, parfois déjà installé (caméras de circulation). Surtout au début de leur utilisation, jusque dans les années 1990, les capteurs vidéo ont été utilisés pour émuler des capteurs existants, par exemple en traçant des boucles virtuelles de détection, et ainsi limiter les calculs, car les ordinateurs de l'époque n'étaient pas aussi puissants qu'aujourd'hui. Aujourd'hui, les méthodes d'intelligence artificielle, vision par ordinateur et apprentissage automatique, ont fait de grands progrès, et il devient possible de détecter et suivre les usagers dans des situations de plus en plus complexes, et même de détecter certains événements. Il n'est cependant pas encore possible d'extraire les trajectoires de tous les usagers et véhicules dans les environnements urbains complexes avec différents types d'usagers, de différentes tailles, et des mouvements complexes qui s'entrecroisent. D'autres inconvénients sont liés aux variations de luminosité et aux faibles luminosités (la nuit) pour les caméras dans le domaine du visible (visible par l'œil humain). Pour palier à ces problèmes, il est possible d'utiliser des caméras infrarouges.

Un autre capteur spatial est le LIDAR ("light radar")] qui permet de relever, en deux ou trois dimensions, un nuage de points de l'environnement. Il est alors possible de construire des modèles en trois dimensions de la scène, y compris des usagers et véhicules, et donc de les suivre à chaque balayage du LIDAR. Ce capteur coûte encore très cher, mais il devrait devenir plus accessible à moyen terme, et est déjà utilisé par les agences de transport responsables des infrastructures de transport pour faire l'inventaire de ces infrasctructures, par exemple regarder l'état de la chaussée, des panneaux de signalisation, et autres infrastructures civiles.

Vue de Folsom Street (en) (San Francisco) par un lidar Ouster OS1 monté sur une voiture sous forme de nuage de points : chaque point est coloré en fonction de l'intensité du signal retour.
Exemple de positions recueillies par un capteur GNSS lors d'un déplacement d'un utilisateur de l'application MTL Trajet de la Ville de Montréal en 2017.

Une dernière catégorie est celle des capteurs donnant des détections uniques des usagers, par exemple les lecteurs de transpondeurs aux péages routiers (marqueurs RFID) et de connexion à des appareils Wifi et Bluetooth. Les plaques d'immatriculation des véhicules permettent aussi le suivi unique des véhicules. Il est ainsi possible d'obtenir des temps de déplacements et des trajectoires simplifiées des usagers à des points prédéfinis. Le capteur idéal pour la collecte de données spatiale est le capteur GNSS pour relever des trajectoires complètes des usagers qui acceptent de partager leurs positions.

En ce qui concerne les différents modes, ces méthodes ont été pensées à l'origine pour détecter les véhicules motorisés. Certains capteurs, comme les caméras, fonctionnent pour tous les usagers. D'autres nécessitent des adaptations pour ce faire, comme les boucles magnétiques pour les vélos et les capteurs infrarouges pour les piétons.

Tableaux d'exemples récapitulatifs

[modifier | modifier le wikicode]
Caractéristiques principales des méthodes principales (temp.: temporaire; perm.: permanent) (certaines caractéristiques sont graduées, du minimum (-) au maximum (++: très bon))
Ce qui est indiqué dans le tableau est pour des cas typiques, mais les caractéristiques des méthodes pourraient changer dans des cas particuliers.
Caractéristique Mesure manuelle Couverture Permanent Intrusif Fixe Discret Précision
Manuel oui ponctuelle temp. non oui + +
Tubes non ponctuelle temp. non oui - +
Boucles non ponctuelle perm. oui oui ++ ++
Radar non ponctuelle perm. non oui ++ ++
Imagerie aérienne oui spatiale temp. non oui ++ ++
Vidéo non spatiale temp./perm. non oui + +
GNSS non spatiale temp./perm. non non - ++
Grandeurs mesurées par les différentes méthodes (type: catégorie d'usager (mode))
Grandeur Manuel Tubes Boucles Radar Imagerie aérienne Vidéo GNSS
Comptage oui oui oui oui oui oui oui
Vitesse non oui oui (2) oui oui oui oui
Classification type non longueur longueur type type type
Événements non non non non oui oui oui
Couverture (rappel) ponctuelle ponctuelle ponctuelle ponctuelle spatiale spatiale spatiale

Enjeux de la collecte de données et surveillance

[modifier | modifier le wikicode]

Les données de déplacements des personnes sont des données personnelles dont il est possible de dériver beaucoup d'informations privées. Il y a donc un risque de surveillance des usagers des transports, avec des enjeux éthiques et des risques sur la vie privée des personnes. Pour les collecter, les agences publiques et les chercheurs ne peuvent collecter des données personnelles que pour des objectifs bien spécifiques. Ils doivent faire l'objet d'une demande d'évaluation éthique, et l'autorisation de leur collecte dépend du rapport entre les risques pour les personnes en regard des objectifs de la collecte et des avantages pour la société. Ces données, une fois collectées, doivent être protégées et gardées confidentielles pour éviter des mauvaises utilisations. C'est pourquoi il peut parfois être préférable de collecter des données plus pauvres mais intrinsèquement anonymes, comme des comptages, plutôt que des données plus complètes et riches comme des trajectoires individuelles des personnes.

Bansky one nation under cctv
  1. ATC (2015). Notions élémentaires sur la collecte de données sur le transport urbain des personnes : suivre le monde en constante évolution. https://www.tac-atc.ca/sites/tac-atc.ca/files/site/doc/resources/ptm-dcmp-f-primer.pdf
  2. ARTM. Enquête Origine-Destination. Accédé le 12 décembre 2022. https://www.artm.quebec/planification/enqueteod/
  3. Notes du cours "Systèmes de transport" CIV2710, Polytechnique Montréal
  4. Bonnel, P. (2002). Prévision de la demande de transport (Doctoral dissertation, Université Lumière-Lyon II). https://tel.archives-ouvertes.fr/docs/00/26/89/19/PDF/HDR_Bonnel_Patrick.pdf
  5. Richardson, A. J. (Anthony Joseph) & Meyburg, Arnim H & Ampt, Elizabeth S (1995). Survey methods for transport planning. Eucalyptus, Parkville, Vic http://www.no2hcf.co.uk/docs/Traffic_survey_form.pdf
  6. Fundamentals of Transportation. (2020). Wikibooks, The Free Textbook Project. https://en.wikibooks.org/wiki/Fundamentals_of_Transportation/Data