GSCOP-RUB-GROG-poster

Soutenance de thèse de Thomas BARZOLA lundi 20 mars 2023 à 14h00 en amphithéâtre Gosse - 46 avenue Félix Viallet, 38000 Grenoble et Zoom

Intitulée : « A Modular Approach to Compare Optimization Methods for Bike Sharing Systems »
Lien vers le Zoom
Meeting ID: 992 2019 8215
Passcode: 2

Jury de thèse :
 
  • Rapporteurs : Frédéric Meunier et Tal Raviv
  • Examinateurs : Christine Solnon, Etienne Côme et Nadia Brauner
  • Encadrants: Van-Dat Cung, Nicolas Gast, Vincent Jost

Résumé :

Les systèmes de vélos en libre-service (VLS) sont aujourd'hui installés dans de nombreuses villes. Dans un tel système, un utilisateur peut prendre n'importe quel vélo disponible et le rendre là où il y a une place de parking libre. La littérature de recherche opérationnelle contient de nombreux articles qui étudient les questions d'optimisation liées aux VLS, et en particulier maximiser la disponibilité des vélos où et quand les utilisateurs en ont besoin. Cependant, les méthodes d'optimisation proposées par ces articles sont difficiles à comparer car la plupart des articles utilisent leurs propres instances de problèmes et définissent leurs propres métriques. Cette thèse vise à combler cette lacune en construisant une méthodologie de recherche reproductible pour les VLS. Dans ce travail, nous divisons cette méthodologie en quatre modules : utilisation de données historiques, estimation de la demande, méthodes d'optimisation et évaluation des performances. Nous étudions chaque module séparément. Dans chaque cas, nous proposons un prototype d'implémentation et comparons les solutions existantes lorsqu'elles sont disponibles. Le premier module traite de l'utilisation de données provenant de systèmes réels. Pour de nombreux systèmes, deux types de données sont en général disponibles : les trajets effectués par les utilisateurs, et les enregistrements du nombre de vélos disponibles dans chaque station. En général ces données sont incohérentes, nous proposons une méthode pour corriger cela et détecter les opérations de relocalisation. Le deuxième module est l'estimation de la demande. Pour optimiser un VLS, il est essentiel d'estimer la demande des utilisateurs pour lesquels le système est conçu. La plupart des travaux d'optimisation de la littérature utilisent la demande historique pour estimer la demande du système. Nous expérimentons les quelques méthodes de la littérature existantes ainsi qu'une méthode nouvellement introduite pour détecter la demande censurée. Le troisième module est l'optimisation de la disponibilité des vélos.A titre d'exemple, nous re-implémentons un algorithme d'optimisation publié. Nous illustrons les défis de la recherche reproductible en essayant de reproduire les résultats. Ce chapitre montre que, même si les auteurs originaux ont mis à disposition un grand nombre de données sur leurs expériences, nous n'avons pas obtenu les mêmes résultats quantitatifs que la publication originale. Cette différence souligne la nécessité d'améliorer les normes de publication afin de produire des résultats plus reproductibles. Enfin, notre quatrième et dernier module est utilisé pour valider les méthodes d'optimisation implémentées dans le 3ème module. Nous considérons qu'un simulateur ayant toutes les exigences (modèles de comportement des utilisateurs, scénarios de demande, stratégies de gestion, etc.) peut être un modèle de validation. Nous utilisons un simulateur tiers pour illustrer ce module. Nous avons observé tout au long de cette thèse que la reproductibilité des recherches n'est pas toujours traitée avec la diligence requise alors qu'elle est fondamentale pour produire des connaissances. Dans ce travail, nous nous efforçons de spécifier et de fournir des outils reproductibles afin de garantir que des chercheurs puissent obtenir les mêmes résultats avec les mêmes données. Nous fournissons des liens vers les données, les codes, les environnements et les analyses nécessaires à la reproduction des expériences.

Abstract :

Bike Sharing Systems (BSSs) are nowadays installed in many cities. In such a system, a user can take any available bike and return it to wherever there is an available parking spot. The Operations Research literature contains many papers that study optimization questions related to BSS, and in particular how to maximize the availability of bikes where and when the users need them. Yet, the optimization methods proposed by these papers are difficult to compare because most papers use their own problem instances and define their own metrics. This thesis aims to fill this gap by building a reproducible research methodology for BSSs. In this work, we divide this methodology in four modules: use of historical data, demand estimation, optimization methods, and performance evaluation. We study each module separately. In each case, we propose a prototype implementation and compare existing solutions when they are available. The first module handles the use of data from real systems. For many systems, two types of data are usually available: trips made by users, and records of the number of bikes available in each station. We observe that in general these data are inconsistent and we propose a method to correct this and detect relocation operations. The second module is the demand estimation one. In optimizing a BSS, it is essential to estimate the demand of the users for whom the system is designed. Most of the optimization works in the literature use historical demand to estimate the demand of the system. We experiment with the few existing methods of the literature along with a newly introduced method to detect censored demand. The third module is bike availability optimization. We implement a published optimization algorithm for this module as an example. We illustrate the challenges of reproducible research by trying to replicate the results. This chapter shows that, although the original authors made the data about their experiments available, we did not get the same quantitative results as the original publication. This difference highlights the need for better publication standards to produce more reproducible results. Finally, our fourth and last module is used to validate the optimization methods implemented in the 3rd module. We advocate that a simulator having all the requirements (user behavior models, demand scenarios, management strategies, etc.) can be a validation model. We use a third-party simulator to illustrate this module. We observe throughout this thesis that making research reproducible is not always handled with due diligence while being fundamental to produce valuable knowledge. In this work, we try our best efforts to specify and provide reproducible tools to ensure that researchers could obtain the same results with the same data. We give links to the data, codes, environments and analyses needed to reproduce the experiments.