Sujets, 2022/2023 Printemps
RC1. Data Explorable
Domaines | Data science, Data Mining, Big Data… |
---|---|
Librairies (proposées) | scikit-learn, seaborn, bokeh, d3js, chart.js, etc. |
Langages (proposé) | Python, javascript, html/css, etc. |
Responsable du sujet | Rémy Cazabet |
Informations à voir | http://cazabetremy.fr/Teaching/LIFPROJET.html |
Le principe de ce projet est de choisir une source de données accessible (open data, data crawling, etc), de collecter ces données, les analyser, et construire un “explorable” permettant à n'importe qui d'explorer ces données de manière interactive, typiquement sous la forme d'un site web.
Vous êtes libre de choisir les données qui vous intéresse, et nous discuterons des analyses que nous pouvons en faire (restitution sous forme de cartes, de réseaux/graphes, de graphiques interactifs, sous forme de site-web ou non, etc.).
Quelques exemples classiques de données: Données météorologiques, Données de santé (Covid…), Données sportives (résultats sportifs par saison ou par match…), Culturelles (données de films, de musique…), Restaurants/Musées… Mais aussi: (politique, réseaux sociaux, économie, environnement, sécurité, etc.)
Si vous ne savez pas quelles données existent ou non, partez du principe que tout existe, et nous chercherons ensemble ce qui est effectivement accessible. Si vous ne savez pas où trouver des données, quelques points de départ: https://data.grandlyon.com/accueil, https://www.data.gouv.fr/fr/ , https://datasetsearch.research.google.com .
Vous pouvez consulter quelques projets précédents sur ma page http://cazabetremy.fr/Teaching/StudentsProduction.html .
RC2. Kaggle Challenge
Domaines | Machine Learning (“Intelligence Artificielle”) | |
---|---|---|
Librairies (proposées) | scikit-learn, keras, tensor-flow… | |
Langages (proposé) | Python, autre | |
Responsable du sujet | Rémy Cazabet | |
Informations à voir | Challenges Kaggle en cours | |
Kaggle est le site web le plus connu de challenges en machine learning.
En 2 mots: des entreprises proposent des challenges auxquels n'importe qui peut tenter de proposer une solution. La meilleure solution gagne. Mais là où Kaggle est particulièrement intéressant, c'est qu'il propose des tutoriels pour résoudre certains problèmes classiques, en utilisant différentes méthodes. Votre objectif: 1) Suivre un/des tutoriels pour résoudre un problème tout fait, 2)Choisir un challenge en cours et appliquer ce que vous avez appris. Vous pouvez consulter quelques projets précédents sur ma page http://cazabetremy.fr/Teaching/StudentsProduction.html.
RC3. Recommendation de contenus
Domaines | Machine Learning | |
---|---|---|
Librairies (proposées) | scikit-learn, keras, tensor-flow… | |
Langages (proposé) | Python, autre | |
Responsable du sujet | Rémy Cazabet | |
Informations à voir | Notebook pour commencer | |
L'objectif de ce projet est de créer un outil de recommendation de contenus: pour un utilisateur qui indique ses préférences (notes ou like) sur des contenus (films, musiques, jeux vidéos…), vous lui recommanderez des contenus similaires, découvert automatiquement à partir des préférences des autres utilisateurs (en se basant sur des bases de données existantes). Vous pouvez travailler uniquement sur l'algorithme lui-même (python uniquement donc), ou faire un site web complet de recommendation. Un exemple de méthode classique pour le faire est le collaborative filtering: https://en.wikipedia.org/wiki/Collaborative_filtering , mais d'autres méthodes plus avancées seront possible pour les groupes qui avancent rapidement.
RC4. Web crawling et data analysis de données de publications scientifiques
Domaines | Web crawling, base de données, analyse de données | |
---|---|---|
Librairies | beautifulsup, languages web… | |
Langages (proposé) | python, javascript | |
Responsable du sujet | Rémy Cazabet | |
Informations à voir | https://taylorandfrancis.com/partnership/commercial/accelerated-publication/ | |
Dans le cadre d’un projet de recherche, nous souhaitons étudier le temps écoulé entre la soumission d’un article à un journal scientifique et sa publication. Plus particulièrement, nous nous intéressons à un nouveau modèle économique pour lequel les chercheurs peuvent payer pour accélérer le temps d’évaluation de leurs articles: nous voulons voir les effets sur la vitesse d’acceptation. L’idée est d’écrire des scripts de web-crawling pour récupérer automatiquement ces dates dans des journaux d’intérêts. En particulier ceux proposant cette nouvelle solution (https://taylorandfrancis.com/partnership/commercial/accelerated-publication/), mais aussi d’autres journaux typiques pour avoir un point de comparaison. Ces données devront être stockées dans un format standard dans une base de données, et mis à jour automatiquement à intervalle fixe, par exemple chaque semaine. Vous disposerez d’un serveur web pour faire tourner vos scripts. Si vous le souhaitez, vous développerez un site web pour permettre aux chercheurs de voir le temps moyen d’acceptation d’un article dans chaque journal
RC5. Outil de visualisation d’un arbre de tweet/ (Twitter, Mastodon)
Domaines | data viz, analyse de réseaux sociaux, etc. | |
---|---|---|
Librairies | API twitter, javascript, (python..)l | |
Langages (proposé) | python, javascript | |
Responsable du sujet | Rémy Cazabet |
Twitter est un media social très utilisé pour partager et suivre de l’information. Bien que donnant souvent lieu à des débats houleux entre ses membres, il n’a pas d’outil simple pour suivre l’ensemble de l’arbre de discussion autour d’un twitt initial. Vous proposerez un outil graphique, de préférence sous la forme d’un site web, pour afficher des arbres de discussion a partir d’un tweet d’origine. Vous pourrez vous concentrer sur l’aspect collecte et classement des données (quelles réponses montrer lorsqu’il y en a des milliers ?) et/ou sur l’aspect visualisation (arbre intéractif avec D3.js où l’on peut plier et déplier des branches à la demande.)
RC6. Site web de jeu en ligne interactif
Domaines | Web | |
---|---|---|
Librairies | Utiliser des frameworks complet (MERN, MEAN) https://www.datasciencecentral.com/profiles/blogs/mern-vs-mean-which-stack-to-use-in-2021 | |
Langages (proposé) | Javascript, html, etc. | |
Responsable du sujet | Rémy Cazabet |
Dans ce sujet, vous développerez un site web, en utilisant des frameworks modernes de votre choix, par exemple parmi la liste suivante : (https://medium.com/javarevisited/10-best-frontend-and-backend-frameworks-for-java-python-ruby-and-javascript-developers-cce3c951787a), de préférence en les combinant (MERN, MEAN, MEVN…). Ce site web doit permettre de jouer à un jeu, quel qu'il soit, depuis un jeu que vous avez inventé à un classique de type scrabble, dames, échecs ou autre. Il doit permettre aux joueurs de jouer en temps réel les uns contre les autres (salon de jeu, codes pour rejoindre une partie…), et d'afficher des statistiques (hall of fame, meilleurs scores du jour, etc.).
RC7. Contribution à la librairie Python CDlib (Community Detection Library)
Domaines | Machine Learning, python, developpement logiciel,… |
---|---|
Librairies (proposées) | cdlib, networkx, scikit-learn, seaborn, etc. |
Langages (proposé) | Python |
Responsable du sujet | Rémy Cazabet |
Informations à voir | http://cazabetremy.fr/Teaching/LIFPROJET.html |
La librairie python CDlib (Community Detection library) est une librairie spécialisée dans le problème de la détection de communautés dans les graphes, un problème équivalent à celui du clustering mais pour des données de type graphe. Il s’agit de la principale librairie du domaine, avec plus de 100 téléchargements individuels par mois. Je suis l’un des 3 principaux contributeurs de cette librairie. Le sujet de ce POM consiste à contribuer à la librairie, par exemple en y ajoutant de nouveaux algorithmes, en corrigeant des bugs, en améliorant le code ou la documentation, etc. Il y a 2 aspects: 1)Aspect “machine learning”, puisqu’il faudra se plonger dans domaine du machine learning, le clustering de graphe, 2)Un aspect développement logiciel, puisqu’il faudra comprendre le fonctionnement d’une librairie python, de la génération automatique de documentation, et coder avec un niveau de qualité suffisant pour intégrer du code à une librairie utilisée par des centaines de personnes.
Références: -Code de la librairie: https://github.com/GiulioRossetti/cdlib -Documentation: https://cdlib.readthedocs.io/en/latest/ -Liste d’améliorations possible identifiées: https://github.com/GiulioRossetti/cdlib/projects/2
AM1. Deep learning et image : classification et génération d'images
Domaines | Image Processing / Deep Learning(IA) / Interaction |
---|---|
Techniques et langages | Python / PyQt |
Responsable du sujet | Alexandre Meyer |
Niveau de difficulté | intermédiaire |
L'objectif de ce projet est d'explorer les possibilités qu'offre les réseaux de neurones à traiter des images. Il y a deux grandes pistes qui peuvent être explorées. D'abord la classification d'images qui cherche à reconnaitre un objets à partir de sa photo, c'est à dire à lui donner un label : le nom de la personne, le type d'objet, un caractère pour la reconnaissance d'écriture, des informations sur des images satallitaires ou médicales, etc. Le deuxième aspect est l'édition ou la génération de nouvelles images. Un réseau peut apprendre à modifier, voir à générer une nouvelle image après avoir “appris” sur une base d'images du même type.
Par exemple, les auto-encoders sont une classe d'algorithme basée sur les réseaux de neurones profonds qui transforment un jeu de données (des images pour nous) en une représentation latente (cachée) que l'on nomme un code. Ils sont composés d'un encodeur qui produit le code et d'un décodeur qui repasse du code à la données d'origine (l'image). Une piste pour ce sujet serait de construire cet auto-encoder sur une classe d'images puis d'offrir à l'utilisateur des curseurs pour éditer le code tout en lui montrant l'image décodé. En allant plus loin, il est également envisageable d'explorer les GAN (Generative Adversarial Network) pour produire une nouvelle image … Le domaine est vaste.
GANs vs. Autoencoders: Comparison of Deep Generative Models GAN — Some cool applications of GANs.
AM2. Animation procédurale des mouvements d'un personnage et jeu vidéo sous Unity
Domaines | Animation/Interaction/Jeu vidéo |
---|---|
Techniques et langages | C# / Unity |
Responsable du sujet | Alexandre Meyer |
Difficulté | Raisonnable / Intermédiaire |
Les approches classiques d'animations d'un personnage virtuel dans un jeu vidéo sont en utilisant des clips d'animations. Ces clips peuvent être produit par un animateur, provenir de capture de mouvements ou être généré procéduralement. En pratique, les 3 approches sont souvent mélangées. L'idée de ce sujet est d'explorer la famille de techniques de génération procédurale. A partie de données comme la longueur du pas, l'algorithme pourra produire les positions de pieds sur le sol, ainsi qu'une trajectoire de vol entre chaque contact. En phase avec la trajectoire des pieds il est possible de produire une trajectoire du bassin. Le reste du corps pourra être déduit par de la cinématique inverse.
Unity semble être une bonne plateforme pour ceci car il propose un certains nombres d'outils intégrés : un algorithme de ray-casting pour trouver l'interection entre un rayon et la surface du sol (point de contact du pied), un algorithme de cinématique inverse pour générer la position du corps en fonction des positions des pieds, etc.
Il est possible de travailler uniquement sur l'animation ou d'inclure ces mouvements dans un jeu vidéo : jeu de sport, jeu de combat, voir “plateformer” ou exploration d'un monde. L'équipe du projet peut se partager entre les dévelopeurs du jeu qui déplaceront un personnage non animé dans un 1er temps et incluront l'animation procédurale au fur et à mesure.
AM3. Capture et transfert d'animation d'un visage vers un autres par image warping ou déformation de maillages 3D
Domaines | Image Processing |
---|---|
Techniques et langages | Python ou C++/OpenGL ou C#/Unity |
Responsable du sujet | Alexandre Meyer |
Difficulté | Sujet progressif |
L'objectif de ce projet est de développé un algorithme capable de transférer le mouvement d'un visage d'une personne filmé vers une autre personne. La capture de l'animation du visage source se fera en détectant les points caractéristiques d'un visage filmé avec une webcam en utilisant DLib (python ou C++).
Un premier prototype se fera en générant une nouvelle position de marqueurs de visage puis en réalisant un warping (déformation) de l'image du visage cible. Une interpolation par RBF (ou autre) semble une solution réalisable.
Ce warping pourra s'etendre dans 2 directions - vers la déformation d'un maillage 3D, probablement en utilsant Gkit (le code de LIFGRAPHIQUE en L2); - vers une éformation 2D plus réaliste en utilisant les réseaux de neurones (GAN).
AM4. Animation physique et optimisation de la morphologie de créatures animées
Domaine | Algorithme évolutionniste, simulation physqiue, méta heuristiques, optimisation, moteur physique |
---|---|
Langage | C++ ou python avec BulletPhysics; Ou C# avec Unity; etc. |
Responsable du sujet | Fabien Rico et Alexandre Meyer |
Information à voir | |
http://jvf.free.fr/550_Articles_LinuxMag/GLMF_076_034_041.pdf | |
https://www.youtube.com/watch?v=JBgG_VSP7f8 | |
https://www.youtube.com/watch?v=m4E9sj9vH1I |
Les algorithmes évolutionnistes ou génétiques sont des méta-heuristique d'optimisation c'est à dire des méthodes globales pour résoudre des problèmes de toutes sorte qu'il faut adapté à un problème particulier. Comme leur nom l'indique, ils sont basés sur le concepts d'évolution. On génère une famille aléatoire d'individu dont on conserve les plus performant, que l'on mélange pour générer une nouvelle famille …
Une idée classique de ce choix de projet est d'appliquer ces algorithmes évolutionnistes à un problème de génération de forme de créatures en cherchant à ce que ces créatures réalisent une tâche le mieux possible : par exemple la locomotion. Vous prendrez en main un moteur physique. L'algorithme évolutioniste proposera une série de créatures avec des morphologies différentes encodées par une séquence de “gènes” (un code). La simulation physique donnera une distance de déplacement que l'algo cherchera à maximiser.
L'implémentation peut se faire en C++ ou en python avec le moteur BulletPhysics; mais également en C# avec Unity.
AM5. Modélisation, Rendu, Animation de nuages ou de la surface de l'eau
Domaine | Synthèse d'images |
---|---|
Langage | C++ (ou C# avec Unity) |
Responsable du sujet | Alexandre Meyer |
Information à voir | |
https://tel.archives-ouvertes.fr/tel-00319974/file/defense.pdf | |
Les nuages ou l'eau font partis des éléments à modéliser, afficher et animer dans une scène d'extérieure en synthèse d'images. Ce projet se propose d'explorer certains aspects des nuages ou de la surface de l'eau : leur formation, leur mouvement, leur interaction avec la lumière.
La réalisation pourra se faire en C++ avec gkit (ou autre code en C++), mais pourra également se réaliser en C# sous Unity.
SA1. Modélisation distribuée d’un jeu stratégique - Exemple du tactical RPG
Domaine | Intelligence Artificielle |
---|---|
Langage (proposé) | C++, java |
Responsable du sujet | |
A voir | https://perso.liris.cnrs.fr/samir.aknine/L3/Battle%20Simulation%20Distributed%20AI%20-%20Vid%c3%a9o%20pr%c3%a9sentation.mp4 |
L’objectif de ce projet est de proposer une modélisation distribuée d’un jeu stratégique. Nous prendrons comme exemple le tactical RPG. Nous considérerons des personnages qui évoluent sur un environnement dynamique. Les personnages appartiennent à plusieurs groupes. Les personnages peuvent se déplacer en même temps selon des règles préétablies. Nous implémenterons une méthode de résolution distribuée avec des entités autonomes dotée de comportements intelligents. Nous commencerons par définir des stratégies de résolution simples dans lesquelles les personnages effectuent des déplacements uniquement sur la base de leur perception. Dans une deuxième étape, nous définirons des stratégies de résolution plus fines permettant aux personnages de construire des stratégies de jeu collectives en interagissant avec leur voisinage. Plusieurs exemples de jeux ont été déjà implémentés par les étudiants. Nous pourrons mettre a disposition leur code. Des exemples de développements se trouvent a cette adresse : https://perso.liris.cnrs.fr/samir.aknine/L3/
SA2. Partage dynamique d’énergie verte entre des ilots autonomes et des véhicules connectés
Domaine | Intelligence Artificielle |
---|---|
Langage (proposé) | C++, java |
Responsable du sujet | Samir AKNINE |
Plusieurs projets urbains innovants d’ilots autonomes tels que le projet du groupe Bouygues-construction pour la gestion intelligente de l’énergie traitent du problème du partage dynamique de l’énergie avec son réseau de communication énergétique et un système de stockage par des batteries de nouvelle génération directement installées dans les bâtiments. Ce projet vise à équiper les foyers avec de nouveaux dispositifs intelligents pour éprouver des solutions originales pour les futurs réseaux de distribution. Il cible l’ouverture des réseaux et l’exploitation automatique des îlots. L’évolution actuelle de ces ilots est renforcée grâce au développement de nouvelles batteries de stockage à fort potentiel et à faibles coûts, et au transfert intelligent de l’énergie entre les ilots avec un câblage interne indépendamment des systèmes de distribution classiques. Ce transfert permet d’envisager une adaptation de la consommation de manière locale, i.e., à l’échelle d’un quartier, en réduisant les coûts et les pertes du transport de l’énergie.
Pour accompagner le développement de ce projet, une solution pour la gestion du surplus d’énergie s’est inscrite en direction des véhicules autonomes solution de stockage et d’usage intelligent de l’énergie renouvelable. Ce modèle de fonctionnement requière l’installation de bornes de rechargement communicantes au niveau des ilots autonomes permettant aux résidents et aux non-résidents de l’ilot d’accéder au surplus d’énergie produite dans ces ilots moyennant une participation financière mais avec un coup d’achat de cette énergie relativement inférieur à celui appliqué par les fournisseurs standards. La gestion de l’énergie doit ainsi être reformulée comme un problème de planification où l’énergie fournie est considérée comme une ressource partagée et intermittente dont l’usage doit être régulé et optimisé par ce nouveau système intelligent. L’objectif de ce projet est ainsi d’implémenter une méthode de résolution qui permet aux véhicules de se recharger auprès des bornes intelligentes et de contrôler dynamiquement les interactions entre les véhicules autonomes et les bornes. Les étudiants peuvent se baser sur une premiere implementation deja realisee sur projet pour développer les nouveaux mécanismes.
Des exemples de développements se trouvent a cette adresse : https://perso.liris.cnrs.fr/samir.aknine/L3/
SA3. Livraison de marchandises
Domaine Intelligence Artificielle Langage (proposé) C++, java Responsable du sujet Samir AKNINE L’objectif de ce travail est de proposer un planner automatique pour la livraison intelligente de marchandise. Nous allons considérer un ensemble de véhicules de livraison chacun ayant des propriétés spécifiques (ex. poids maximum à transporter, niveau d’autonomie, …). Chaque véhicule possède une liste de tâches à accomplir dans la journée. Il doit planifier l’ordre d’exécution de ses tâches de manière dynamique et parer à tout événement pouvons se produire dans son environnement (ex. blocage ponctuel d’une voie). Nous proposerons une modélisation distribuée dans laquelle chaque véhicule possède des connaissances de son environnement et peut interagir avec les autres véhicules et l’infrastructure. Il décide individuellement de ses actions et peut adapter ses comportements de manière dynamique. Nous implémenterons et testerons un ensemble de mécanismes pour garantir cette interaction et adaptation aux événements imprévus. Une première implémentation de ce travail peut etre mise a disposition des étudiants. Des exemples de développements se trouvent a cette adresse : https://perso.liris.cnrs.fr/samir.aknine/L3/
SA4. Gestion intelligente de parkings dans un centre urbain
Domaine | Intelligence Artificielle |
---|---|
Langage (proposé) | C++, java |
Responsable du sujet | Samir AKNINE |
L’objectif de ce projet est de proposer une méthode distribuée pour l’affectation des places de stationnement à des véhicules intelligents. Le rôle de l’étudiant est d’implémenter l’ensemble des comportements nécessaires aux véhicules pour interagir avec les parkings et négocier le tarif de stationnement qui est décidé dynamiquement en tenant compte d’un ensemble d’informations, telles que la durée du stationnement, le profil de l’usager, le taux d’occupation du parking, le créneau horaire, etc. Un travail d’implémentation a été déjà mené sur ce projet. Les étudiants peuvent se baser sur ces développements pour implémenter les nouveaux mécanismes. Des exemples de développements se trouvent a cette adresse : https://perso.liris.cnrs.fr/samir.aknine/L3/
SA5. Véhicule autonome : Gestion automatique de la traversée d’une intersection intelligente
Domaine Intelligence Artificielle Langage (proposé) C++, java Responsable du sujet Samir AKNINE Les récentes évolutions technologiques des dernières années ont permis d’améliorer le niveau d’équipement des véhicules rendus de plus en plus connectés, voire autonomes, ce qui permet de proposer de nouvelles réponses aux problèmes du trafic urbain. Les véhicules sont, à présent, capables de communiquer et de se coordonner. Avec notre projet, nous proposons une approche de régulation du trafic s’appuyant sur des méthodes distribuées pour améliorer les conditions de mobilité des véhicules. Dans le cadre ce travail, nous implémenterons la méthode de régulation que nous avons définie à l’échelle de l’intersection tirant parti des capacités de communication des véhicules, et dans laquelle les véhicules autonomes négocient leur droit de passage dans chaque intersection. Cette négociation s’effectue en utilisant des mécanismes prédéfinis en s’appuyant sur les données de mobilité de chaque véhicule et en permettant ainsi de prendre en compte différents critères pour la prise de décision locale, comme l’état général du trafic, la localisation d’éventuelles congestions, ou encore la circulation des bus, les trajets programmés par les véhicules, etc. L'étudiant peut avoir acces a une premiere implementation deja realisee. Des exemples de développements se trouvent a cette adresse : https://perso.liris.cnrs.fr/samir.aknine/L3/
SA6. Modélisation distribuée d’une variante d'un jeu stratégique (Échecs / Dames / Shogi / Taquin)
Domaine | Intelligence Artificielle |
---|---|
Langage (proposé) | C++, java |
Responsable du sujet | Samir AKNINE |
L’objectif de ce projet est de proposer une modélisation distribuée d’un jeu stratégique. Nous prendrons comme exemple une variante le jeu d’échés ou de dames. Dans ce jeu, les pièces peuvent se coordonner et communiquer pour mettre en œuvre des stratégies collectives. Elles peuvent effectuer différents mouvements parallèles selon des règles prédéfinies et exhiber différents comportements (tels que des attaques de groupes simultanées). Nous testerons différentes règles de jeu et implémenterons les stratégies collectives. Un travail d'implémentation a été réalisé préalablement sur ce projet. Les étudiants pourront s'ils le souhaitent réutiliser le code existant. Des exemples de développements se trouvent a cette adresse : https://perso.liris.cnrs.fr/samir.aknine/L3/
SA7. Sites marchands intelligents pour le commerce électronique
Domaine | Intelligence Artificielle |
---|---|
Langage (proposé) | C++, java |
Responsable du sujet | Samir AKNINE |
Nous utiliserons des modèles de négociation automatique pour la mise en place de sites marchands intelligents. Chaque site dit “vendeur” propose plusieurs items ou produits avec des indications sur les propriétés des items (ex. prix min,…). Un utilisateur peut spécifier, à un site dit “acheteur”, l’item qu’il recherche, ses propriétés ainsi que les contraintes et les préférences associées à cet item. Le site acheteur se chargera alors de mener les négociations automatiques avec les sites vendeurs proposant cet item. Le travail demandé consiste à modéliser les différents comportements de négociation automatique pour la vente et l’achat des items. Nous définirons les protocoles d’interactions et de négociation correspondants. Nous implémenterons et testerons l'ensemble des mécanismes à proposer. Un système a été développé sur ce sujet. Nous pouvons mettre a disposition des étudiants le code associé. Des exemples de développements se trouvent a cette adresse : https://perso.liris.cnrs.fr/samir.aknine/L3/