Présentation de la page

Cette page présente les sujets de POM que je (Rémy Cazabet) propose pour l'année 2024/2025. Pour contexte, je suis maître de conférences à Lyon 1, laboratoire LIRIS, dans l'équipe DM2L, Data Mining and Machine Learning

Simuler un réseau social avec des LLM avec Y social

Dans le cadre d'un projet de recherche, nous avons développé une plateforme appelée (Y social), qui permet d'utiliser des LLMs (Large Language Models) pour simuler des réseaux sociaux. L'idée est de générer des réseaux sociaux synthétiques, avec des caractéristiques contrôlées, pour ensuite les utiliser dans des expériences de recherche.
Le travail consistera à s'approprier la plateforme, à la tester, puis de simuler des intéractions sur un réseaux social de manière à reproduire un événement réel. Par exemple, on pourra s'intéresser a des élections présidentielles (France, etats unis, etc), des mouvements sociaux, des épidémies, etc. Le travail consistera à s'approprier le sujet, à simuler des événements, puis à analyser les résultats obtenus.
L'objectif premier est d'utiliser en pratique cette plateforme pour voir ses forces, faiblesses, limites, etc.


Contribution à la librairie python de recherche CDlib

La détection de communauté, aussi appelé clustering de graphe, est le problème principal de machine learning non-supervisé sur les graphes/réseaux. La librairie (CDlib) est une librairie python de référence spécialisée sur cette question. Comptant plusieurs dizaine de milliers de télchargements à son actif, il s’agit d’un outil largement utilisé à travers le monde, tant pour la recherche que pour l’enseignement. Je suis l’un des co-fondateurs de cette librairie.
Votre objectif sera de contribuer à cette librairie. De multiples contributions sont possible, selon votre intérêt:
  • Amélioration des outils de visualisation
  • Développement d’un benchmark de test
  • Ajout de nouvelles méthodes, notamment basées sur le deep learning -Correction de bugs
  • Une liste d’autres améliorations possible peut être consultée sur cette page : https://github.com/GiulioRossetti/cdlib/projects/2
Ce faisant, vous découvrirez à la fois un problème de machine learning, et le développement de code source libre de qualité professionnelle.