Cazabet Rémy Homepage

Présentation de la page

Cette page présente les sujets de POM que je (Rémy Cazabet) propose pour l'année 2024/2025. Pour contexte, je suis maître de conférences à Lyon 1, laboratoire LIRIS, dans l'équipe DM2L, Data Mining and Machine Learning

Simuler un réseau social avec des LLM avec Y social

Dans le cadre d'un projet de recherche, nous avons développé une plateforme appelée (Y social), qui permet d'utiliser des LLMs (Large Language Models) pour simuler des réseaux sociaux. L'idée est de générer des réseaux sociaux synthétiques, avec des caractéristiques contrôlées, pour ensuite les utiliser dans des expériences de recherche.
Le travail consistera à s'approprier la plateforme, à la tester, puis de simuler des intéractions sur un réseaux social de manière à reproduire un événement réel. Par exemple, on pourra s'intéresser a des élections présidentielles (France, etats unis, etc), des mouvements sociaux, des épidémies, etc. Le travail consistera à s'approprier le sujet, à simuler des événements, puis à analyser les résultats obtenus.
L'objectif premier est d'utiliser en pratique cette plateforme pour voir ses forces, faiblesses, limites, etc.

Contribution à la librairie python de recherche CDlib

La détection de communauté, aussi appelé clustering de graphe, est le problème principal de machine learning non-supervisé sur les graphes/réseaux. La librairie (CDlib) est une librairie python de référence spécialisée sur cette question. Comptant plusieurs dizaine de milliers de télchargements à son actif, il s’agit d’un outil largement utilisé à travers le monde, tant pour la recherche que pour l’enseignement. Je suis l’un des co-fondateurs de cette librairie.
Votre objectif sera de contribuer à cette librairie. De multiples contributions sont possible, selon votre intérêt:

Amélioration des outils de visualisation
Développement d’un benchmark de test
Ajout de nouvelles méthodes, notamment basées sur le deep learning -Correction de bugs
Une liste d’autres améliorations possible peut être consultée sur cette page : https://github.com/GiulioRossetti/cdlib/projects/2

Ce faisant, vous découvrirez à la fois un problème de machine learning, et le développement de code source libre de qualité professionnelle.