projet:sujets

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
projet:sujets [2025/01/13 11:04]
marc_bertin
projet:sujets [2025/01/13 14:09] (Version actuelle)
remy
Ligne 1: Ligne 1:
 ====== Sujets, 2024/2025 Printemps ====== ====== Sujets, 2024/2025 Printemps ======
  
 +Slides de présentation des sujets:
 +  * [[https://cazabetremy.fr/Teaching/lifprojet/slides2025pr/ProjetsLifPro2025.pdf|Samir Aknine]]
 +  * [[https://cazabetremy.fr/Teaching/lifprojet/slides2025pr/Sujets%20LIFPROJET%20Automne%202024%20(1).pdf|Célestin Coquidé]]
 +  * [[https://cazabetremy.fr/Teaching/lifprojet/slides2025pr/2025p_LIFPROJET_AM.pdf|Alexandre Meyer]]
 +  * [[https://cazabetremy.fr/Teaching/lifprojet/slides2025pr/projet_SP.pdf|Sabine Peres]]
  
 ===== AM1. Deep learning et image : classification et génération d'images ===== ===== AM1. Deep learning et image : classification et génération d'images =====
Ligne 254: Ligne 259:
  
 ===== MB1.  Etude des controverses : Controverse entre Simon et Mandelbrot (1959-1961) ===== ===== MB1.  Etude des controverses : Controverse entre Simon et Mandelbrot (1959-1961) =====
-^ Domaine | Python, fouille textuelle | +^ Domaine                                                | Python, fouille textuelle | 
-^Langage et bibliothèque (proposés) | Python, llm/chatGPT |+^ Langage et bibliothèque (proposés)                     | Python, llm/chatGPT       | 
 +^ Responsable du sujet                                   | Marc BERTIN               |  
 + 
 +**Description :**  
 +Ce projet explore les approches innovantes de fouille textuelle appliquées à des corpus scientifiques, en vue de mieux comprendre et d’exploiter les données académiques pour l’analyse des controverses. 
 +Nous interrogerons les articles scientifiques produits par Benoît Mandelbrot lors de sa controverse avec Simon. e corpus a déjà été élaboré, analysé et présenté. 
 + 
 +** 
 +Moyen :**  
 + 
 +A disposition un serveur avec carte GPU TITAN avec serveur NAS pour le stockage des données. 
 + 
 +GROBID utilise des modèles d’apprentissage profond s'appuyant sur la bibliothèque DeLFT, un cadre d’apprentissage profond non spécifique à une tâche, conçu pour l'étiquetage de séquences et la classification de textes, via JEP. 
 + 
 +**Objectif :**  
 + 
 +  * découvrir les approches pour la fouille textuelle autour des corpus scientifiques. 
 +  * Extraire les notions et les concepts de la controverse (déjà identifié), 
 +  * Encodage TEI du corpus avec GroBID (voir le github : [[https://github.com/kermitt2/grobid]] ) 
 +  * Annoter le corpus de la controverse, 
 +  * Navigation dans la controverse scientifique. 
 +  * Si possible proposer une visualisation de la controverse. 
 +  * Rendre l'approche possible à d'autres controverses 
 + 
 +Plus d'information sur Mandelbrot : [[https://epistemofinance.hypotheses.org/14552]] 
 + 
 + 
 +===== MB2. Constitution d'un docker pour fouiller les articles scientifiques extrait à partir de OAI-PMH ===== 
 +^ Domaine | Python, OAI-PMH, Docker | 
 +^ Langage et bibliothèque (proposés) | Python, OAI-PMH |
 ^ Responsable du sujet | Marc BERTIN                                  ^ Responsable du sujet | Marc BERTIN                                 
  
- * Description : Nous interrogerons les articles scientifiques produits +**Description :**  
-par Benoît Mandelbrot lors de sa controverse avec SimonLe + 
-corpus a déjà été constitué, étudié et présenté+OAI-PMH est le sigle de l’Open Archives Initiative - Protocol for Metadata Harvesting, ce qui signifie « ////protocole pour 
-* Moyen : A disposition un serveur avec carte GPU TITAN avec +la collecte de métadonnées de l’Initiative pour les Archives ouvertes//// 
-serveur NAS pour le stockage des données. +». 
-* Objectif : découvrir les approches pour la fouille textuelle autour +Ce projet vise à exploiter le protocole OAI-PMH (Open Archives Initiative Protocol for Metadata Harvesting)  
-des corpus scientifiques.+pour constituer un corpus d'articles scientifiques issus de réservoirs de données ouverts.  
 +Le corpus sera analysé afin d’identifier et d’extraire les controverses scientifiques qu’il contient. 
 + 
 +**Moyen :**  
 + 
 +A disposition un serveur avec carte GPU TITAN avec serveur NAS pour le stockage des données. 
 + 
 +Vous pourrez utiliser (liste non exhaustive) :  
 + 
 +  * Sickle, oai-harvest ou PyOAI pour le moissonage 
 +  * Hugging Face / llm 
 + 
 + 
 +**Objectif :**  
 + 
 +  * Proposer un outil de fouille textuel d'article scientifique en langage naturel. 
 +  * Implémenter un outil d'harvesting reposant sur le protocole OAI-PMH. 
 +  * Collecter les données pleins textes via une interface de recherche d'information. 
 +  * Interroger en langage naturel les textes harvaster. 
 +  * La solution sera proposée sous Docker. 
 + 
 + 
 + 
 + 
 +===== MB3.   Système embarqué de détection automatique de touche pour la pratique du Kyudo - tir à l'arc japonais  ===== 
 + 
 +^ Domaine | Python, Détection d’événement 
 +^ Langage et bibliothèque (proposés) | Python, openCV, ESP32/CAM| 
 +^ Responsable du sujet | Marc BERTIN                                 |  
 + 
 +**Description :**  
 + 
 +Ce projet propose de développer un système de détection automatique des flèches dans la mato (cible de kyudo) à l’aide d’un module ESP32-CAM 
 +La carte ESP32-Cam intègre un processeur ESP32 et une caméra OV2640 (2M pixels). Elle consiste à transmettre en WIFI et en direct un flux vidéo, des images. 
 +Grâce à sa caméra embarquée, l’ESP32-CAM capturera les images de la cible et utilisera un algorithme de traitement d'image léger pour identifier l'emplacement des impacts.  
 +Ce dispositif portable et économique permettrait d'automatiser l'évaluation des tirs, réduisant les biais humains et facilitant l’entraînement.  
 + 
 + 
 +**Moyen :**  
 + 
 +  * Serveur avec carte TITAN 
 +  * ESP32-CAM qui est une carte de développement dotée de capacités Wi-Fi et Bluetooth, comprenant un module ESP32S, une caméra OV2642, un emplacement pour carte micro SD, neuf broches GPIO, un flash LED intégré, une mémoire flash intégrée, 520 Ko de RAM interne et 4 Mo de PSRAM. Le module peut être programmé à l'aide de différents environnements, notamment l'IDE Arduino, l'IDF Espressif, MicroPython, JavaScript, Lua et PlatformIO dans VS Code. 
 +  * Librairie openCV et pyTorch [[https://opencv.org/]], liste non exhaustive 
 + 
 +**Objectif :**  
 + 
 +  * Expérimenter la faisabilité d'une solution de détection de la "touche", c'est-à-dire identification de la flèche dans la mato (cible) pour le déploiement de compétition national. 
 + 
 +**Lien annexe** 
 +Le Kyudo en France: [[https://www.kyudo.fr/la-voie-de-l-arc]] 
 + 
  
-* Extraire les notions et les concepts de la controverse (déjà identifié), 
-* Encodage TEI du corpus avec GroBID 
-* Annoter le corpus de la controverse, 
-* Navigation dans la controverse scientifique. 
-* Si possible proposer une visualisation de la controverse. 
-* Rendre l'approche possible à d'autres controverses 
  
  • projet/sujets.1736762656.txt.gz
  • Dernière modification: 2025/01/13 11:04
  • de marc_bertin