Différences

Ci-dessous, les différences entre deux révisions de la page.

--- projet:sujets [2025/01/13 11:04]
marc_bertin
+++ projet:sujets [2025/01/13 14:09] (Version actuelle)
remy
@@ Ligne 1: / Ligne 1: @@
 ====== Sujets, 2024/2025 Printemps ======
+Slides de présentation des sujets:
+  * [[https://cazabetremy.fr/Teaching/lifprojet/slides2025pr/ProjetsLifPro2025.pdf|Samir Aknine]]
+  * [[https://cazabetremy.fr/Teaching/lifprojet/slides2025pr/Sujets%20LIFPROJET%20Automne%202024%20(1).pdf|Célestin Coquidé]]
+  * [[https://cazabetremy.fr/Teaching/lifprojet/slides2025pr/2025p_LIFPROJET_AM.pdf|Alexandre Meyer]]
+  * [[https://cazabetremy.fr/Teaching/lifprojet/slides2025pr/projet_SP.pdf|Sabine Peres]]
 ===== AM1. Deep learning et image : classification et génération d'images =====
@@ Ligne 254: / Ligne 259: @@
 ===== MB1.  Etude des controverses : Controverse entre Simon et Mandelbrot (1959-1961) =====
-^ Domaine | Python, fouille textuelle |
+^ Domaine                                                | Python, fouille textuelle |
-^Langage et bibliothèque (proposés) | Python, llm/chatGPT |
+^ Langage et bibliothèque (proposés)                     | Python, llm/chatGPT       |
+^ Responsable du sujet                                   | Marc BERTIN               |
+**Description :**
+Ce projet explore les approches innovantes de fouille textuelle appliquées à des corpus scientifiques, en vue de mieux comprendre et d’exploiter les données académiques pour l’analyse des controverses.
+Nous interrogerons les articles scientifiques produits par Benoît Mandelbrot lors de sa controverse avec Simon. e corpus a déjà été élaboré, analysé et présenté.
+**
+Moyen :**
+A disposition un serveur avec carte GPU TITAN avec serveur NAS pour le stockage des données.
+GROBID utilise des modèles d’apprentissage profond s'appuyant sur la bibliothèque DeLFT, un cadre d’apprentissage profond non spécifique à une tâche, conçu pour l'étiquetage de séquences et la classification de textes, via JEP.
+**Objectif :**
+  * découvrir les approches pour la fouille textuelle autour des corpus scientifiques.
+  * Extraire les notions et les concepts de la controverse (déjà identifié),
+  * Encodage TEI du corpus avec GroBID (voir le github : [[https://github.com/kermitt2/grobid]] )
+  * Annoter le corpus de la controverse,
+  * Navigation dans la controverse scientifique.
+  * Si possible proposer une visualisation de la controverse.
+  * Rendre l'approche possible à d'autres controverses
+Plus d'information sur Mandelbrot : [[https://epistemofinance.hypotheses.org/14552]]
+===== MB2. Constitution d'un docker pour fouiller les articles scientifiques extrait à partir de OAI-PMH =====
+^ Domaine | Python, OAI-PMH, Docker |
+^ Langage et bibliothèque (proposés) | Python, OAI-PMH |
 ^ Responsable du sujet | Marc BERTIN                                 |
- * Description : Nous interrogerons les articles scientifiques produits
+**Description :**
-par Benoît Mandelbrot lors de sa controverse avec Simon. Le
-corpus a déjà été constitué, étudié et présenté.
+OAI-PMH est le sigle de l’Open Archives Initiative - Protocol for Metadata Harvesting, ce qui signifie « ////protocole pour
-* Moyen : A disposition un serveur avec carte GPU TITAN avec
+la collecte de métadonnées de l’Initiative pour les Archives ouvertes////
-serveur NAS pour le stockage des données.
+».
-* Objectif : découvrir les approches pour la fouille textuelle autour
+Ce projet vise à exploiter le protocole OAI-PMH (Open Archives Initiative Protocol for Metadata Harvesting)
-des corpus scientifiques.
+pour constituer un corpus d'articles scientifiques issus de réservoirs de données ouverts.
+Le corpus sera analysé afin d’identifier et d’extraire les controverses scientifiques qu’il contient.
+**Moyen :**
+A disposition un serveur avec carte GPU TITAN avec serveur NAS pour le stockage des données.
+Vous pourrez utiliser (liste non exhaustive) :
+  * Sickle, oai-harvest ou PyOAI pour le moissonage
+  * Hugging Face / llm
+**Objectif :**
+  * Proposer un outil de fouille textuel d'article scientifique en langage naturel.
+  * Implémenter un outil d'harvesting reposant sur le protocole OAI-PMH.
+  * Collecter les données pleins textes via une interface de recherche d'information.
+  * Interroger en langage naturel les textes harvaster.
+  * La solution sera proposée sous Docker.
+===== MB3.   Système embarqué de détection automatique de touche pour la pratique du Kyudo - tir à l'arc japonais  =====
+^ Domaine | Python, Détection d’événement  |
+^ Langage et bibliothèque (proposés) | Python, openCV, ESP32/CAM|
+^ Responsable du sujet | Marc BERTIN                                 |
+**Description :**
+Ce projet propose de développer un système de détection automatique des flèches dans la mato (cible de kyudo) à l’aide d’un module ESP32-CAM.
+La carte ESP32-Cam intègre un processeur ESP32 et une caméra OV2640 (2M pixels). Elle consiste à transmettre en WIFI et en direct un flux vidéo, des images.
+Grâce à sa caméra embarquée, l’ESP32-CAM capturera les images de la cible et utilisera un algorithme de traitement d'image léger pour identifier l'emplacement des impacts.
+Ce dispositif portable et économique permettrait d'automatiser l'évaluation des tirs, réduisant les biais humains et facilitant l’entraînement.
+**Moyen :**
+  * Serveur avec carte TITAN
+  * ESP32-CAM qui est une carte de développement dotée de capacités Wi-Fi et Bluetooth, comprenant un module ESP32S, une caméra OV2642, un emplacement pour carte micro SD, neuf broches GPIO, un flash LED intégré, une mémoire flash intégrée, 520 Ko de RAM interne et 4 Mo de PSRAM. Le module peut être programmé à l'aide de différents environnements, notamment l'IDE Arduino, l'IDF Espressif, MicroPython, JavaScript, Lua et PlatformIO dans VS Code.
+  * Librairie openCV et pyTorch [[https://opencv.org/]], liste non exhaustive
+**Objectif :**
+  * Expérimenter la faisabilité d'une solution de détection de la "touche", c'est-à-dire identification de la flèche dans la mato (cible) pour le déploiement de compétition national.
+**Lien annexe**
+Le Kyudo en France: [[https://www.kyudo.fr/la-voie-de-l-arc]]
-* Extraire les notions et les concepts de la controverse (déjà identifié),
-* Encodage TEI du corpus avec GroBID
-* Annoter le corpus de la controverse,
-* Navigation dans la controverse scientifique.
-* Si possible proposer une visualisation de la controverse.
-* Rendre l'approche possible à d'autres controverses