projet:sujets

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
projet:sujets [2025/01/13 11:09]
marc_bertin
projet:sujets [2025/01/13 14:09] (Version actuelle)
remy
Ligne 1: Ligne 1:
 ====== Sujets, 2024/2025 Printemps ====== ====== Sujets, 2024/2025 Printemps ======
  
 +Slides de présentation des sujets:
 +  * [[https://cazabetremy.fr/Teaching/lifprojet/slides2025pr/ProjetsLifPro2025.pdf|Samir Aknine]]
 +  * [[https://cazabetremy.fr/Teaching/lifprojet/slides2025pr/Sujets%20LIFPROJET%20Automne%202024%20(1).pdf|Célestin Coquidé]]
 +  * [[https://cazabetremy.fr/Teaching/lifprojet/slides2025pr/2025p_LIFPROJET_AM.pdf|Alexandre Meyer]]
 +  * [[https://cazabetremy.fr/Teaching/lifprojet/slides2025pr/projet_SP.pdf|Sabine Peres]]
  
 ===== AM1. Deep learning et image : classification et génération d'images ===== ===== AM1. Deep learning et image : classification et génération d'images =====
Ligne 254: Ligne 259:
  
 ===== MB1.  Etude des controverses : Controverse entre Simon et Mandelbrot (1959-1961) ===== ===== MB1.  Etude des controverses : Controverse entre Simon et Mandelbrot (1959-1961) =====
-^ Domaine | Python, fouille textuelle | +^ Domaine                                                | Python, fouille textuelle | 
-^ Langage et bibliothèque (proposés) | Python, llm/chatGPT | +^ Langage et bibliothèque (proposés)                     | Python, llm/chatGPT       
-^ Responsable du sujet | Marc BERTIN                                 +^ Responsable du sujet                                   | Marc BERTIN               
  
 **Description :**  **Description :** 
- +Ce projet explore les approches innovantes de fouille textuelle appliquées à des corpus scientifiques, en vue de mieux comprendre et d’exploiter les données académiques pour l’analyse des controverses. 
-Nous interrogerons les articles scientifiques produits +Nous interrogerons les articles scientifiques produits par Benoît Mandelbrot lors de sa controverse avec Simon. corpus a déjà été élaboréanalysé et présenté.
-par Benoît Mandelbrot lors de sa controverse avec Simon. Le +
-corpus a déjà été constituéétudié et présenté.+
  
 ** **
Ligne 268: Ligne 271:
  
 A disposition un serveur avec carte GPU TITAN avec serveur NAS pour le stockage des données. A disposition un serveur avec carte GPU TITAN avec serveur NAS pour le stockage des données.
 +
 +GROBID utilise des modèles d’apprentissage profond s'appuyant sur la bibliothèque DeLFT, un cadre d’apprentissage profond non spécifique à une tâche, conçu pour l'étiquetage de séquences et la classification de textes, via JEP.
  
 **Objectif :**  **Objectif :** 
Ligne 273: Ligne 278:
   * découvrir les approches pour la fouille textuelle autour des corpus scientifiques.   * découvrir les approches pour la fouille textuelle autour des corpus scientifiques.
   * Extraire les notions et les concepts de la controverse (déjà identifié),   * Extraire les notions et les concepts de la controverse (déjà identifié),
-  * Encodage TEI du corpus avec GroBID+  * Encodage TEI du corpus avec GroBID (voir le github : [[https://github.com/kermitt2/grobid]] )
   * Annoter le corpus de la controverse,   * Annoter le corpus de la controverse,
   * Navigation dans la controverse scientifique.   * Navigation dans la controverse scientifique.
Ligne 279: Ligne 284:
   * Rendre l'approche possible à d'autres controverses   * Rendre l'approche possible à d'autres controverses
  
 +Plus d'information sur Mandelbrot : [[https://epistemofinance.hypotheses.org/14552]]
  
  
- +===== MB2. Constitution d'un docker pour fouiller les articles scientifiques extrait à partir de OAI-PMH ===== 
-===== MB2.  Science of Science :Constitution d'un docker pour fouiller les articles scientifiques extrait à partir de OAI-PMH ===== +^ Domaine | Python, OAI-PMH, Docker 
-^ Domaine | Python, fouille textuelle +^ Langage et bibliothèque (proposés) | Python, OAI-PMH |
-^ Langage et bibliothèque (proposés) | Python, llm/chatGPT |+
 ^ Responsable du sujet | Marc BERTIN                                  ^ Responsable du sujet | Marc BERTIN                                 
  
 **Description :**  **Description :** 
  
-Nous interrogerons les articles scientifiques produits +OAI-PMH est le sigle de l’Open Archives Initiative - Protocol for Metadata Harvesting, ce qui signifie « ////protocole pour 
-par Benoît Mandelbrot lors de sa controverse avec SimonLe +la collecte de métadonnées de l’Initiative pour les Archives ouvertes//// 
-corpus a déjà été constitué, étudié et présenté.+». 
 +Ce projet vise à exploiter le protocole OAI-PMH (Open Archives Initiative Protocol for Metadata Harvesting)  
 +pour constituer un corpus d'articles scientifiques issus de réservoirs de données ouverts.  
 +Le corpus sera analysé afin d’identifier et d’extraire les controverses scientifiques qu’il contient.
  
-** +**Moyen :** 
-Moyen :** +
  
 A disposition un serveur avec carte GPU TITAN avec serveur NAS pour le stockage des données. A disposition un serveur avec carte GPU TITAN avec serveur NAS pour le stockage des données.
 +
 +Vous pourrez utiliser (liste non exhaustive) : 
 +
 +  * Sickle, oai-harvest ou PyOAI pour le moissonage
 +  * Hugging Face / llm
 +
  
 **Objectif :**  **Objectif :** 
  
-  * découvrir les approches pour la fouille textuelle autour des corpus scientifiques+  * Proposer un outil de fouille textuel d'article scientifique en langage naturel
-  * Extraire les notions et les concepts de la controverse (déjà identifié), +  * Implémenter un outil d'harvesting reposant sur le protocole OAI-PMH. 
-  * Encodage TEI du corpus avec GroBID +  * Collecter les données pleins textes via une interface de recherche d'information. 
-  * Annoter le corpus de la controverse, +  * Interroger en langage naturel les textes harvaster
-  * Navigation dans la controverse scientifique+  * La solution sera proposée sous Docker.
-  * Si possible proposer une visualisation de la controverse. +
-  * Rendre l'approche possible à d'autres controverses+
  
  
  
 +
 +===== MB3.   Système embarqué de détection automatique de touche pour la pratique du Kyudo - tir à l'arc japonais  =====
 +
 +^ Domaine | Python, Détection d’événement  |
 +^ Langage et bibliothèque (proposés) | Python, openCV, ESP32/CAM|
 +^ Responsable du sujet | Marc BERTIN                                 
 +
 +**Description :** 
 +
 +Ce projet propose de développer un système de détection automatique des flèches dans la mato (cible de kyudo) à l’aide d’un module ESP32-CAM. 
 +La carte ESP32-Cam intègre un processeur ESP32 et une caméra OV2640 (2M pixels). Elle consiste à transmettre en WIFI et en direct un flux vidéo, des images.
 +Grâce à sa caméra embarquée, l’ESP32-CAM capturera les images de la cible et utilisera un algorithme de traitement d'image léger pour identifier l'emplacement des impacts. 
 +Ce dispositif portable et économique permettrait d'automatiser l'évaluation des tirs, réduisant les biais humains et facilitant l’entraînement. 
 +
 +
 +**Moyen :** 
 +
 +  * Serveur avec carte TITAN
 +  * ESP32-CAM qui est une carte de développement dotée de capacités Wi-Fi et Bluetooth, comprenant un module ESP32S, une caméra OV2642, un emplacement pour carte micro SD, neuf broches GPIO, un flash LED intégré, une mémoire flash intégrée, 520 Ko de RAM interne et 4 Mo de PSRAM. Le module peut être programmé à l'aide de différents environnements, notamment l'IDE Arduino, l'IDF Espressif, MicroPython, JavaScript, Lua et PlatformIO dans VS Code.
 +  * Librairie openCV et pyTorch [[https://opencv.org/]], liste non exhaustive
 +
 +**Objectif :** 
 +
 +  * Expérimenter la faisabilité d'une solution de détection de la "touche", c'est-à-dire identification de la flèche dans la mato (cible) pour le déploiement de compétition national.
 +
 +**Lien annexe**
 +Le Kyudo en France: [[https://www.kyudo.fr/la-voie-de-l-arc]]
  
  
  
  
  • projet/sujets.1736762958.txt.gz
  • Dernière modification: 2025/01/13 11:09
  • de marc_bertin