Différences
Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente | ||
projet:sujets [2025/01/13 11:07] marc_bertin |
projet:sujets [2025/01/13 14:09] (Version actuelle) remy |
||
---|---|---|---|
Ligne 1: | Ligne 1: | ||
====== Sujets, 2024/2025 Printemps ====== | ====== Sujets, 2024/2025 Printemps ====== | ||
+ | Slides de présentation des sujets: | ||
+ | * [[https:// | ||
+ | * [[https:// | ||
+ | * [[https:// | ||
+ | * [[https:// | ||
===== AM1. Deep learning et image : classification et génération d' | ===== AM1. Deep learning et image : classification et génération d' | ||
Ligne 254: | Ligne 259: | ||
===== MB1. Etude des controverses : Controverse entre Simon et Mandelbrot (1959-1961) ===== | ===== MB1. Etude des controverses : Controverse entre Simon et Mandelbrot (1959-1961) ===== | ||
- | ^ Domaine | Python, fouille textuelle | | + | ^ Domaine |
- | ^ Langage et bibliothèque (proposés) | Python, llm/chatGPT | | + | ^ Langage et bibliothèque (proposés) |
- | ^ Responsable du sujet | Marc BERTIN | + | ^ Responsable du sujet |
**Description :** | **Description :** | ||
- | + | Ce projet explore les approches innovantes de fouille textuelle appliquées à des corpus scientifiques, | |
- | Nous interrogerons les articles scientifiques produits | + | Nous interrogerons les articles scientifiques produits par Benoît Mandelbrot lors de sa controverse avec Simon. |
- | par Benoît Mandelbrot lors de sa controverse avec Simon. | + | |
- | corpus a déjà été constitué, étudié | + | |
** | ** | ||
Ligne 268: | Ligne 271: | ||
A disposition un serveur avec carte GPU TITAN avec serveur NAS pour le stockage des données. | A disposition un serveur avec carte GPU TITAN avec serveur NAS pour le stockage des données. | ||
+ | |||
+ | GROBID utilise des modèles d’apprentissage profond s' | ||
**Objectif :** | **Objectif :** | ||
Ligne 273: | Ligne 278: | ||
* découvrir les approches pour la fouille textuelle autour des corpus scientifiques. | * découvrir les approches pour la fouille textuelle autour des corpus scientifiques. | ||
* Extraire les notions et les concepts de la controverse (déjà identifié), | * Extraire les notions et les concepts de la controverse (déjà identifié), | ||
- | * Encodage TEI du corpus avec GroBID | + | * Encodage TEI du corpus avec GroBID |
* Annoter le corpus de la controverse, | * Annoter le corpus de la controverse, | ||
* Navigation dans la controverse scientifique. | * Navigation dans la controverse scientifique. | ||
* Si possible proposer une visualisation de la controverse. | * Si possible proposer une visualisation de la controverse. | ||
* Rendre l' | * Rendre l' | ||
+ | |||
+ | Plus d' | ||
+ | |||
+ | |||
+ | ===== MB2. Constitution d'un docker pour fouiller les articles scientifiques extrait à partir de OAI-PMH ===== | ||
+ | ^ Domaine | Python, OAI-PMH, Docker | | ||
+ | ^ Langage et bibliothèque (proposés) | Python, OAI-PMH | | ||
+ | ^ Responsable du sujet | Marc BERTIN | ||
+ | |||
+ | **Description :** | ||
+ | |||
+ | OAI-PMH est le sigle de l’Open Archives Initiative - Protocol for Metadata Harvesting, ce qui signifie « //// | ||
+ | la collecte de métadonnées de l’Initiative pour les Archives ouvertes//// | ||
+ | ». | ||
+ | Ce projet vise à exploiter le protocole OAI-PMH (Open Archives Initiative Protocol for Metadata Harvesting) | ||
+ | pour constituer un corpus d' | ||
+ | Le corpus sera analysé afin d’identifier et d’extraire les controverses scientifiques qu’il contient. | ||
+ | |||
+ | **Moyen :** | ||
+ | |||
+ | A disposition un serveur avec carte GPU TITAN avec serveur NAS pour le stockage des données. | ||
+ | |||
+ | Vous pourrez utiliser (liste non exhaustive) : | ||
+ | |||
+ | * Sickle, oai-harvest ou PyOAI pour le moissonage | ||
+ | * Hugging Face / llm | ||
+ | |||
+ | |||
+ | **Objectif :** | ||
+ | |||
+ | * Proposer un outil de fouille textuel d' | ||
+ | * Implémenter un outil d' | ||
+ | * Collecter les données pleins textes via une interface de recherche d' | ||
+ | * Interroger en langage naturel les textes harvaster. | ||
+ | * La solution sera proposée sous Docker. | ||
+ | |||
+ | |||
+ | |||
+ | |||
+ | ===== MB3. | ||
+ | |||
+ | ^ Domaine | Python, Détection d’événement | ||
+ | ^ Langage et bibliothèque (proposés) | Python, openCV, ESP32/CAM| | ||
+ | ^ Responsable du sujet | Marc BERTIN | ||
+ | |||
+ | **Description :** | ||
+ | |||
+ | Ce projet propose de développer un système de détection automatique des flèches dans la mato (cible de kyudo) à l’aide d’un module ESP32-CAM. | ||
+ | La carte ESP32-Cam intègre un processeur ESP32 et une caméra OV2640 (2M pixels). Elle consiste à transmettre en WIFI et en direct un flux vidéo, des images. | ||
+ | Grâce à sa caméra embarquée, l’ESP32-CAM capturera les images de la cible et utilisera un algorithme de traitement d' | ||
+ | Ce dispositif portable et économique permettrait d' | ||
+ | |||
+ | |||
+ | **Moyen :** | ||
+ | |||
+ | * Serveur avec carte TITAN | ||
+ | * ESP32-CAM qui est une carte de développement dotée de capacités Wi-Fi et Bluetooth, comprenant un module ESP32S, une caméra OV2642, un emplacement pour carte micro SD, neuf broches GPIO, un flash LED intégré, une mémoire flash intégrée, 520 Ko de RAM interne et 4 Mo de PSRAM. Le module peut être programmé à l'aide de différents environnements, | ||
+ | * Librairie openCV et pyTorch [[https:// | ||
+ | |||
+ | **Objectif :** | ||
+ | |||
+ | * Expérimenter la faisabilité d'une solution de détection de la " | ||
+ | |||
+ | **Lien annexe** | ||
+ | Le Kyudo en France: [[https:// | ||
+ | |||
+ | |||
+ | |||