iTrameur – Outils d’analyse textométrique de données
Présentation
Le plateau iTrameur – Outils d’analyse textométrique de données est un ensemble d’outils en ligne comportant plusieurs fonctionnalités de l’analyse automatique de textes en vue de leur profilage sémantique, thématique et de leur interprétation.
iTrameur est à l’origine un outil de textométrie. Il dispose aussi des fonctionnalités particulières qui permettent d’annoter dynamiquement des corpus ou d’explorer des ressources annotées (treebanks monolingues/multilingues) ou des alignements.
Pour débuter l’exploration, on charge un fichier (structuré en parties et/ou découpé en sections) ou une base annotée comportant plusieurs couches d’annotation : forme, lemme, catégorie, etc. Le texte (ou la base importée) peut aussi être un bi-texte aligné. Les données sont analysées automatiquement via les fonctionnalités d’exploration textométrique. Les résultats obtenus sont sauvegardés dans un rapport.
iTrameur est utilisé dans le cadre de formations en traduction et linguistique de corpus dispensées par la Faculté S&H d’Université Paris Cité (UFR EILA) et les réseaux universitaires partenaires (pluriTAL : http://www.tal.univ-paris3.fr/plurital).
Les projets avec les outils textométriques permettent d’avancer la réflexion sur les méthodes d’exploration de corpus annotés, séries textuelles chronologiques (traduction/révision, données d’apprentissage), etc.
L’accès au plateau iTrameur est ouvert à la communauté scientifique académique.
Lien de présentation : https://u-paris.cloud.panopto.eu/Panopto/Pages/Viewer.aspx?id=dad374ee-f81b-4651-a171-afe200be759c
Activités
Expertises
- Préparer les données pour les analyses textométriques (segmentation, découpage en sections, découpage en parties, annotation via des scripts) ;
- Explorer les données textuelles (structurées en parties et/ou découpées en sections) ou une base annotée (même type de structuration, comportant en outre plusieurs couches d’annotation : forme, lemme, catégorie, etc.) ;
- Réaliser des analyses textométriques “classiques” : dictionnaire, concordancier, spécificités, segments répétés, graphique de ventilation, cooccurrents, etc.
- Explorer des corpus richement annotés (treebanks monolingues/multilingues) ou des corpus alignés.
Équipements
Architecture du plateau
iTrameur fonctionne dans un navigateur habituel (de préférence Firefox ou Chrome).
En plus de l’exploration des données chargées via les opérations textométriques (dictionnaire, concordancier, spécificités, segments répétés, graphique de ventilation, cooccurrents, etc.), iTrameur regroupe des modules satellites également disponibles en ligne :
- iTrameur-Specif-Partie : les mots spécifiques d’une partie d’un corpus ; navigation via la carte des sections ;
- iTrameur-CooCs-Bitext : les cooccurrents d’un pôle sur un corpus aligné (avec retour en contexte) ; navigation via la carte des sections alignées ;
- iTrameur-CooCs : un graphe de cooccurrents sur un pôle donné (avec retour en contexte); navigation via la carte des sections ;
- iTrameur-CooCs-regexp : un graphe de cooccurrents sur un ensemble de pôles définis via une regexp ; navigation via la carte des sections ;
- iTrameur-Réseau CooCs : un réseau de cooccurrences généralisées.
Services proposés
Accès au plateau iTrameur – Outils d’analyse textométrique de données qui permet d’utiliser de nombreuses fonctionnalités pour l’analyse statistique de textes
Le plateau dispose aussi des fonctionnalités permettent de re-annoter dynamiquement des corpus ou d’explorer des ressources richement annotées.
Plusieurs exemples de corpus de travail accessibles en ligne (treebanks, corpus alignés) peuvent être téléchargés puis ouverts dans iTrameur.
Thématiques
Tutelle
Université Paris Cité
Unité de rattachement
UPR 3967 – Centre de Linguistique Interlangues, de Lexicologie, de Linguistique Anglaise et de Corpus
– Atelier de recherche sur la parole
Réseaux
Consortium HN CORpus, Langues et Interactions : https://corli.huma-num.fr/le-trameur/
Plateformes dans la même thématique
Base d’Aide à la Rédaction de TExtes Scientifiques (ARTES)
ARTES est à la fois un projet scientifique et une plateforme d’aide à la rédaction et à la traduction dans les domaines de connaissances spécialisées, développée par l’équipe de recherche du CLILLAC-ARP et de l’UFR EILA d’Université Paris Cité.
PROCESS (Platform for Research Online and CitizEn Science Surveys) du CRESS
PROCESS est une plateforme technologique permettant de faciliter la conception et la mise en place d’études utilisant des méthodes de sciences participatives.
Plateforme de Calcul Haute-Performance NOVA
Nova vise à répondre aux besoins de calculs haute-perfomance des membres d’Université Paris Cité
Plateau de linguistique informatique du LLF – Laboratoire de Linguistique Formelle (UMR7110)
La Plateforme de linguistique informatique du LLF (Pli) regroupe un ensemble d’infrastructures informatiques, d’applications et de services utiles à la recherche en linguistique.
Pure Neural Server – CLILLAC-ARP – plateforme de traduction automatique sur serveur université
La Plateforme PNS-UP est un serveur de traduction qui permet d’utiliser des modèles de traduction automatique spécialisée pour les projets de traduction, post-édition et révision de fichiers, de la parole et de pages Web.