iTrameur – Outils d’analyse textométrique de données

Présentation

Le plateau iTrameur – Outils d’analyse textométrique de données est un ensemble d’outils en ligne comportant plusieurs fonctionnalités de l’analyse automatique de textes en vue de leur profilage sémantique, thématique et de leur interprétation.

iTrameur est à l’origine un outil de textométrie. Il dispose aussi des fonctionnalités particulières qui permettent d’annoter dynamiquement des corpus ou d’explorer des ressources annotées (treebanks monolingues/multilingues) ou des alignements.
Pour débuter l’exploration, on charge un fichier (structuré en parties et/ou découpé en sections) ou une base annotée comportant plusieurs couches d’annotation : forme, lemme, catégorie, etc. Le texte (ou la base importée) peut aussi être un bi-texte aligné. Les données sont analysées automatiquement via les fonctionnalités d’exploration textométrique. Les résultats obtenus sont sauvegardés dans un rapport.

iTrameur est utilisé dans le cadre de formations en traduction et linguistique de corpus dispensées par la Faculté S&H d’Université Paris Cité (UFR EILA) et les réseaux universitaires partenaires (pluriTAL : http://www.tal.univ-paris3.fr/plurital).
Les projets avec les outils textométriques permettent d’avancer la réflexion sur les méthodes d’exploration de corpus annotés, séries textuelles chronologiques (traduction/révision, données d’apprentissage), etc.

L’accès au plateau iTrameur est ouvert à la communauté scientifique académique.

Lien de présentation : https://u-paris.cloud.panopto.eu/Panopto/Pages/Viewer.aspx?id=dad374ee-f81b-4651-a171-afe200be759c

Activités

Expertises

  • Préparer les données pour les analyses textométriques (segmentation, découpage en sections, découpage en parties, annotation via des scripts) ;
  • Explorer les données textuelles (structurées en parties et/ou découpées en sections) ou une base annotée (même type de structuration, comportant en outre plusieurs couches d’annotation : forme, lemme, catégorie, etc.) ;
  • Réaliser des analyses textométriques “classiques” : dictionnaire, concordancier, spécificités, segments répétés, graphique de ventilation, cooccurrents, etc.
  • Explorer des corpus richement annotés (treebanks monolingues/multilingues) ou des corpus alignés.

Équipements

Architecture du plateau
iTrameur fonctionne dans un navigateur habituel (de préférence Firefox ou Chrome).
En plus de l’exploration des données chargées via les opérations textométriques (dictionnaire, concordancier, spécificités, segments répétés, graphique de ventilation, cooccurrents, etc.), iTrameur regroupe des modules satellites également disponibles en ligne :

  • iTrameur-Specif-Partie : les mots spécifiques d’une partie d’un corpus ; navigation via la carte des sections ;
  • iTrameur-CooCs-Bitext : les cooccurrents d’un pôle sur un corpus aligné (avec retour en contexte) ; navigation via la carte des sections alignées ;
  • iTrameur-CooCs : un graphe de cooccurrents sur un pôle donné (avec retour en contexte); navigation via la carte des sections ;
  • iTrameur-CooCs-regexp : un graphe de cooccurrents sur un ensemble de pôles définis via une regexp ; navigation via la carte des sections ;
  • iTrameur-Réseau CooCs : un réseau de cooccurrences généralisées.

Services proposés

Accès au plateau iTrameur – Outils d’analyse textométrique de données qui permet d’utiliser de nombreuses fonctionnalités pour l’analyse statistique de textes

Le plateau dispose aussi des fonctionnalités permettent de re-annoter dynamiquement des corpus ou d’explorer des ressources richement annotées.

Plusieurs exemples de corpus de travail accessibles en ligne (treebanks, corpus alignés) peuvent être téléchargés puis ouverts dans iTrameur.

Thématiques

Contact

8, place Paul Ricoeur
75205 Paris

email
Site web

Tutelle

Université Paris Cité

Unité de rattachement

UPR 3967 – Centre de Linguistique Interlangues, de Lexicologie, de Linguistique Anglaise et de Corpus
– Atelier de recherche sur la parole

Réseaux

Consortium HN CORpus, Langues et Interactions : https://corli.huma-num.fr/le-trameur/
 

Plateformes dans la même thématique

Base d’Aide à la Rédaction de TExtes Scientifiques (ARTES)

ARTES est à la fois un projet scientifique et une plateforme d’aide à la rédaction et à la traduction dans les domaines de connaissances spécialisées, développée par l’équipe de recherche du CLILLAC-ARP et de l’UFR EILA d’Université Paris Cité.