Pure Neural Server – CLILLAC-ARP – plateforme de traduction automatique sur serveur université

Présentation

La Plateforme PNS-UP (SYSTRAN Pure Neural® Server) est un serveur de traduction qui permet d’utiliser des modèles de traduction automatique spécialisée pour les projets de traduction, post-édition et révision de fichiers, de la parole et de pages Web. Depuis 2022, elle héberge le serveur PAPTAN qui permet d’entraîner des modèles de langues multilingues et spécialisés et de déployer l’écosystème de la traduction neuronale pour la recherche fondamentale, l’enseignement de la traduction spécialisée et les applications des industries de la langue.

La plateforme est ouverte à la communauté scientifique académique.

Activités

Expertises

Entrainer des modèles de traduction spécialisés (si les données textuelles sont fournies par les demandeurs)

Déployer les modèles spécialisés sur la Plateforme PNS-UP (SYSTRAN Pure Neural® Server) pour utilisation ultérieure en traduction automatique

La plateforme travaille avec les différentes formations en traduction dispensées par la Faculté Sociétés et Humanités d’Université Paris Cité (UFR EILA, UFR d’Études anglophones, etc.) et les réseaux partenaires (EMT : https://ec.europa.eu/info/resources-partners/european-masters-translation-emt_fr, AFFUMT : https://affumt.wordpress.com/), des partenaires industriels et différentes équipes de recherche pour une meilleure compréhension des mécanismes de la traduction neuronale et son amélioration. Elle permet d’avancer la réflexion sur l’utilisation des corpus spécialisés en entraînement, l’interaction homme-machine en post-édition et révision, ainsi que sur l’enseignement de la traduction outillée.

Equipements

Architecture de la plateforme
PAPTAN est adossée à la plateforme PNS-UP utilisée pour la formation et recherche en traduction spécialisée :
• Plateforme PNS-UP (SYSTRAN Pure Neural® Server). Ce serveur de traduction permet d’utiliser des modèles de traduction automatique spécialisée pour les projets de traduction, post-édition et révision de fichiers, de la parole et de pages Web ;
• SYSTRAN Model Studio Lite : serveur d’entrainement de modèles spécialisés paramétré pour les applications des industries de la langue ;
• SYSTRAN Model Studio Advanced : serveur d’entrainement de modèles spécialisés avec des fonctionnalités avancées permettant d’accéder aux GPUs de la plateforme PAPTAN ;
• Accès SSH aux GPUs (carte A100 du serveur PowerEdge R7525) pour les administrateurs (après la validation de la demande par les coordinateurs).

Services proposés

Accès au système SYSTRAN Pure Neural® Server, qui permet d’utiliser des modèles de traduction automatique spécialisée pour les projets de traduction, post-édition et révision de fichiers, de la parole et de pages Web.

Accès SSH aux GPUs de la plateforme PAPTAN pour l’entrainement des modèles ou des expériences en traitement automatique des langues (après la validation de la demande par les coordinateurs).

Thématiques

Contact

Plateforme pour l’apprentissage profond pour la traduction automatique neuronale
CLILLAC-ARP
8 place Paul Ricœur – 75013 Paris
mail
Site web : plateforme Paptan

Tutelle

Université Paris Cité

Unité de rattachement

Centre de Linguistique Interlangues, de Lexicologie, de Linguistique Anglaise et de Corpus – Atelier de recherche sur la parole – URP 3967
 

Plateformes dans la même thématique

iTrameur – Outils d’analyse textométrique de données

Le plateau iTrameur – Outils d’analyse textométrique de données est un ensemble d’outils en ligne comportant plusieurs fonctionnalités de l’analyse automatique de textes en vue de leur profilage sémantique, thématique et de leur interprétation.

Base d’Aide à la Rédaction de TExtes Scientifiques (ARTES)

ARTES est à la fois un projet scientifique et une plateforme d’aide à la rédaction et à la traduction dans les domaines de connaissances spécialisées, développée par l’équipe de recherche du CLILLAC-ARP et de l’UFR EILA d’Université Paris Cité.

Plateforme “Géotéca” : Géomatique, Télédétection, Cartographie

Géotéca vise à mettre en commun les compétences et les matériels dédiés à l’analyse des images de télédétection et des données spatialisées, dans toutes les disciplines utilisant ces techniques, depuis les sciences humaines jusqu’aux sciences de la Terre et des planètes.

Plateforme – Chimiothèque du LCBPT

La Chimiothèque UMR8601 / PARIS CITE est un projet fédérateur entre les équipes de notre laboratoire pour la conservation du patrimoine chimique du laboratoire et sa valorisation sur de nouvelles cibles biologiques.
Elle fait partie des laboratoires associés à la Chimiothèque Nationale (CN) du CNRS depuis 2004 et à l’infrastructure de recherche ChemBioFrance depuis 2019.

Plateau – Macromolecular Modeling Platform

Créé en 2012, le plateau de modélisation macromoléculaire du LCBPT exploite des approches in silico pour répondre à des questions structurales ou fonctionnelles sur des molécules ou complexes d’intérêt biologique.