Pure Neural Server – plateforme de traduction automatique sur serveur université (PNS-UP)

Présentation

PNS-UP (Pure Neural Server – UP) est une plateforme de traduction qui permet d’utiliser des modèles de traduction automatique spécialisée pour les projets de traduction, post-édition et révision de fichiers de texte, de la parole et de pages web.

Activités :
La plateforme travaille avec les formations de la Faculté Sociétés et Humanités d’Université Paris Cité (UFR EILA, UFR d’Études anglophones, etc.) et les réseaux partenaires, European Master’s in Translation (EMT), l’Association française des formations universitaires aux métiers de la traduction (AFFUMT), des partenaires industriels et des équipes de recherche pour une meilleure compréhension des mécanismes de la traduction automatique et son amélioration. Elle permet d’avancer la réflexion sur l’utilisation des ressources linguistiques en entraînement, sur l’interaction homme-machine en post-édition et révision, ainsi que sur l’enseignement de la traduction outillée, dans une synergie optimale entre machine et humain.

Projets portés :
MULTITAN-GML : MULTIlinguisme, Traduction Automatique Neuronale hyperspécialisée et Grands
Modèles de Langue
PAPTAN : Plateforme pour l’apprentissage profond pour la traduction automatique neuronale
ENSUPECO : ENglish SUbtitling of PEdagogical Content

l’infrastructure technique - serveurs

Activités

Expertises

Entraîner des modèles de langues multilingues et spécialisés et déployer l’écosystème de la traduction neuronale pour la recherche fondamentale, l’enseignement de la traduction spécialisée et les applications des industries de la langue.

Mettre en production les ressources linguistiques (corpus spécialisés, bases de données terminologiques et phraséologiques)

Entraîner, affiner et déployer des modèles génératifs open-source à partir de données textuelles et structurées spécialisées.

Permettre l’utilisation intensive des GPU grâce à un système d’ordonnancement, accessible directement ou via une interface de programmation.

Optimiser l’utilisation des GPU pour améliorer l’efficacité des tâches

Equipements

SYSTRAN translate Server 10
SYSTRAN Model Studio Advanced
Accès au service SYSTRAN Model Studio Lite

MULTITAN-GML : serveur HPE DL385 Gen11 GPU CTO, 2 cartes graphiques H100 80GB
Le serveur a pour objectif de doter la plateforme de capacités de calcul accrues en vue de l’entraînement et de l’affinage de modèles de traduction neuronale ainsi que de grands modèles de langues (Large Language Models). Il a aussi pour mission d’assurer des sauvegardes dynamiques afin de sécuriser la plateforme.

PAPTAN : serveur Dell PowerEdge R7525, 3 cartes graphiques A100
Le serveur permet d’entraîner des modèles de langues multilingues et spécialisés et déployer l’écosystème de la traduction neuronale pour la recherche fondamentale, l’enseignement de la traduction spécialisée et les applications des industries de la langue.

Services proposés

Accès recherche : Permet de manipuler et de comparer des modèles de traduction ou d’inférence open source dans le cadre d’expérimentations avancées.

Accès pédagogique : Offre un parcours complet de traduction automatique, incluant des outils dédiés à la production et à l’évaluation des traductions ainsi que des modèles associés.

L’architecture des services prévoit plusieurs types d’accès :
STS10 (SYSTRAN translate Server 10) : serveur de traduction qui permet d’utiliser des modèles de traduction automatique spécialisée pour les projets de traduction, post-édition et révision de fichiers, de la parole et de pages Web (demande de création de compte).

Accès au service SYSTRAN Model Studio Lite : serveur d’entrainement de modèles spécialisés paramétré pour les applications des industries de la langue (via interface graphique simplifiée, demande de création de compte avec coût d’accès au service).

SYSTRAN Model Studio Advanced : serveur d’entraînement de modèles spécialisés avec des fonctionnalités avancées, offrant des accès aux GPUs de la plateforme (après la validation de la demande).

Accès SSH aux serveurs GPU MULTITAN-GML | PAPTAN pour les administrateurs (après la validation de la demande).

Thématiques

Contact

Pure Neural Server – plateforme de traduction automatique sur serveur université (PNS-UP)
URP 3967 – ALTAE, Bâtiment “Olympe de Gouges”
8 place Paul Ricœur – 75013 Paris
mail
Site web : plateforme Paptan

Tutelle

Université Paris Cité

Unité de rattachement

Centre de Linguistique Interlangues, de Lexicologie, de Linguistique Anglaise et de Corpus – Atelier de recherche sur la parole – URP 3967
 

Plateformes dans la même thématique

iTrameur – Outils d’analyse textométrique de données

Le plateau iTrameur – Outils d’analyse textométrique de données est un ensemble d’outils en ligne comportant plusieurs fonctionnalités de l’analyse automatique de textes en vue de leur profilage sémantique, thématique et de leur interprétation.

Base d’Aide à la Rédaction de TExtes Scientifiques (ARTES)

ARTES est à la fois un projet scientifique et une plateforme d’aide à la rédaction et à la traduction dans les domaines de connaissances spécialisées, développée par l’équipe de recherche du CLILLAC-ARP et de l’UFR EILA d’Université Paris Cité.

Plateforme “Géotéca” : Géomatique, Télédétection, Cartographie

Géotéca vise à mettre en commun les compétences et les matériels dédiés à l’analyse des images de télédétection et des données spatialisées, dans toutes les disciplines utilisant ces techniques, depuis les sciences humaines jusqu’aux sciences de la Terre et des planètes.

Plateforme – Chimiothèque du LCBPT

La Chimiothèque UMR8601 / PARIS CITE est un projet fédérateur entre les équipes de notre laboratoire pour la conservation du patrimoine chimique du laboratoire et sa valorisation sur de nouvelles cibles biologiques.
Elle fait partie des laboratoires associés à la Chimiothèque Nationale (CN) du CNRS depuis 2004 et à l’infrastructure de recherche ChemBioFrance depuis 2019.

Plateau – Macromolecular Modeling Platform

Créé en 2012, le plateau de modélisation macromoléculaire du LCBPT exploite des approches in silico pour répondre à des questions structurales ou fonctionnelles sur des molécules ou complexes d’intérêt biologique.