Pure Neural Server – plateforme de traduction automatique sur serveur université (PNS-UP)

Présentation

PNS-UP (Pure Neural Server – UP) est une plateforme de traduction qui permet d’utiliser des modèles de traduction automatique spécialisée pour les projets de traduction, post-édition et révision de fichiers de texte, de la parole et de pages web.

Activités :
La plateforme travaille avec les formations de la Faculté Sociétés et Humanités d’Université Paris Cité (UFR EILA, UFR d’Études anglophones, etc.) et les réseaux partenaires, European Master’s in Translation (EMT), l’Association française des formations universitaires aux métiers de la traduction (AFFUMT), des partenaires industriels et des équipes de recherche pour une meilleure compréhension des mécanismes de la traduction automatique et son amélioration. Elle permet d’avancer la réflexion sur l’utilisation des ressources linguistiques en entraînement, sur l’interaction homme-machine en post-édition et révision, ainsi que sur l’enseignement de la traduction outillée, dans une synergie optimale entre machine et humain.

Projets portés :
MULTITAN-GML : MULTIlinguisme, Traduction Automatique Neuronale hyperspécialisée et Grands
Modèles de Langue
PAPTAN : Plateforme pour l’apprentissage profond pour la traduction automatique neuronale
ENSUPECO : ENglish SUbtitling of PEdagogical Content

l’infrastructure technique - serveurs

Activités

Expertises

Entraîner des modèles de langues multilingues et spécialisés et déployer l’écosystème de la traduction neuronale pour la recherche fondamentale, l’enseignement de la traduction spécialisée et les applications des industries de la langue.

Mettre en production les ressources linguistiques (corpus spécialisés, bases de données terminologiques et phraséologiques)

Entraîner, affiner et déployer des modèles génératifs open-source à partir de données textuelles et structurées spécialisées.

Permettre l’utilisation intensive des GPU grâce à un système d’ordonnancement, accessible directement ou via une interface de programmation.

Optimiser l’utilisation des GPU pour améliorer l’efficacité des tâches

Equipements

SYSTRAN translate Server 10
SYSTRAN Model Studio Advanced
Accès au service SYSTRAN Model Studio Lite

MULTITAN-GML : serveur HPE DL385 Gen11 GPU CTO, 2 cartes graphiques H100 80GB
Le serveur a pour objectif de doter la plateforme de capacités de calcul accrues en vue de l’entraînement et de l’affinage de modèles de traduction neuronale ainsi que de grands modèles de langues (Large Language Models). Il a aussi pour mission d’assurer des sauvegardes dynamiques afin de sécuriser la plateforme.

PAPTAN : serveur Dell PowerEdge R7525, 3 cartes graphiques A100
Le serveur permet d’entraîner des modèles de langues multilingues et spécialisés et déployer l’écosystème de la traduction neuronale pour la recherche fondamentale, l’enseignement de la traduction spécialisée et les applications des industries de la langue.

Services proposés

Accès recherche : Permet de manipuler et de comparer des modèles de traduction ou d’inférence open source dans le cadre d’expérimentations avancées.

Accès pédagogique : Offre un parcours complet de traduction automatique, incluant des outils dédiés à la production et à l’évaluation des traductions ainsi que des modèles associés.

L’architecture des services prévoit plusieurs types d’accès :
STS10 (SYSTRAN translate Server 10) : serveur de traduction qui permet d’utiliser des modèles de traduction automatique spécialisée pour les projets de traduction, post-édition et révision de fichiers, de la parole et de pages Web (demande de création de compte).

Accès au service SYSTRAN Model Studio Lite : serveur d’entrainement de modèles spécialisés paramétré pour les applications des industries de la langue (via interface graphique simplifiée, demande de création de compte avec coût d’accès au service).

SYSTRAN Model Studio Advanced : serveur d’entraînement de modèles spécialisés avec des fonctionnalités avancées, offrant des accès aux GPUs de la plateforme (après la validation de la demande).

Accès SSH aux serveurs GPU MULTITAN-GML | PAPTAN pour les administrateurs (après la validation de la demande).

Thématiques

Contact

Pure Neural Server – plateforme de traduction automatique sur serveur université (PNS-UP)
URP 3967 – ALTAE, Bâtiment “Olympe de Gouges”
8 place Paul Ricœur – 75013 Paris
mail
Site web : plateforme Paptan

Tutelle

Université Paris Cité

Unité de rattachement

Centre de Linguistique Interlangues, de Lexicologie, de Linguistique Anglaise et de Corpus – Atelier de recherche sur la parole – URP 3967
 

Plateformes dans la même thématique

Plateforme d’expertise technologique de Production, d’Ingénierie, et de Caractérisation de Vésicules Extracellulaires pour des Thérapies Personnalisées (IVETh)

La plateforme a pour objectif d’offrir des expertises autour des vésicules extracellulaires et un parc d’équipements de rupture pour la caractérisation du sécrétome et des vésicules extracellulaires thérapeutiques ou issues de biofluides pour du diagnostic.
Cette plateforme est ouverte à la communauté scientifique académique et industrielle.

Centre des Humanités Numériques des Grands Moulins – Direction générale déléguée des bibliothèques et musées

Le Centre des humanités numériques (CHN) est une plateforme de la Faculté Sociétés & Humanités d’Université Paris Cité portée opérationnellement par la Direction des Bibliothèques et Musées (DGDBM). Il s’adresse aux doctorants et aux communautés de recherche de la Faculté Sociétés & Humanités d’Université Paris Cité, ainsi qu’aux acteurs des humanités numériques du site géographique parisien.

Centre François Arago (FACe) d’APC

Le Centre François Arago (FACe) est le centre de traitement de données multi-messagers du laboratoire APC. Ce centre vise à fournir l’infrastructure et l’expertise nécessaires pour répondre aux besoins des agences spatiales en matière de traitement de données (segment sol).