Faculté des Humanités
Département
Sciences du langage

Master "Sciences du langage" parcours "Lexicographie, Terminographie, Traitement Automatique des Corpus"

Documents de présentation

Actualités du Master

1 ère campagne de campagne de candidature :

- M1 Via Mon Master : 06/02 au 24/03

- M2 Via E-Candidat : 02/05 au 02/06

 

 

Le parcours « Lexicographie, Terminographie et Traitement Automatique des Corpus » (LTTAC) de la mention Sciences de langage de master vise à donner une qualification en ingénierie linguistique en phase avec les nouvelles technologies de l’information et de la communication.

Cette qualification permet une insertion professionnelle dans différents domaines:

  • rédaction d’encyclopédies et de dictionnaires monolingues, bilingues ou plurilingues ;
  • conception de bases de données pour la lexicographie et la terminologie ;
  • développement de lexiques pour des outils d’aide à la rédaction ou des systèmes de traduction automatique ou assistée ;
  • élaboration de catalogues et de guides thématiques ;
  • construction d’ontologies pour le traitement automatique des langues et l’intelligence artificielle ;
  • intégration de ressources lexicales à des moteurs de recherche et autres outils d’extraction d’informations ;
  • etc.

Au terme de leur formation, les diplômé.e.s de la formation peuvent prétendre à une insertion professionnelle, notamment, en tant que lexicographes (rédacteurs ou chefs de projets) ; terminologues dans le domaine public ou privé ; traducteurs-terminologues dans des entreprises de traduction de logiciels ; informaticiens dans des équipes d’informatique éditoriale ; linguistes-informaticiens dans des entreprises relevant des industries de la langue ; rédacteurs de guides pratiques et de catalogues techniques ou commerciaux.

Consultez les fiches ROME (Répertoire Opérationnel des Métiers et des Emplois) correspondant à une partie des emplois cités ci-dessus :

Consultez les fiches ROME (Répertoire Opérationnel des Métiers et des Emplois) correspondant à une partie des emplois cités ci-dessus :

  • E1105 : Coordination d’édition (Assistant / Assistante d’édition ; Directeur / Directrice éditoriale ; Éditeur / Éditrice ; Responsable d’édition) ; 
  • E1108 : Traduction, interprétariat (Traducteur / Traductrice terminologue) ; 
  • E1205 : Réalisation de contenus multimédias (Infographiste ; Web designer / designeuse) ;
  • E1305 : Préparation et correction en édition et presse (Correcteur-éditeur / Correctrice-éditrice de textes ; Correcteur / Correctrice d’édition ; Correcteur / Correctrice ; Préparateur-correcteur / Préparatrice-correctrice) ;
  • E1306 : Prépresse (Rédacteur / Rédactrice en chef ; Opérateur / Opératrice en Publication Assistée par Ordinateur – PAO – ; Claviste en Publication Assistée par Ordinateur – PAO – ; Opérateur / Opératrice de prépresse) ;  
  • K2401 : Recherches en Sciences de l’homme et de la société (Lexicographe ; Terminologue ; Lexicologue ; Linguiste ; Chargé / Chargée de recherches en sciences humaines).

Pour un aperçu des emplois effectivement occupés par les diplômés du master LTTAC et des autres formations lilloises, voir les enquêtes de l'Observatoire de la Direction des Formations : https://odif.univ-lille.fr/repertoires-demplois

 

Le parcours LTTAC est conçu pour présenter un processus de description lexicale complet, tout en fournissant des compétences fondamentales pour se spécialiser dans l’un des types d’activité que ce processus intègre :

  • tout commence par la documentation des usages des locuteurs, ce qui implique de savoir sélectionner et collecter des observables afin de constituer des corpus, souvent de structurer ces derniers informatiquement, en XML, et de les enrichir d’annotations, et, enfin, de les explorer ;
  • il convient ensuite de savoir analyser les emplois lexicaux observés en mobilisant les connaissances linguistiques pertinentes ;
  • il est en outre nécessaire de savoir définir un principe de description, que ce soit pour un projet éditorial, une documentation lexicale interne à une entreprise ou une ressource destinée à des outils logiciels, puis d’être en mesure d’élaborer les descriptions des items sélectionnés en fonction de ce principe, en usant des codifications pertinentes, de modalités rédactionnelles adaptées, etc. ;
  • enfin, les descriptions dictionnairiques rédigées sont (originellement ou par manipulation des textes saisis) des documents structurés en XML, comme le sont aujourd’hui la majorité des contenus éditoriaux publiés, et leur présentation à des lecteurs implique un processus d’informatique éditoriale et de composition pour la mise en forme et les publications sous forme de livres imprimés ou numériques (ePub, pdf, etc.) ou d’applications, ou comme contenus de sites Web.

Compétences linguistiques générales

  • Disposer d’un solide bagage théorique en linguistique fondamentale.
  • Manier correctement l’anglais scientifique, à l’oral et à l’écrit (en réception et en production).

Connaissances scientifiques et professionnelles spécifiques au parcours LTTAC

  • Être capable de réinvestir les connaissances linguistiques acquises pour la production de divers types de descriptions lexicales.
  • Savoir élaborer et exploiter un corpus électronique destiné à des analyses linguistiques, en particulier pour la documentation de descriptions lexicales.
  • Être initié aux différentes composantes de l’activité lexicographique et terminographique.
  • Avoir une bonne connaissance des dictionnaires imprimés et électroniques récents, et des produits antérieurs les plus importants.
  • Avoir une représentation des évolutions du secteur éditorial de la référence et, plus largement, de l’édition avec l’avènement d’outils informatiques de production et de lecture.
  • Avoir une solide compétence en manipulations éditoriales de flux XML (de documents textuels structurés en XML) pour l’édition d’ouvrages imprimés ou électroniques, d’applications ou de sites Web.
  • Être informé  des domaines d’application du traitement automatique des langues et des industries développant des outils informatiques à composante lexicale.
  • Être familiarisé avec les réalités de la vie professionnelle.

Maîtrise d’outils et de ressources

  • Savoir manier les ressources et outils informatiques pertinents pour l’ensemble des applications concernées par les analyses linguistiques, dont le traitement du lexique et les traitements lexicographiques et terminographiques.
  • Maîtriser le langage de structuration de documents XML (corpus documentaires ou contenus éditoriaux) ainsi que ceux qui permettent de décrire les modèles de documents (DTD, schémas) et de procéder à des manipulations structurelles et textuelles (en XSLT, en particulier).
  • Programmer en JavaScript et en Perl pour l’extraction d’informations au sein de documents textuels (informatiquement structurés ou non).
  • Avoir de solides bases en :
    •• manipulation de logiciels de transcription alignée aux sons ou aux vidéos et de systèmes d’alignement de corpus multilingues,
    •• manipulation d’outils d’indexation automatique de documents et d’étiqueteurs morphosyntaxiques,
    •• manipulation de concordanciers et d’outils de fouille de textes et d’extraction d’informations,
    •• conception d’ontologies,
    •• conception de bases de données SQL et emploi de celles-ci pour le stockage de données linguistiques comme pour l’élaboration de dictionnaires en ligne,
    •• manipulation d’outils de publication assistée par ordinateur (PAO), comme InDesign, pour l’édition imprimée, électronique ou multisupports de divers types de produits éditoriaux.

Savoir-faire

  • Savoir sélectionner des ressources documentaires répondant efficacement à un besoin d’analyse linguistique.
  • Savoir définir un projet de descriptions lexicales en fonction des besoins des destinataires humains ou logiciels, sélectionner les informations à fournir et en déterminer les modalités d’expression (rédigée ou codifiée selon la destination).
  • Savoir rédiger des descriptions lexicales destinées à des lecteurs humains ou dédiées à des applications informatiques.
  • Être capable de mener à terme une réflexion sur un objet de recherche en lien avec la formation (analyse critique de dictionnaires publiés, réflexion méthodologique pour la conception d’outils informatiques pour la linguistique, etc.) ou de développer un projet original (de corpus documentaire, de dictionnaire, d’encyclopédie, de logiciel à composante lexicale, etc.) susceptible de déboucher sur une application concrète.

Candidatures 2024 (pour l'année 2024-2025)

  • candidature en M1 : via la plateforme Mon Master du 26 février au 24 mars 2024.
  • candidature en M2 : via la plateforme e-candidat, du 2 mai au 2 juin 2024.

Les titulaires du M1 "Lexicographie, Terminographie et Traitement Automatique des Corpus" à l'Université de Lille sont admis.es de droit en M2 de ce même parcours. Il n'est donc pas utile de déposer de dossier.

 

Public

La formation est ouverte aux étudiant.e.s francophones, quelle que soit leur nationalité. La pratique de plusieurs langues – langues de large diffusion ou d'extension plus restreinte – est un atout particulièrement apprécié dans l'ensemble des activités professionnelles qui ont recours aux techniques du traitement automatique des langues.
En formation initiale, le parcours LTTAC s’inscrit de manière naturelle dans la filiation de cursus comportant une composante linguistique et/ou de traitement automatique des langues. Il est toutefois également accessible aux étudiant.e.s issues d’autres filières en fonction de leur projet professionnel.
En reprise d'études, le parcours est en particulier ouvert :

  • aux professionnel.le.s des industries de la langue impliqués dans la constitution et la manipulation de ressources lexicales structurées et de corpus
  • aux professionnel.le.s de la lexicographie et de la terminographie souhaitant compléter leur formation théorique
  • aux spécialistes de disciplines scientifiques et techniques désireux de s’initier à la méthodologie d’élaboration de répertoires disciplinaires
  • aux éditeurs.trices souhaitant actualiser leurs connaissances en gestion de flux éditoriaux XML

 

MASTER 1

Mentions de licence conseillées

  • Mention Sciences du langage
  • Mention Lettres
  • Mention Informatique
  • Mention LLCER
  • Mention Histoire
  • Mention Philosophie

Composition du dossier (pièces spécifiques)

  • Lettre de motivation faisant état de la formation antérieure du ou de la candidat.e et de sa cohérence avec le parcours LTTAC de mention SDL
  • Projet de recherche ou professionnel rédigé
  • Programme détaillé obligatoire en cas de cursus à l’étranger ou cursus non universitaire
  • Attestation de niveau de langue française pour les candidat.e.s de pays non francophones
  • Attestation pôle emploi pour les demandeur.euse.s d’emploi

 

MASTER 2

Conditions d'accès

  • Soit avoir validé une première année de master dans le champ des Sciences du langage ou dans le champ de l’une des mentions de licence conseillées pour l’entrée en M1
  • Soit pouvoir faire la preuve de compétences dans le champ des sciences du langage, par le biais d'une expérience professionnelle ou autre.

Composition du dossier

  • CV détaillé
  • Certificat de scolarité année en cours
  • Diplômes ou titres obtenus depuis le baccalauréat
  • Relevé de notes du bac ou du titre en équivalence
  • Relevés de notes après bac
  • Justificatif.s de stage
  • Justificatif.s des expériences professionnelles
  • Pièce d’identité
  • Lettre de demande d’intégration présentant le projet professionnel et personnel de recherche
  • Programme détaillé obligatoire en cas de cursus à l’étranger ou de cursus non universitaire
  • Attestation de niveau de langue française pour les candidat.e.s de pays non francophones
  • Attestation pôle emploi pour les demandeur.euse.s d’emploi

Pour le détail, merci de consulter le guide des études 2023/2024

Le M1 et le M2 comportent respectivement 458 et 384 heures de cours, auxquelles s’ajoutent un stage de 3 à 6 mois par année assorti d’un rapport de stage et d’une soutenance, et la rédaction d’un mémoire de recherche en M1, de recherche ou de projet professionnel en M2. Les enseignements s’échelonnent de début septembre à fin avril en M1 et M2. Les étudiant.e.s qui exercent une activité professionnelle pourront bénéficier d’un régime aménagé leur permettant d’étaler chaque année de formation au-delà d’une année universitaire.

L’offre de formation à partir de 2020-2021 est conçue en “Blocs de Compétences et de Connaissances” (BCC), qui incluent des “Unités d’enseignement” (UE) sous lesquelles sont réunis un ou plusieurs “Éléments constitutifs” (EC) qui correspondent chacun à un enseignement.

MASTER 1 - 60 crédits européens 

  • BCC1 : Savoir élaborer des analyses et des descriptions linguistiques (BCC communs à tous les parcours de M. SDL )
    • UE1.1 Linguistique (3 ECTS/semestre) : Linguistique comparée, Syntaxe
    • UE1.2 Linguistique (3 ECTS/semestre) : Ressources et outils informatiques pour la linguistique, Linguistique de corpus
  • BCC2 : Savoir employer une langue étrangère à des fins professionnelles ( BCC communs à tous les parcours de M. SDL)
    • UE2.1 Langues vivantes (3 ECTS/semestre) : Anglais pour linguistes OU Soutien linguistique en Français Langue Étrangère (FLE)
  • BCC3 : Acquérir une méthodologie de travail en linguistique
    • UE3.1 Méthodologie du mémoire ou du stage (3 ECTS au S1)
  • BCC4 : Savoir élaborer des traitements dictionnairiques
    • UE4.1 Lexicographie & Terminographie (6 ECTS/semestre) : Analyse de l'offre dictionnairique, Analyse structurelle de dictionnaires, Analyse structurelle xmlisée de dictionnaires, Lexicographie bilingue et linguistique contrastive, Rédaction d’articles selon un projet éditorial
  • BCC5 : Savoir constituer, enrichir et explorer des corpus
    • UE5.1 TAC & TAL (3 ECTS/semestre) : Algorithmique, Perl
  • BCC6 : Savoir gérer un flux XML éditorial
    • UE6.1 Informatique éditoriale (3 ECTS/semestre) : Stylages de textes, XML (enrichissements textuels et TEI), XSLT pour l’édition en HTML, XSLT pour la restructuration de documents
  • BCC7 : Construire son expérience éditoriale et linguistique
    • UE7.1 Professionalisation (3 ECTS/semestre) : Gestion de projets, Atelier logiciels 2, Stage de 455 à 840 heures.
    • UE7.2 Spécialisation (3 ECTS/semestre) : un cours au choix, voir liste ci-dessous
  • BCC8 Savoir élaborer en autonomie un mémoire de recherche ou de recherche et développement
    • UE8.1 Mémoire (3 ECTS au S2) : Mémoire

Cours au choix (UE7.2 Spécialisation) :

  • Semestre 1 : Ateliers logiciels 1 OU Acquisition/apprentissage du langage et des langues 1 OU Linguistique de la LSF 1 OU Sociolinguistique OU Topics in Linguistics 1 OU Topics in Linguistics 2 OU Aspects linguistiques de la traduction OU Humanités numériques OU Édition critique OU Littérature comparée OU Littérature italienne : Écriture de l’exil au féminin OU Allemand OU Linguistique de l'oral  OU Grammaire français/ anglais OU Phonologie OU Grammaire de constructions
  • Semestre 2 : Acquisition/apprentissage du langage et des langues 2 OU Linguistique de la LSF 2 OU Topics in linguistics 3 OU Topics in linguistics 4 OU Aspects culturels de la traduction OU Édition numérique OU Littérature comparée OU Littérature comparée : littérature et histoire OU Allemand OU Grammaire du français OU Didactique de la phonétique OU Linguistique expérimentale

 

MASTER 2 - 60 crédits européens

  • BCC1 : Savoir élaborer des analyses et des descriptions linguistiques (BCC communs à tous les parcours de M. SDL )
    • UE1.1 Linguistique (3 ECTS/semestre) : Morphologie, Sémantique, Activités du TAL
    • UE1.2 Linguistique (3 ECTS/semestre) : Bases de données et corpus
  • BCC2 : Savoir employer une langue étrangère à des fins professionnelles ( BCC communs à tous les parcours de M. SDL)
    • UE2.1 Langues vivantes (3 ECTS au S3) : Anglais pour linguistes OU Soutien linguistique en Français Langue Étrangère (FLE)
  • BCC4 : Savoir élaborer des traitements dictionnairiques
    • UE4.1 Lexicographie & Terminographie (6 ECTS/semestre) : Analyse de l'offre dictionnairique, Analyse structurelle de dictionnaires, Analyse structurelle xmlisée de dictionnaires, Lexicographie bilingue et linguistique contrastive, Rédaction d’articles selon un projet éditorial
  • BCC5 : Savoir constituer, enrichir et explorer des corpus
    • UE5.1 TAC & TAL (3 ECTS/semestre) : JavaScript, Textométrie (+Algorithmique pour primo-arrivants)
  • BCC6 : Savoir gérer un flux XML éditorial
    • UE6.1 Informatique éditoriale (3 ECTS/semestre) : Lexicographie électronique, Connaissance de la chaîne éditoriale électronique, Éditions multisupports, Connaissance des mondes professionnels éditoriaux (+ XML, XSLT pour l’édition en HTML, XSLT pour la restructuration de documents pour les primo-arrivants)
  • BCC7 : Construire son expérience éditoriale et linguistique
    • UE7.1 Professionalisation (3 ECTS au S3, 6 ECTS au S4) : Gestion de projets, Stage de 455 à 910 heures.
  • BCC8 Savoir élaborer en autonomie un mémoire de recherche ou de recherche et développement
    • UE8.1 Mémoire (3 ECTS au S3, 6 ECTS au S4) : Mémoire étape au S3, Mémoire au S4

Pour des questions précises ou des informations personnalisées  (toutes les adresses sont de la forme prenom.nom@univ-lille.fr) :

  • sur le contenu pédagogique de la formation, merci de contacter la responsable de la formation : Delphine Tribout, maitresse de conférences en sciences du langage
  • sur des questions administratives portant sur le master, merci de contacter Adeline Loock, gestionnaire pédagogique (03.62.26.97.51)
  • pour un accompagnement à la reprise d’études et pour des informations sur la voie diplômante de la VAE (Validation des Acquis de l'Expérience), merci de consulter le lien ici.