Gæsteforelæsning ved Gilles Souvay

La linguistique des corpus

Alle er velkomne!

Titre de la conférence : «  Trésor de la Langue Française, FRANTEXT et autres ressources informatisées : présentation et utilisation de dictionnaires et de bases de textes développées à l'ATILF »

Gilles Souvay est docteur en informatique, ingénieur de recherche au laboratoire ATILF (Analyse et Traitement Informatique de la Langue Française). http://www.atilf.fr C'est un laboratoire du CNRS (Centre National de la recherche Scientifique) et de l'Université de Lorraine.

Le laboratoire est né dans les années 60 pour réaliser le Trésor de la langue Française un dictionnaire de la langue française du XIXe et XXe siècle qui est désormais informatisé et en ligne aux adresses http://atilf.atilf.fr/tlf.htm et http://www.cnrtl.fr/definition/ Les travaux du laboratoire se focalisent actuellement sur le lexique et le traitement automatique de la langue (natural language processing).

Gilles Souvay a la responsabilité de la maintenance et la mise à jour de la base textuelle FRANTEXT La base contient de plus de 4500 textes de toute période du français que l'on peut interroger à partir des mots, des lemmes ou d'expressions complexes http://www.frantext.fr.

Il assure l'encadrement informatique des projets de l'équipe linguistique française et romane. Il s'agit essentiellement de projets lexicographiques en ligne traitant des états anciens de la langue et de l'étymologie.

DMF : Dictionnaire du Moyen Français  http://www.atilf.fr/dmf ; DÉCT : Dictionnaire Électronique de Chrétien de Troyes http://www.atilf.fr/dect ; DÉRom : Dictionnaire Étymologique Roman http://www.atilf.fr/DERom

Son activité recherche se déroule dans le domaine du traitement automatique des états anciens de la langue (lemmatisation et gestion de la variation graphique).