|Site de l'université Stendhal - Grenoble 3|
Traverses

Accueil > CESR > Programmes en cours

Programmes en cours

Le corpus d’application de la SFI METILDE est le fonds de manuscrits de Stendhal, en lien avec le projet CLELIA et le site des manuscrits de Stendhal (www.manuscrits-de-stendhal.org).

Structure fédérative interne (SFI) MÉTILDE

Projet porté par Cécile Meynard (Traverses 19-21, Université Stendhal Grenoble 3, EA 3748/MSH Alpes, USR 3394), en partenariat avec :
-  le laboratoire LIDILEM (Linguistique et Didactique des Langues Étrangères et Maternelles, EA 609) ;
-  et l’équipe GRESEC (Groupe de recherche sur les enjeux de la Communication, EA 608).

L’objectif est de proposer des outils méthodologiques et informatiques utiles à d’autres communautés de chercheurs, travaillant sur d’autres fonds patrimoniaux numérisés. Il ne s’agit pas simplement de produire des éditions en ligne ou imprimées, mais d’inventer de nouvelles façons de présenter, de consulter, d’analyser et d’interpréter l’objet manuscrit. Pour ce faire, l’analyse des publics et de leurs usages est fondamental, d’où l’intérêt de travailler en collaboration entre littéraires, spécialistes de Traitement automatique des Langues, et spécialistes de l’Information-Communication.

Ce projet, piloté par Cécile Meynard, s’articule en quatre sous-projets :

- le premier, animé par Cécile Meynard, porte sur le développement de parcours pédagogiques, à destination d’enseignants, d’élèves et d’étudiants.
- le second, animé par Viviane Clavier, identifie la communauté des spécialistes susceptibles de s’intéresser à des manuscrits d’auteurs, observe les usages qu’ils font des manuscrits afin de voir comment la plate-forme CLELIA s’intègre (ou non) dans leurs pratiques informationnelles. Il s’appuie sur deux méthodologies : les traces d’usages qui peuvent être recueillies dans le site lui-même, et des entretiens individuels semi-directifs réalisés auprès de spécialistes en littérature.
- le troisième, animé par Marie-Christine Bordeaux, porte sur la médiation (en présence et à distance) des Manuscrits vis-à-vis de publics non experts (ou "publics ordinaires"), en collaboration avec la Bibliothèque municipale de Grenoble. La méthodologie s’appuie sur l’analyse des pratiques de médiation présentes ou à venir autour des Manuscrits, et éventuellement sur une étude d’usage de ces publics ordinaires.
- le quatrième, animé par Thomas Lebarbé, porte sur la description linguistique des traces d’écriture. Les transcriptions produites par l’équipe des manuscrits, sur la base de l’outil développé à cet effet par T. Lebarbé, constituent un corpus unique, certes d’ordre littéraire, mais aussi d’ordre linguistique dont les retombées permettront en retour d’alimenter les argumentaires des analyses littéraires et génétiques : le processus scriptural (hésitations, reprises, corrections, discontinuité syntaxique, etc.) peut être analysé et caractérisé, par exemple, à l’aune de l’analyse syntaxique des productions orales proposée par Claire Blanche-Benveniste et l’équipe du Groupe Aixois de recherche en syntaxe. Par ailleurs, ces phénomènes représentent un verrou pour les technologies du TAL qui généralement se fondent sur des structures phrastiques complètes et syntaxiquement correctes – il est donc nécessaire de reconsidérer les modèles d’analyse automatique pour le traitement des corpus de manuscrits.

Une telle approche permettra :

-  de concevoir un ensemble de méthodes et de modèles de représentation des bases documentaires de manuscrits – les outils informatiques permettant ces représentations seront déposés sur des plateformes généralistes (SourceForge) et spécialisées (Plume) ;
-  de définir une typologie empirique et une caractérisation fine des utilisateurs et des usages de ces bases – ces modèles seront intégrés aux plateformes afin d’assister efficacement l’utilisateur dans sa recherche d’information.

Télécharger le descriptif du projet.

***

CLELIA

Corpus Littéraire Et Linguistique assisté par des outils d’Informatique Appliquée.
Ce projet de base documentaire en ligne, piloté par Cécile Meynard (Traverses 19-21) et Thomas Lebarbé (LIDILEM), a comme double objectif l’exploitation et la valorisation littéraire et linguistique du fonds de manuscrits de Stendhal conservés à la Bibliothèque municipale de Grenoble (environ 40 000 pages). Il s’agit d’un travail collaboratif et interdisciplinaire d’une quinzaine de chercheurs français et étrangers, stendhaliens ou spécialistes d’informatique et de linguistique, dans le cadre du groupe « Manuscrits de Stendhal » de l’équipe Traverses 19-21 (EA 3748), composante Centre d’Etudes stendhaliennes et romantiques (CESR).

Etant donné le nombre et la complexité des documents à traiter, seule la mise en place d’un corpus numérique s’est avérée satisfaisante, pour rendre possible l’analyse littéraire et linguistique des écrits et à terme de permettre la réalisation d’éditions critiques électroniques et/ou papier beaucoup plus satisfaisantes.
CLELIA a été mise en ligne en novembre 2009 sur le site www.manuscrits-de-stendhal.org, site commun à l’Université Stendhal et à la Ville de Grenoble, développé dans le cadre d’une convention. On y trouve les fac-similés des pages de manuscrits (images fournies par la Bibliothèque municipale de Grenoble) ainsi que leurs transcriptions et divers enrichissements (fournis par le groupe « Manuscrits de Stendhal »). Au 15 octobre 2013, 2256 pages de manuscrits ont été mises en ligne, avec la perspective d’en avoir 10 000 en 2017. Un moteur de recherche simple permet à l’heure actuelle d’effectuer des recherches par mots-clés. Une doctorante en TAL, travaillant sous la direction de Thomas Lebarbé, est en train de développer un moteur de recherche avancée en langue naturelle.

CLELIA constitue par ailleurs le support d’une édition imprimée innovante dans le cadre du groupe « Manuscrits », celle des Journaux et Papiers de Stendhal, dont le premier tome, édité par Cécile Meynard, Hélène de Jacquelot et Marie-Rose Corredor, est paru aux ELLUG en juin 2013. Trois autres tomes sont prévus d’ici 2017.

Le projet « Manuscrits de Stendhal » bénéficie du label de la Maison des Sciences de l’Homme – Alpes (MSH-Alpes). Cécile Meynard a d’ailleurs pu obtenir en 2013-2014 une délégation CNRS avec un rattachement à la MSH-Alpes. Le projet a le soutien de la région Rhône-Alpes (Cluster 13 puis ARC5) et du Consortium CAHIER (TGIR Huma-Num). Ce projet s’inscrit pleinement dans l’axe « Génétique et Edition savante de textes XIXème – XXIème siècle » de Traverses 19-21 et dans l’un des axes prioritaires de l’université, « Edition critique, édition numérique et constitution de corpus ».

Afin de valoriser le fonds de manuscrits par un travail scientifique d’équipe, un séminaire de recherche mensuel, puis trimestriel, a été mis en place par Cécile Meynard depuis début 2007. Il s’agit d’un séminaire de travail, dans lequel la réflexion collective, le partage d’expériences et le compte rendu de travaux personnels sont primordiaux. Des ateliers sont également organisés (formation à l’utilisation d’xml, ateliers pratiques de transcription et commentaires de pages problématiques…). Il s’agit de rassembler des spécialistes de Stendhal et en particulier de ses manuscrits mais aussi des informaticiens et spécialistes de linguistique, qui apportent un point de vue différent et complémentaire sur le corpus.

Les prochaines séances, ouvertes à toute personne intéressée, auront lieu les 15 novembre 2013, 7 février et 13 juin 2014, à la MSH-Alpes (salle de réunion du 2e étage), de 13h30 à 17h.

En lien avec CLELIA, deux colloques ont été organisés :
-  en 2006, De l’Hypertexte au manuscrit, actes publiés sous la direction de Françoise Leriche et Cécile Meynard en 2008 aux ELLUG.
-  En 2010, Journaux d’écrivains : enjeux génériques et éditoriaux, actes publiés par Cécile Meynard en 2012 chez Peter Lang.
Un colloque, « Patrimoine et Humanités numériques », organisé par Cécile Meynard, Thomas Lebarbé et Dominique Rigaux, est également prévu du 10 au 12 juin 2014 à la MSH-Alpes.

L’originalité de ce projet résulte aussi et surtout de sa dualité. En effet, au-delà de ces besoins spécifiques des littéraires par rapport au corpus des manuscrits de Stendhal, l’objectif est aussi d’en faire un outil performant du point de vue linguistique. Un partenariat a ainsi été mis en place avec le laboratoire LIDILEM (Linguistique et Didactique des Langues Etrangères et Maternelles - EA609- Université Grenoble 3), qui se charge de la modélisation documentaire, de la conception et du développement informatiques et du traitement linguistique et morpho-syntaxique du corpus. Plusieurs feuilles de style (CSS) et feuilles de transformation (XSLT) permettent d’afficher ou non les ratures, de présenter le texte dans une mise en page proche de celle de Stendhal ou linéarisée, avec l’orthographe du romancier ou une orthographe modernisée, etc. Il s’agit donc d’un précieux outil éditorial. L’intérêt de cette base documentaire étant de mettre à disposition du public des documents et des outils pour ce corpus stendhalien, mais aussi d’être transposable à d’autres types de corpus de manuscrits.

Le corpus développé par l’équipe des Manuscrits de Stendhal présente en effet pour les linguistes une dimension originale : il possède la particularité d’être annoté à la main, le transcripteur définissant notamment les différents scripteurs, les dates et lieu d’écriture ainsi que tous les phénomènes liés à la rédaction littéraire (ratures, ajouts, corrections…). Grâce à cet enrichissement effectué manuellement en XML, le corpus pourra être restructuré dynamiquement en fonction des besoins de l’analyse littéraire mais aussi d’une étude linguistique de ce corpus représentatif d’un certain type d’écrit littéraire de la première moitié du 19e siècle. L’objectif sera alors d’associer au dispositif de gestion du corpus des outils de traitement automatique des langues (TAL) afin d’apporter un enrichissement complémentaire d’analyse syntaxique et de lemmatisation. La résultante de cet enrichissement automatique permettra de développer des outils de recherche dans le corpus aussi bien pour le chercheur, littéraire ou linguiste, que pour le grand public. Parallèlement à cette modélisation, le corpus permettra tout un ensemble d’analyses linguistiques : les phénomènes diachroniques aussi bien d’un point de vue terminologique que stylistique (grâce à la datation des feuillets), la description de la pratique de l’écriture (grâce à l’annotation des ratures et ajouts successifs) et l’analyse contrastive entre l’ébauche littéraire et l’œuvre finalisée (les œuvres de Stendhal étant majoritairement mise à disposition librement en ligne).

Cette ressource linguistique et littéraire est évolutive et collaborative, et permet donc d’imaginer l’ajout ultérieur d’autres fonctionnalités, grâce à la contribution de nouveaux chercheurs.

Actualités

Conférence de Chantal Thomas

21 mai 2014
18 h 30, Bibliothèque du Centre-Ville.

Rencontre avec Robert Mc Liam Wilson.

3 juin 2014
18 h 30
Bibliothèque du Centre ville de Grenoble.

Plus d'évenements CESR...

Publications

Romanesques

Revue du Centre d’Etudes du roman et du romanesque.
« L’Expérience romanesque au XIXé siècle. »
Etudes réunies par Catherine Mariette-Clot..
Classiques Garnier

Journaux et Papiers de Stendhal - Tome 1.

Édition établie par Cécile Meynard , Hélène de Jacquelot et Marie-Rose Corredor
ELLUG.

Plus de publications...