publicationdiffusion

   © 2009 France Martineau

Structure du Corpus MCVF

Le corpus MCVF (Modéliser le changement : les voies du français) est structuré de façon dialectale, sociale et historique. Il est constitué en grande partie de textes intégraux. Le corpus couvre quatre périodes historiques:

I. Ancien français
II. Moyen français
III. Français du XVIe siècle
IV. Français classique (France et Nouvelle-France) (XVIIe et XVIIIe siècles)

liste_corpus

Encodage des textes

Les textes sont saisis en format XML ; la norme qui a été suivie est celle du TEI (Text Encoding Initiative). Notre protocole de transcription et d’encodage TEI peut être consulté librement, de façon à uniformiser les formats. À ce balisage, nous ajoutons des descripteurs historiques permettant de préciser le profil social du scripteur et le parcours du texte. Nous procédons ensuite à une annotation morphologique et  syntaxique.

manuel_xml
manuel_morpho
manuel_morpho

Corpus interrogeables MCVF

Le corpus peut être interrogé par tout utilisateur qui remplit le formulaire d’accès. Les textes du Corpus MCVF ne sont pas accessibles dans leur intégralité. Toutefois, on peut les interroger et obtenir des résultats sous forme de concordance ou de structures arborescentes (selon le moteur de recherche) pour différents types de requêtes.

Corpus MCVF, format XML-TEI
Corpus MCVF, étiqueté morphosyntaxiquement
Corpus Les Canadas vus par les Canadiens (accessible sans formulaire d’accès) http://www.collectionbaby.uottawa.ca

formuser
 
© Université d'Ottawa