|
Structure du Corpus MCVF
Le corpus MCVF (Modéliser le changement : les voies du français) est structuré de façon dialectale, sociale et historique. Il est constitué en grande partie de textes intégraux. Le corpus couvre quatre périodes historiques:
| I. |
Ancien français |
| II. |
Moyen français |
| III. |
Français du XVIe siècle |
| IV. |
Français classique (France et Nouvelle-France) (XVIIe et XVIIIe siècles) |

Encodage des textes
Les textes sont saisis en format XML ; la norme qui a été suivie est celle du TEI (Text Encoding Initiative). Notre protocole de transcription et d’encodage TEI peut être consulté librement, de façon à uniformiser les formats. À ce balisage, nous ajoutons des descripteurs historiques permettant de préciser le profil social du scripteur et le parcours du texte. Nous procédons ensuite à une annotation morphologique et syntaxique.



Corpus interrogeables MCVF
Le corpus peut être interrogé par tout utilisateur qui remplit le formulaire d’accès. Les textes du Corpus MCVF ne sont pas accessibles dans leur intégralité. Toutefois, on peut les interroger et obtenir des résultats sous forme de concordance ou de structures arborescentes (selon le moteur de recherche) pour différents types de requêtes.
|
Corpus MCVF, format XML-TEI |
 |
Corpus MCVF, étiqueté morphosyntaxiquement |
 |
Corpus Les Canadas vus par les Canadiens (accessible sans formulaire d’accès)
http://www.collectionbaby.uottawa.ca |

|