Je suis interessé par la
structure de textes de domains particuliers. Je travaille dans
l'Apprentissage de Schemas, défini dans McKeown (1985),
pour la Structuration Rhétorique dans la
Génération Automatique du Textes.
Dans ma these, je veux choisir le
schema qui maximise la probabilité
conditionnelle ci-dessous :
P(Schema|(Donnés,Textes))
J'ai estimé la probabilité
avec trois distances :
- La distance entre les données choisies par le
système et les données qui sont dans les textes.
||Kordinateur-
Khumain||
- La distance entre les arbres rhétoriques
générés et les arbres rhétoriques du
textes.
||Rordinateur-
Rhumain||
- La distance entre les textes générés et
les textes humains.
||Dordinateur-
Dhumain||
|